백엔드 개발 PHP 튜토리얼 php 中文字符串截取有关问题?

php 中文字符串截取有关问题?

Jun 13, 2016 am 10:21 AM
quot str string substr

php 中文字符串截取问题???
因为用substr()函数截取中文字符串会出现问题,所以我就上网找了一个函数,如下:

PHP code
<!--Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->//中文字符串截取无乱码函数function cut_str($string, $start, $length) {   if(strlen($string)>$length){      $str = null;      $len = $start+$length;      for($i=$start;$i0xa0){           $str.=substr($string,$i,2);           $i++;        }else{            $str.=substr($string,$i,1);          }   }        return $str.'...';   }else{        return $string;   }}    
로그인 후 복사

但是用过之后还是会出现问题,比如我截取的是“利用滤镜及图层样式制作逼真的石块字”,
PHP code
<!--Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->$str = "利用滤镜及图层样式制作逼真的石块字";cut_str($str,0,50);
로그인 후 복사


但是效果出来了却是这样的:“利用滤镜及图层样式制作逼真的石块?...”,除了个问号一样的字符,我郁闷啊,上网查了一下,汉子在utf-8编码中一般占3个字节,但是这个函数中这里“$str.=substr($string,$i,2);”却截取2,这是什么意思呢??始终没有弄明啊。。。。如果我把2改成3后,那句就会变成“利?甔?滻??镜?及?图?山??样?弼??制?佽??逼?眜?的?石?坝?字...”,唉,,,真的被它搞败了,哪位大侠救救我啊。。。。。。。。。

------解决方案--------------------
怎么不用mb_substr()函数
------解决方案--------------------
你要确定你的编码。截取时指定编码。
------解决方案--------------------
它是以字节计算的。gbk编码。一个中文等于2个字节。
------解决方案--------------------
当然是mb_substr了,楼主对编码看样不太懂。。。

utf8中文编码2-3个字符很常见,但非ASCII字符的单字节一定是第7位为1的,与ASCII单字节是不冲突的,GBK码也是类似的。

请用mb_substr,它会自动根据utf8编码范围识别多字节字符的。
------解决方案--------------------
这个函数只适用于gbk编码

探讨

哈哈,研究了下手册,刚搞定,就是你说的,确定一下编码,但是我想知道那个函数为啥不行啊??那个貌似是php面试的答案诶。前辈能否指点一二,特别是那里的2,utf-8中汉子明明是3-4个字符啊,而且常用的是3个字符啊。。。。。麻烦了

------解决方案--------------------
PHP code
/**************************** * subCNchar() 截取汉字 * * [$str]     [要截取的字符串] * [$start]   [截取的起始位置] * [$length]  [要截取的长度] * [$charset] [字符串编码] ****************************/function subCNchar($str, $start = 0, $length, $charset = "utf-8") {    if (strlen($str) <font color="#e78608">------解决方案--------------------</font><br>为什么不能在后面加上.....<br>echo mb_strlen($str,'utf-8')>10 ? mb_substr($str,0,10,'utf-8').'...' : $str;<br><font color="#e78608">------解决方案--------------------</font><br>加"..."见12楼,  <br><br>如果你非要改这个函数,utf8的编码很有规律,就是下面几种,除ascii码部分外,<br>第一个字节都是11开头,连续的1的个数代表了总字节数,后续字节都是10开头<br>其中汉字基本在3个字节的区.  <br>知道了这个规律,写个函数应该很容易吧?<br>U+007F	   0xxxxxxx<br>U+07FF	   110xxxxx 10xxxxxx<br>U+FFFF	   1110xxxx 10xxxxxx 10xxxxxx<br>U+1FFFFF   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx<br>U+3FFFFFF  111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx<br>U+7FFFFFFF 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx<br><br><br><br>
로그인 후 복사
探讨

那这个函数能不能改成utf-8的??mb_substr()貌似不能在未输出完的字符结尾加上“...”诶,这样影响效果,求解

------解决方案--------------------
你可以用mb_strimwidth函数
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Jul 24, 2023 pm 07:55 PM

Java의 String.valueOf() 함수를 사용하여 기본 데이터 유형을 문자열로 변환 Java 개발에서 기본 데이터 유형을 문자열로 변환해야 할 때 일반적인 방법은 String 클래스의 valueOf() 함수를 사용하는 것입니다. 이 함수는 기본 데이터 유형의 매개변수를 허용하고 해당 문자열 표현을 반환할 수 있습니다. 이 기사에서는 기본 데이터 유형 변환을 위해 String.valueOf() 함수를 사용하는 방법을 살펴보고 다음과 같은 몇 가지 코드 예제를 제공합니다.

char 배열을 문자열로 변환하는 방법 char 배열을 문자열로 변환하는 방법 Jun 09, 2023 am 10:04 AM

char 배열을 문자열로 변환하는 방법: 할당을 통해 달성할 수 있습니다. char 배열이 문자열에 직접 값을 할당하고 실행하도록 하려면 {char a[]=" abc d\0efg ";string s=a;} 구문을 사용합니다. 변환을 완료하는 코드입니다.

Java의 String.replace() 함수를 사용하여 문자열의 문자(문자열)를 바꿉니다. Java의 String.replace() 함수를 사용하여 문자열의 문자(문자열)를 바꿉니다. Jul 25, 2023 pm 05:16 PM

Java의 String.replace() 함수를 사용하여 문자열의 문자(문자열) 바꾸기 Java에서 문자열은 불변 객체입니다. 즉, 문자열 객체가 생성되면 해당 값을 수정할 수 없습니다. 그러나 문자열에서 특정 문자나 문자열을 바꿔야 하는 상황이 발생할 수 있습니다. 이때 Java의 String 클래스에 있는 replacement() 메소드를 사용하여 문자열 교체를 구현할 수 있습니다. String 클래스의 replacement() 메소드에는 두 가지 유형이 있습니다.

2w 단어 자세한 설명 문자열, yyds 2w 단어 자세한 설명 문자열, yyds Aug 24, 2023 pm 03:56 PM

안녕하세요 여러분, 오늘은 Java: String에 대한 기본 지식을 여러분과 공유하겠습니다. String 클래스의 중요성은 말할 필요도 없이 우리 백엔드 개발에서 가장 많이 사용되는 클래스라고 할 수 있으므로 이에 대해 이야기할 필요가 있다.

Golang 함수 바이트, 룬, 문자열 타입 변환 스킬 Golang 함수 바이트, 룬, 문자열 타입 변환 스킬 May 17, 2023 am 08:21 AM

Golang 프로그래밍에서 바이트, 룬 및 문자열 유형은 매우 기본적이고 일반적인 데이터 유형입니다. 문자열 및 파일 스트림과 같은 데이터 작업을 처리하는 데 중요한 역할을 합니다. 이러한 데이터 작업을 수행할 때 일반적으로 서로 변환해야 하며, 이를 위해서는 일부 변환 기술을 숙달해야 합니다. 이 기사에서는 독자가 이러한 데이터 유형을 더 잘 이해하고 프로그래밍 실습에 능숙하게 적용할 수 있도록 돕기 위해 Golang 함수의 바이트, 룬 및 문자열 유형 변환 기술을 소개합니다.

Jul 25, 2023 am 09:09 AM

문자열의 길이를 얻으려면 Java의 String.length() 함수를 사용하십시오. Java 프로그래밍에서 문자열은 문자열의 길이, 즉 문자열의 문자 수를 가져와야 하는 경우가 많습니다. Java에서는 String 클래스의 length() 함수를 사용하여 문자열의 길이를 얻을 수 있습니다. 다음은 간단한 예제 코드입니다: publicclassStringLengthExample{publ

자바의 String 클래스를 사용하는 방법 자바의 String 클래스를 사용하는 방법 Apr 19, 2023 pm 01:19 PM

1. String1. JDK의 문자열 이해 먼저 JDK의 String 클래스 소스 코드를 살펴보면 String 클래스가 final로 수정되는 것을 볼 수 있습니다. String 클래스의 하위 클래스가 없으므로 JDK를 사용하는 모든 사람들이 동일한 String 클래스를 사용합니다. String 상속이 허용되면 모든 사람이 사용하는 String 클래스가 동일한 버전이 아닙니다. 서로 다른 두 사람이 동일한 메서드를 사용하면 결과가 달라져 코드 개발이 불가능해집니다. 상속과 메서드 재정의는 유연성을 제공할 뿐만 아니라 많은 하위 클래스가 다르게 동작하게 만듭니다.

Java 문자열에서 분할 방법을 사용하는 방법 Java 문자열에서 분할 방법을 사용하는 방법 May 02, 2023 am 09:37 AM

String의 분할 메서드는 String의 분할() 메서드를 사용하여 들어오는 문자나 문자열에 따라 문자열을 분할하고 분할 배열을 반환합니다. 1. 일반적인 사용법 @ 또는 같은 일반 문자를 구분 기호로 사용하는 경우: Stringaddress="Shanghai@Shanghai City@Minhang District@Wuzhong Road";String[]splitAddr=address.split("@");System .out. println(splitAddr[0]+splitAddr[1]+splitAddr[2]+splitAddr[3

See all articles