Rumah pembangunan bahagian belakang tutorial php php 中文字符串截取有关问题?

php 中文字符串截取有关问题?

Jun 13, 2016 am 10:21 AM
quot str string substr

php 中文字符串截取问题???
因为用substr()函数截取中文字符串会出现问题,所以我就上网找了一个函数,如下:

PHP code
<!--Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->//中文字符串截取无乱码函数function cut_str($string, $start, $length) {   if(strlen($string)>$length){      $str = null;      $len = $start+$length;      for($i=$start;$i0xa0){           $str.=substr($string,$i,2);           $i++;        }else{            $str.=substr($string,$i,1);          }   }        return $str.'...';   }else{        return $string;   }}    
Salin selepas log masuk

但是用过之后还是会出现问题,比如我截取的是“利用滤镜及图层样式制作逼真的石块字”,
PHP code
<!--Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->$str = "利用滤镜及图层样式制作逼真的石块字";cut_str($str,0,50);
Salin selepas log masuk


但是效果出来了却是这样的:“利用滤镜及图层样式制作逼真的石块?...”,除了个问号一样的字符,我郁闷啊,上网查了一下,汉子在utf-8编码中一般占3个字节,但是这个函数中这里“$str.=substr($string,$i,2);”却截取2,这是什么意思呢??始终没有弄明啊。。。。如果我把2改成3后,那句就会变成“利?甔?滻??镜?及?图?山??样?弼??制?佽??逼?眜?的?石?坝?字...”,唉,,,真的被它搞败了,哪位大侠救救我啊。。。。。。。。。

------解决方案--------------------
怎么不用mb_substr()函数
------解决方案--------------------
你要确定你的编码。截取时指定编码。
------解决方案--------------------
它是以字节计算的。gbk编码。一个中文等于2个字节。
------解决方案--------------------
当然是mb_substr了,楼主对编码看样不太懂。。。

utf8中文编码2-3个字符很常见,但非ASCII字符的单字节一定是第7位为1的,与ASCII单字节是不冲突的,GBK码也是类似的。

请用mb_substr,它会自动根据utf8编码范围识别多字节字符的。
------解决方案--------------------
这个函数只适用于gbk编码

探讨

哈哈,研究了下手册,刚搞定,就是你说的,确定一下编码,但是我想知道那个函数为啥不行啊??那个貌似是php面试的答案诶。前辈能否指点一二,特别是那里的2,utf-8中汉子明明是3-4个字符啊,而且常用的是3个字符啊。。。。。麻烦了

------解决方案--------------------
PHP code
/**************************** * subCNchar() 截取汉字 * * [$str]     [要截取的字符串] * [$start]   [截取的起始位置] * [$length]  [要截取的长度] * [$charset] [字符串编码] ****************************/function subCNchar($str, $start = 0, $length, $charset = "utf-8") {    if (strlen($str) <font color="#e78608">------解决方案--------------------</font><br>为什么不能在后面加上.....<br>echo mb_strlen($str,'utf-8')>10 ? mb_substr($str,0,10,'utf-8').'...' : $str;<br><font color="#e78608">------解决方案--------------------</font><br>加"..."见12楼,  <br><br>如果你非要改这个函数,utf8的编码很有规律,就是下面几种,除ascii码部分外,<br>第一个字节都是11开头,连续的1的个数代表了总字节数,后续字节都是10开头<br>其中汉字基本在3个字节的区.  <br>知道了这个规律,写个函数应该很容易吧?<br>U+007F	   0xxxxxxx<br>U+07FF	   110xxxxx 10xxxxxx<br>U+FFFF	   1110xxxx 10xxxxxx 10xxxxxx<br>U+1FFFFF   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx<br>U+3FFFFFF  111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx<br>U+7FFFFFFF 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx<br><br><br><br>
Salin selepas log masuk
探讨

那这个函数能不能改成utf-8的??mb_substr()貌似不能在未输出完的字符结尾加上“...”诶,这样影响效果,求解

------解决方案--------------------
你可以用mb_strimwidth函数
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tukar jenis data asas kepada rentetan menggunakan fungsi String.valueOf() Java Tukar jenis data asas kepada rentetan menggunakan fungsi String.valueOf() Java Jul 24, 2023 pm 07:55 PM

Tukar jenis data asas kepada rentetan menggunakan fungsi String.valueOf() Java Dalam pembangunan Java, apabila kita perlu menukar jenis data asas kepada rentetan, kaedah biasa ialah menggunakan fungsi valueOf() kelas String. Fungsi ini boleh menerima parameter jenis data asas dan mengembalikan perwakilan rentetan yang sepadan. Dalam artikel ini, kami akan meneroka cara menggunakan fungsi String.valueOf() untuk penukaran jenis data asas dan menyediakan beberapa contoh kod untuk

Bagaimana untuk menukar tatasusunan char kepada rentetan Bagaimana untuk menukar tatasusunan char kepada rentetan Jun 09, 2023 am 10:04 AM

Kaedah menukar tatasusunan char kepada rentetan: Ia boleh dicapai dengan penugasan Gunakan sintaks {char a[]=" abc d\0efg ";string s=a;} untuk membenarkan tatasusunan char terus memberikan nilai kepada rentetan, dan laksanakan. kod untuk melengkapkan penukaran.

Gunakan fungsi String.replace() Java untuk menggantikan aksara (rentetan) dalam rentetan Gunakan fungsi String.replace() Java untuk menggantikan aksara (rentetan) dalam rentetan Jul 25, 2023 pm 05:16 PM

Gantikan aksara (rentetan) dalam rentetan menggunakan fungsi String.replace() Java Dalam Java, rentetan ialah objek tidak boleh ubah, yang bermaksud apabila objek rentetan dicipta, nilainya tidak boleh diubah suai. Walau bagaimanapun, anda mungkin menghadapi situasi di mana anda perlu menggantikan aksara atau rentetan tertentu dalam rentetan. Pada masa ini, kita boleh menggunakan kaedah replace() dalam kelas String Java untuk melaksanakan penggantian rentetan. Kaedah replace() kelas String mempunyai dua jenis:

2w perkataan penjelasan terperinci String, yyds 2w perkataan penjelasan terperinci String, yyds Aug 24, 2023 pm 03:56 PM

Salam semua, hari ini saya akan berkongsi dengan anda pengetahuan asas Java: String. Tidak perlu diperkatakan kepentingan kelas String, ia boleh dikatakan sebagai kelas yang paling banyak digunakan dalam pembangunan back-end kami, jadi adalah perlu untuk membincangkannya.

Kemahiran penukaran jenis bait fungsi Golang, rune dan rentetan Kemahiran penukaran jenis bait fungsi Golang, rune dan rentetan May 17, 2023 am 08:21 AM

Dalam pengaturcaraan Golang, jenis bait, rune dan rentetan adalah jenis data yang sangat asas dan biasa. Mereka memainkan peranan penting dalam memproses operasi data seperti rentetan dan aliran fail. Apabila melakukan operasi data ini, kita biasanya perlu menukarnya kepada satu sama lain, yang memerlukan penguasaan beberapa kemahiran penukaran. Artikel ini akan memperkenalkan teknik penukaran jenis bait, rune dan rentetan bagi fungsi Golang, bertujuan untuk membantu pembaca memahami dengan lebih baik jenis data ini dan dapat mengaplikasikannya dengan mahir dalam amalan pengaturcaraan.

Gunakan fungsi String.length() java untuk mendapatkan panjang rentetan Gunakan fungsi String.length() java untuk mendapatkan panjang rentetan Jul 25, 2023 am 09:09 AM

Gunakan fungsi String.length() Java untuk mendapatkan panjang rentetan Dalam pengaturcaraan Java, rentetan ialah jenis data yang sangat biasa Kita selalunya perlu mendapatkan panjang rentetan, iaitu bilangan aksara dalam rentetan. Di Java, kita boleh menggunakan fungsi length() kelas String untuk mendapatkan panjang rentetan. Berikut ialah kod contoh mudah: publicclassStringLengthExample{publ

Bagaimana untuk menggunakan kelas String java Bagaimana untuk menggunakan kelas String java Apr 19, 2023 pm 01:19 PM

1. Memahami String1 dalam JDK Pertama, mari kita lihat kod sumber kelas String dalam JDK Ia melaksanakan banyak antara muka. Anda boleh melihat bahawa kelas String diubah suai diwarisi dan tiada subkelas kelas String, supaya semua orang yang menggunakan JDK menggunakan kelas String yang sama dua orang yang berbeza Menggunakan kaedah yang sama menunjukkan hasil yang berbeza, yang menjadikannya mustahil untuk membangunkan kod Warisan dan kaedah mengatasi bukan sahaja membawa fleksibiliti, tetapi juga menyebabkan banyak subkelas berkelakuan berbeza.

Cara menggunakan kaedah split dalam Java String Cara menggunakan kaedah split dalam Java String May 02, 2023 am 09:37 AM

Kaedah split dalam String menggunakan kaedah split() String untuk memisahkan String mengikut aksara atau rentetan yang masuk dan mengembalikan tatasusunan split. 1. Penggunaan umum Apabila menggunakan aksara umum, seperti @ atau, sebagai pemisah: Stringaddress="Shanghai@Shanghai City@Minhang District@Wuzhong Road";String[]splitAddr=address.split("@");System .out. println(splitAddr[0]+splitAddr[1]+splitAddr[2]+splitAddr[3

See all articles