在php中如果我要用substr()截取字符串全英文的沒問題,如果包括有中文或英文就會悲劇了,但大家也 別切我們可以使用其它辦法來解決。
php截取中文字串出現亂碼,這是最近發現的事情,先前我曾經寫過一篇關於自動生成meta信息的文章,那篇關於利用php截取文章前多少字作為description方法,但是出現了IE6無法載入CSS的現象,這裡做一個補充。
首先要明確這麼一個問題,之所以會出現IE6偶爾無法載入CSS的現象,是因為檔案出現了亂碼,導致後面的載入CSS的link無法被IE6正確解析。因此就看到了一個純HTML頁面,沒有CSS,赤裸裸!明確了問題,剩下的問題就好解決了,就是防止亂碼,既然萬戈所提供的函數出現了亂碼,就重新去找了一個php函數來解決這個亂碼的問題。
substr()函數可以分割文字,但要分割的文字如果包含中文字元往往會遇到問題。
mb_substr()這個函數的用法與substr()相似,只是在最後要加入多一個參數,以設定字串的編碼。
透過這裡大幾就應該理解我改進萬戈方法的原因了~~
下面再介紹幾個更高級處理辦法
例1
代碼字串編碼為UTF-8的,一個中文字元佔三個位元組:
public static function chinesesubstr($str, $start, $len) { // $str指字串,$start指字串的起始位置,$len指字串長度
$strlen = $start + $len; // 用$strlen儲存字串的總長度,即從字串的起始位置到字串的總長度
程式碼如下
function func_chgtitle($str,$len) { //$length我们允许字符串显示的最大长度 $tmpstr = ""; $strlen = $len; for($i = 0; $i < $strlen; $i++) { if(ord(substr($str, $i, 1)) > 0xa0) { $tmpstr .= substr($str, $i, 2); $i++; } else $tmpstr .= substr($str, $i, 1); } return $tmpstr; }