首頁 後端開發 php教程 真正根据utf8编码的规律来进行截取字符串的函数(utf8版sub_str )_php技巧

真正根据utf8编码的规律来进行截取字符串的函数(utf8版sub_str )_php技巧

May 17, 2016 am 09:08 AM
utf8 截取字串

复制代码 代码如下:

/*
* 功能: 作用跟substr一样,除了它不会造成乱码
* 参数:
* 返回:
*/
function utf8_substr( $str , $start , $length=null ){
// 先正常截取一遍.
$res = substr( $str , $start , $length );
$strlen = strlen( $str );
/* 接着判断头尾各6字节是否完整(不残缺) */
// 如果参数start是正数
if ( $start >= 0 ){
// 往前再截取大约6字节
$next_start = $start + $length; // 初始位置
$next_len = $next_start + 6 $next_segm = substr( $str , $next_start , $next_len );
// 如果第1字节就不是 完整字符的首字节, 再往后截取大约6字节
$prev_start = $start - 6 > 0 ? $start - 6 : 0;
$prev_segm = substr( $str , $prev_start , $start - $prev_start );
}
// start是负数
else{
// 往前再截取大约6字节
$next_start = $strlen + $start + $length; // 初始位置
$next_len = $next_start + 6 $next_segm = substr( $str , $next_start , $next_len );
// 如果第1字节就不是 完整字符的首字节, 再往后截取大约6字节.
$start = $strlen + $start;
$prev_start = $start - 6 > 0 ? $start - 6 : 0;
$prev_segm = substr( $str , $prev_start , $start - $prev_start );
}
// 判断前6字节是否符合utf8规则
if ( preg_match( '@^([\x80-\xBF]{0,5})[\xC0-\xFD]?@' , $next_segm , $bytes ) ){
if ( !empty( $bytes[1] ) ){
$bytes = $bytes[1];
$res .= $bytes;
}
}
// 判断后6字节是否符合utf8规则
$ord0 = ord( $res[0] );
if ( 128 = $ord0 ){
// 往后截取 , 并加在res的前面.
if ( preg_match( '@[\xC0-\xFD][\x80-\xBF]{0,5}$@' , $prev_segm , $bytes ) ){
if ( !empty( $bytes[0] ) ){
$bytes = $bytes[0];
$res = $bytes . $res;
}
}
}
return $res;
}

测试数据::
复制代码 代码如下:

$str = 'dfjdjf测13f试65&2数据fdj(1就mfe&……就';
var_dump( utf8_substr( $str , 22 , 12 ) ); echo '
';
var_dump( utf8_substr( $str , 22 , -6 ) ); echo '
';
var_dump( utf8_substr( $str , 9 , 12 ) ); echo '
';
var_dump( utf8_substr( $str , 19 , 12 ) ); echo '
';
var_dump( utf8_substr( $str , 28 , -6 ) ); echo '
';

显示结果::(截取无乱码, 欢迎大家测试, 提交bug)
string(12) "据fdj"
string(26) "据fdj(1就mfe&…"
string(13) "13f试65&2数"
string(12) "数据fd"
string(20) "dj(1就mfe&…"
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1657
14
CakePHP 教程
1415
52
Laravel 教程
1309
25
PHP教程
1257
29
C# 教程
1230
24
utf8編碼漢字佔多少位元組 utf8編碼漢字佔多少位元組 Feb 21, 2023 am 11:40 AM

utf8編碼漢字佔3個位元組。在UTF-8編碼中,一個中文等於三個位元組,一個中文標點佔三個位元組;而在Unicode編碼中,一個中文(含繁體)等於兩個位元組。 UTF-8使用1~4位元組為每個字元編碼,一個US-ASCIl字元只需1位元組編碼,帶有變音符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文等字母則需要2位元組編碼。

如何在Go語言中截取字串 如何在Go語言中截取字串 Mar 13, 2024 am 08:33 AM

Go語言是一種強大且靈活的程式語言,它提供了豐富的字串處理功能,包括字串截取。在Go語言中,我們可以使用切片(slice)來截取字串。接下來,將詳細介紹如何在Go語言中截取字串,並附上具體的程式碼範例。一、使用切片截取字串在Go語言中,可以使用切片表達式來截取字串的一部分。切片表達式的語法如下:slice:=str[start:end]其中,s

go語言怎麼截取字串 go語言怎麼截取字串 Jan 12, 2023 pm 04:02 PM

截取方法:1、截取單個字符,語法“string[index]”,其中“string”表示來源字串,“index”表示要取得的字符下標;2、截取子串,語法“string[start : end ]”,其中“start”表示要截取的第一個字元所在的索引(截取時包含該字元),“end”表示要截取的最後一個字元所在的索引(不包含該字元);3、取得整個字串,語法“string[:]”。

node utf8漢字亂碼怎麼辦 node utf8漢字亂碼怎麼辦 Feb 08, 2023 am 10:29 AM

node utf8漢字亂碼的解決方法:1、透過「typeof」查看「SarchName」的型別;2、使用「Name=iconv.decode(name,'gbk')」方式轉換編碼為utf8即可。

如何使用MySQL中的LEFT函數截取字串的左邊部分 如何使用MySQL中的LEFT函數截取字串的左邊部分 Jul 12, 2023 pm 01:37 PM

如何使用MySQL中的LEFT函數截取字串的左邊部分在資料庫管理系統中,常常會遇到需要從字串中截取某部分的情況。 MySQL提供了許多內建的字串函數,其中包括LEFT函數,它可以用於截取字串的左邊部分。 LEFT函數的語法如下:LEFT(str,length)其中,str是要被截取的字串,length是要截取的長度。接下來,我們將透過程式碼範例來演示如

PHP中的substr()函數:如何截取字串的一部分 PHP中的substr()函數:如何截取字串的一部分 Nov 03, 2023 am 10:43 AM

PHP中的substr()函數:如何截取字串的一部分,需要具體程式碼範例在PHP程式設計中,字串的處理是非常常見的操作之一。而截取字串的一部分則是處理字串時常遇到的需求。在PHP中,我們可以使用內建的substr()函數來截取字串的一部分。本文將詳細介紹substr()函數的用法,並給出具體的程式碼範例。 substr()函數的基本用法如下:string

利用MySQL的LEFT函數截取字串的指定長度 利用MySQL的LEFT函數截取字串的指定長度 Jul 25, 2023 pm 05:04 PM

利用MySQL的LEFT函數截取字串的指定長度在MySQL中,我們經常需要對字串進行截取操作,以滿足特定需求。其中,LEFT函數是一個非常實用的函數,可以截取字串的指定長度。本文將介紹如何使用MySQL的LEFT函數進行字串截取,並給出程式碼範例。首先,我們要先了解LEFT函數的語法。 LEFT函數的基本語法如下:LEFT(string,lengt

MySQL中如何使用RIGHT函數截取字串的右邊部分 MySQL中如何使用RIGHT函數截取字串的右邊部分 Jul 12, 2023 am 10:20 AM

MySQL中如何使用RIGHT函數截取字串的右邊部分在MySQL中,RIGHT函數是用來截取字串右邊部分的函數。它接受兩個參數:待截取的字串和待截取的長度,傳回一個包含指定長度的字串。使用RIGHT函數可以非常方便地取得字串的右邊部分。下面我們將透過程式碼範例來示範如何使用RIGHT函數。首先,我們需要建立一個範例資料表,用於儲存待截取的字串。 CR

See all articles