백엔드 개발 PHP 튜토리얼 PHP兑现中文字符的无乱码截断

PHP兑现中文字符的无乱码截断

Jun 13, 2016 am 10:49 AM
str substr

PHP实现中文字符的无乱码截断

PHP内置的substr()函数不能对中文字符进行很好的截断处理,对于一些中英文混合的字符会出现乱码的情况。下面提供两种解决函数。

?

1、GB2312编码方式的截断

?

function msubstr($str, $start, $len) {    if (strlen($str)-$start  0xa0) {   //0xa0 表示中文汉字编码的第一个编码字符ASCII 码值都大于0xa0            $tmpstr .= substr($str, $i, 2);            $i++;         } else            $tmpstr .= substr($str, $i, 1);     }     return $tmpstr . "...";} 
로그인 후 복사

?

2、utf8格式下的中文字符截断

?

UTF-8编码的字符可能由1~3个字节组成, 具体数目可以由第一个字节判断出来。(理论上可能更长,但这里假设不超过3个字节)

第一个字节大于224的,它与它之后的2个字节一起组成一个UTF-8字符

第一个字节大于192小于224的,它与它之后的1个字节组成一个UTF-8字符

否则第一个字节本身就是一个英文字符(包括数字和一小部分标点符号)。

?

//$sourcestr 是要处理的字符串//$cutlength 为截取的长度(即字数)function cut_str($sourcestr,$cutlength){   $returnstr='';   $i=0;   $n=0;   $str_length=strlen($sourcestr);//字符串的字节数   while (($n=224)    //如果ASCII位高与224,      {         $returnstr=$returnstr.substr($sourcestr,$i,3); //根据UTF-8编码规范,将3个连续的字符计为单个字符                  $i=$i+3;            //实际Byte计为3         $n++;            //字串长度计1      }       elseif ($ascnum>=192) //如果ASCII位高与192,      {         $returnstr=$returnstr.substr($sourcestr,$i,2); //根据UTF-8编码规范,将2个连续的字符计为单个字符         $i=$i+2;            //实际Byte计为2         $n++;            //字串长度计1      }       elseif ($ascnum>=65 && $ascnum$cutlength){          $returnstr = $returnstr . "...";//超过长度时在尾处加上省略号      }     return $returnstr;}
로그인 후 복사
?

?

?

?

1 楼 zeroneta 2011-09-26  
呵呵 那我就在来个 UTF-8截取无乱码
function utf8( $a, $s = '' )
{
preg_match_all( '/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/', $a, $d, PREG_PATTERN_ORDER );
return join( $s, $d[0] );
}

2 楼 zeroneta 2011-09-26  
调用方式


utf8( substr( '截取我', 0, 1 ) );

3 楼 bupt_roy 2011-09-29  
zeroneta 写道
调用方式


utf8( substr( '截取我', 0, 1 ) );

高手,学习学习,哈哈
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

PHP는 문자열의 첫 번째 문자의 ASCII 값을 반환합니다. PHP는 문자열의 첫 번째 문자의 ASCII 값을 반환합니다. Mar 21, 2024 am 11:01 AM

이 글에서는 PHP가 반환하는 문자열의 첫 번째 문자의 ASCII 값에 대해 자세히 설명할 것입니다. 편집자는 이것이 매우 실용적이라고 생각하므로 이 글을 읽으신 후 뭔가를 얻으실 수 있기를 바랍니다. PHP는 문자열의 첫 번째 문자에 대한 ASCII 값을 반환합니다. 소개 PHP에서 문자열의 첫 번째 문자에 대한 ASCII 값을 얻는 것은 문자열 처리 및 문자 인코딩에 대한 기본 지식이 필요한 일반적인 작업입니다. ASCII 값은 컴퓨터 시스템에서 문자의 숫자 값을 나타내는 데 사용되며 문자 비교, 데이터 전송 및 저장에 중요합니다. 문자열의 첫 번째 문자에 대한 ASCII 값을 가져오는 프로세스에는 다음 단계가 포함됩니다. 문자열 가져오기: ASCII 값을 가져오려는 문자열을 결정합니다. 변수 또는 문자열 상수일 수 있습니다.

PHP는 다른 문자열에 있는 문자열의 시작 위치부터 끝 ​​위치까지 문자열을 반환합니다. PHP는 다른 문자열에 있는 문자열의 시작 위치부터 끝 ​​위치까지 문자열을 반환합니다. Mar 21, 2024 am 10:31 AM

이 글은 PHP가 다른 문자열에서 문자열의 시작 위치부터 끝 ​​위치까지 문자열을 반환하는 방법을 자세히 설명합니다. 편집자는 이것이 꽤 실용적이라고 생각하므로 참고용으로 공유하겠습니다. 이 기사에서 뭔가를 얻을 수 있습니다. PHP에서 substr() 함수를 사용하여 문자열에서 부분 문자열을 추출합니다. substr() 함수는 문자열에서 지정된 범위 내의 문자를 추출할 수 있습니다. 구문은 다음과 같습니다. substr(string,start,length) 여기서: string: 하위 문자열을 추출할 원래 문자열입니다. start: 하위 문자열의 시작 위치에 대한 인덱스입니다(0부터 시작). 길이(선택 사항): 하위 문자열의 길이입니다. 지정하지 않은 경우

문자열을 가로채는 PHP의 substr() 함수 이해 문자열을 가로채는 PHP의 substr() 함수 이해 Nov 18, 2023 am 11:27 AM

문자열을 가로채기 위한 PHP의 substr() 함수 이해하기 PHP 언어에서 substr() 함수는 지정된 위치와 길이에서 문자열 조각을 가로채는 데 사용할 수 있는 매우 유용한 함수입니다. substr() 함수는 가로챌 문자열, 가로채기 시작 위치, 가로채기 길이 등 세 가지 매개 변수를 허용합니다. 아래에서는 substr() 함수의 사용법을 자세히 소개하고 구체적인 코드 예제를 제공합니다. substr() 함수의 기본 사용법 substr() 함수

Python 내장 유형 str 소스 코드 분석 Python 내장 유형 str 소스 코드 분석 May 09, 2023 pm 02:16 PM

1유니코드 컴퓨터 저장의 기본 단위는 8비트로 구성된 바이트(byte)이다. 영어는 26개의 문자와 여러 개의 기호로만 구성되므로 영어 문자를 바이트 단위로 직접 저장할 수 있습니다. 하지만 다른 언어(예: 중국어, 일본어, 한국어 등)는 문자 수가 많기 때문에 인코딩에 여러 바이트를 사용해야 합니다. 컴퓨터 기술이 확산됨에 따라 비라틴어 문자 인코딩 기술이 계속 발전하고 있지만 여전히 두 가지 주요 제한 사항이 있습니다. 다국어 지원이 불가능합니다. 한 언어의 인코딩 방식을 다른 언어에서 사용할 수 없으며 통일된 표준이 없습니다. 예를 들어 중국어에는 GBK, GB2312, GB18030 등과 같은 여러 인코딩 표준이 있습니다. 인코딩 방법이 통일되어 있지 않기 때문에 개발자는 서로 다른 인코딩 간에 전환해야 하며 많은 오류가 필연적으로 발생합니다.

Python에서 __str__과 __repr__의 유사점과 차이점은 무엇입니까? Python에서 __str__과 __repr__의 유사점과 차이점은 무엇입니까? Apr 29, 2023 pm 07:58 PM

__str__과 __repr__의 유사점과 차이점은 무엇입니까? 우리 모두는 문자열 표현을 알고 있습니다. Python의 내장 함수인 repr()은 식별을 용이하게 하기 위해 문자열 형식으로 객체를 표현할 수 있습니다. 이것이 "문자열 표현"입니다. repr()은 특수 메소드 __repr__을 통해 객체의 문자열 표현을 얻습니다. __repr__이 구현되지 않은 경우 벡터의 인스턴스를 콘솔에 인쇄하면 결과 문자열이 구현될 수 있습니다. >>>classExample:pass>>>print(str(Example()))>>>

PHP는 문자열의 첫 글자를 소문자로 변환합니다. PHP는 문자열의 첫 글자를 소문자로 변환합니다. Mar 21, 2024 pm 02:11 PM

이 기사에서는 PHP가 문자열의 첫 글자를 소문자로 변환하는 방법을 자세히 설명할 것입니다. 매우 실용적이라고 생각하므로 이 기사를 읽고 뭔가를 얻을 수 있기를 바랍니다. PHP 문자열의 첫 글자를 소문자로 변환하기 소개 PHP에서는 문자열의 첫 글자를 소문자로 변환하는 것이 일반적인 작업입니다. 이는 내장 함수 lcfirst() 또는 문자열 연산자 strtolower()를 사용하여 달성할 수 있습니다. 이 가이드에서는 두 가지 접근 방식을 모두 살펴보고 예제 코드와 모범 사례를 제공합니다. 방법 1: lcfirst() 함수 사용 lcfirst() 함수는 문자열의 첫 글자를 소문자로 변환하고 나머지 문자는 변경하지 않도록 특별히 설계되었습니다. 구문은 다음과 같습니다.

Jul 24, 2023 pm 10:13 PM

문자열의 하위 문자열을 얻으려면 PHP 함수 "substr"을 사용하십시오. PHP 프로그래밍에서는 문자열 내용의 일부를 가져와야 하는 상황에 자주 직면합니다. 이때 PHP 내장 함수 "substr"을 사용하여 이를 달성할 수 있습니다. 이 문서에서는 "substr" 함수를 사용하여 문자열의 하위 문자열을 가져오는 방법을 설명하고 몇 가지 코드 예제를 제공합니다. 1. substr 함수의 기본 사용법 substr 함수는 문자열에서 지정된 길이의 부분 문자열을 얻는 데 사용됩니다. 기본 구문은 다음과 같습니다: substr(

PHP mb_substr 함수가 잘못된 솔루션입니다. PHP mb_substr 함수가 잘못된 솔루션입니다. Mar 22, 2024 am 09:00 AM

잘못된 PHPmb_substr 함수에 대한 해결 방법 PHP 응용 프로그램을 개발할 때 mb_substr 함수는 문자열을 가로채는 데 자주 사용됩니다. 그러나 때로는 다양한 환경의 문자 인코딩 문제로 인해 mb_substr 함수가 유효하지 않은 상황이 발생할 수 있습니다. 이 문제를 해결하기 위해서는 mb_substr 함수를 효과적으로 처리해야 합니다. 일반적인 해결책은 mb_substr 함수가 다음을 수행할 수 있도록 하는 것입니다.

See all articles