> 백엔드 개발 > PHP 문제 > PHP substr이 잘못된 문자열을 가로채면 어떻게 해야 할까요?

PHP substr이 잘못된 문자열을 가로채면 어떻게 해야 할까요?

藏色散人
풀어 주다: 2023-03-08 18:48:01
원래의
2713명이 탐색했습니다.

잘못된 문자열을 가로채는 php substr에 대한 솔루션: 1. 가로채려면 mbstring 확장 라이브러리의 "mb_substr()"을 사용하고 구문은 "mb_substr(string, 시작 위치, 문자 길이, "문자 인코딩")"입니다. . ecshop 사용 내부 함수는 UTF-8로 인코딩된 문자열을 가로챕니다.

PHP substr이 잘못된 문자열을 가로채면 어떻게 해야 할까요?

이 기사의 운영 환경: Windows 7 시스템, PHP 8 버전, DELL G3 컴퓨터

PHP 프로그램 개발에서는 정보 목록을 출력할 때 제목이 포함되어서는 안 되는 등 문자열 가로채기 작업이 자주 수행됩니다. 너무 길어서 기사 요약을 인쇄하려면 일련의 문자열 가로채기 작업도 수행해야 합니다. 이러한 요구 사항에 직면하면 이를 달성하기 위해 substr() 메서드를 사용하는 것이 전체 영어 문자열을 가로채는 데 더 적합하다고 생각하는 경우가 많습니다.

하지만 문자열에 중국어 문자가 나타나면 PHP substr 중국어 문자가 깨질 수 있습니다. 중국어 UTF-8 인코딩에서는 각 중국어 문자가 3바이트를 차지하고 GB2312는 2바이트, 영어는 1바이트를 차지하고 숫자는 숫자가 가로채어짐 부정확함, substr()은 강제로 한자를 반으로 "톱질"하여 깨진 문자가 다음 문자를 함께 끌어와서 단어를 만들게 하므로 PHP substr 중국어 문자가 깨져서 나타납니다.

substr --- 문자열의 일부 가져오기

구문: string substr (string string, int start [, int length])

설명:

  • substr()은 start 및 length 매개 변수로 지정된 문자열의 일부를 반환합니다.

  • start가 양수이면 반환된 문자열은 문자열의 시작 문자부터 시작됩니다.

예:

<?php
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
?>
로그인 후 복사

start가 음수인 경우 반환된 문자열은 문자열 끝의 시작 단어부터 시작됩니다.

예:

<?php
$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
?>
로그인 후 복사

매개변수 길이가 지정되고 양수인 경우 반환된 문자열은 시작부터 길이 문자를 반환합니다.
매개변수 길이가 음수인 경우 반환된 문자열은 문자열 끝에서 길이 번째 문자에서 끝납니다.

예:

<?php
$rest = substr ("abcdef", 1, -1); // returns "bcde"
?>
로그인 후 복사

영어에는 문제가 없습니다. 우리는 중국어를 테스트합니다.

<?php
$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了
?>
로그인 후 복사

문자를 가로채는 결과는 확실히 우리가 원하는 결과가 아닙니다. 중국어로 왜곡된 PHP 하위 문자열로 인해 프로그램이 제대로 작동하지 않을 수 있습니다. 두 가지 주요 해결 방법이 있습니다:

1. mbstring 확장 라이브러리의 mb_substr()을 사용하여 가로채서 잘못된 문자가 나타나지 않도록 합니다.

mb_substr()/mb_strcut() 함수를 사용할 수 있습니다. mb_substr()/mb_strcut()의 사용법은 mb_substr() 끝에 매개변수를 하나 더 추가해야 한다는 점을 제외하면 substr()과 유사합니다. /mb_strcut은 문자열 인코딩을 설정하지만 대부분의 서버는 php_mbstring.dll을 열지 않습니다. php.ini에서 php_mbstring.dll을 열어야 합니다.

<?php
  echo mb_substr("php中文字符encode",0,4,"utf-8");
?>
로그인 후 복사

마지막 인코딩 매개변수를 지정하지 않으면 3바이트가 한자 1문자로 사용됩니다. 이는 utf-8 문자 집합 설명을 추가하면 의 단위로 가로채게 됩니다. 한 마디.

사용시 php파일의 인코딩과 웹페이지 표시시 인코딩에 주의하세요. 이 mb_substr 메소드를 사용하려면 문자열의 인코딩을 미리 알아야 하며, 인코딩을 모른다면 판단이 필요합니다. mbstring 라이브러리에서는 문자열 인코딩을 확인할 수 있는 mb_check_encoding도 제공하지만 아직 완벽하지는 않습니다. .

PHP에는 여러 문자열 차단 기능이 포함되어 있으며 그 중 substr 및 mb_substr이 일반적으로 사용됩니다. 전자가 중국어를 처리할 때 GBK는 2길이 단위이고, UTF는 3길이 단위이다. 후자는 인코딩을 지정한 후 한자 1자가 1길이 단위가 된다.

substr은 때때로 중국어의 1/3 또는 절반을 잘라내어 문자가 왜곡되어 표시되는 경우가 있습니다. 상대적으로 말하면 mb_substr이 우리가 사용하기에 더 적합합니다. 그러나 때때로 mb_substr은 사용하기 쉽지 않습니다. 예를 들어 작은 그림의 간략한 정보를 표시하고 싶다면 한자는 5자가 딱 맞고, 5자가 넘으면 처음 4자를 가로채서 "..."만 추가하면 됩니다. 중국어이지만 영어나 숫자를 처리할 때 이 차단이 너무 짧습니다.

2. 차단 기능을 직접 작성하지만 mbstring 확장 라이브러리를 사용하는 것만큼 효율성이 높지 않습니다. 다음은 UTF-8로 인코딩된 문자열을 가로채는 ecshop의 함수입니다.

function sub_str($str, $length = , $append = true)
{
  $str = trim($str);
  $strlength = strlen($str);
  if ($length == || $length >= $strlength)
  {
    return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身
  }
  elseif ($length < ) //如果截取长度为负数
  {
    $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度
    if ($length < )
    {
      $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度
    }
  }
  if (function_exists(&#39;mb_substr&#39;))
  {
    $newstr = mb_substr($str, , $length, EC_CHARSET);
  }
  elseif (function_exists(&#39;iconv_substr&#39;))
  {
    $newstr = iconv_substr($str, , $length, EC_CHARSET);
  }
  else
  {
    //$newstr = trim_right(substr($str, , $length));
    $newstr = substr($str, , $length);
  }
  if ($append && $str != $newstr)
  {
    $newstr .= &#39;...&#39;;
  }
  return $newstr;
}
로그인 후 복사

그렇습니다. 위의 코드도 매우 간단합니다. 이해가 되지 않는 부분이 있으면 메시지를 남겨주세요. 당신은 가능한 한 빨리.

추천 학습: "PHP 비디오 튜토리얼"

위 내용은 PHP substr이 잘못된 문자열을 가로채면 어떻게 해야 할까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
php
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿