다양한 방법을 사용하여 중국어 문자열을 완벽하게 차단함으로써 mbstring 및 iconv 확장을 설치하지 않고도 UTF-8, GBK, GB2312, BIG5 인코딩이 지원됩니다. 위 확장 프로그램을 설치하면 더 많은 인코딩이 지원됩니다. 기능 설명.
세 가지 방법이 있습니다
1. mb_substr()에는 mbstring 확장이 필요합니다
2. iconv_substr()에는 iconv 확장이 필요합니다
3. 기본적으로 지원됩니다.
세 가지 방법이 우선적으로 적용됩니다. 하단 이전 방법을 사용할 수 없는 경우 자동으로 다음 방법이 사용됩니다.
이 코드는 Midnight에서 발표한 "문자열 가로채기, 공통 인코딩 지원" 코드에서 최적화되었습니다
1. mb_substr 및 iconv_substr이 원본 코드에서 반환되지 않도록 수정합니다. 잘못된 호출
2. 문자열 접미사 차단을 최적화하고 접미사를 사용자 정의할 수 있습니다. 기본값은 비어 있습니다.
<?php /** * 字符串截取,支持中文和其他编码 * * @param string $str 需要转换的字符串 * @param string $start 开始位置 * @param string $length 截取长度 * @param string $charset 编码格式 * @param string $suffix 截断字符串后缀 * @return string */ function substr_ext($str, $start=0, $length, $charset="utf-8", $suffix="") { if(function_exists("mb_substr")){ return mb_substr($str, $start, $length, $charset).$suffix; } elseif(function_exists('iconv_substr')){ return iconv_substr($str,$start,$length,$charset).$suffix; } $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/"; $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/"; $re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/"; $re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/"; preg_match_all($re[$charset], $str, $match); $slice = join("",array_slice($match[0], $start, $length)); return $slice.$suffix; }