중국어, 영어 멀티코드 문자의 왜곡된 문자를 가로채는 문제를 스마트하게 해결-PHP 튜토리얼-php.cn

집

백엔드 개발

PHP 튜토리얼

중국어, 영어 멀티코드 문자의 왜곡된 문자를 가로채는 문제를 스마트하게 해결

PHP中文网

Jul 25, 2016 am 08:59 AM

smarty 왜곡된 문자 성격 가로채기 해결책

이 글은 주로 스마트하게 중국어와 영어 다중 코드 문자를 가로채는 문제에 대한 해결책을 소개합니다. 여기에는 원래의 smartTruncate를 수정하는 내용이 포함되어 있어 도움이 필요한 친구들이 참고할 수 있습니다. 🎜>

본 글에서는 스마트티를 이용하여 중국어, 영어 멀티인코딩 문자에서 깨져있는 문자를 가로채는 문제에 대한 해결 방법을 찾아낸 예시를 설명하고 있으며, 참고용으로 공유하고자 합니다. 구체적인 방법은 다음과 같습니다.

일반 웹사이트 페이지 표시에는 필연적으로 부분 문자열이 가로채어지게 됩니다. 이때 truncate가 유용하지만, 영어 사용자에게만 적합합니다. 잘림으로 인해 문자가 깨질 수 있으며, 중국어와 영어가 혼합된 문자열의 경우 동일한 수의 문자열을 가로채면 실제 표시 길이가 달라져 시각적으로 고르지 않게 나타나 모양에 영향을 줍니다. 한자의 길이가 대략 영어 두 글자의 길이와 같기 때문이다. 또한 truncate는 GB2312, UTF-8 및 기타 인코딩과 동시에 호환되지 않습니다.

smartTruncate 개선: 파일 이름: modifier.smartTruncate.php
구체 코드는 다음과 같습니다.

코드는 다음과 같습니다.

<?php 
function smartDetectUTF8($string) 
{ 
    static $result = array();
    if(! array_key_exists($key = md5($string), $result)) 
    { 
        $utf8 = " 
            /^(?: 
                [\x09\x0A\x0D\x20-\x7E]                            # ASCII 
                | [\xC2-\xDF][\x80-\xBF]                             # non-overlong 2-byte 
                | \xE0[\xA0-\xBF][\x80-\xBF]                       # excluding overlongs 
                | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}           # straight 3-byte 
                | \xED[\x80-\x9F][\x80-\xBF]                      # excluding surrogates 
                | \xF0[\x90-\xBF][\x80-\xBF]{2}                 # planes 1-3 
                | [\xF1-\xF3][\x80-\xBF]{3}                          # planes 4-15 
                | \xF4[\x80-\x8F][\x80-\xBF]{2}                  # plane 16 
            )+$/xs 
        ";
        $result[$key] = preg_match(trim($utf8), $string); 
    }
    return $result[$key]; 
}
function smartStrlen($string) 
{ 
    $result = 0;
    $number = smartDetectUTF8($string) ? 3 : 2;
    for($i = 0; $i < strlen($string); $i += $bytes) 
    { 
        $bytes = ord(substr($string, $i, 1)) > 127 ? $number : 1;
        $result += $bytes > 1 ? 1.0 : 0.5; 
    }
    return $result; 
}
function smartSubstr($string, $start, $length = null) 
{ 
    $result = &#39;&#39;&#39;&#39;;
    $number = smartDetectUTF8($string) ? 3 : 2;
    if($start < 0) 
    { 
        $start = max(smartStrlen($string) + $start, 0); 
    }
    for($i = 0; $i < strlen($string); $i += $bytes) 
    { 
        if($start <= 0) 
        { 
            break; 
        }
        $bytes = ord(substr($string, $i, 1)) > 127 ? $number : 1;
        $start -= $bytes > 1 ? 1.0 : 0.5; 
    }
    if(is_null($length)) 
    { 
        $result = substr($string, $i); 
    } 
    else 
    { 
        for($j = $i; $j < strlen($string); $j += $bytes) 
        { 
            if($length <= 0) 
            { 
                break; 
            }
            if(($bytes = ord(substr($string, $j, 1)) > 127 ? $number : 1) > 1) 
            { 
                if($length < 1.0) 
                { 
                    break; 
                }
                $result .= substr($string, $j, $bytes); 
                $length -= 1.0; 
            } 
            else 
            { 
                $result .= substr($string, $j, 1); 
                $length -= 0.5; 
            } 
        } 
    }
    return $result; 
}
function smarty_modifier_smartTruncate($string, $length = 80, $etc = &#39;&#39;...&#39;&#39;, 
                                       $break_words = false, $middle = false) 
{ 
    if ($length == 0) 
        return &#39;&#39;&#39;&#39;;
    if (smartStrlen($string) > $length) { 
        $length -= smartStrlen($etc); 
        if (!$break_words && !$middle) { 
            $string = preg_replace(&#39;&#39;/\s+?(\S+)?$/&#39;&#39;, &#39;&#39;&#39;&#39;, smartSubstr($string, 0, $length+1)); 
        } 
        if(!$middle) { 
            return smartSubstr($string, 0, $length).$etc; 
        } else { 
            return smartSubstr($string, 0, $length/2) . $etc . smartSubstr($string, -$length/2); 
        } 
    } else { 
        return $string; 
    } 
} 
?>

로그인 후 복사

위 코드는 완전히 구현되었습니다. 원래의 truncate 기능을 가지며 GB2312 및 UTF-8 인코딩과 모두 호환됩니다. 문자 길이를 판단할 때 한자는 1.0, 영어는 0.5로 계산되므로 플러그인 사용에는 특별한 상황이 없습니다.
다음은 간단한 테스트입니다.
코드는 다음과 같습니다.

표시: A in B Hua C.. (중국어 기호 길이는 1.0, 영어 기호 길이는 0.5, 길이는 생략된 기호 고려)

{$content|smartTruncate:5:".."}（$content等于"A中B华C人D民E共F和G国H"）

로그인 후 복사

GB2312 인코딩을 사용하든 UTF-8 인코딩을 사용하든 결과가 올바른 것을 알 수 있는데, 이것이 제가 플러그인 이름에 smart라는 단어를 추가하는 이유 중 하나입니다.

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7561

Cakephp 튜토리얼

1384

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

부트 스트랩 테이블이 ajax를 사용하여 데이터를 잡아 당기면해야 할 일 Apr 07, 2025 am 11:54 AM

서버에서 데이터를 얻기 위해 ajax를 사용하는 시점에 달린 부트 스트랩 코드에 대한 솔루션 : 1. 서버 측 코드 (예 : UTF-8)의 올바른 문자 인코딩을 설정하십시오. 2. AJAX 요청에서 요청 헤더를 설정하고 허용 된 문자 인코딩 (수락-차 세트)을 지정하십시오. 3. 부트 스트랩 테이블의 "Unescape"변환기를 사용하여 탈출 한 HTML 엔티티를 원래 문자로 해독하십시오.

부트 스트랩 목록에서 기본 스타일을 제거하는 방법은 무엇입니까? Apr 07, 2025 am 10:18 AM

부트 스트랩 목록의 기본 스타일은 CSS 재정의 상태에서 제거 할 수 있습니다. 보다 구체적인 CSS 규칙 및 선택기를 사용하여 부트 스트랩 기본 스타일을 우선적으로 "근접성 원리"및 "가중치 원리"를 따르십시오. 스타일 충돌을 피하기 위해보다 타겟팅 된 선택기를 사용할 수 있습니다. 재정의가 실패한 경우 사용자 정의 CS의 무게를 조정하십시오. 동시에 성능 최적화에주의를 기울이고, 과도하게 사용하지 않으며, 간결하고 효율적인 CSS 코드를 작성하십시오.

데이터베이스에 대한 Navicat의 솔루션을 연결할 수 없습니다 Apr 08, 2025 pm 11:12 PM

다음 단계는 Navicat이 데이터베이스에 연결할 수없는 문제를 해결하는 데 사용될 수 있습니다. 서버 연결을 확인하고 서버가 실행되고 주소 및 포트가 올바르게 작동하는지 확인하고 방화벽에서 연결을 허용합니다. 로그인 정보를 확인하고 사용자 이름, 암호 및 권한이 올바른지 확인하십시오. 네트워크 연결을 확인하고 라우터 또는 방화벽 고장과 같은 네트워크 문제를 해결하십시오. 일부 서버에서 지원하지 않을 수있는 SSL 연결을 비활성화하십시오. Navicat 버전이 대상 데이터베이스와 호환되는지 확인하려면 데이터베이스 버전을 확인하십시오. 연결 시간 초과를 조정하고 원격 또는 느린 연결의 경우 연결 시간 초과를 늘리십시오. 다른 해결 방법, 위의 단계가 작동하지 않으면 소프트웨어를 다시 시작하거나 다른 연결 드라이버를 사용하거나 데이터베이스 관리자 또는 공식 Navicat 지원을 컨설팅 할 수 있습니다.

특정 시스템 버전에서 MySQL이보고 한 오류에 대한 솔루션 Apr 08, 2025 am 11:54 AM

MySQL 설치 오류에 대한 솔루션은 다음과 같습니다. 1. MySQL 종속성 라이브러리 요구 사항이 충족되도록 시스템 환경을주의 깊게 확인하십시오. 다른 운영 체제 및 버전 요구 사항이 다릅니다. 2. 오류 메시지를주의 깊게 읽고 프롬프트 (예 : 라이브러리 파일 누락 또는 부족한 권한)에 따라 종속성 설치 또는 Sudo 명령 사용과 같은 해당 조치를 취합니다. 3. 필요한 경우 소스 코드를 설치하고 컴파일 로그를주의 깊게 확인하십시오. 그러나 일정량의 Linux 지식과 경험이 필요합니다. 궁극적으로 문제를 해결하는 핵심은 시스템 환경 및 오류 정보를 신중하게 확인하고 공식 문서를 참조하는 것입니다.

MySQL을 해결하는 방법은 로컬 호스트에 연결할 수 없습니다 Apr 08, 2025 pm 02:24 PM

MySQL 연결은 다음과 같은 이유로 인한 것일 수 있습니다. MySQL 서비스가 시작되지 않았고 방화벽이 연결을 가로 채고 포트 번호가 올바르지 않으며 사용자 이름 또는 비밀번호가 올바르지 않으며 My.cnf의 청취 주소가 부적절하게 구성되어 있습니다. 1. MySQL 서비스가 실행 중인지 확인합니다. 2. MySQL이 포트 3306을들을 수 있도록 방화벽 설정을 조정하십시오. 3. 포트 번호가 실제 포트 번호와 일치하는지 확인하십시오. 4. 사용자 이름과 암호가 올바른지 확인하십시오. 5. my.cnf의 바인드 아드 드레스 설정이 올바른지 확인하십시오.

MySQL에 루트로 로그인 할 수 없습니다 Apr 08, 2025 pm 04:54 PM

Root로 MySQL에 로그인 할 수없는 주된 이유는 권한 문제, 구성 파일 오류, 암호 일관성이 없음, 소켓 파일 문제 또는 방화벽 차단입니다. 솔루션에는 다음이 포함됩니다. 구성 파일의 BAND-ADDRESS 매개 변수가 올바르게 구성되어 있는지 확인하십시오. 루트 사용자 권한이 수정 또는 삭제되어 재설정되었는지 확인하십시오. 케이스 및 특수 문자를 포함하여 비밀번호가 정확한지 확인하십시오. 소켓 파일 권한 설정 및 경로를 확인하십시오. 방화벽이 MySQL 서버에 연결되는지 확인하십시오.

VUE에서 내보내기 기본값을 사용하는 방법 Apr 07, 2025 pm 07:21 PM

Vue의 내보내기 기본값은 다음과 같이 밝혀집니다. 기본 내보내기, 이름을 지정하지 않고 전체 모듈을 한 번에 가져옵니다. 컴포넌트는 컴파일 시간에 모듈로 변환되며 사용 가능한 모듈은 빌드 도구를 통해 포장됩니다. 상수 또는 함수와 같은 다른 컨텐츠와 같은 지명 된 수출 및 내보내기와 결합 할 수 있습니다. 자주 묻는 질문에는 원형 종속성, 경로 오류 및 구축 오류가 포함되며, 코드 및 가져 오기 문을주의 깊게 조사해야합니다. 모범 사례에는 코드 세분화, 가독성 및 구성 요소 재사용이 포함됩니다.

PHP 및 부트 스트랩 테이블에서 차량 코드 문제를 해결하는 방법 Apr 07, 2025 am 11:27 AM

부트 스트랩 테이블을 사용하여 중국어가 달린 코드를 표시하는 솔루션 : 1. PHP 문자를 UTF-8로 설정하십시오. 2. PHP 스크립트에 설정된 문자를 설정하십시오. 3. 데이터베이스 문자 세트가 UTF-8인지 확인하십시오. 4. 부트 스트랩 테이블의 문자 세트를 "Zh-CN"으로 설정하십시오. 5. MBString을 사용하여 캐스트 캐릭터 세트를 확장하십시오. 6. 다른 인코딩으로부터의 트랜스 코드 데이터; 7. 브라우저 인코딩을 확인하십시오.

See all articles