백엔드 개발 PHP 튜토리얼 3바이트를 초과하는 utf8 문자 또는 utf8이 아닌 문자를 필터링합니다.

3바이트를 초과하는 utf8 문자 또는 utf8이 아닌 문자를 필터링합니다.

Jul 29, 2016 am 09:03 AM
amp continue str

function filterUtf8($str)
    {
        /*utf8 编码表:
        * Unicode符号范围           | UTF-8编码方式
        * u0000 0000 - u0000 007F   | 0xxxxxxx
        * u0000 0080 - u0000 07FF   | 110xxxxx 10xxxxxx
        * u0000 0800 - u0000 FFFF   | 1110xxxx 10xxxxxx 10xxxxxx
        *
        */
        $re = '';
        $str = str_split(bin2hex($str), 2);

        $mo =  1<<7;
        $mo2 = $mo | (1 << 6);
        $mo3 = $mo2 | (1 << 5);         //三个字节
        $mo4 = $mo3 | (1 << 4);          //四个字节
        $mo5 = $mo4 | (1 << 3);          //五个字节
        $mo6 = $mo5 | (1 << 2);          //六个字节


        for ($i = 0; $i < count($str); $i++)
        {
            if ((hexdec($str[$i]) & ($mo)) == 0)
            {
                $re .=  chr(hexdec($str[$i]));
                continue;
            }

            //4字节 及其以上舍去
            if ((hexdec($str[$i]) & ($mo6) )  == $mo6)
            {
                $i = $i +5;
                continue;
            }

            if ((hexdec($str[$i]) & ($mo5) )  == $mo5)
            {
                $i = $i +4;
                continue;
            }

            if ((hexdec($str[$i]) & ($mo4) )  == $mo4)
            {
                $i = $i +3;
                continue;
            }

            if ((hexdec($str[$i]) & ($mo3) )  == $mo3 )
            {
                $i = $i +2;
                if (((hexdec($str[$i]) & ($mo) )  == $mo) &&  ((hexdec($str[$i - 1]) & ($mo) )  == $mo)  )
                {
                    $r = chr(hexdec($str[$i - 2])).
                        chr(hexdec($str[$i - 1])).
                        chr(hexdec($str[$i]));
                    $re .= $r;
                }
                continue;
            }



            if ((hexdec($str[$i]) & ($mo2) )  == $mo2 )
            {
                $i = $i +1;
                if ((hexdec($str[$i]) & ($mo) )  == $mo)
                {
                    $re .= chr(hexdec($str[$i - 1])) . chr(hexdec($str[$i]));
                }
                continue;
            }
        }
        return $re;
    }
로그인 후 복사

위 내용은 내용을 포함하여 utf8 문자 또는 utf8이 아닌 문자에서 3바이트를 초과하는 문자 필터링에 대해 소개하고 있어 PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되기를 바랍니다.

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

AMP는 어떤 코인인가요? AMP는 어떤 코인인가요? Feb 24, 2024 pm 09:16 PM

AMP 코인이란 무엇입니까? AMP 토큰은 Synereo 플랫폼의 주요 거래 통화로 2015년 Synereo 팀에 의해 만들어졌습니다. AMP 토큰은 다양한 기능과 용도를 통해 사용자에게 더 나은 디지털 경제 경험을 제공하는 것을 목표로 합니다. AMP 토큰의 목적 AMP 토큰은 Synereo 플랫폼에서 다양한 역할과 기능을 가지고 있습니다. 첫째, 플랫폼의 암호화폐 보상 시스템의 일부로서 사용자는 콘텐츠를 공유하고 홍보함으로써 AMP 보상을 얻을 수 있으며, 이는 사용자가 플랫폼 활동에 보다 적극적으로 참여하도록 장려하는 메커니즘입니다. AMP 토큰은 Synereo 플랫폼에서 콘텐츠를 홍보하고 배포하는 데에도 사용할 수 있습니다. 사용자는 AMP 토큰을 사용하여 더 많은 시청자가 보고 공유하도록 유도함으로써 플랫폼에서 콘텐츠의 가시성을 높일 수 있습니다.

계속해서 현재 루프 또는 모든 루프에서 벗어나나요? 계속해서 현재 루프 또는 모든 루프에서 벗어나나요? Feb 02, 2023 pm 04:20 PM

계속은 현재 루프에서 벗어나는 것입니다. continue 문은 이 루프를 건너뛰고 다음 루프를 실행하는 데 사용됩니다. continue 문을 만나면 프로그램은 즉시 조건식을 다시 확인합니다. 표현식 결과가 false이면 다음 루프가 시작됩니다. 루프를 종료합니다.

PHP에서 continue 키워드의 역할과 사용 PHP에서 continue 키워드의 역할과 사용 Jun 28, 2023 pm 08:07 PM

PHP에서 continue 키워드의 역할과 사용법 PHP 프로그래밍에서 continue는 매우 유용한 키워드입니다. 루프 문의 실행 흐름을 제어하는 ​​데 사용되며 현재 루프의 나머지 코드를 건너뛰고 다음 루프 실행에 직접 들어갈 수 있습니다. continue의 기능은 루프 문의 현재 반복에서 코드를 건너뛰고 다음 반복을 직접 시작하는 것입니다. continue 문이 실행되면 루프 제어는 continue를 실행하지 않고 즉시 루프 본문의 시작 부분으로 이동합니다.

Python 내장 유형 str 소스 코드 분석 Python 내장 유형 str 소스 코드 분석 May 09, 2023 pm 02:16 PM

1유니코드 컴퓨터 저장의 기본 단위는 8비트로 구성된 바이트(byte)이다. 영어는 26개의 문자와 여러 개의 기호로만 구성되므로 영어 문자를 바이트 단위로 직접 저장할 수 있습니다. 하지만 다른 언어(예: 중국어, 일본어, 한국어 등)는 문자 수가 많기 때문에 인코딩에 여러 바이트를 사용해야 합니다. 컴퓨터 기술이 확산됨에 따라 비라틴어 문자 인코딩 기술이 계속 발전하고 있지만 여전히 두 가지 주요 제한 사항이 있습니다. 다국어 지원이 불가능합니다. 한 언어의 인코딩 방식을 다른 언어에서 사용할 수 없으며 통일된 표준이 없습니다. 예를 들어 중국어에는 GBK, GB2312, GB18030 등과 같은 여러 인코딩 표준이 있습니다. 인코딩 방법이 통일되어 있지 않기 때문에 개발자는 서로 다른 인코딩 간에 전환해야 하며 많은 오류가 필연적으로 발생합니다.

Python에서 __str__과 __repr__의 유사점과 차이점은 무엇입니까? Python에서 __str__과 __repr__의 유사점과 차이점은 무엇입니까? Apr 29, 2023 pm 07:58 PM

__str__과 __repr__의 유사점과 차이점은 무엇입니까? 우리 모두는 문자열 표현을 알고 있습니다. Python의 내장 함수인 repr()은 식별을 용이하게 하기 위해 문자열 형식으로 객체를 표현할 수 있습니다. 이것이 "문자열 표현"입니다. repr()은 특수 메소드 __repr__을 통해 객체의 문자열 표현을 얻습니다. __repr__이 구현되지 않은 경우 벡터의 인스턴스를 콘솔에 인쇄하면 결과 문자열이 구현될 수 있습니다. >>>classExample:pass>>>print(str(Example()))>>>

JS 루프 학습: 루프 문에서 벗어나 break and continue JS 루프 학습: 루프 문에서 벗어나 break and continue Aug 03, 2022 pm 07:08 PM

이전 기사에서는 JS의 여러 루프 제어 구조(while 및 do-while 루프, for 루프)에 대해 알아보았습니다. 루프에서 벗어나는 데 도움이 되기를 바랍니다. 모든 사람!

Java에서 continue 문을 사용하는 방법 Java에서 continue 문을 사용하는 방법 Apr 26, 2023 am 11:43 AM

참고 1. continue 문은 루프의 나머지 문을 건너뛰고 다음 루프를 강제로 실행하는 것을 의미합니다. 그 기능은 루프를 종료하는 것입니다. 즉, 루프 아래의 실행되지 않은 문을 건너뛰고 다음 루프를 실행하는지 확인하는 것입니다. 루프가 실행됩니다. 2. continue 문은 break 문과 유사하지만 루프에만 나타날 수 있습니다. 예 intsum=0;for(inti=1;i

Go 언어에서 str의 비밀을 밝히다 Go 언어에서 str의 비밀을 밝히다 Mar 29, 2024 am 11:27 AM

Go 언어는 빠르고 간결하며 효율적인 오픈 소스 프로그래밍 언어로, 프로그래머들 사이에서 점점 더 인기를 얻고 있습니다. 문자열은 프로그램에서 자주 사용되는 데이터 타입 중 하나로, Go 언어 특유의 처리 방식도 갖고 있다. 이 글은 독자들이 Go 언어에서 문자열(str)의 신비를 발견하고 구체적인 코드 예제를 통해 그 사용법과 특징을 분석하도록 유도할 것입니다. 문자열 정의 및 초기화 Go 언어에서 문자열은 큰따옴표 ""로 묶인 일련의 문자입니다. 예: str

See all articles