PHP 및 UTF-8의 모범 사례에 대한 자세한 소개

黄舟
풀어 주다: 2023-03-06 11:56:01
원래의
1208명이 탐색했습니다.

"PHP의 문자열, 인코딩, UTF-8" 기사에서는 상대적으로 지루한 일련의 기본 지식을 설명합니다. 이제 PHP 문자열 처리에 대한 모범 사례에 대해 이야기해 보겠습니다. UTF-8", 관련 지식의 두 번째 부분입니다. 결론 먼저 - PHP의 모든 측면에서 UTF-8 인코딩을 사용하세요.

PHP 언어 수준은 유니코드 문자 집합을 지원하지 않지만 대부분의 문제는 UTF-8 인코딩을 통해 해결될 수 있습니다.

가장 좋은 방법은 입력 인코딩을 명확하게 알고(모르는 경우 감지) 내부적으로 UTF-8 인코딩으로 균일하게 변환하고 출력 인코딩을 UTF-8 인코딩으로 균일하게 변환하는 것입니다.

PHP 수준에서 UTF-8을 처리하는 방법

유니코드 문자 집합을 작동할 때 반드시 mbstring 확장을 설치하고 기본 문자열 함수 대신 해당 함수를 사용하십시오. 예를 들어 UTF-8 PHP 코드로 인코딩된 파일이 있는데 strlen() 함수를 사용하는 것이 잘못된 경우에는 mb_strlen() 함수를 대신 사용하세요.

mbstring 확장의 대부분의 기능은 인코딩(내부 인코딩)을 기반으로 처리되어야 합니다. UTF-8 인코딩을 균일하게 사용하십시오. 이 중 대부분은 PHP.INI에서 구성할 수 있습니다.

PHP 5.6부터 default_charset 구성은 mbstring.http_input, mbstring.http_output을 대체할 수 있습니다.

또 다른 중요한 구성은 mbstring.언어입니다. 기본값은 Neutral(UTF-8)입니다.

파일 인코딩과 mbstring 확장자의 내부 인코딩은 동일한 개념이 아닙니다.

요약:

  • mbstring 확장과 관련된 PHP.INI 부분은 가능한 한 UTF-8을 사용해야 합니다.

  • 기본 문자열 조작 함수 대신 mbstring 확장 함수를 사용하십시오.

  • 관련 함수를 사용할 경우에는 작업하는 문자의 인코딩을 반드시 이해하시기 바랍니다. 해당 함수를 사용할 경우 디스플레이에 UTF-8 인코딩 매개변수를 작성합니다. 예를 들어 htmlentities() 함수의 세 번째 매개변수는 UTF를 표시합니다. 8.

파일 IO 작업: UTF-8 처리 방법

다음은 파일을 열고 싶지만 파일 내용의 인코딩이 무엇인지 모르는 경우 이를 처리하는 방법에 대한 예입니다.

가장 좋은 방법은 열 때 UTF-8로 균일하게 변환한 다음, 내용을 수정한 후 다시 원래 인코딩으로 변환하여 파일에 저장하는 것입니다. 코드를 보세요:

if ( mb_internal_encoding()!="UTF-8") {
        mb_internal_encoding("UTF-8");
}

$file = "file.txt"; //一个编码为gbk的中文文件
$str= file_get_contents($file);
//不管来源是什么编码,统一显示的时候转换为 UTF-8
 if (mb_check_encoding($str,"GBK")) 
    $str =  mb_convert_encoding($str,"UTF-8",“GBK”); 

$str ="修改内容";
$str =  mb_convert_encoding($str,$srcbm,"UTF-8"); //原样转回去
file_put_contents($file,$str);
로그인 후 복사

​Mysql 및 UTF-8 모범 사례

이는 비교적 간단합니다. 먼저 MySQL이 UTF-8인지 확인하세요. 그런 다음 Mysql 클라이언트는 연결 시 UTF-8도 유지합니다. 특히 PHP에서 imysql 또는 PDO 확장이 Mysql에 연결되면 UTF-8이 연결 인코딩으로 설정됩니다. 양쪽이 일치하면 일반적으로 문제가 발생하지 않습니다.

관심이 있으시면 이 글을 읽어보세요

브라우저 및 UTF-8 모범 사례

이것은 또한 상대적으로 간단합니다. 즉, 출력 내용이 웹 페이지인 경우 문자열 처리 출력은 항상 동시에 UTF-8이어야 하며, PHP.INI에서는 default_charset도 명확하게 UTF-8로 설정됩니다. HTML의 메타 태그도 UTF-8로 명시적으로 식별됩니다.

이제 모든 것이 괜찮습니까? 아니요, 서버와 브라우저에서 사용자가 UTF-8 인코딩을 사용할 수 있도록 허용하더라도 사용자의 행동은 구속력이 없습니다. 다른 인코딩의 문자를 입력했거나 다른 인코딩의 문자로 파일 이름을 업로드했을 수 있습니다. 할? 사용자의 인코딩은 mb_http_input() 및 mb_check_encoding() 함수를 통해 감지한 다음 내부적으로 UTF-8로 변환할 수 있습니다. 모든 수준에서 최종 처리가 UTF-8 인코딩인지 확인하세요. 즉, 입력이 어떤 인코딩인지 알 수 있는 방법이 필요하며, 처리 후 제어 출력의 인코딩은 UTF-8입니다.

mbstring.encoding_translation 지시어와 mb_Detect_encoding() 함수를 사용하는 것은 권장되지 않습니다. 오랫동안 나를 고문했습니다.

운영 체제 및 UTF-8 모범 사례

운영 체제상의 이유로 인해 PHP는 유니코드 파일 이름을 처리할 때 다른 처리 메커니즘을 사용합니다.

Linux에서는 파일 이름이 항상 UTF-8로 인코딩되고, 중국어 Windows 환경에서는 파일 이름이 항상 GBK로 인코딩됩니다.

​예를 들어 설명하세요:

//命令行程序函数,运行在中文版 Windows 10 操作系统 ,文件编码为 UTF-8

function filenameexample() {
    $filename = "测试.txt" ;
    $gbk_filename = iconv("UTF-8","GBK",$filename);
    file_put_contents($gbk_filename, "测试");
    echo file_get_contents($gbk_filename);
}

function scandirexample() {
    $arr = scandir("./tmp");
    foreach ($arr as $v) {
        if ($v == "." || $v =="..")
            continue ;
        $filename = iconv( "GBK","UTF-8",$v ) ;
        $content = file_get_contents("./tmp/" . $v );
    }
}
로그인 후 복사

Windows 및 Linux와 호환되는 프로그램을 작성하고 싶지 않다면

 function urlencodeexample() {
    $filename = "测试2.txt" ;
    $urlencodefilename = urlencode($filename) ;
    file_put_contents($urlencodefilename, "测试");
    echo file_get_contents($urlencodefilename);
 }
로그인 후 복사

와 같이 파일 이름을 urlencode할 수 있습니다. PHP를 사용하여 header() 함수를 통해 파일을 다운로드하는 경우 브라우저와 운영 체제도 고려해야 합니다(대부분의 사람들은 Windows를 사용함). Chrome의 경우 출력 파일 이름 인코딩은 UTF-8일 수 있으며 Chrome은 자동으로 파일 이름을 다음으로 변환합니다. GBK 인코딩.

낮은 버전의 IE의 경우 운영 체제 환경을 상속하므로 다운로드한 파일 이름이 중국어인 경우 UTF-8 인코딩으로 트랜스코딩해야 합니다. 그렇지 않으면 다운로드할 때 사용자에게 잘못된 파일 이름이 표시됩니다. 코드를 통해 설명하세요:

$agent=$_SERVER["HTTP_USER_AGENT"];
if(strpos($agent,'MSIE')!==false  {
    $filename = iconv("UTF-8","GBK","附件.txt");
    header("Content-Disposition: attachment; filename=\"$filename\"");
}
로그인 후 복사

 以上就是详细介绍PHP 与 UTF-8的最佳实践的内容,更多相关内容请关注PHP中文网(www.php.cn)!


관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿