PHP 중국어 잘못된 문자는 PHP 개발에서 흔히 발생하는 문제입니다. 예: PHP 중국어 잘못된 문자는 때때로 웹 페이지 자체에서 발생하고 일부는 MySQL과 상호 작용하는 동안 발생하며 때로는 운영 체제와 관련됩니다. 그렇다면 PHP에서 중국어 왜곡 코드를 해결하는 방법은 무엇입니까? 다음으로 이 세 가지 상황을 자세히 살펴보겠습니다.
추천 매뉴얼: php 자습 매뉴얼
1. 첫 번째는 PHP 웹 페이지의 인코딩입니다.
1. PHP 파일 자체의 인코딩과 웹 페이지의 인코딩이
a와 일치해야 합니다. gb2312 인코딩을 사용하려면 PHP에서 헤더를 출력해야 합니다. header(“Content-Type: text/html; charset =gb2312"), 정적 페이지에 를 추가합니다. 인코딩 모든 파일의 형식은 ANSI이며 메모장으로 열고 선택 항목으로 저장할 수 있으며 ANSI로 인코딩되어 소스 파일을 덮어씁니다.
b. utf-8 인코딩을 사용하려면 php에서 header("Content-Type: text/html; charset=utf-8") 헤더를 출력하고 , 모든 파일의 인코딩 형식은 utf-8입니다. utf-8로 저장하는 것은 약간 번거로울 수 있습니다. 일반적으로 utf-8 파일은 처음에 BOM을 가지고 있습니다. 세션을 사용하면 문제가 발생합니다. editplus에서 도구-> 매개변수 선택->파일->UTF-8 서명에서 항상 삭제를 선택한 다음 저장하여 BOM 정보를 제거합니다.
2. PHP 자체는 유니코드가 아니며, substr과 같은 모든 기능을 mb_substr로 변경해야 합니다(mbstring 확장 프로그램을 설치해야 함). 그렇지 않으면 iconv를 사용하여 트랜스코딩할 수 있습니다.
II. PHP와 Mysql 간의 데이터 상호 작용
PHP와 데이터베이스의 인코딩은 일관되어야 합니다
1. mysql 구성 파일 my.ini 또는 my.cnf를 수정하세요. MySQL은 utf8
[mysql] default-character-set=utf8 [mysqld] default-character-set=utf8 default-storage-engine=MyISAM 在[mysqld]下加入: default-collation=utf8_bin init_connect='SET NAMES utf8'
2로 인코딩하는 것이 가장 좋습니다. 데이터베이스 작업을 수행하려면 프로그램 앞에 mysql_query("set names"를 추가하세요. '인코딩'"); 인코딩은 PHP 인코딩과 일치합니다. PHP 인코딩이 gb2312이면 mysql 인코딩은 gb2312입니다. utf-8이면 mysql 인코딩은 다음과 같습니다. utf8, 데이터를 삽입하거나 검색할 때 잘못된 문자가 없도록
3. PHP는 운영체제와 관련이 있습니다
Windows와 Linux의 인코딩이 다릅니다. Windows 환경에서 PHP 함수를 호출할 때 매개변수가 utf-8로 인코딩되면 다음과 같은 오류가 발생합니다. move_uploaded_file(), filesize(), readfile() 등. 이러한 함수는 업로드 및 다운로드를 처리할 때 자주 사용됩니다. 호출 시 다음이 발생할 수 있습니다. 다음 오류:
Warning: move_uploaded_file()[function.move-uploaded-file]:failed to open stream: Invalid argument in ... Warning: move_uploaded_file()[function.move-uploaded-file]:Unable to move '' to '' in ... Warning: filesize() [function.filesize]: stat failed for ... in ... Warning: readfile() [function.readfile]: failed to open stream: Invalid argument in ..
Linux 환경에서 gb2312 인코딩을 사용하면 이러한 오류가 발생하지 않지만, 저장된 파일 이름이 깨져서 파일을 읽을 수 없습니다. 이 경우 먼저 매개변수를 인식 가능한 인코딩으로 변환하면 됩니다. 운영 체제에 의해. 코드의 경우, 인코딩 변환은 mb_convert_encoding(문자열, 새 인코딩, 원래 인코딩) 또는 iconv(원래 인코딩, 새 인코딩, 문자열)로 수행할 수 있으므로 처리 후 저장되는 파일 이름은 글자 깨짐 현상이 없고, 파일은 정상적으로 읽을 수 있으며, 중국어 이름을 가진 파일은 업로드 및 다운로드가 가능합니다.
실제로 시스템과 완전히 분리되어 시스템 인코딩을 고려할 필요가 없는 더 나은 솔루션이 있습니다. 문자와 숫자로만 구성된 파일 이름을 파일 이름으로 생성하고 원래 이름을 한자로 저장할 수 있습니다. 데이터베이스에서는 move_uploaded_file()을 호출하면 문제가 없습니다. 다운로드 시 파일명을 한자가 포함된 원래 이름으로 변경하기만 하면 됩니다.
다운로드를 구현하는 코드는 다음과 같습니다
header("Pragma: public"); header("Expires: 0"); header("Cache-Component: must-revalidate, post-check=0, pre-check=0"); header("Content-type: $file_type"); header("Content-Length: $file_size"); header("Content-Disposition: attachment; filename=\"$file_name\""); header("Content-Transfer-Encoding: binary"); readfile($file_path);
$file_type은 파일 종류, $file_name은 원래 이름, $file_path는 서비스에 저장된 파일의 주소입니다.
넷. 왜곡된 문자가 나타나는 이유를 요약해 보겠습니다
일반적으로 왜곡된 문자가 나타나는 이유는 두 가지입니다. 첫 번째는 인코딩(문자 집합) 때문입니다. 설정이 올바르지 않아 브라우저가 잘못된 인코딩으로 구문 분석하여 화면을 가득 채우는 지저분한 "천국의 책"이 발생합니다. 둘째, 파일이 잘못된 인코딩으로 열린 다음 원래 텍스트 파일이 저장되었습니다. GB2312로 인코딩되어 있지만 UTF-8 인코딩으로 열고 저장됩니다. 위의 잘못된 코드 문제를 해결하려면 먼저 개발의 어떤 측면에 인코딩이 포함되는지 알아야 합니다.
1. 파일 인코딩:
은 페이지 파일(.html, .php 등) 자체가 인코딩되는 것을 말합니다. 저장되었습니다.
메모장 및 Dreamweaver 페이지를 열면 파일 인코딩이 자동으로 인식되므로 문제가 없습니다. 그러나 ZendStudio는 자동으로 인코딩을 인식하지 않으며 기본 설정 구성에 따라 특정 인코딩으로만 파일을 엽니다. 작업 중 실수로 인코딩이 잘못된 파일을 열었고, 수정 후 저장하자마자 문자가 깨져서 나타났습니다.(저도 잘 알고 있습니다.)
2. 페이지 선언 인코딩:
HTML 코드 HEAD에서 웹 페이지에 어떤 인코딩이 사용되는지 브라우저에 알리기 위해 현재 XXX는 중국어 웹 사이트 개발에서 주로 GB2312 및 UTF-8을 사용합니다.
3. 데이터베이스 연결 인코딩:
데이터베이스 작업을 수행할 때 데이터베이스로 데이터를 전송하기 위해 어떤 인코딩이 사용되는지를 의미합니다. 여기서 주의할 점은 MySQL의 내부 기본값과 같은 데이터베이스 자체의 인코딩과 혼동하지 말아야 한다는 것입니다.
이는 latin1 인코딩입니다. 즉, MySQL은 데이터를 latin1 인코딩으로 저장하고, 다른 인코딩으로 MySQL에 전송된 데이터는 latin1 인코딩으로 변환됩니다.
이제 우리는 웹 개발에서 코딩이 어디에 관련되는지 알았으니, 잘못된 코드의 원인도 알게 되었습니다. 위의 세 가지 코딩 설정이 일치하지 않습니다. 대부분의 다양한 코딩이 ASCII와 호환되므로 영어 기호는 중국어가 아닙니다. 불행.
다섯. 일반적인 오류 상황과 해결 방법:
1 데이터베이스는 UTF8 인코딩을 사용하며 페이지 선언 인코딩은 GB2312입니다. , 이는 문자가 왜곡되는 가장 일반적인 원인입니다.
이때, PHP 스크립트에서 데이터를 직접 SELECT하면 깨져서 쿼리하기 전에 사용해야 합니다: mysql_query("SET NAMES GBK"); MYSQL 연결 인코딩을 설정하고 페이지 선언 인코딩이 여기에 설정된 연결 인코딩과 일치하는지 확인합니다(GBK는 GB2312의 확장임) ).
페이지가 UTF-8로 인코딩된 경우 다음을 사용할 수 있습니다. mysql_query("SET NAMES UTF8")
일반적으로 사용되는 UTF-8 대신 UTF8이라는 점에 유의하세요.
페이지에 선언된 인코딩이 데이터베이스의 내부 인코딩과 일치하는 경우 연결 인코딩을 설정할 필요가 없습니다.
참고:
사실 MYSQL의 데이터 입출력은 위에서 언급한 것보다 더 복잡합니다. MYSQL 구성 파일 my.ini에는 [client]에 정의된 2가지 기본 인코딩이 있습니다. [mysqld]의 기본 문자 집합 및 기본 문자 집합 클라이언트 연결과 내부 데이터베이스에 각각 기본적으로 사용되는 인코딩을 설정합니다.
위에 지정한 인코딩은 실제로 MYSQL 클라이언트가 서버에 연결할 때 명령줄 매개변수입니다. Character_set_client - 기본 인코딩을 사용하는 대신 수신된 클라이언트 데이터의 인코딩이 무엇인지 MYSQL 서버에 알려줍니다.
2. 페이지 선언의 인코딩은 파일 자체의 인코딩과 일치하지 않습니다. 인코딩이 일치하지 않으면 페이지를 만들 때 아티스트가 브라우저에서 보는 내용이 깨질 수 있기 때문입니다. 게시 후 수정되는 경우가 많습니다. 잘못된 인코딩으로 페이지를 연 다음 저장하면 일부 사소한 버그가 발생합니다.
또는 CuteFTP와 같은 일부 FTP 소프트웨어를 사용하여 온라인에서 파일을 직접 수정할 수도 있습니다. 잘못된 소프트웨어 인코딩 구성으로 인해 변환이 잘못될 수 있습니다. 암호.
3. 가상 호스트를 임대한 일부 친구는 위의 세 가지 인코딩을 올바르게 설정했음에도 불구하고 여전히 문자가 깨져 있는 것을 발견했습니다. 예를 들어 웹페이지는 GB2312입니다. 인코딩됨, IE 및 기타 브라우저는 열 때 항상 UTF-8로 인식합니다. HEAD 페이지에는 GB2312로 브라우저 인코딩을 수동으로 수정합니다. 다음 페이지가 정상적으로 표시됩니다.
이유는 Apache 서버가 서버의 전역 기본 인코딩을 설정하고 httpd.conf에 AddDefaultCharset을 추가하기 때문입니다. UTF-8 . 이때 서버는 먼저 HTTP 헤더를 브라우저에 보내며, 페이지에 선언된 인코딩보다 우선순위가 높으므로 당연히 브라우저는 이를 잘못 인식하게 됩니다.
두 가지 솔루션이 있습니다. 관리자가 이를 가상 머신의 구성 파일에 추가하세요. AddDefaultCharset GB2312를 사용하여 전역 구성을 재정의하거나 자체 디렉터리의 .htaccess에서 구성합니다.
요약:
한마디로, PHP에서 중국어 왜곡 코드를 해결하는 가장 좋고 빠른 방법은 페이지에서 선언한 코딩을 데이터베이스의 내부 코딩과 일치하게 만드는 것입니다. 페이지가 데이터베이스의 내부 코딩과 일치하지 않습니다. , 연결 인코딩을 설정하면 됩니다. mysql_query("SET NAMES XXX ");
1.php 페이지 중국어 왜곡 문자
관련 영상 추천: 1.
Dugu Jiujian (4)_PHP 영상 튜토리얼
위 내용은 PHP 중국어 잘못된 코드를 해결하는 방법은 무엇입니까? PHP에서 중국어 문자가 왜곡되는 세 가지 상황 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!