PHP에서 gbk를 utf8로 변환하는 방법은 무엇입니까?

青灯夜游
풀어 주다: 2023-03-07 07:22:02
원래의
4885명이 탐색했습니다.

PHP에서 iconv() 함수를 사용하여 gbk 인코딩을 utf8 인코딩으로 변환할 수 있습니다. iconv 함수는 알려진 문자 집합 파일을 알려진 다른 문자 집합 파일로 변환할 수 있으며 구문 형식은 "iconv('GBK', 'UTF) -8', 문자열)".

PHP에서 gbk를 utf8로 변환하는 방법은 무엇입니까?

추천: "PHP 비디오 튜토리얼"

Convert gbk to utf8 in php

PHP에서는 iconv() 함수를 사용하여 gbk를 utf8로 변환할 수 있습니다.

iconv 함수는 알려진 문자 집합 파일을 알려진 다른 문자 집합 파일로 변환할 수 있습니다. 예: GB2312에서 UTF-8로 변환합니다.

iconv 기능은 php5에 내장되어 있으며 기본적으로 GB 문자 집합이 켜져 있습니다.

예:

<?php
header("Content-type:text/html;charset=GB2312");
echo $str= &#39;你好,这里是gbk转utf8!&#39;;
echo &#39;<br />&#39;;
echo iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, $str); //将字符串的编码从GB2312转到UTF-8
로그인 후 복사

설명: php iconv 함수

PHP의 iconv 함수 라이브러리는 다양한 문자 집합 간의 변환을 완료할 수 있으며 PHP 프로그래밍에 없어서는 안될 기본 함수 라이브러리이지만 때로는 iconv가 일부 데이터에 적합하지 않습니다. 아무런 이유 없이 트랜스코딩이 줄어들 것입니다. 예를 들어 "—" 문자를 gb2312로 변환하면 오류가 발생합니다.

이 기능의 사용법을 천천히 살펴보겠습니다.

가장 간단한 애플리케이션은 gb2312를 utf-8로 대체합니다.

$text=iconv("GB2312","UTF-8",$text);
로그인 후 복사

$text=iconv("UTF-8","GB2312",$text)를 사용하는 과정에서, 영어 이름에 "—", "." 등의 특수 문자가 있으면 변환이 중단됩니다. 이 문자 뒤의 텍스트는 더 이상 변환할 수 없습니다. $text=iconv("UTF-8","GB2312",$text)过程中,如果遇到一些特别字符时,如:"—",英文名中的"."等等字符,转换就断掉了。这些字符后的文字都没法继续转换了。

针对这的问题,可以用如下代码实现:

$text=iconv("UTF-8","GBK",$text);
로그인 후 복사

你没有看错,就这么简单,不使用gb2312,而写成GBK,就可以了。

还有一种方法,第二个参数,加上//IGNORE,忽略错误,如下:

iconv("UTF-8","GB2312//IGNORE",$data);
로그인 후 복사

没有具体比较这两种方法,感觉第一种(GBK代替gb2312)方法更好。

php手册中iconv() 说明:

iconv

(PHP 4 >= 4.0.5, PHP 5)
iconv – Convert string to requested character encoding
Description
string iconv ( string in_charset, string out_charset, string str )
Performs a character set conversion on the string str from in_charset to out_charset. Returns the converted string or FALSE on failure.
If you append the string //TRANSLIT to out_charset transliteration is activated. This means that when a character can't be represented in the target charset, it can be approximated through one or several similarly looking characters. If you append the string //IGNORE, characters that cannot be represented in the target charset are silently discarded. Otherwise, str is cut from the first illegal character.

在使用这个函数进行字符串编码转换时,需要注意,如果将utf-8转换为gb2312时,可能会出现字符串被截断的情况发生。此时可以使用以下方法解决:

$str=iconv(&#39;utf-8&#39;,"gb2312//TRANSLIT",file_get_contents($filepath));
로그인 후 복사

即在第二个参数出添加红色字部分,表示:如果在目标编码中找不到与源编码相匹配的字符,会选择相似的字符进行转换。此处也可以使用://IGNORE 这个参数,表示忽略不能转换的字符。

ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存。

iconv不是php的默认函数,也是默认安装的模块。需要安装才能用的。

如果是windows2000+php,你可以修改php.ini文件,将extension=php_iconv.dll前的";"去掉,同时你要copy你的原php安装文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是这个目录)。在linux环境下,用静态安装的方式,在configure时加多一项 --with-iconv就可以了,phpinfo看得到iconv的项。(Linux7.3+Apache4.06+php4.3.2)。

mb_convert_encoding与iconv函数介绍

mb_convert_encoding这个函数是用来转换编码的。原来一直对程序编码这一概念不理解,不过现在好像有点开窍了。不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

做一个GBK To UTF-8:

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("妳係我的友仔", "UTF-8", "GBK"); 
?>
로그인 후 복사

再来个GB2312 To Big5:

<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
로그인 후 복사

不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )

이 문제를 해결하려면 다음 코드를 사용하여 해결할 수 있습니다. 🎜
$content = iconv("GBK", "UTF-8″, $content);
$content = mb_convert_encoding($content, "UTF-8″, "
로그인 후 복사
로그인 후 복사
🎜읽으신 내용이 맞습니다. 매우 간단합니다. gb2312를 사용하지 말고 GBK로 작성하세요. 🎜🎜또 다른 방법이 있습니다. 두 번째 매개변수에 //IGNORE를 추가하고 다음과 같이 오류를 무시하세요. 🎜rrreee🎜이 두 방법 사이에는 특별한 비교가 없습니다. 첫 번째 방법( GBK는 gb2312를 대체합니다. 더 나은 방법이 있습니다. 🎜🎜🎜PHP 매뉴얼의 Iconv() 설명: 🎜🎜🎜🎜iconv🎜🎜🎜🎜🎜(PHP 4 >= 4.0.5, PHP 5)🎜iconv – 문자열을 요청된 문자 인코딩으로 변환🎜Description🎜string iconv ( string in_charset, string out_charset, string str )🎜 in_charset에서 out_charset으로 문자열 str에 대해 문자 집합 변환을 수행합니다. 실패 시 변환된 문자열 또는 FALSE를 반환합니다.🎜 문자열 //TRANSLIT를 out_charset에 추가하면 음역이 활성화됩니다. 문자가 대상 문자 집합에 표시될 수 없는 경우 유사하게 보이는 하나 이상의 문자를 통해 대략적으로 표현할 수 있습니다. //IGNORE 문자열을 추가하면 대상 문자 집합에 표시할 수 없는 문자는 자동으로 삭제됩니다. str은 첫 번째 불법 문자부터 잘립니다.🎜🎜🎜이 함수를 사용하여 문자열 인코딩을 변환할 때 utf-8을 gb2312로 변환하면 문자열이 잘릴 수 있으니 주의하세요. 이때 다음 방법을 사용하여 해결할 수 있습니다. 🎜rrreee🎜 즉, 두 번째 매개변수에 빨간색 부분을 추가합니다. 즉, 대상 인코딩에서 소스 인코딩과 일치하는 문자가 발견되지 않으면 유사한 문자가 검색됩니다. 변환을 위해 선택되었습니다. 여기서 //IGNORE 매개변수를 사용하여 변환할 수 없는 문자를 무시할 수도 있습니다. 🎜🎜ignore는 변환 중 오류를 무시한다는 의미입니다. 무시 매개변수가 없으면 이 문자 뒤에 오는 모든 문자열을 저장할 수 없습니다. 🎜🎜iconv는 php의 기본 기능은 아니며, 기본적으로 설치되는 모듈이기도 합니다. 사용하기 전에 설치해야 합니다. 🎜🎜windows2000+php인 경우 php.ini 파일을 수정하고 확장명=php_iconv.dll 앞에 있는 ";"을 제거해야 합니다. 동시에 원본 PHP 설치 파일 아래에 있는 iconv.dll을 복사해야 합니다. winnt/system32(dll이 이 디렉토리를 가리키는 경우) Linux 환경에서는 정적 설치를 사용하여 구성 시 --with-iconv 항목을 추가하면 됩니다. iconv 항목은 phpinfo에서 확인할 수 있습니다. (리눅스7.3+아파치4.06+php4.3.2). 🎜🎜🎜mb_convert_encoding 및 iconv 함수 소개🎜🎜🎜mb_convert_encoding이 함수는 인코딩을 변환하는 데 사용됩니다. 예전에는 프로그램 코딩의 개념을 이해하지 못했는데 이제는 조금 이해가 된 것 같습니다. 그러나 영어에는 일반적으로 인코딩 문제가 없으며 중국어 데이터에만 이 문제가 있습니다. 예를 들어, Zend Studio 또는 Editplus를 사용하여 프로그램을 작성할 때 gbk 인코딩을 사용합니다. 데이터를 데이터베이스에 입력해야 하고 데이터베이스 인코딩이 utf8이면 데이터를 인코딩하고 변환해야 합니다. 데이터베이스에 들어갈 때 깨집니다. 🎜🎜🎜Make a GBK To UTF-8:🎜🎜rrreee🎜🎜그리고 GB2312 To Big5:🎜🎜rrreee🎜하지만 위 기능을 사용하려면 설치가 필요하지만 mbstring 확장 라이브러리를 활성화해야 합니다. 첫 번째. 🎜🎜string mb_convert_encoding ( string str, string to_encoding [, mix from_encoding] ) php.ini에서 먼저 mbstring 확장 라이브러리를 활성화해야 합니다. mb_convert_encoding을 제거하세요. 하나 이상의 입력 인코딩을 지정할 수 있습니다. 내용에 따라 자동으로 식별되지만 실행 효율성은 iconv보다 훨씬 나쁩니다.

string iconv ( string in_charset, string out_charset, string str )注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数。

$content = iconv("GBK", "UTF-8″, $content);
$content = mb_convert_encoding($content, "UTF-8″, "
로그인 후 복사
로그인 후 복사

更多编程相关知识,请访问:编程学习课程!!

위 내용은 PHP에서 gbk를 utf8로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!