PHP에서 iconv() 함수를 사용하여 gbk 인코딩을 utf8 인코딩으로 변환할 수 있습니다. iconv 함수는 알려진 문자 집합 파일을 알려진 다른 문자 집합 파일로 변환할 수 있으며 구문 형식은 "iconv('GBK', 'UTF) -8', 문자열)".
추천: "PHP 비디오 튜토리얼"
Convert gbk to utf8 in php
PHP에서는 iconv() 함수를 사용하여 gbk를 utf8로 변환할 수 있습니다.
iconv 함수는 알려진 문자 집합 파일을 알려진 다른 문자 집합 파일로 변환할 수 있습니다. 예: GB2312에서 UTF-8로 변환합니다.
iconv 기능은 php5에 내장되어 있으며 기본적으로 GB 문자 집합이 켜져 있습니다.
예:
<?php header("Content-type:text/html;charset=GB2312"); echo $str= '你好,这里是gbk转utf8!'; echo '<br />'; echo iconv('GB2312', 'UTF-8', $str); //将字符串的编码从GB2312转到UTF-8
설명: php iconv 함수
PHP의 iconv 함수 라이브러리는 다양한 문자 집합 간의 변환을 완료할 수 있으며 PHP 프로그래밍에 없어서는 안될 기본 함수 라이브러리이지만 때로는 iconv가 일부 데이터에 적합하지 않습니다. 아무런 이유 없이 트랜스코딩이 줄어들 것입니다. 예를 들어 "—" 문자를 gb2312로 변환하면 오류가 발생합니다.
이 기능의 사용법을 천천히 살펴보겠습니다.
가장 간단한 애플리케이션은 gb2312를 utf-8로 대체합니다.
$text=iconv("GB2312","UTF-8",$text);
$text=iconv("UTF-8","GB2312",$text)
를 사용하는 과정에서, 영어 이름에 "—", "." 등의 특수 문자가 있으면 변환이 중단됩니다. 이 문자 뒤의 텍스트는 더 이상 변환할 수 없습니다. $text=iconv("UTF-8","GB2312",$text)
过程中,如果遇到一些特别字符时,如:"—",英文名中的"."等等字符,转换就断掉了。这些字符后的文字都没法继续转换了。
针对这的问题,可以用如下代码实现:
$text=iconv("UTF-8","GBK",$text);
你没有看错,就这么简单,不使用gb2312,而写成GBK,就可以了。
还有一种方法,第二个参数,加上//IGNORE
,忽略错误,如下:
iconv("UTF-8","GB2312//IGNORE",$data);
没有具体比较这两种方法,感觉第一种(GBK代替gb2312)方法更好。
php手册中iconv() 说明:
iconv
(PHP 4 >= 4.0.5, PHP 5)
iconv – Convert string to requested character encoding
Description
string iconv ( string in_charset, string out_charset, string str )
Performs a character set conversion on the string str from in_charset to out_charset. Returns the converted string or FALSE on failure.
If you append the string //TRANSLIT to out_charset transliteration is activated. This means that when a character can't be represented in the target charset, it can be approximated through one or several similarly looking characters. If you append the string //IGNORE, characters that cannot be represented in the target charset are silently discarded. Otherwise, str is cut from the first illegal character.
在使用这个函数进行字符串编码转换时,需要注意,如果将utf-8转换为gb2312时,可能会出现字符串被截断的情况发生。此时可以使用以下方法解决:
$str=iconv('utf-8',"gb2312//TRANSLIT",file_get_contents($filepath));
即在第二个参数出添加红色字部分,表示:如果在目标编码中找不到与源编码相匹配的字符,会选择相似的字符进行转换。此处也可以使用://IGNORE 这个参数,表示忽略不能转换的字符。
ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存。
iconv不是php的默认函数,也是默认安装的模块。需要安装才能用的。
如果是windows2000+php,你可以修改php.ini文件,将extension=php_iconv.dll前的";"去掉,同时你要copy你的原php安装文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是这个目录)。在linux环境下,用静态安装的方式,在configure时加多一项 --with-iconv就可以了,phpinfo看得到iconv的项。(Linux7.3+Apache4.06+php4.3.2)。
mb_convert_encoding与iconv函数介绍
mb_convert_encoding
这个函数是用来转换编码的。原来一直对程序编码这一概念不理解,不过现在好像有点开窍了。不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。
做一个GBK To UTF-8:
<?php header("content-Type: text/html; charset=Utf-8"); echo mb_convert_encoding("妳係我的友仔", "UTF-8", "GBK"); ?>
再来个GB2312 To Big5:
<?php header("content-Type: text/html; charset=big5"); echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); ?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
$content = iconv("GBK", "UTF-8″, $content); $content = mb_convert_encoding($content, "UTF-8″, "
//IGNORE
를 추가하고 다음과 같이 오류를 무시하세요. 🎜rrreee🎜이 두 방법 사이에는 특별한 비교가 없습니다. 첫 번째 방법( GBK는 gb2312를 대체합니다. 더 나은 방법이 있습니다. 🎜🎜🎜PHP 매뉴얼의 Iconv() 설명: 🎜🎜🎜🎜iconv🎜🎜🎜🎜🎜(PHP 4 >= 4.0.5, PHP 5)🎜iconv – 문자열을 요청된 문자 인코딩으로 변환🎜Description🎜string iconv ( string in_charset, string out_charset, string str )🎜 in_charset에서 out_charset으로 문자열 str에 대해 문자 집합 변환을 수행합니다. 실패 시 변환된 문자열 또는 FALSE를 반환합니다.🎜 문자열 //TRANSLIT를 out_charset에 추가하면 음역이 활성화됩니다. 문자가 대상 문자 집합에 표시될 수 없는 경우 유사하게 보이는 하나 이상의 문자를 통해 대략적으로 표현할 수 있습니다. //IGNORE 문자열을 추가하면 대상 문자 집합에 표시할 수 없는 문자는 자동으로 삭제됩니다. str은 첫 번째 불법 문자부터 잘립니다.🎜🎜🎜이 함수를 사용하여 문자열 인코딩을 변환할 때 utf-8을 gb2312로 변환하면 문자열이 잘릴 수 있으니 주의하세요. 이때 다음 방법을 사용하여 해결할 수 있습니다. 🎜rrreee🎜 즉, 두 번째 매개변수에 빨간색 부분을 추가합니다. 즉, 대상 인코딩에서 소스 인코딩과 일치하는 문자가 발견되지 않으면 유사한 문자가 검색됩니다. 변환을 위해 선택되었습니다. 여기서 //IGNORE 매개변수를 사용하여 변환할 수 없는 문자를 무시할 수도 있습니다. 🎜🎜ignore는 변환 중 오류를 무시한다는 의미입니다. 무시 매개변수가 없으면 이 문자 뒤에 오는 모든 문자열을 저장할 수 없습니다. 🎜🎜iconv는 php의 기본 기능은 아니며, 기본적으로 설치되는 모듈이기도 합니다. 사용하기 전에 설치해야 합니다. 🎜🎜windows2000+php인 경우 php.ini 파일을 수정하고 확장명=php_iconv.dll 앞에 있는 ";"을 제거해야 합니다. 동시에 원본 PHP 설치 파일 아래에 있는 iconv.dll을 복사해야 합니다. winnt/system32(dll이 이 디렉토리를 가리키는 경우) Linux 환경에서는 정적 설치를 사용하여 구성 시 --with-iconv 항목을 추가하면 됩니다. iconv 항목은 phpinfo에서 확인할 수 있습니다. (리눅스7.3+아파치4.06+php4.3.2). 🎜🎜🎜mb_convert_encoding 및 iconv 함수 소개🎜🎜🎜mb_convert_encoding
이 함수는 인코딩을 변환하는 데 사용됩니다. 예전에는 프로그램 코딩의 개념을 이해하지 못했는데 이제는 조금 이해가 된 것 같습니다. 그러나 영어에는 일반적으로 인코딩 문제가 없으며 중국어 데이터에만 이 문제가 있습니다. 예를 들어, Zend Studio 또는 Editplus를 사용하여 프로그램을 작성할 때 gbk 인코딩을 사용합니다. 데이터를 데이터베이스에 입력해야 하고 데이터베이스 인코딩이 utf8이면 데이터를 인코딩하고 변환해야 합니다. 데이터베이스에 들어갈 때 깨집니다. 🎜🎜🎜Make a GBK To UTF-8:🎜🎜rrreee🎜🎜그리고 GB2312 To Big5:🎜🎜rrreee🎜하지만 위 기능을 사용하려면 설치가 필요하지만 mbstring 확장 라이브러리를 활성화해야 합니다. 첫 번째. 🎜🎜string mb_convert_encoding ( string str, string to_encoding [, mix from_encoding] )
php.ini에서 먼저 mbstring 확장 라이브러리를 활성화해야 합니다. mb_convert_encoding을 제거하세요. 하나 이상의 입력 인코딩을 지정할 수 있습니다. 내용에 따라 자동으로 식별되지만 실행 효율성은 iconv보다 훨씬 나쁩니다.string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding
函数。
$content = iconv("GBK", "UTF-8″, $content); $content = mb_convert_encoding($content, "UTF-8″, "
更多编程相关知识,请访问:编程学习课程!!
위 내용은 PHP에서 gbk를 utf8로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!