php教程 php手册 php字符编码转换之gb2312转为utf8

php字符编码转换之gb2312转为utf8

Jun 06, 2016 pm 08:27 PM
PHP 문자 인코딩

PHP输出页面时经常有乱码,怎么办呢?今天我就提供一个方法,可以自动判断php字符编码,把gbk或gb2312编码的字符串转为utf8 。

 在php中字符编码转换我们一般会用到iconv与mb_convert_encoding进行操作,但是mb_convert_encoding在转换性能上比iconv要差很多哦。
string iconv ( string in_charset, string out_charset, string str ) 注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

使用:
发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.
一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

复制代码 代码如下:


/**
*自动判断把gbk或gb2312编码的字符串转为utf8
*能自动判断输入字符串的编码类,如果本身是utf-8就不用转换,否则就转换为utf-8的字符串
*支持的字符编码类型是:utf-8,gbk,gb2312
*@$str:string 字符串
*/
function yang_gbk2utf8($str){
    $charset = mb_detect_encoding()($str,array('UTF-8','GBK','GB2312'));
    $charset = strtolower($charset);
    if('cp936' == $charset){
        $charset='GBK';
    }
    if("utf-8" != $charset){
        $str = iconv($charset,"UTF-8//IGNORE",$str);
    }
    return $str;
}


下面我接着看在转换字符编码的一些问题
用mb_detect_encoding($str);函数,使用该函数必须打开php的extension=php_mbstring.dll扩展

复制代码 代码如下:


$str="测试ing";
$cha=mb_detect_encoding($str);
$s = iconv($cha,"UTF-8",$str);
var_dump($s);
?>


结果返回:
string(0) “”
真是奇怪,为什么会这样。

复制代码 代码如下:


$str="测试ing";
$cha=mb_detect_encoding($str);
$s = iconv("GB2312","UTF-8",$str);
var_dump($s);
?>


返回结果正确。发现该函数mb_detect_encoding($str);判断还是不准确。不知是什么原因。
函数string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
可以转换为指定编码的字符串,我写了例子

复制代码 代码如下:


<br><?php <BR>$a="我很好";<br>echo mb_convert_encoding ($a,'UTF-8');<br>?> <br><br>可结果是:<br>??潞?潞?<br>现在的问题就是我如果把不同的字符串编码形式统一转换为utf-8,如果事先知道改变吗可以用iconv,但如果不知道该编码该怎么办呢?<br>问题3:iconv问题,如果转换的字符串,第一个字节的编码大于一定的数会返回空.<br>如:<br><p><span>复制代码</span> 代码如下:</p><p><br><?php <BR>$str=chr(254)."测试ing".chr(254);<br>$s = iconv("GB2312","UTF-8",$str);<br>var_dump($s);<br>?> <br></p><br>返回<br>string(0) “”
<p>mb_convert_encoding的用法见官方:</p>
<p></p>
<p>PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。</p>
<p>下面还有一些详细的例子:<br>iconv — Convert string to requested character encoding<br>(PHP 4 >= 4.0.5, PHP 5)<br>mb_convert_encoding — Convert character encoding<br>(PHP 4 >= 4.0.6, PHP 5)<br>用法:<br>string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )<br>需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉<br>mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;<br>string iconv ( string in_charset, string out_charset, string str )<br>注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。<br>Returns the converted string or FALSE on failure.<br>使用:<br>发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.<br>一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.<br>from_encoding is specified by character code name before conversion. it can be array or string – comma separated enumerated list. If it is not specified, the internal encoding will be used.<br>/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */<br>$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);<br>/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */<br>$str = mb_convert_encoding($str, “EUC-JP”, “auto”);<br>例子:<br></p><p><span>复制代码</span> 代码如下:</p><p><br><?php   <BR> $content = iconv("GBK", "UTF-8", $content);  <br> $content = mb_convert_encoding($content, "UTF-8", "GBK");  <br>?><br></p><br>这个可以根据输入输出的字符编码进行转换<br><p><span>复制代码</span> 代码如下:</p>


로그인 후 복사
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)