php編碼轉換函數(自動轉換字元集支援數組轉換)

WBOY
發布: 2016-07-25 09:10:20
原創
1177 人瀏覽過
  1. // 自动转换字符集 支持数组转换
  2. function auto_charset($fContents, $from='gbk', $to='utf-8') {
  3. $from = strtoupper($from) == 'UTF8' ? 'utf-8' : $from;
  4. $to = strtoupper($to) == 'UTF8' ? 'utf-8' : $to;
  5. if (strtoupper($from) === strtoupper($to) || empty($fContents) || (is_scalar($fContents) && !is_string($fContents))) {
  6. //如果编码相同或者非字符串标量则不转换
  7. return $fContents;
  8. }
  9. if (is_string($fContents)) {
  10. if (function_exists('mb_convert_encoding')) {
  11. return mb_convert_encoding($fContents, $to, $from);
  12. } elseif (function_exists('iconv')) {
  13. return iconv($from, $to, $fContents);
  14. } else {
  15. return $fContents;
  16. }
  17. } elseif (is_array($fContents)) {
  18. foreach ($fContents as $key => $val) {
  19. $_key = auto_charset($key, $from, $to);
  20. $fContents[$_key] = auto_charset($val, $from, $to);
  21. if ($key != $_key)
  22. unset($fContents[$key]);
  23. }
  24. return $fContents;
  25. }
  26. else {
  27. return $fContents;
  28. }
  29. }
复制代码

这时可能会想到直接用iconv来进行转码,但iconv这个函数需要提供的两个参数为输入编码和输出编码,而现在根本不知道接受的字符串是什么编码,如果此时能得到接收字符是什么编码就好了。 对于这个问题,有以下两种方案供参考。

方案一 要客户端提交数据时,指定所提交的编码,这时就需要多给一个用来指定编码的变量。 $string = $_GET['charset'] === 'gbk' ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str']; 对于这种情况,如果在没有约定或者我们不能控制客户端的情况下,似乎这种方案使用不是很好。

方案二 直接由服务器端来检测所接收的数据编码。 这种方案当然是最理想了的了,现在问题是怎么检测一个字符的编码吗?对于这种情况,在php里,mb_string这个扩展中的mb_check_encoding提供了我们所需要的功能。 $str = mb_check_encoding($_GET['str'],'gbk') ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str']; 但这需要打开mb_string这个扩展,有些时候可能我们的生产服务器中没有打开这个扩展。对于这种情况,需要自己借助如下函数来判断编码。

  1. function isGb2312($string) {
  2. for($i=0; $i 127) {
  3. if( ($v >= 228) && ($v < = 233) )
  4. {
  5. if( ($i+2) >= (strlen($string) - 1)) return true;
  6. $v1 = ord( $string[$i+1] );
  7. $v2 = ord( $string[$i+2] );
  8. if( ($v1 >= 128) && ($v1 < =191) && ($v2 >=128) && ($v2 < = 191) )
  9. return false;
  10. else
  11. return true;
  12. }
  13. }
  14. }
  15. return true;
  16. }
  17. function isUtf8($string) {
  18. return preg_match('%^(?:
  19. [x09x0Ax0Dx20-x7E] # ASCII
  20. | [xC2-xDF][x80-xBF] # non-overlong 2-byte
  21. | xE0[xA0-xBF][x80-xBF] # excluding overlongs
  22. | [xE1-xECxEExEF][x80-xBF]{2} # straight 3-byte
  23. | xED[x80-x9F][x80-xBF] # excluding surrogates
  24. | xF0[x90-xBF][x80-xBF]{2} # planes 1-3
  25. | [xF1-xF3][x80-xBF]{3} # planes 4-15
  26. | xF4[x80-x8F][x80-xBF]{2} # plane 16
  27. )*$%xs', $string);
  28. }
复制代码

这里我们就可以使用以上任何一个函数来实现编码的检测,并将其转换为指定的编码了。 $str = isGb2312($_GET['str'],'gbk') ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str'];



來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板