この記事では主に、PHP のエンコード変換で文字化けしたコードを解決する方法を説明します。皆さんのお役に立てれば幸いです。
iconv の詳細な説明:
iconv — 文字列は必要な文字に従ってエンコードされ、変換されます iconv にはバグがあり、2 番目のパラメーターを設定するときに、当然、変換できません。デフォルトの欠点を少し補うために、変換できないことを避けるために切り捨てが使用されます。使用方法は次のとおりです
iconv("UTF-8″,"GB2312//IGNORE",$data);
ちなみに、稀な文字の変換に失敗した場合は、その失敗を無視して、以下の内容の変換を続行します。
iconvstring iconv ( string $in_charset , string $out_charset , string $str ) 第一个参数:内容原的编码 第二个参数:目标编码 第三个参数:要转的字符串 函数返回字符串<?php$instr = ‘测试’;// GBK转UTF-8$outstr = iconv(‘GBK’,'UTF-8′,$instr); ?>
変換された文字列を返すか、失敗した場合は FALSE を返します。
mb_convert_encoding の詳細な説明: 変換の成功率を保証するために、別の
conversion 関数 mb_convert_encoding を使用することもできます。また、この関数は 3 番目のパラメーターを省略することもできます。エンコーディングを自動的に識別しますが、効率に影響するため、使用しないことをお勧めします。それでも注意が必要な場合は、mb_convert_encoding と iconv パラメーターの順序が異なるため、注意が必要です。
mb_convert_encoding string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] ) 第一个参数:要处理的字符串 第二个参数:目标编码 第三个参数:内容原编码,它可以是一个 array 也可以是逗号分隔的枚举列表<?php$instr = '测试'; // GBK转UTF-8$outstr = mb_convert_encoding($instr,'UTF-8','GBK',); $str = mb_convert_encoding($instr, "UCS-2LE", "JIS, eucjp-win, sjis-win");?>
mb_convert_variables
mb_convert_variables —1つ以上の変数の文字エンコーディングを変換します
mb_convert_variables ( $to_encoding , $from_encoding , &$vars [, mixed &$... ] )
mb_convert_variables() 会拼接变量数组或对象中的字符串来检测编码,因为短字符串的检测往往会失败。因此,不能在一个数组或对象中混合使用编码。
to_encoding 将 string 转换成这个编码。 from_encoding 可以指定为一个 array 或者逗号分隔的 string,它将尝试根据 from-coding 来检测编码。 当省略了 from_encoding,将使用 detect_order。 vars 是要转换的变量的引用。 参数可以接受 String、Array 和 Object 的类型。 mb_convert_variables() 假设所有的参数都具有同样的编码。 额外的 vars。
返回值 : 成功时返回转换前的字符编码,失败时返回 FALSE。
实例:<?php/* 转换变量 $post1、$post2 编码为内部(internal)编码 */$interenc = mb_internal_encoding();$inputenc = mb_convert_variables($interenc, "ASCII,UTF-8,SJIS-win", $post1, $post2);?>
mb_internal_encoding mb_internal_encoding —
内部文字エンコーディングの設定/取得
mixed mb_internal_encoding ([ string $encoding = mb_internal_encoding() ] )
参数 : encoding 字符编码名称使用于 HTTP 输入字符编码转换、HTTP 输出字符编码转换、mbstring 模块系列函数字符编码转换的默认编码。 返回值 : 如果设置了 encoding,则成功时返回 TRUE, 或者在失败时返回 FALSE。 In this case, the character encoding for multibyte regex is NOT changed. 如果省略了 encoding,则返回当前的字符编码名称。
<?php/* 设置内部字符编码为 UTF-8 */mb_internal_encoding("UTF-8");/* 显示当前的内部字符编码*/echo mb_internal_encoding();?>
mb_detect_encoding 詳細な説明:
mb _detect_encoding —文字エンコーディングを検出
string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )
1
检测字符串 str 的编码。
参数 str 待检查的字符串。 encoding_list 是一个字符编码列表。 编码顺序可以由数组或者逗号分隔的列表字符串指定。 如果省略了 encoding_list 将会使用 detect_order。strict strict 指定了是否严格地检测编码。 默认是 FALSE。 返回值 检测到的字符编码,或者无法检测指定字符串的编码时返回 FALSE。
字符串编码未知的情况下对字符串进行编码:
1、无论字符串编码是什么,均转换为gbk
function getSafeStr($str){ $s1 = iconv('utf-8','gbk//IGNORE',$str); $s0 = iconv('gbk','utf-8//IGNORE',$s1); if($s0 == $str){ return $s1; }else{ return $str; } }
2、无论字符串编码是什么,均转换为utf-8
function getSafeStr($str){ $s1 = iconv('gbk','utf-8//IGNORE',$str); $s0 = iconv('utf-8','gbk//IGNORE',$s1); if($s0 == $str){ return $s1; }else{ return $str; } }
获取字符串编码方法:
function getcode($str){ $s1 = iconv('utf-8','gbk//IGNORE',$str); $s0 = iconv('gbk','utf-8//IGNORE',$s1); if($s0 == $str){ return 'utf-8'; }else{ return 'gbk'; } }
以上がPHPエンコード変換の文字化けを解決する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。