file_get_contents からのデータのエンコーディングを確認する方法

WBOY
リリース: 2016-06-13 13:37:12
オリジナル
1129 人が閲覧しました

file_get_contents からのデータのエンコーディングを確認する方法
前述のとおり

------解決策------ -
EUC-CN は、GB 2312 の最も一般的に使用される表現方法です。ブラウザのエンコード表の「GB2312」は通常「EUC-CN」表記を指します。

ただし、mb_detect_encoding を使用しても正しい結果は得られません。
このリスト「gb2312,gbk,utf-8」のエンコード位置を調整して見てください。
------解決策------------------
エンコーディングはコンテンツを決定しますが、コンテンツはエンコーディングを決定しません。
たとえば、gbk の中国語文字が表示された場合、それは 2 つの ISO-8859-1 文字として認識されます。
したがって、mb_detect_encoding は次のとおりです。推測ですので完全に正しいとは限りません(実際には絶対的な正しさはありません)

file_get_contents で取得したコンテンツが Web ページであれば、そのような情報がない場合は「推測」するしかありません。

------解決策---------

話し合う
エンコーディングはコンテンツを決定しますが、コンテンツはエンコーディングを決定しません。
たとえば、gbk の中国語文字を見ると、それは 2 つの ISO-8859-1 文字として認識されます。
mb_detect_encoding は推測のみであり、正確であることを完全に保証することはできません (実際、絶対的な正しさはありません)

file_get_contents で取得したコンテンツが Web ページの場合、メタを使用して判断できます
そのような情報がない場合は、「推測」することしかできません

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート