ホームページ バックエンド開発 PHPチュートリアル PHP 文字エンコードを gb2312 から utf8_PHP に変換するチュートリアル

PHP 文字エンコードを gb2312 から utf8_PHP に変換するチュートリアル

Jul 13, 2016 am 10:48 AM
ic php utf8 一般的に 存在する キャラクター 私たち コーディング 変換する

PHP では、通常、iconv と mb_convert_encoding を使用して文字エンコーディングを変換しますが、mb_convert_encoding は変換パフォーマンスの点で iconv よりもはるかに劣ります。

文字列 iconv (文字列 in_charset、文字列 out_charset、文字列 str)
注: 変換先のエンコーディングの指定に加えて、2 番目のパラメーターでは、//TRANSLIT と //IGNORE の 2 つの接尾辞を追加することもできます。//TRANSLIT は、直接変換できない文字を 1 つ以上の近似文字に自動的に変換します。 //IGNORE は変換できない文字を無視し、デフォルトの効果は最初の不正な文字から切り捨てられます。
変換された文字列を返すか、失敗した場合は FALSE を返します。

string mb_convert_encoding ( string str, string to_encoding [,混合 from_encoding] )
まず mbstring 拡張ライブラリを有効にし、php.ini の extension=php_mbstring.dll の前にある ; を削除する必要があります。 mb_convert_encoding は複数の入力エンコーディングを指定できますが、内容に基づいて自動的に識別されますが、実行効率は iconv よりもはるかに悪くなります。
使用:

iconv が文字「-」を gb2312 に変換するときにエラーが発生することが判明しました。ignore パラメータがないと、この文字に続くすべての文字列を保存できません。この「-」はどうやってもうまく変換できず出力できません。 なお、mb_convert_encoding にはこのバグはありません

通常は、iconv を使用します。mb_convert_encoding 関数は、元のエンコーディングが特定できない場合、または変換後に iconv が正常に表示できない場合にのみ使用してください。

コードは次のとおりですコードをコピー/** * gbk または gb2312 でエンコードされた文字列を自動的に判断して utf8 に変換します コードは次のとおりです
*入力文字列のエンコードタイプを自動的に判断できます。UTF-8の場合は変換する必要はありません。それ以外の場合はUTF-8文字列に変換されます

*サポートされている文字エンコーディングの種類は、utf-8、gbk、gb2312 です
*@$str:string 文字列
*/
関数 yang_gbk2utf8($str){
$charset = mb_detect_encoding()($str,array('UTF-8','GBK','GB2312')); $charset = strto lower($charset); If('cp936' == $charset){
$charset='GBK'; }
If("utf-8" != $charset){
$str = iconv($charset,"UTF-8//IGNORE",$str); }
$str を返します
}




次に、文字エンコーディングを変換する際の問題について見ていきます

mb_detect_encoding($str); 関数を使用するには、php extension=php_mbstring.dll 拡張子を開く必要があります。

コードをコピー

$str="テスト中"; エコー $cha;コードは次のとおりです
$cha=mb_detect_encoding($str); ?>

gb2312のページで入力したのですが、出力結果がUTF-8になってしまい非常におかしく、原因はまだ分かりません。

一律にUTF-8エンコーディングに変換したい場合は、以下の方法を使用してください

コードをコピー

$str="テスト中"; $s = iconv($cha,"UTF-8",$str); ?>
$cha=mb_detect_encoding($str); var_dump($s);

返された結果:
文字列(0) 「」
なぜこんなことが起こるのか本当に不思議です。

を使用してください
コードは次のとおりです コードをコピー
$str="テスト中";
$cha=mb_detect_encoding($str);
$s = iconv("GB2312","UTF-8",$str);
var_dump($s);
?>


返された結果は正しいです。関数 mb_detect_encoding($str) が依然として不正確であることがわかりました。その理由はわかりません。
関数 string mb_convert_encoding ( string $str , string $to_encoding [,mixed $from_encoding ] )

指定したエンコーディングの文字列に変換できる、例を書きました

コードは次のとおりです コードをコピー

$a="大丈夫です";
echo mb_convert_encoding ($a,'UTF-8');
?>

結果は次のとおりです:
??枞?枞?
ここで問題となるのは、異なる文字列エンコーディングを UTF-8 に変換する場合、その変更が事前にわかっていれば iconv を使用できるかということですが、エンコーディングがわからない場合はどうすればよいでしょうか?

問題 3: iconv の問題、変換された文字列、最初のバイトのエンコーディングが特定の数値より大きい場合、空が返されます。

例:

コードは次のとおりです コードをコピー
$str=chr(254)."テスト".chr(254);
$s = iconv("GB2312","UTF-8",$str);
var_dump($s);
?>

戻る
文字列(0) 「」

mb_convert_encodingの使用方法については、公式Webサイトをご覧ください:

http://cn.php.net/manual/en/function.mb-convert-encoding.php

PHP の別の関数 iconv も文字列エンコーディングの変換に使用され、その関数は上記の関数と似ています。

以下にいくつかの詳細な例があります:
iconv — 文字列を要求された文字エンコーディングに変換します
(PHP 4 >= 4.0.5、PHP 5)
mb_convert_encoding — 文字エンコーディングを変換する
(PHP 4 >= 4.0.6、PHP 5)

使用法:
string mb_convert_encoding ( string str, string to_encoding [,混合 from_encoding] )
まず mbstring 拡張ライブラリを有効にし、php.ini の extension=php_mbstring.dll の前にある ; を削除する必要があります。 mb_convert_encoding は複数の入力エンコーディングを指定できますが、内容に基づいて自動的に識別されますが、実行効率は iconv よりもはるかに悪くなります。
文字列 iconv (文字列 in_charset、文字列 out_charset、文字列 str)

注: 変換先のエンコーディングの指定に加えて、2 番目のパラメーターでは、//TRANSLIT と //IGNORE の 2 つの接尾辞を追加することもできます。//TRANSLIT は、直接変換できない文字を 1 つ以上の近似文字に自動的に変換します。 //IGNORE は変換できない文字を無視し、デフォルトの効果は最初の不正な文字から切り捨てられます。

変換された文字列を返すか、失敗した場合は FALSE を返します。

使用:

iconv が文字「-」を gb2312 に変換するときにエラーが発生することが判明しました。ignore パラメータがないと、この文字に続くすべての文字列を保存できません。この「-」はどうやってもうまく変換できず出力できません。 なお、mb_convert_encoding にはこのバグはありません

通常の状況では、iconv を使用します。mb_convert_encoding 関数は、元のエンコーディングが特定できない場合、または変換後に iconv が正常に表示されない場合にのみ使用してください。
from_encoding は、変換前の文字コード名で指定されます。配列または文字列 (カンマ区切りの列挙リスト) が可能です。指定されていない場合は、内部エンコーディングが使用されます。 /* JIS、eucjp-win、sjis-win からエンコードを自動検出し、str を UCS-2LE に変換します */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);

/* 「auto」は「ASCII,JIS,UTF-8,EUC-JP,SJIS」に展開されます */

$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例:

コードは次のとおりです

コードをコピー $content = iconv("GBK", "UTF-8", $content); $content = mb_convert_encoding($content, "UTF-8", "GBK"); ?>




これは入出力の文字エンコーディングに応じて変換できます

コードは次のとおりです

コードをコピー

関数 phpcharset($data, $to) { if(is_array($data)) { foreach($data as $key => $val) { $data[$key] = phpcharset($val, $to);
}

} その他 {
$encode_array = array('ASCII', 'UTF-8', 'GBK', 'GB2312', 'BIG5');
$encoded = mb_detect_encoding($data, $encode_array);
$to = strtoupper($to);
if($encoded != $to) {
$data = mb_convert_encoding($data, $to, $encoded);
}
}
$data を返します;
}
?>





http://www.bkjia.com/PHPjc/632791.htmlwww.bkjia.com

tru​​e

技術記事 PHP では、通常、iconv と mb_convert_encoding を使用して文字エンコーディングを変換しますが、mb_convert_encoding は変換パフォーマンスの点で iconv よりもはるかに劣ります。 string iconv ( string...
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Dec 24, 2024 pm 04:42 PM

PHP 8.4 では、いくつかの新機能、セキュリティの改善、パフォーマンスの改善が行われ、かなりの量の機能の非推奨と削除が行われています。 このガイドでは、Ubuntu、Debian、またはその派生版に PHP 8.4 をインストールする方法、または PHP 8.4 にアップグレードする方法について説明します。

CakePHP の日付と時刻 CakePHP の日付と時刻 Sep 10, 2024 pm 05:27 PM

Cakephp4 で日付と時刻を操作するには、利用可能な FrozenTime クラスを利用します。

CakePHP について話し合う CakePHP について話し合う Sep 10, 2024 pm 05:28 PM

CakePHP は、PHP 用のオープンソース フレームワークです。これは、アプリケーションの開発、展開、保守をより簡単にすることを目的としています。 CakePHP は、強力かつ理解しやすい MVC のようなアーキテクチャに基づいています。モデル、ビュー、コントローラー

CakePHP ファイルのアップロード CakePHP ファイルのアップロード Sep 10, 2024 pm 05:27 PM

ファイルのアップロードを行うには、フォーム ヘルパーを使用します。ここではファイルアップロードの例を示します。

CakePHP バリデータの作成 CakePHP バリデータの作成 Sep 10, 2024 pm 05:26 PM

Validator は、コントローラーに次の 2 行を追加することで作成できます。

PHP 開発用に Visual Studio Code (VS Code) をセットアップする方法 PHP 開発用に Visual Studio Code (VS Code) をセットアップする方法 Dec 20, 2024 am 11:31 AM

Visual Studio Code (VS Code とも呼ばれる) は、すべての主要なオペレーティング システムで利用できる無料のソース コード エディター (統合開発環境 (IDE)) です。 多くのプログラミング言語の拡張機能の大規模なコレクションを備えた VS Code は、

CakePHP クイックガイド CakePHP クイックガイド Sep 10, 2024 pm 05:27 PM

CakePHP はオープンソースの MVC フレームワークです。これにより、アプリケーションの開発、展開、保守がはるかに簡単になります。 CakePHP には、最も一般的なタスクの過負荷を軽減するためのライブラリが多数あります。

PHPでHTML/XMLを解析および処理するにはどうすればよいですか? PHPでHTML/XMLを解析および処理するにはどうすればよいですか? Feb 07, 2025 am 11:57 AM

このチュートリアルでは、PHPを使用してXMLドキュメントを効率的に処理する方法を示しています。 XML(拡張可能なマークアップ言語)は、人間の読みやすさとマシン解析の両方に合わせて設計された多用途のテキストベースのマークアップ言語です。一般的にデータストレージに使用されます

See all articles