コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > PHPチュートリアル > PHP分割GBK中国語文字化けの解決策

PHP分割GBK中国語文字化けの解決策

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2016-07-25 09:00:11

オリジナル

1213 人が閲覧しました

PHP で中国語の文字列を gbk エンコード形式で分割すると文字化けが発生しやすくなります。この問題を解決するにはどうすればよいですか?困っている友達は、この記事の紹介を参照してください。

次のような文字列 (GBK) の場合、explode は正しい結果を取得できません。 $result =explode("|", "滕華塔|海青");

その理由は、文字「韬」（タオと発音します。あなたがそれを知らなくても問題ありませんし、私も知りません）の場合、その GBK エンコーディング値が 8f7c であるためです。残念ながら、ASCII 値は「」です。 |"も7cです

同様の問題がいくつかあります。 GBK エンコードのエンコード範囲は 0x8140-0xfefe であるため、理論的には、下位バイトが 7c の単語には次のような問題が発生します。倈(827c)、億(837c)、禧(b17c)、鴴(e57c)...など

この状況に関しては、まず、utf8 へのトランスコーディングを使用してから、分解してから元に戻すことができます。これは、より面倒な方法です。 2 番目に、正規表現を使用して、「分離」を「一致」に置き換えることができます。 preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//ハードコーディングされたエンコーディングこのように、$matches のインデックス 0 に対応する配列が結果の単語の配列になります。

上記は php GBK エンコーディングの問題の解決策です。皆さんとのコミュニケーションを歓迎します。

関連ラベル：

php分割GBK中文乱码的解决方法

前の記事：質問に基づいてパスワード関数を取得するための PHP 実装コード次の記事：PHP タイムスタンプ関数の概要と例

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

LLMSの仕組み：トレーニング後、ニューラルネットワーク、幻覚、推論への事前トレーニング

2025-02-26 03:58:14
ブロックチェーンとAIを組み合わせてアートを生成しました。次に何が起こったのか。

2025-02-26 03:38:10
高度なプロンプトエンジニアリング：思考チェーン（COT）

2025-02-26 03:17:10
SQLiteでの検索拡張生成

2025-02-26 02:49:09
独自のnode.js APIを構築するためにLLM駆動のボイラープレートを使用する方法

2025-02-26 01:08:13
2024年のコーディングのためのLLMS：価格、パフォーマンス、そして最高の戦い

2025-02-26 00:46:10
ビジョン言語モデルを促します

2025-02-25 23:42:08
大手言語モデルの応答の信頼性を測定する方法

2025-02-25 22:50:13
人生の幻想

2025-02-25 21:54:11
科学者は人間の思考を反映する大きな言語モデルに真剣に取り組む

2025-02-25 20:45:11

最新の問題

PHPでキャッシュを実装する方法を説明します。

2025-03-21 13:39:34
PHPでDateTimeクラスをどのように使用しますか？

2025-03-21 13:38:34
PHPの名前空間の目的を説明します。

2025-03-21 13:37:19
PHPのクローンと__Clone（）の違いは何ですか？

2025-03-21 13:35:24
spl_autoload_register（）関数をどのように使用しますか？

2025-03-21 13:34:32

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート