ホームページ バックエンド開発 PHPの問題 PHPを使用してUnicodeとutf8を変換するにはどうすればよいですか?

PHPを使用してUnicodeとutf8を変換するにはどうすればよいですか?

Jul 10, 2020 am 11:03 AM
php unicode utf8

PHP を使用して Unicode と utf8 を変換する方法: まず、[4-6] バイトのエンコードを考慮する必要はありません。その後、4 バイトを超える [utf-8] 文字​​が表示されます。直接文字化けとみなされますが、無視するか、Unicode エンティティ形式に変換すると、コードは [$utf8char = "{$c};"] になります。

PHPを使用してUnicodeとutf8を変換するにはどうすればよいですか?

php を使用して Unicode と utf8 を変換する方法:

Unicode エンコードでは、utf-8 と gb を実装します。シリーズ エンコード (gb2312、gbk、gb18030) 変換の基礎. utf-8 からこれらのエンコードへの比較表を直接作成することもできますが、utf-8 の可変エンコードが不確実であるため、これを行う人はほとんどいません。一般に、Unicode と gb エンコーディング間の比較表が使用されます。Unicode (UCS-2) は実際には utf-8 の基本エンコーディングであり、utf-8 はその実装にすぎません。この 2 つは次の対応関係があります:

  • #Unicode 記号の範囲 | UTF-8 エンコード方式

  • ##u0000 0000 - u0000 007F | 0xxxxxxxx

  • # #u0000 0080 - u0000 07FF | 110xxxxx 10xxxxxx
  • ##u0000 0800 - u0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
  • 現在 utf-8 で使用されている文字のため、すべてUCS-2なので、4~6バイトのエンコーディングを考慮する必要はありません。同様に、逆変換時にUTF-8の文字が4バイト以上出現した場合は、そのまま文字化けとみなします。無視または変換します。 Unicode エンティティ形式 ("long int;" 形式) に変換し、それをブラウザまたは関連する解析プログラムに渡して処理します。PHP を使用して Unicode を utf-8 エンコーディングに変換するアルゴリズムは次のとおりです:
  • /*
     * 参数 $c 是unicode字符编码的int类型数值,如果是用二进制读取的数据,在php中通常要用 hexdec(bin2hex( $bin_unichar )) 这样转换
     */
    function uni2utf8( $c )
    {
      if ($c < 0x80)
      {
            $utf8char = chr($c);
      }
      else if ($c < 0x800)
      {
            $utf8char = chr(0xC0 | $c >> 0x06).chr(0x80 | $c & 0x3F);
      }
      else if ($c < 0x10000)
      {
            $utf8char = chr(0xE0 | $c >> 0x0C).chr(0x80 | $c >> 0x06 & 0x3F).chr(0x80 | $c & 0x3F);
      }
      //因为UCS-2只有两字节,所以后面的情况是不可能出现的,这里只是说明unicode HTML实体编码的用法。
      else
      {
            $utf8char = "&#{$c};";
      }
      return $utf8char;
    }
    ログイン後にコピー
現在の環境では、utf-8 文字セット == unicode (UCS-2) と考えられますが、理論上、主要な文字セット関係の包含関係は次のとおりです。

utf-8 > unicode(UCS-2) > gb18030 > gbk > gb2312
ログイン後にコピー

したがって、エンコードがすべて正しい場合:

gb2312 => gbk => gb18030 => unicode(UCS-2) => utf-8
ログイン後にコピー

このような変換プロセスは基本的にロスレスですが、逆に

utf-8 => unicode(UCS-2) => gb18030=> gbk => gb2312
ログイン後にコピー

このような変換処理では、認識できない文字が含まれる可能性が非常に高いため、システムが UTF-8 エンコードを使用している場合は、安易にエンコード操作を逆にしないようにしてください。

関連する学習の推奨事項:

PHP プログラミングの入門から熟練度まで

以上がPHPを使用してUnicodeとutf8を変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

session_start()が複数回呼び出されるとどうなりますか? session_start()が複数回呼び出されるとどうなりますか? Apr 25, 2025 am 12:06 AM

session_start()への複数の呼び出しにより、警告メッセージと可能なデータ上書きが行われます。 1)PHPは警告を発し、セッションが開始されたことを促します。 2)セッションデータの予期しない上書きを引き起こす可能性があります。 3)session_status()を使用してセッションステータスを確認して、繰り返しの呼び出しを避けます。

作曲家:AIを介したPHP開発の援助 作曲家:AIを介したPHP開発の援助 Apr 29, 2025 am 12:27 AM

AIは、作曲家の使用を最適化するのに役立ちます。特定の方法には次のものが含まれます。1。依存関係管理の最適化:AIは依存関係を分析し、最適なバージョンの組み合わせを推奨し、競合を減らします。 2。自動コード生成:AIは、ベストプラクティスに準拠したComposer.jsonファイルを生成します。 3.コードの品質を改善する:AIは潜在的な問題を検出し、最適化の提案を提供し、コードの品質を向上させます。これらの方法は、開発者が効率とコードの品質を向上させるのに役立つ機械学習および自然言語処理技術を通じて実装されています。

session_start()関数の重要性は何ですか? session_start()関数の重要性は何ですか? May 03, 2025 am 12:18 AM

session_start()iscrucialinphpformangingusersions.1)itInitiateSanewsessionifnoneExists、2)resumesanexistingsession、および3)SetSessionCookieforcontinuityAcrossRequests、ApplicationslicationSliviseSlikeUserauthicationAnticatent。

データ処理と計算にMySQL関数を使用する方法 データ処理と計算にMySQL関数を使用する方法 Apr 29, 2025 pm 04:21 PM

MySQL関数は、データ処理と計算に使用できます。 1.基本的な使用には、文字列処理、日付計算、数学操作が含まれます。 2。高度な使用法には、複数の関数を組み合わせて複雑な操作を実装することが含まれます。 3.パフォーマンスの最適化では、Where句での機能の使用を回避し、GroupByおよび一時テーブルを使用する必要があります。

H5:HTML5の重要な改善 H5:HTML5の重要な改善 Apr 28, 2025 am 12:26 AM

HTML5は5つの重要な改善をもたらします。1。セマンティックタグにより、コードの明確性とSEO効果が向上します。 2.マルチメディアサポートは、ビデオとオーディオの埋め込みを簡素化します。 3。フォームエンハンスメントは、検証を簡素化します。 4.オフラインおよびローカルストレージにより、ユーザーエクスペリエンスが向上します。 5。キャンバスとグラフィック機能は、Webページの視覚化を強化します。

作曲家:PHP開発者のパッケージマネージャー 作曲家:PHP開発者のパッケージマネージャー May 02, 2025 am 12:23 AM

Composerは、PHPの依存関係管理ツールであり、Composer.jsonファイルを介してプロジェクトの依存関係を管理しています。 1)依存関係情報を取得するためのComposer.jsonを解析する。 2)依存関係を解析して、依存性ツリーを形成します。 3)PackagistからVendorディレクトリへの依存関係をダウンロードしてインストールします。 4)Composer.Lockファイルを生成して、依存関係バージョンをロックして、チームの一貫性とプロジェクトの保守性を確保します。

cでタイプの特性を使用する方法は? cでタイプの特性を使用する方法は? Apr 28, 2025 pm 08:18 PM

Typetraitsは、Cでコンパイル時間タイプのチェックと操作に使用され、コードの柔軟性とタイプの安全性が向上します。 1)タイプの判断は、STD :: iS_integralおよびstd :: is_floating_pointを介して実行され、効率的なタイプチェックと出力を達成します。 2)std :: is_triviely_copyableを使用して、ベクトルコピーを最適化し、タイプに従って異なるコピー戦略を選択します。 3)コンパイル時間の意思決定、タイプの安全性、パフォーマンスの最適化、コードの複雑さに注意してください。タイプトライトの合理的な使用は、コードの品質を大幅に改善できます。

mysqlの文字セットと照合ルールを構成する方法 mysqlの文字セットと照合ルールを構成する方法 Apr 29, 2025 pm 04:06 PM

MySQLで文字セットと照合を構成する方法は次のとおりです。1。サーバーレベルでの文字セットとコレクションの設定:setNames'utf8 '; setCharacterSetutf8; setCollat​​ion_connection = 'utf8_general_ci'; 2。特定の文字セットと照合を使用するデータベースを作成します:createdatabaseexample_dbcharactersetutf8collat​​eutf8_general_ci; 3.テーブルを作成するときに文字セットとコレクションを指定:createTableExample_table(idint

See all articles