私のphpファイルの1つはgbkでエンコードされており、utf8エンコード形式に変換したいのですが、その中にいくつかの単語があり、フォントはiconvでは変換できません。どうすればよいでしょうか、PHP言語を使用してutf8エンコード形式に変換します
返信内容:
《エンコーディング》256 枚のシールが入った小さな箱があり、それぞれに番号が付いています。あなたは学校の「シールコード愛好家グループ」に参加しています。よく一緒にゲームをする女の子がいます。「この夏どこに行きましたか?」と尋ねると、彼女は「78、89」と答えます。 、67インチ。お二人とも自分のアザラシにとても慣れているので、彼女が「NYC」を意味していることはすぐにわかりました。
「それではどこで生まれたのですか?」とあなたは尋ねます。
彼女はためらって、少し考えて、「77、195、188、110、99、104、101、110」と言いました。
あなたはびっくりしました。 1 箱には 256 個のスタンプが入っていますが、通常は最初の 128 個しか使用しません。 77 が M であることは知っていますが、195 とは何ですか?一瞬思い出せなかったので、仕方なく持ち歩いていた印鑑の箱から195番と188番を取り出して紙に押しました。 。
それで女の子は「ミュンヘン」と言いました。しかし、これは何を意味するのでしょうか? Ã と ⁄ プラットフォーム?あなたはその小さな女の子を疑いの目で見ました、そしてその小さな女の子もあなたを疑いの目で見ました。彼女が振り返り、箱を取り出して開けるのを見たとき、あなたは唖然としました。中には何千もの小さなアザラシがびっしりと詰まっていました。そして層がたくさんあります!少女は器用にある階層の方を向いて、爪で小さな印鑑を選び、紙に
「ü」
という記号を印刷して、あなたにその印鑑を手渡しました。手に取って見てみると、実は「C3 BC」と刻印されており、さらに「195 188」という小さな文字が並んでいます。つまり...彼女にとって、195 188 は「ü」のシールが印刷できることを意味します...しかし、彼女はあなたの箱にも「ü」があるという印象を持ったので、あなたは箱から 252 番のシールを取り出します。ボックスに入れて彼女に渡します。それはただの「ü」です。あなたが途方にくれて顔を見合わせて泣きそうになったとき、利益団体のカウンセラーがやって来て、「子供たち、悲しまないで、愛を信じ続けなさい。」と優しく言いました。そして彼は一冊の本を手に取りました。壁の本棚から、表紙に「ICONV」と印刷された大きな本を手際よくめくって「iso8859」の章を開き、その項目の最後の番号「00fc
ü: 252
」を指さしました。 「見てください! iso8859 ü は 252 番です!」そして彼は「utf8」の章に目を向け、「00fc
ü: C3 BC」を指してこう言いました。「そして、utf8 の ü は 16 進数の C3 です」 、BC、十進数で言うと 195、188 です!」
おじさんは大きな本を閉じ、あなたの印鑑の箱をひっくり返し、裏に印刷された小さな文字の行をあなたに指摘しました:「iso8859でエンコード」、外国人の女の子の箱の裏には「utf8」で「エンコード済み」と印刷されています。 「私があなたを助けることはここまでしかできません、若者よ」 叔父は、理解したようなあなたを見て微笑みながら言いました。
なぜこのような本があるのか、なぜ各箱に同じものが入っていないのかはよくわかりませんが、今後、知らない番号を言う少女に出会ったら、あなたは一緒に本「ICONV」をチェックして、子供の頃の幸せな生活を送りましょう。
——————別記事——————
《フォント》
印鑑収集愛好家として、私は人生でたくさんの箱を集めました。各箱には番号の付いた穴がたくさんあり、それぞれの穴にシールが挿入されています。「Arial」と書かれた箱があり、その中にある65番のシールを取り出します。
と書かれています。
「ブラシ スクリプト」ボックスの No. 65 など、他の多くのボックスにある No. 65 スタンプのパターンは非常に似ています。
ある日、「Webdings」と書かれた箱に出会うまでは、中のシール番号 65 が次のように紙に印刷されていました。
... 次に、あなたは子供の頃に一緒に遊んだ女の子のことを思い出し、震える手で 78、89、67 の 3 つのシールを取り出し、紙に押します。
————————
エンコーディングとフォントの関係は何ですか?
「00fc ü: 252」と「00fc ü: C3 BC」の「00fc」は何でしょうか?
iconv は何に使用されますか?
- ————————
- 質問への答え:
- フォントは文字の
形状
とエンコーディングを表します。これは、特定の
数字
がどの文字を表すかによって生じる
規則- です。フォントは特定のコードで配置されますが、78 が文字 N である場合もあれば、目である場合もあるのと同様に、コードと特定のフォントの間に必ずしも関連性はありません。 世界中で考えられるすべての記号をリストに集め、その中の各文字に一意の番号を割り当てるこのエンコーディング プランは Unicode と呼ばれます。そして、それらの番号は (Unicode) コード ポイントと呼ばれます。 00fc は、Unicode エンコード方式における ü のコード ポイントです。 Unicode の特定の文字のコード ポイントは、iconv を通じて見つけることができます。utf8 または iso8859 の対応するコード ポイントも、iconv を通じて見つけることができます。 utf8 の。つまり、iconv はエンコーディングを変換できますが、このエンコーディングの表示に使用される特定のフォントは iconv とは何の関係もありません。 ご招待ありがとうございます。
彼らはみな偉大な達人で、通りすがりの新人にすぎません。
Tao Wu の答えは非常に鮮やかで、エンコーディングとフォントを区別する必要があります。なぜこのような疑問が出るのかというと、変換後の表示がおかしいからでしょうか?
質問してください。PPT を開くと、多くのものが自動的に Webding フォントに変換されてしまい、復元できません。
ありがとうございます。
入力したものはピンイン「da」で、「big」を選択します- システムは現在のエンコーディングに従って 0x34 0x35 を入力します
フォント ライブラリはグラフィック ライブラリまたはベクター グラフィック ライブラリであり、「big」はそれに応じて表示されますエンコーディング 0x34 0x35- 異なるフォント ライブラリで同じエンコーディングを持つ画像は、異なる方法で描画される可能性があります。
——————しかし、ここでも質問があります:
utf8 と gbk は両方とも「big」と入力できますが、エンコーディングとフォントは対応していますか?どのように対応しているのでしょうか?それともマッピング用の中間層はありますか?
(libiconv と freetype のコードは昔見たのですが、今ではまったく思い出せません。)
文字エンコードについて:文字エンコード入門