PHP でウムラウトを同等の ASCII 文字列に置き換える
ウムラウトを含む UTF-8 文字列を、最も近い 7 ビット ASCII 文字列に変換しようとしています。 「lärm」などの文字を「larm」に、「andré」を「larm」に変換します。 「アンドレ」最初は、utf8_decode の後に strtr を使用してこの変換を行おうとしました。ただし、UTF-8 でエンコードされたソース ファイルが原因で、ウムラウトに ISO-8859-15 文字を入力するのが困難になりました。
解決策として ISO-8859-15 ファイルを含めることが考えられますが、より効率的なアプローチ。 iconv 関数は、異なる文字エンコーディング間で文字列を変換するための堅牢な方法を提供します。
目的を達成するには、次のコードを使用できます。
$input = "lärm andré"; echo iconv("utf-8","ascii//TRANSLIT",$input);
この更新されたアプローチは、ascii// を利用します。 TRANSLIT オプション。非 ASCII 文字を最も近い ASCII 文字に変換します。これにより、手動で文字をマッピングする必要がなくなり、UTF-8 文字列のウムラウトを処理する信頼性の高い方法が提供されます。
拡張例:
次の拡張例は、iconv を示しています。さまざまな文字エンコーディングとの間の変換における関数の多用途性:
$input = "こんにちは世界"; echo iconv("UTF-8", "UTF-16BE", $input); // Convert to UTF-16BE echo iconv("UTF-16BE", "ASCII//TRANSLIT", $input); // Translate to ASCII equivalents
この例ではたとえば、入力文字列は UTF-8 から UTF-16BE に変換され、その後同等の ASCII 文字列に変換されます。これは、さまざまな文字エンコーディングと変換操作を処理する際の iconv の柔軟性を示しています。
以上がPHP でウムラウトを同等の ASCII に効率的に置き換えるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。