PHP で文字列から言語を検出する方法
PHP で特定の文字列の言語を判別する必要がある場合、いくつかの方法があります。あなたが取れるアプローチ。 1 つのオプションは、Text_LanguageDetect PEAR パッケージを利用することです。
Text_LanguageDetect の使用
Text_LanguageDetect パッケージは、UTF-8 でエンコードされた文字列の言語を検出する簡単な方法を提供します。これを使用する方法の簡単なデモを次に示します。
require_once 'Text/LanguageDetect.php'; $l = new Text_LanguageDetect(); $result = $l->detect($text, 4); if (PEAR::isError($result)) { echo $result->getMessage(); } else { print_r($result); }
この例では、$text は分析する文字列を表し、$result は検出された各言語の確率を含む配列です。 「4」引数は、検出する言語の最大数を指定します。
検出プロセスの出力は次のようになります:
Array ( [german] => 0.407037037037 [dutch] => 0.288065843621 [english] => 0.283333333333 [danish] => 0.234526748971 )
ご覧のとおり、パッケージは推定値を提供します。入力文字列の言語確率分布の。これは、言語識別タスクや多言語アプリケーションの作成に役立ちます。
以上がPHP で文字列の言語を判断するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。