PHP はどのようにして UTF-8 文字列の言語を検出できるのでしょうか?-PHPチュートリアル-php.cn

PHP はどのようにして UTF-8 文字列の言語を検出できるのでしょうか?

Patricia Arquette

リリース： 2024-12-03 22:32:12

オリジナル

1176 人が閲覧しました

How Can PHP Detect the Language of a UTF-8 String?

UTF-8 文字列の PHP 言語検出

PHP では、UTF-8 文字列の言語を検出するのが一般的なタスクです。汎用性の高いソリューションの 1 つは、Text_LanguageDetect PEAR パッケージです。

このパッケージは、52 言語のデータベースを備えており、使いやすさを提供します。ただし、東アジア言語の検出はサポートされていません。

使用法

Text_LanguageDetect パッケージを使用するには、次の手順に従います。

require_once 'Text/ を使用してパッケージを含めます。 LanguageDetect.php';
言語検出器オブジェクトを初期化します: $l = new Text_LanguageDetect();
言語を検出し、返される上位の結果の数を指定します: $result = $l->detect($text, 4);

検出が成功すると、検出された言語とその信頼スコアを含む配列を受け取ります。それ以外の場合は、エラーメッセージが表示されます。

例

次の例を考えてみましょう:

require_once 'Text/LanguageDetect.php';
$l = new Text_LanguageDetect();
$result = $l->detect("Hallo Welt", 4);

if (PEAR::isError($result)) {
    echo $result->getMessage();
} else {
    print_r($result);
}

ログイン後にコピー

このコードは、文字列「Hallo Welt」の言語を検出し、検出された言語の配列とその信頼スコアを返します。配列は次のようになります:

Array
(
    [german] => 0.407037037037
    [dutch] => 0.288065843621
    [english] => 0.283333333333
    [danish] => 0.234526748971
)

ログイン後にコピー

以上がPHP はどのようにして UTF-8 文字列の言語を検出できるのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。