Java/ColdFusion/CFML を使用した言語検出ライブラリ (および API) の比較
言語検出は、過去のプロジェクトで必要だった機能です。 2020 年に、Optimaize Language Detector Java ライブラリの kju2 フォークの使用に関する記事を書きました。 Optimaize ライブラリは 2015 年以降更新されておらず、kju2 フォークは 2023 年 4 月 16 日に読み取り専用モードになりました。
Lingua Java ライブラリを評価しました。これは「Java および JVM 用の最も正確な自然言語検出ライブラリであり、長文にも短文にも同様に適しています」と主張しており、積極的に更新およびサポートされているようです。 私の小規模な単体テストでは、Lingua の速度がわずかに遅く、マレー語のテキストを正しく識別できなかったようです。
両方の Java ライブラリの検出時間は、英語ではかなりランダムでした。 295 ミリ秒で応答が返される場合もあれば、48,000 ミリ秒以上かかる場合もあります。 (私の開発用 PC だけかもしれません。) kju2 の方が平均的に速いようです。
また、165 の言語をサポートし、「精度が高い」と主張するサードパーティの Detect Language API も見つけました。 API キーが必要で、無料プランとプレミアム プランの両方が提供されます。
Java や ColdFusion/CFML を使用して言語検出を実行している場合、何を使用していますか?
そうあるべき | kju2 lang | kju2 ミリ秒 | リンガラン | リンガMS | API 言語 | API ms | サンプルテキスト |
---|---|---|---|---|---|---|---|
英語 | 英語 | 2272 | 英語 | 570 | ja | 537 | スペイン語の語彙を学ぶための優れた方法は、完全にスペイン語で書かれたテキスト、物語、記事を読むことです。だからこそ、私たちはさまざまなトピックについてスペイン語で独自の短い読み物を書きました。 |
ギリシャ語 | ギリシャ語 | 6 | ギリシャ語 | 12 | エル | 105 | Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ. |
フランス語 | フランス語 | 61 | フランス語 | 78 | フランス | 70 | お休みなさい、フランスは永遠に終わります。ル・ソレイユ・セ・レーヴ・タール。 Il fait encore nuit quand je vais au travail.パルフォワ、私はネージュのようなものです。 |
ヘブライ語 | ヘブライ語 | 3 | ヘブライ語 | 11 | わあ | 110 | כל ישראל יש להם חלק לעולם הבא, שנאמר ועמך כולם צדיקים, לעולם יירש |
アラビア語 | アラビア語 | 2 | アラビア語 | 19 | アル | 81 | عندما يريد العالم أن يتكلّم ، فهو يتحدّث بلغة يونيكود。 سجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود |
中国語 | 中国語 | 2 | 中国語 | 8 | zh | 74 | 長くなると見栄えが悪くなるが、それでも善良な心を持っている。 小さな子に恵まれた家は、大水に襲われ、家には耐えられない。これに限らず、藁の痛み、病状、薬物摂取のない都市は、できるかぎり助けになります。 |
韓国語 | 12 | 韓国語 | 3 | こ | 120 | 안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다。 | |
スペイン語 | 0 | スペイン語 | 116 | は | 92 | 習慣的に、航空便の運航を停止し、航空便の運航を停止してください。 | |
タイ | 1 | タイ | 14 | 番目 | 105 | ข้อ 1 มนุษย์ทั้งหลายเกิดมามีอิสระและเสมอภ意味:意味ด้วยเจตนารมณ์แห่งภราดรภาพ | |
ベトナム語 | 2 | ベトナム語 | 14 | ヴィ | 98 | これは、私があなたに与えられたことです。 Mọi con người đều được tạo hoa ban cho lý trí và lương tâm và cần phải đối xử với nhau trong tình anh em. | |
トルコ語 | 3 | トルコ語 | 93 | tr | 212 | ユカルダ マヴィ ギョク、アサドゥ ヤジズ ヤラトゥルドゥクタ;イキシニン アラシンダ インサン オール ヤラトゥルムシュ。 İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak テュルク ミレチニン ülkesini、türesini、idare edivermiş、tanzim edivermis。デルト・タラフ・ヘップ・デュシュマン・イミシュ。質問者は、あなたの意見を聞いてください。 Başlılara baş eğdirmiş、dizlirere diz çöktürmüş. | |
日本語 | 3 | 日本語 | 7 | じゃ | 194 | 幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんは中に入れるができ、私はまた働いてたらき始めました。 | |
ロシア語 | ロシア語 | 2 | ロシア語 | 1393 | る | 96 | すべての人は生まれながらにして自由であり、その尊厳と権利は平等です。彼らには理性と良心が与えられており、兄弟愛の精神でお互いに行動しなければなりません。 |
フィンランド語 | フィンランド語 | 6 | フィンランド語 | 383 | フィ | 125 | 誰もが教育を受ける権利を持っています。教育は、少なくとも初等教育と基礎教育については無料でなければなりません。初等教育は義務教育でなければなりません。技術教育および職業教育は普遍的に受けられなければならず、高等教育は能力に応じてすべての人に平等に開かれていなければなりません。 |
ウルドゥー語 | ウルドゥー語 | 1 | ウルドゥー語 | 22 | 君 | 104 | を使用してください。 |
タイ | タイ | 1 | タイ | 2 | 番目 | 78 | こんにちは世界|
マレー語 | 2 | 不明 | 291 | ID | 88 | ペサンの道徳はセリタ・ラクヤット・バワン・メラ・バワン・プティ・アダラ・ジャンガン・テリヤ・タマク・ダン・セラカです。セピアプ・オラン・スーダ・メミリキ・レゼキンヤ・マシング・マシング。オラン・ヤン・テリブ・セラカ・アカン・メンダパット・バラサン・ヤン・セットンパル・デンガン・ペルブアタンヤ。 Selalu berbuat baik lah Dalam ikiap hanpah laku、maka kitakan mendapat kebidahan dan happanika. |
https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25
以上がJava/ColdFusion/CFML を使用した言語検出ライブラリ (および API) の比較の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











一部のアプリケーションが適切に機能しないようにする会社のセキュリティソフトウェアのトラブルシューティングとソリューション。多くの企業は、内部ネットワークセキュリティを確保するためにセキュリティソフトウェアを展開します。 ...

システムドッキングでのフィールドマッピング処理は、システムドッキングを実行する際に難しい問題に遭遇することがよくあります。システムのインターフェイスフィールドを効果的にマッピングする方法A ...

データベース操作にMyBatis-Plusまたはその他のORMフレームワークを使用する場合、エンティティクラスの属性名に基づいてクエリ条件を構築する必要があることがよくあります。あなたが毎回手動で...

多くのアプリケーションシナリオでソートを実装するために名前を数値に変換するソリューションでは、ユーザーはグループ、特に1つでソートする必要がある場合があります...

intellijideaultimatiateバージョンを使用してスプリングを開始します...

Javaオブジェクトと配列の変換:リスクの詳細な議論と鋳造タイプ変換の正しい方法多くのJava初心者は、オブジェクトのアレイへの変換に遭遇します...

eコマースプラットフォーム上のSKUおよびSPUテーブルの設計の詳細な説明この記事では、eコマースプラットフォームでのSKUとSPUのデータベース設計の問題、特にユーザー定義の販売を扱う方法について説明します。

データベースクエリにTKMYBATISを使用する場合、クエリ条件を構築するためにエンティティクラスの変数名を優雅に取得する方法は一般的な問題です。この記事はピン留めします...
