Java/ColdFusion/CFML を使用した言語検出ライブラリ (および API) の比較

WBOY
リリース: 2024-09-06 06:00:32
オリジナル
962 人が閲覧しました

Comparing Language Detection Libraries (& API) Using Java/ColdFusion/CFML

言語検出は、過去のプロジェクトで必要だった機能です。 2020 年に、Optimaize Language Detector Java ライブラリの kju2 フォークの使用に関する記事を書きました。 Optimaize ライブラリは 2015 年以降更新されておらず、kju2 フォークは 2023 年 4 月 16 日に読み取り専用モードになりました。

Lingua Java ライブラリを評価しました。これは「Java および JVM 用の最も正確な自然言語検出ライブラリであり、長文にも短文にも同様に適しています」と主張しており、積極的に更新およびサポートされているようです。 私の小規模な単体テストでは、Lingua の速度がわずかに遅く、マレー語のテキストを正しく識別できなかったようです。

両方の Java ライブラリの検出時間は、英語ではかなりランダムでした。 295 ミリ秒で応答が返される場合もあれば、48,000 ミリ秒以上かかる場合もあります。 (私の開発用 PC だけかもしれません。) kju2 の方が平均的に速いようです。

また、165 の言語をサポートし、「精度が高い」と主張するサードパーティの Detect Language API も見つけました。 API キーが必要で、無料プランとプレミアム プランの両方が提供されます。

Java や ColdFusion/CFML を使用して言語検出を実行している場合、何を使用していますか?

韓国語韓国語12韓国語3こ120안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다。 スペイン語スペイン語0スペイン語116は92習慣的に、航空便の運航を停止し、航空便の運航を停止してください。タイタイ1タイ14番目105ข้อ 1 มนุษย์ทั้งหลายเกิดมามีอิสระและเสมอภ意味:意味ด้วยเจตนารมณ์แห่งภราดรภาพベトナム語ベトナム語2ベトナム語14ヴィ98これは、私があなたに与えられたことです。 Mọi con người đều được tạo hoa ban cho lý trí và lương tâm và cần phải đối xử với nhau trong tình anh em.トルコ語トルコ語3トルコ語93tr212ユカルダ マヴィ ギョク、アサドゥ ヤジズ ヤラトゥルドゥクタ;イキシニン アラシンダ インサン オール ヤラトゥルムシュ。 İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak テュルク ミレチニン ülkesini、türesini、idare edivermiş、tanzim edivermis。デルト・タラフ・ヘップ・デュシュマン・イミシュ。質問者は、あなたの意見を聞いてください。 Başlılara baş eğdirmiş、dizlirere diz çöktürmüş.日本語日本語3日本語7じゃ194幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんは中に入れるができ、私はまた働いてたらき始めました。 を使用してください。 こんにちは世界 マレー語
そうあるべき kju2 lang kju2 ミリ秒 リンガラン リンガMS API 言語 API ms サンプルテキスト
英語 英語 2272 英語 570 ja 537 スペイン語の語彙を学ぶための優れた方法は、完全にスペイン語で書かれたテキスト、物語、記事を読むことです。だからこそ、私たちはさまざまなトピックについてスペイン語で独自の短い読み物を書きました。
ギリシャ語 ギリシャ語 6 ギリシャ語 12 エル 105 Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ.
フランス語 フランス語 61 フランス語 78 フランス 70 お休みなさい、フランスは永遠に終わります。ル・ソレイユ・セ・レーヴ・タール。 Il fait encore nuit quand je vais au travail.パルフォワ、私はネージュのようなものです。
ヘブライ語 ヘブライ語 3 ヘブライ語 11 わあ 110 כל ישראל יש להם חלק לעולם הבא, שנאמר ועמך כולם צדיקים, לעולם יירש
アラビア語 アラビア語 2 アラビア語 19 アル 81 عندما يريد العالم أن يتكلّم ، فهو يتحدّث بلغة يونيكود。 سجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود
中国語 中国語 2 中国語 8 zh 74 長くなると見栄えが悪くなるが、それでも善良な心を持っている。 小さな子に恵まれた家は、大水に襲われ、家には耐えられない。これに限らず、藁の痛み、病状、薬物摂取のない都市は、できるかぎり助けになります。
ロシア語 ロシア語 2 ロシア語 1393 96 すべての人は生まれながらにして自由であり、その尊厳と権利は平等です。彼らには理性と良心が与えられており、兄弟愛の精神でお互いに行動しなければなりません。
フィンランド語 フィンランド語 6 フィンランド語 383 フィ 125 誰もが教育を受ける権利を持っています。教育は、少なくとも初等教育と基礎教育については無料でなければなりません。初等教育は義務教育でなければなりません。技術教育および職業教育は普遍的に受けられなければならず、高等教育は能力に応じてすべての人に平等に開かれていなければなりません。
ウルドゥー語 ウルドゥー語 1 ウルドゥー語 22 104
タイ タイ 1 タイ 2 番目 78
マレー語 2 不明 291 ID 88 ペサンの道徳はセリタ・ラクヤット・バワン・メラ・バワン・プティ・アダラ・ジャンガン・テリヤ・タマク・ダン・セラカです。セピアプ・オラン・スーダ・メミリキ・レゼキンヤ・マシング・マシング。オラン・ヤン・テリブ・セラカ・アカン・メンダパット・バラサン・ヤン・セットンパル・デンガン・ペルブアタンヤ。 Selalu berbuat baik lah Dalam ikiap hanpah laku、maka kitakan mendapat kebidahan dan happanika.
ソースコード

https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25

以上がJava/ColdFusion/CFML を使用した言語検出ライブラリ (および API) の比較の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:dev.to
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート