Meta Platforms は本日、NLLB-200 のシステム コードを公開しました。NLLB-200 は、Meta が社内で開発した、200 言語のテキストを翻訳できる人工知能システムです。
Meta は、研究者が NLLB-200 をソフトウェア プロジェクトにより簡単に適用できるように設計されたツール セットも発表しました。
Meta 氏によると、NLLB-200 が理解できる 200 言語の多くは、他の AI 翻訳システムでは十分にサポートされていません。現在広く使用されている翻訳ツールは 25 未満のアフリカ言語をサポートしていますが、NLLB-200 は最大 55 のアフリカ言語をサポートしています。
翻訳精度も、NLLB-200 が他のツールよりも優れている分野だとメタ氏は述べています。 Meta は、機械翻訳されたテキストの品質を測定するために使用されるアルゴリズムである BLEU 評価システムの精度基準を使用します。 Meta 氏によると、NLLB-200 の BLEU スコアは以前より平均 44% も高くなっています。
Meta CEO のマーク・ザッカーバーグ氏は、「私たちは 200 の異なる言語を翻訳できる自社開発の AI モデルをオープンソース化しましたが、その多くは現在の翻訳システムではサポートされていません。このプロジェクトはノーと呼ばれています」と述べました。置き去りにされた言語、そして私たちが使用する人工知能モデリング テクノロジーは、世界中の何十億人もの人々が話す言語の高品質な翻訳を生成しています。」
NLLB-200 には 500 億を超えるパラメーターがあり、これらの構成はAI システムがデータをどのように処理するかを決定します。 AI システムのパラメータが多ければ多いほど、その精度は高くなります。
NLLB-200 システムはメタ エンジニアによって開発された他の多くの AI イノベーションも利用しているため、NLLB-200 の多数のパラメータだけが、200 の言語を高精度でサポートできる唯一の要素ではありません。
Meta は、社内で開発された LASER ツールキットを使用して、機械学習関連の研究をサポートしています。このツールキットを使用すると、研究者は、ある言語で特定のタスクを実行するようにニューラル ネットワークをトレーニングし、そのニューラル ネットワークを他の言語に比較的簡単に適応させることができ、翻訳の目的に役立ちます。 Meta は、LASER の改良版である LASER3 をサポートする新しい NLLB-200 システムを開発しました。
LASER のオリジナル バージョンには、テキストを AI システムが理解できる数学的表現に変換する特殊なコンポーネントである LSTM と呼ばれるニューラル ネットワークが含まれていました。この数学的表現は、より正確な翻訳を生成するのに役立ちます。 LASER3 では、Meta が LSTM ニューラル ネットワークを、同じタスクをより効率的に実行できる高度な自然言語処理モデルである Transformer に置き換えます。
メタは、トレーニング データの収集に使用されるシステムをアップグレードしたり、AI トレーニング ワークフローに変更を加えたりするなど、NLLB-200 の機能を向上させるために他のいくつかの方法も使用しました。
Meta は、社内で開発された Research SuperCluster スーパーコンピューター (写真) を使用して NLLB-200 をトレーニングします。 Meta が今年 1 月に Research SuperCluster を初めて導入したとき、このシステムには 6,080 個の Nvidia の最新 A100 データセンター GPU が搭載されており、最終的には 16,000 個の GPU にアップグレードされる予定であると述べていました。
Meta は NLLB-200 を使用して、Facebook、Instagram、その他のプラットフォームでより優れた自動翻訳機能を提供する予定であり、このシステムは 1 日あたり 250 億件以上の翻訳をサポートすると予想されています。
Meta は社内で NLLB-200 の推進に取り組んでいる一方で、他の企業組織が独自のソフトウェア プロジェクトにシステムを導入できるよう支援することも計画しています。
Meta には、NLLB-200 に加えて、AI のトレーニングに使用できるオープンソース コードと、翻訳精度を評価するための FLORES-200 と呼ばれるデータセットがあります。 Meta は、非営利団体による NLLB-200 の導入を支援するために、最大 20 万ドルの資金を提供します。さらに、Meta はウィキメディア財団と協力して、ウィキペディアの記事に自動翻訳技術を適用する予定です。
以上がAIテキスト翻訳システムの品質が44%向上し、500億を超えるパラメータを使用して200の言語を翻訳の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。