AI技術界において、「中国語の理解」は常に克服するのが難しい課題でした。なぜなら、中国語は世界中の言語の中で最も難易度が高いからです。
たとえば、次の単純な 20 単語の文は、多くの外国人を確実に圧倒するでしょう。
雨の日、自転車に乗っていて転びそうになりましたが、幸いにも助かりました。
しかし、中国語理解の分野における最新の権威リストCLUEでは、テンセントとアリババのAIモデルが連続して人間のパフォーマンスを上回りました。最近、AI にできないことはあるのだろうか、と人々は本当に疑問に思うでしょう。
CLUEの最新ランキング
CLUEの正式名称は「中国語理解評価ベンチマーク」です。
英語の GLUE や SuperGLUE と同様に、CLUE は、機械が人間と同じように中国語のテキストを理解し、応答する能力を評価する一連のタスクです。3 年前に開始され、初の大規模な中国語テキストでもあります。言語評価ベンチマーク。NLP テクノロジーの継続的な進歩と画期的な進歩を促進することを目的としています。
CLUE の公式 Web サイトには、コーパス、ランキング、事前トレーニング済みモデル、代表的なデータセット、その他の情報から選択できます。文章の類似性、分類、文脈推論、読解など17の評価タスクは公式サイトで詳しく紹介されています。
今年11月22日、アリババのAIモデル「AliceMind」が86.685という高スコアを記録し、総合ランキングで堅実に1位を獲得するとともに、これまでの記録も更新しました。この一連のテストで人類が保持した記録。
この一連のテストにおいて人工知能が人間を上回ったのはこれが初めてであることも言及する価値があります。
偶然にも、そのわずか 4 日後、テンセントの「Hunyuan AI Large Model」はテストで 86.918 という高スコアを記録し、再び新記録を樹立しました。これは、AliceMind のスコアよりも 0.233 ポイントも高かったのです。
中国の二大インターネット巨人、あなたが歌い、私がステージに立つと、人工知能がさまざまな分野や側面で人間を超える能力を持っていることがわかります。
先週金曜日、アリババクラウドコンピューティング部門も記事で「これは中国のAIモデルに対する理解が新たなレベルに達したことを示している」と述べた。
中国の大手テクノロジー企業は、アリババの音声起動仮想アシスタント、テンセントのXiaowei、AliGenie、さらには機械翻訳やスパムなどの機能を強化するために使用される自然言語処理 (NLP) システムの改善に懸命に取り組んでいます。検出およびその他の機能。
今年初め、Baidu が開発した AI モデル「Du Xiaoxiao」が書いたエッセイは、多くのインターネットスラングや珍しい言葉を誤って使用していたにもかかわらず、大学入学試験でほとんどの学生よりも高い得点を獲得しました。
さらに、最新のランキングでは、中国のスマートフォンメーカーOPPOとフードデリバリー大手の美団の人工知能モデルもそれぞれ4位と5位にランクインした。
それでも、一部の研究者は、一部の言語タスクでは機械が人間よりもうまくできるが、ほとんどの AI モデルが言語の複雑さを真に理解するにはまだ長い道のりがあると述べています。
昨年、アラバマ州オーバーン大学の研究部門とアドビによる共同研究で、一部の理解タスクでは人間よりも優れたパフォーマンスを発揮する多くの AI が、依然としてランダムにスクランブルされた単語を区別できないことが判明しました。
参考文献:
https://www.cluebenchmarks.com/rank.html
https://www.scmp.com/tech/big-tech/article /3201294/tencent-and-alibabas-ai-models- Understand-chinese-better-humans-new-rankings-show
https://www.techtimes.com/articles/284084/20221128/tencent - alibaba-ai-tech-tops-chinese- language-comprehension-humans-ranks.htm
https://english.newstracklive.com/news/ai-models-from-tencent-and-alibaba- は-人間よりも優れた中国語の理解-sc71-nu355-ta355-1259160-1.html
以上がAIが初めて人間を超える!テンセントとアリババの NLP モデルはあなたよりも中国語を理解していますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。