7月19日のニュース 世界最大の意味評価コンペティションSemEval-2022はこのほど、今年唯一の「Best System Paper Award」をAlibaba Damo Academyなどの研究者に授与すると発表した。彼らは、中国語や英語を含む 11 言語の知識を組み込んだ固有表現認識 (NER) システムを設計し、人名、地名、機関、作品などの重要な実体情報を正確に識別し、AI の理解を効果的に向上させました。人間の言語、能力。
SemEval (意味評価) は、自然言語処理の分野における権威ある国際コンペティションです。20 年以上の歴史があり、国際コンピュータ言語学会のレキシコンおよびセマンティクス グループが主催しています ( ACL)は、AI が人間の言語に含まれる意味を分析して理解できるようにすることを目的としています。
SemEval には、Best Task Paper Award と Best System Paper Award という 2 つの最優秀論文賞があります。一般的な理解は、1 つは質問することであり、もう 1 つは問題を解決することです。アリババDAMOアカデミー、上海科技大学、浙江大学、シンガポール理工設計大学の共同研究チームが、今年の最優秀システム論文賞を受賞し、221の候補論文の中から傑出した論文が「DAMO-NLP at SemEval- 2022 タスク 11: 多言語固有表現認識のための知識ベースのシステム》。
SemEval-2022 ベスト システム ペーパー
優勝チームが参加 1 名SemEval-2022 の 12 タスクのうち、多言語複合固有表現認識 (多言語複合固有表現認識)。固有表現認識 (NER) は、自然言語処理分野の基礎的な作業であり、主に人名、地名、組織名、固有名詞など、テキスト内で特定の意味を持つ実体単語 (Entity) を識別することを指します。等
このタスクでは、研究者は、「語幹」、略語、口語表現など、複数の言語が混在する文パターンを含め、中国語や英語を含む 11 言語でエンティティを識別できるシステムを設計する必要があります。正確な識別。例:「2016年、彼女はHBOのテレビシリーズ『ゲーム・オブ・スローンズ』にゲスト出演しました。」 AIは、略称の組織名「HBO」と作品のタイトル「ゲーム・オブ・スローンズ」を認識して理解する必要があります。
Dharma Academy System が総合スコアで 1 位を獲得しました
論文は、多言語の名前付きエンティティの新しいセットを提案しました認識システムは、競技課題13項目中10位を獲得し、総合スコアで1位を獲得し、業界レベルを大きく向上させました。
一般に、言葉の意味は曖昧であるため、文脈に基づいてしか言葉を正確に理解することはできませんが、これはAIにも当てはまります。新しいシステムの強みは、文脈がなくても AI が複雑な実体の単語を理解できるようになることです。研究者らによると、このシステムは追加の外部知識を導入して多言語の一般知識ベースを構築し、インタラクティブな検索を通じてテキストの文脈情報を拡張してあいまいさを排除し、多段階の微調整と組み合わせることでエンティティを正確に識別できるという。情報 。
Dharma Academy システム原則
レポートによると、この受賞歴のある研究は、翻訳、検索、人間工学の分野で広く使用されています。 -コンピュータ対話など この分野には幅広い応用が期待されています。現在、DAMO アカデミーの機械翻訳システムは 214 言語で翻訳サービスを提供でき、200 万の国内中小企業向けに毎日数億ワードを翻訳し、国内製品の世界展開を支援しています。権威ある国際調査機関であるガートナーの最新レポート「クラウドAI開発者サービス主要機能レポート」では、アリババ言語AIが世界第2位にランクされ、中国企業史上最高の成績を収めたと指摘している。
以上がアリババ DAMO アカデミーが AI による人間の言語の理解を助ける SemEval の最優秀論文を受賞の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。