阿里達摩院獲SemEval最佳論文讓AI更懂人類語言-人工智慧-PHP中文網

阿里達摩院獲SemEval最佳論文讓AI更懂人類語言

王林

發布： 2023-04-09 12:21:05

轉載

1841 人瀏覽過

7月19日消息，全球規模最大的語意評測競賽SemEval-2022近日宣布，將今年唯一的「最佳系統論文獎」頒發給阿里達摩院等機構的研究人員。他們為中英文在內的11種語言設計出一套融入知識的命名實體識別（NER）系統，能夠精準識別出人名、地名、機構、作品等關鍵性的實體信息，有力提升了AI理解人類語言的能力。

SemEval（Semantic Evaluation語意評測）是自然語言處理領域的權威國際競賽，已有超過20年歷史，由國際電腦語言學學會（ACL）的詞彙和語意小組主辦，旨在讓AI去分析、理解人類語言中蘊含的意義。

SemEval的最佳論文獎共有兩個：最佳任務論文獎（Best Task Paper Award）和最佳系統論文獎（Best System Paper Award）。通俗理解，一個是提問題，一個是解決問題。阿里達摩院與上海科技大學、浙江大學、新加坡科技設計大學的聯合研究團隊摘得了今年的最佳系統論文獎，這篇從221篇候選論文中脫穎而出的文章名為《DAMO-NLP at SemEval- 2022 Task 11: A Knowledge-based System for Multilingual Named Entity Recognition》。

阿里達摩院獲SemEval最佳論文讓AI更懂人類語言

SemEval-2022最佳系統論文

獲獎團隊參加了SemEval-2022的12個任務之一：多語言複雜命名即時辨識（Multilingual Complex Named Entity Recognition）。命名實體辨識（NER）是自然語言處理領域的基礎性工作，指辨識文本中具有特定意義的實體字詞（Entity），主要包括人名、地名、機構名、專有名詞等。

任務要求研究者設計一套系統，能夠辨識中文、英文在內的11種語言中的實體，包括在多語言夾雜、有「梗」、有縮寫、有俗語的句式中，做到精準識別。例如例句：“2016年，她客串出演了HBO電視劇權力的遊戲”，AI需要識別理解出“HBO”這個縮略的機構名，還有“權力的遊戲”這個作品名。

阿里達摩院獲SemEval最佳論文讓AI更懂人類語言

達摩院系統獲得總分第一

論文提出了一套全新的融入知識的多語言命名實體辨識系統，在比賽任務的13個子項中獲得10個第一，總分排名第一，較大幅度提升了業界水準。

一般來說，由於字詞具有多義性，只有結合上下文語境，我們才能準確理解詞語，AI也是如此。新系統的強大之處在於，即便缺乏上下文語境，也能讓AI理解複雜的實體字。研究人員介紹，該系統額外引入外部知識，構建了一個多語言通用知識庫，透過交互型的檢索來擴充文本的上下文訊息，從而消除歧義；再加上多階段的微調，可以實現精準識別實體訊息。

阿里達摩院獲SemEval最佳論文讓AI更懂人類語言

達摩院系統原理示意

#據介紹，這項獲獎研究成果在翻譯、搜尋、人機對話等領域有著廣泛的應用前景。目前，達摩院的機器翻譯系統能提供214種語言的互譯服務，每天為國內200萬中小商家翻譯上億文字，助力國貨走向全世界。國際權威研究機構Gartner最新報告《雲端AI開發者服務關鍵能力報告》指出，阿里語言AI已排名全球第二，創中國企業史上最佳成績。

以上是阿里達摩院獲SemEval最佳論文讓AI更懂人類語言的詳細內容。更多資訊請關注PHP中文網其他相關文章！

阿里達摩院獲SemEval最佳論文 讓AI更懂人類語言

阿里達摩院獲SemEval最佳論文讓AI更懂人類語言