Menurut berita pada 19 Julai, SemEval-2022, pertandingan penilaian semantik terbesar di dunia, baru-baru ini mengumumkan bahawa satu-satunya "Anugerah Kertas Sistem Terbaik" tahun ini akan dianugerahkan kepada penyelidik dari Akademi Alibaba Damo dan institusi lain. Mereka mereka bentuk sistem pengecaman entiti (NER) bernama yang menggabungkan pengetahuan untuk 11 bahasa, termasuk bahasa Cina dan Inggeris Ia boleh mengenal pasti maklumat entiti utama dengan tepat seperti nama orang, nama tempat, institusi, karya, dsb., yang secara berkesan meningkatkan pemahaman AI tentang. kemampuan bahasa manusia.
SemEval (Penilaian Semantik) ialah pertandingan antarabangsa yang berwibawa dalam bidang pemprosesan bahasa semula jadi dengan lebih daripada 20 tahun sejarah Ia dihoskan oleh Lexicon and Semantics Group of the International Association for Computer Linguistics (ACL). dan bertujuan untuk menjadikan AI Untuk menganalisis dan memahami makna yang terkandung dalam bahasa manusia.
SemEval mempunyai dua anugerah kertas terbaik: Anugerah Kertas Tugasan Terbaik dan Anugerah Kertas Sistem Terbaik. Pemahaman popular ialah satu untuk bertanya dan satu lagi untuk menyelesaikan masalah. Pasukan penyelidik bersama Alibaba DAMO Academy, Universiti Sains dan Teknologi Shanghai, Universiti Zhejiang dan Universiti Teknologi dan Reka Bentuk Singapura memenangi Anugerah Kertas Sistem Terbaik tahun ini. Artikel yang menonjol daripada 221 kertas calon dipanggil "DAMO-NLP di SemEval- 2022 Tugasan 11: Sistem Berasaskan Pengetahuan untuk Pengiktirafan Entiti Berbilang Bahasa》.
Kertas Sistem Terbaik SemEval-2022
Pasukan pemenang mengambil bahagian Satu daripada 12 tugas SemEval-2022: Kompleks Berbilang Bahasa Dinamakan Entiti Pengiktirafan (Pengiktirafan Entiti Dinamakan Kompleks Berbilang Bahasa). Pengecaman entiti bernama (NER) adalah kerja asas dalam bidang pemprosesan bahasa semula jadi Ia merujuk kepada pengenalan perkataan entiti (Entiti) dengan makna khusus dalam teks, terutamanya termasuk nama orang, nama tempat, nama organisasi, kata nama khas, dll.
Tugas tersebut memerlukan penyelidik untuk mereka bentuk sistem yang boleh mengenal pasti entiti dalam 11 bahasa termasuk bahasa Cina dan Inggeris, termasuk pola ayat yang dicampur dengan pelbagai bahasa, termasuk "tangkai", singkatan dan bahasa sehari-hari , dicapai pengenalan yang tepat. Contohnya: "Pada 2016, dia membintangi siri TV HBO Game of Thrones." AI perlu mengenali dan memahami nama organisasi yang disingkat "HBO" dan tajuk karya "Game of Thrones."
Sistem Akademi Dharma memenangi tempat pertama dalam markah keseluruhan
Kertas tersebut mencadangkan satu set baharu entiti yang dinamakan berbilang bahasa yang menggabungkan pengetahuan Sistem pengenalan memenangi 10 tempat pertama di antara 13 sub-item tugasan pertandingan, menduduki tempat pertama dalam jumlah markah, yang telah meningkatkan tahap industri.
Secara umumnya, kerana perkataan mempunyai makna yang samar-samar, kita hanya boleh memahami perkataan dengan tepat berdasarkan konteks, dan perkara yang sama berlaku untuk AI. Kekuatan sistem baharu ialah ia membolehkan AI memahami perkataan entiti yang kompleks walaupun tiada konteks. Menurut penyelidik, sistem ini memperkenalkan pengetahuan luaran tambahan untuk membina asas pengetahuan am berbilang bahasa, yang mengembangkan maklumat kontekstual teks melalui pencarian interaktif untuk menghapuskan kekaburan ditambah dengan penalaan halus berbilang peringkat, ia boleh mengenal pasti entiti dengan tepat; maklumat .
Prinsip Sistem Akademi Dharma
Menurut laporan, penyelidikan yang memenangi anugerah ini telah digunakan secara meluas dalam terjemahan, pencarian, manusia -dialog komputer, dsb. Bidang ini mempunyai prospek aplikasi yang luas. Pada masa ini, sistem penterjemahan mesin DAMO Academy boleh menyediakan perkhidmatan terjemahan dalam 214 bahasa, menterjemah ratusan juta perkataan untuk 2 juta perniagaan kecil dan sederhana domestik setiap hari, membantu produk domestik untuk pergi ke peringkat global. Laporan terbaru "Cloud AI Developer Service Key Capabilities Report" oleh Gartner, sebuah organisasi penyelidikan antarabangsa yang berwibawa, menunjukkan bahawa Alibaba Language AI telah menduduki tempat kedua di dunia, hasil terbaik dalam sejarah syarikat China.
Atas ialah kandungan terperinci Alibaba DAMO Academy memenangi kertas terbaik SemEval untuk membantu AI memahami bahasa manusia dengan lebih baik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!