Bahasa manusia terkenal rumit, dan ahli bahasa telah lama percaya bahawa mustahil untuk mengajar mesin cara menganalisis pertuturan dan struktur perkataan seperti yang dilakukan manusia.
Tetapi penyelidik di McGill University, MIT dan Cornell University telah pun mengambil langkah ke arah ini. Mereka telah membangunkan sistem kecerdasan buatan (AI) yang boleh mempelajari peraturan dan corak bahasa manusia dengan sendirinya.
Model mempelajari corak bahasa peringkat tinggi secara automatik yang boleh digunakan pada bahasa yang berbeza, membolehkannya mencapai hasil yang lebih baik.
Apabila diberi perkataan dan contoh bagaimana perkataan tersebut berubah untuk menyatakan fungsi tatabahasa yang berbeza dalam bahasa — seperti tegang, huruf besar atau jantina — model pembelajaran mesin ini menghasilkan peraturan untuk mentafsir perkataan tersebut Mengapakah bentuk berubah.
Penyelidik telah membangunkan sistem kecerdasan buatan yang boleh mempelajari peraturan dan corak bahasa manusia dengan sendirinya. Kredit: MIT Jose-Luis Olivares
Contohnya, ia mungkin tahu bahawa huruf "a" mesti ditambah pada akhir perkataan untuk menjadikan bentuk maskulin dalam bahasa Serbo-Croatian menjadi feminin.
Para penyelidik mengatakan sistem itu boleh digunakan untuk menguji teori bahasa dan mengkaji persamaan halus dalam cara bahasa yang berbeza menukar perkataan. "Kami mahu melihat sama ada kami boleh meniru pengetahuan dan alasan yang dibawa oleh manusia untuk tugas ini, " kata pengarang bersama Adam Albright, profesor linguistik di MIT.
"Apa yang menarik tentang kerja ini ialah ia menunjukkan cara kami boleh membina algoritma yang boleh membuat generalisasi daripada sampel data bahasa yang sangat kecil, lebih seperti saintis manusia dan kanak-kanak," kata Penolong Profesor di jabatan itu, kata pengarang kanan Timothy O'Donnell, PhD dalam linguistik dari Universiti McGill dan Pengerusi CIFAR AI Mila-Quebec Kanada.
Pembinaan dan penilaian model dan teori saintifik yang didorong oleh data secara automatik merupakan cabaran yang telah lama wujud dalam kecerdasan buatan.
Kami mencadangkan rangka kerja untuk mensintesis model secara algoritma bahagian asas bahasa manusia: morfofonologi, sistem untuk membina bentuk perkataan daripada bunyi. Kami menggabungkan inferens Bayesian dengan sintesis program dan perwakilan yang diilhamkan oleh teori bahasa dan model pembelajaran dan penemuan kognitif.
Merentasi 70 set data daripada 58 bahasa yang berbeza, sistem kami mensintesis model yang boleh ditafsir manusia bagi aspek teras fonologi morfologi untuk setiap bahasa, kadangkala mendekati model yang dicadangkan oleh ahli bahasa manusia. Inferens bersama merentas kesemua 70 set data secara automatik mensintesis pengekodan model meta aliran jenis merentas bahasa yang boleh ditafsir.
Akhir sekali, algoritma yang sama menangkap sejumlah kecil dinamik pembelajaran, memperoleh peraturan fonetik morfologi baharu daripada hanya satu atau beberapa contoh.
Hasil ini menggambarkan laluan kepada penemuan model boleh tafsir yang disokong mesin yang lebih berkuasa dalam linguistik dan bidang saintifik lain.
Atas ialah kandungan terperinci Kecerdasan buatan yang boleh mempelajari corak bahasa manusia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!