Pemahaman bahasa semula jadi (NLP) dikenali sebagai permata mahkota kecerdasan buatan Dengan sokongan model bahasa berskala besar, manusia akhirnya mempunyai keupayaan untuk membolehkan komputer memahami bahasa.
Tetapi "pemahaman" ini masih perlu dimasukkan ke dalam tanda petikan Berdasarkan kesan semasa model NLP, walaupun model boleh memberikan bantuan kepada manusia dalam beberapa bidang, seperti penulisan, klasifikasi teks, dll., mereka masih jauh dari benar-benar mencapai tahap manusia masih jauh lagi dari segi kecerdasan bahasa.
Dari Mei hingga Jun tahun ini, 11 penyelidik dari Universiti Washington, Universiti New York dan Universiti Johns Hopkins melancarkan soal selidik dalam komuniti penyelidikan NLP untuk menjalankan pelbagai isu kontroversi dalam bidang NLP .
Laman utama tinjauan: https://nlpsurvey.net/
Alamat laporan: https://nlpsurvey.net/nlp-metasurvey-results.pdf
Soalan seperti:
Bolehkah model bahasa memahami bahasa? Bolehkah ia dilakukan pada masa hadapan?
Adakah paradigma penanda aras model tradisional masih tersedia?
Model ramalan yang manakah beretika untuk penyelidik membina dan menerbitkan?
Adakah kemajuan seterusnya yang paling berkesan datang daripada industri atau akademik?
Berdasarkan hasil tinjauan, pandangan responden terhadap isu ini hampir separuh setengah. Di samping menjawab soalan, penyelidik juga meminta responden untuk meramalkan taburan jawapan kepada soalan untuk menemui kepercayaan sosiologi palsu (kepercayaan sosiologi palsu) di mana ramalan masyarakat tidak sepadan dengan realiti Hasil eksperimen adalah seperti yang dijangkakan: Pengamal NLP perbezaan yang besar antara idea dan keadaan semasa bidang secara keseluruhan. Antara hasil lain, ia juga boleh dilihat bahawa komuniti sangat melebih-lebihkan kegunaan penanda aras dan keupayaan model NLP untuk menyelesaikan masalah dunia sebenar, dan meremehkan kepentingan struktur bahasa, berat sebelah induktif, dan sains antara disiplin. Sebanyak 480 orang melengkapkan soal selidik, yang mana 327 (68%) telah menulis bersama sekurang-kurangnya 2 penerbitan ACL antara 2019-2022 dan merupakan antara populasi sasaran tinjauan. Menurut data yang disediakan oleh ACL Anthology, 6,323 orang memenuhi syarat, yang bermaksud bahawa kira-kira 5% pengamal NLP kanan mengambil bahagian dalam tinjauan.
Jika dibahagikan mengikut lokasi geografi, 58% adalah dari Amerika Syarikat (35% lebih daripada nilai statistik ACL), 23% adalah dari Eropah dan 8% adalah dari Asia (lebih kurang daripada 26% ACL nilai statistik). Antaranya, penyelidik NLP dari China menyumbang 3% (nilai statistik ACL ialah 9%).
Bahagian ini merangkumi enam soalan. Pengguna perlu menjawab "setuju", "sedikit setuju", "tidak begitu setuju". , "tidak bersetuju" Identiti".
1. Adakah syarikat swasta mempunyai terlalu banyak pengaruh?
77% daripada responden bersetuju.
2. Adakah industri akan menghasilkan hasil penyelidikan yang paling banyak disebut?
86% responden bersetuju bahawa kertas kerja yang akan dipetik secara meluas dalam tempoh sepuluh tahun akan datang lebih berkemungkinan datang daripada industri berbanding akademik.
Walau bagaimanapun, ramai responden percaya bahawa bilangan petikan karya bukanlah proksi yang baik untuk nilai atau kepentingannya, dan penguasaan industri yang berterusan dalam bidang tersebut akan memberi kesan negatif, seperti dalam asas The absolute kepimpinan sistem seperti GPT-3 dan PaLM.
Dan di kalangan responden dalam bidang akademik, kira-kira 82% percaya bahawa industri mempunyai terlalu banyak pengaruh, manakala hanya 58% responden dalam industri bersetuju.
3. Adakah NLP akan memasuki musim sejuk dalam tempoh sepuluh tahun?
Hanya 30% daripada responden bersetuju bahawa pelaburan dan peluang pekerjaan dalam R&D NLP akan dikurangkan sekurang-kurangnya 50% berbanding tempoh puncak.
Walaupun 30% bukanlah jumlah yang besar, ia juga mencerminkan bahagian penyelidik NLP ini percaya bahawa bidang tersebut akan mengalami perubahan besar dalam masa terdekat, sekurang-kurangnya dana pelaburan akan berkurangan. Mungkin terdapat banyak sebab untuk pesimisme, seperti stagnasi inovasi akibat pengaruh industri yang berlebihan, industri akan memonopoli industri dengan sejumlah kecil makmal yang mempunyai sumber yang baik, sempadan antara NLP dan subbidang AI lain akan hilang, dsb. .
4. Adakah NLP akan memasuki musim sejuk dalam masa tiga puluh tahun?
62% daripada responden bersetuju bahawa dalam jangka masa panjang, medan NLP mungkin "melesap" atau sejuk.
5 Adakah kebanyakan karya berkaitan diterbitkan dalam bidang NLP boleh dipersoalkan dari segi nilai saintifik?
67% daripada responden bersetuju.
6. Adakah penting bagi pengarang menyemak tanpa nama?
63% daripada responden bersetuju. Kerahasiaan pengarang semasa semakan adalah cukup berharga untuk mewajarkan pengehadan ke atas penyebaran penyelidikan yang sedang disemak.
Bahagian ini mengandungi empat soalan.
1. Bolehkah skala menyelesaikan hampir semua masalah utama?
Hanya 17% daripada responden bersetuju bahawa jika semua sumber pengkomputeran dan sumber data dalam abad ke-21 digunakan, pelaksanaan berskala besar bagi teknologi sedia ada akan cukup untuk benar-benar menyelesaikan sebarang perkara nyata yang penting- masalah masalah dunia atau aplikasi NLP.
2. Adakah perlu memperkenalkan struktur linguistik?
50% responden bersetuju bahawa perwakilan universal diskret struktur bahasa berdasarkan teori linguistik (cth. melibatkan makna perkataan, sintaks atau graf semantik) adalah penting untuk benar-benar menyelesaikan beberapa masalah penting dalam NLP masalah dunia nyata atau permohonan adalah perlu.
3. Adakah kecenderungan induktif pakar perlu?
51% daripada responden bersetuju bahawa berat sebelah induktif kuat yang direka oleh pakar (seperti tatabahasa universal, sistem simbolik atau primitif pengiraan yang diilhamkan secara kognitif) berguna untuk menyelesaikan beberapa masalah dunia nyata yang penting dalam NLP atau aplikasi adalah perlu.
4. Adakah Ling/CogSci akan menyumbang kepada model yang paling banyak disebut?
61% responden bersetuju bahawa berkemungkinan sekurang-kurangnya satu daripada lima sistem yang paling banyak disebut pada tahun 2030 akan diambil daripada penyelidikan sains khusus, linguistik atau kognitif dari 50 tahun yang lalu hasil yang tidak remeh.
1 Adakah AGI merupakan kebimbangan penting?
58% responden bersetuju bahawa memahami potensi pembangunan kecerdasan am buatan (AGI) dan faedah/risiko yang berkaitan dengannya harus menjadi keutamaan penting bagi penyelidik NLP.
2. Adakah perkembangan terkini membawa kita ke arah AGI?
57% responden bersetuju bahawa perkembangan terkini dalam pemodelan ML berskala besar (seperti pemodelan bahasa dan pembelajaran pengukuhan) adalah langkah penting ke arah AGI.
3. Bolehkah kecerdasan buatan tidak lama lagi membawa kepada perubahan sosial yang revolusioner?
73% responden bersetuju bahawa pada abad ini, automasi buruh yang disebabkan oleh kemajuan dalam AI/ML berkemungkinan membawa kepada penstrukturan semula ekonomi dan perubahan sosial pada skala yang sekurang-kurangnya Revolusi Perindustrian .
4. Bolehkah keputusan kecerdasan buatan membawa kepada bencana peringkat bom nuklear?
36% responden bersetuju bahawa keputusan yang dibuat oleh kecerdasan buatan atau sistem pembelajaran mesin boleh menyebabkan bencana sekurang-kurangnya sama seriusnya dengan perang nuklear berskala penuh abad ini.
Bolehkah model bahasa memahami bahasa?
51% daripada responden bersetuju. Sesetengah model generatif yang dilatih hanya pada teks boleh, dari segi tertentu, memahami bahasa semula jadi jika mereka mempunyai data dan sumber pengkomputeran yang mencukupi
2. Bolehkah model multimodal memahami bahasa?
67% daripada responden bersetuju. Untuk model generatif berbilang modal, seperti yang dilatih untuk mengakses imej, data penderia dan penggerak, dsb., bahasa semula jadi boleh difahami selagi terdapat data dan sumber pengkomputeran yang mencukupi.
3. Bolehkah penilaian teks biasa mengukur keupayaan pemahaman bahasa model?
36% daripada responden bersetuju. Pada dasarnya, kita boleh menilai sejauh mana model memahami bahasa semula jadi dengan menjejak prestasinya pada klasifikasi teks biasa atau tanda aras penjanaan bahasa.
1. Adakah pengamal memberi perhatian terlalu banyak kepada skala model bahasa?
72% daripada responden bersetuju. Pada masa ini, bidang ini terlalu menumpukan pada penskalaan model pembelajaran mesin.
2. Beri terlalu banyak perhatian kepada set data penanda aras?
88% responden bersetuju bahawa model NLP semasa terlalu menumpukan pada mengoptimumkan prestasi pada penanda aras.
3. Adakah "seni bina model" menuju ke arah yang salah?
37% daripada responden bersetuju. Kebanyakan penyelidikan mengenai seni bina model yang diterbitkan dalam tempoh 5 tahun yang lalu berada di landasan yang salah.
4. Adakah "penjanaan bahasa" menuju ke arah yang salah?
41% responden bersetuju bahawa kebanyakan penyelidikan mengenai tugas penjanaan bahasa terbuka yang diterbitkan dalam tempoh 5 tahun lalu berada di landasan yang salah.
5. Adakah "penyelidikan tentang model yang boleh ditafsir" menuju ke arah yang salah?
50% responden bersetuju bahawa kebanyakan penyelidikan yang diterbitkan dalam tempoh 5 tahun lalu tentang membina model boleh tafsir berada di landasan yang salah.
6. Adakah "kebolehtafsiran kotak hitam" menuju ke arah yang salah?
42% responden bersetuju bahawa kebanyakan penyelidikan yang diterbitkan dalam 5 tahun lalu mengenai mentafsir model kotak hitam berada di landasan yang salah.
7. Perlukah kita berbuat lebih banyak untuk menyerap pandangan antara disiplin?
82% daripada responden bersetuju bahawa berbanding dengan situasi semasa, penyelidik NLP harus memberi keutamaan yang lebih besar untuk menggabungkan bidang sains yang berkaitan (seperti sosiolinguistik, sains kognitif, interaksi manusia-komputer) Wawasan dan Kaedah .
1 Adakah kesan NLP positif pada masa lalu?
89. % Orang yang ditemu bual bersetuju bahawa, secara keseluruhan, penyelidikan NLP telah memberi kesan positif kepada dunia.
2. Adakah kesan masa depan NLP akan menjadi positif?
87% daripada responden bersetuju bahawa, secara amnya, penyelidikan NLP akan memberi kesan positif kepada dunia pada masa hadapan.
3. Adakah tidak beretika membina sistem yang mudah disalahgunakan?
59% daripada responden bersetuju.
4. Adakah terdapat kemungkinan konflik antara etika dan sains?
74% responden bersetuju bahawa dalam konteks penyelidikan NLP, pertimbangan etika kadangkala bercanggah dengan kemajuan saintifik.
5. Adakah isu etika kebanyakannya dikaitkan dengan kualiti data dan ketepatan model?
25% responden bersetuju bahawa isu etika utama yang dibangkitkan oleh sistem pembelajaran mesin semasa pada dasarnya boleh diselesaikan dengan meningkatkan kualiti/liputan data dan ketepatan model.
6. Adakah tidak beretika untuk meramalkan ciri-ciri psikologi?
48% responden bersetuju bahawa membangunkan sistem pembelajaran mesin untuk meramalkan ciri psikologi dalaman orang (seperti emosi, identiti jantina, orientasi seksual) sememangnya tidak beretika.
7. Adakah jejak karbon merupakan pertimbangan penting?
60% responden bersetuju bahawa jejak karbon bagi melatih model besar harus menjadi kebimbangan utama penyelidik NLP.
8. Patutkah NLP dikawal?
41% responden bersetuju bahawa pembangunan dan penggunaan sistem NLP perlu dikawal oleh kerajaan.
Atas ialah kandungan terperinci Perbezaan besar dalam NLPers! Tiga universiti terkemuka di Amerika Syarikat mengeluarkan laporan tinjauan: 62% daripada pengamal bersetuju bahawa musim sejuk akan tiba. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!