Pengarang |. Xu Jiecheng
Sejak keluaran ChatGPT pada Disember tahun lalu, topik mengenai model bahasa besar (LLM) dan chatbots hampir menguasai seluruh Internet. Gergasi teknologi utama tidak lama lagi menyedari peluang perniagaan tanpa had yang boleh dibawanya.
Microsoft adalah yang pertama mengambil tindakan dengan melabur AS$10 bilion tambahan untuk menyepadukan ChatGPT ke dalam enjin cariannya sendiri, Bing, yang lebih berhati-hati, melancarkan robot sembang yang dibangunkan sendiri, Bard selepas meluangkan sedikit masa dan tenaga. Tidak ketinggalan, gergasi teknologi domestik Baidu juga baru-baru ini mengumumkan bahawa ia akan memasuki huru-hara dengan chatbot Wenxinyiyan pada bulan Mac tahun ini.
Namun, gergasi teknologi yang sentiasa agresif pada masa lalu nampaknya sengaja berputus asa dengan "pertempuran ChatGPT" ini. Syarikat ini adalah Meta yang diketuai oleh Zuckerberg. Yang menghairankan, Meta mungkin satu-satunya gergasi teknologi yang masih belum mengikuti perkembangan chatbot.
Makin dekat. lihat prestasi Meta Sebab keabnormalan itu berkemungkinan besar disebabkan oleh banyak percubaan yang gagal pada masa lalu - sebenarnya, seawal Jun 2022, Meta sumber terbuka menggunakan model bahasa berskala besar yang dibangunkan sendiri OPT-66B, dan mengeluarkan model bahasa berdasarkan OPT-66B pada bulan Ogos tahun yang sama Chatbot BlenderBot3 adalah 3 bulan lebih awal daripada ChatGPT Boleh dikatakan bahawa Meta adalah salah satu syarikat pertama yang terlibat dalam chatbots LLM.
Walaupun BlenderBot3 hanya dikeluarkan di Amerika Syarikat pada masa itu, sensasi yang ditimbulkannya pada masa itu tidak kurang daripada ChatGPT hari ini. Hanya beberapa jam selepas dikeluarkan, Twitter dan Reddit sudah dipenuhi dengan tangkapan skrin orang yang mempunyai perbualan menarik dengan BlenderBot3.
Walau bagaimanapun, chatbot yang "berjaya" ini tidak lama kemudian bertukar menjadi bencana. Sebilangan besar pengguna mendapati bahawa BlenderBot3 akan menerbitkan kenyataan jahat dan maklumat palsu, malah mempersoalkan strategi perniagaan Zuckerberg, memanggilnya "tidak beretika." Ini menyebabkan sebilangan besar pengguna kehilangan kepercayaan secara beransur-ansur terhadap BlenderBot3 Pada akhirnya, Meta tidak berdaya melihat "bayi besar" yang membelanjakan banyak wang untuk membinanya semakin berkurangan.
Sudah tentu, satu kegagalan tidak memadamkan semangat Meta untuk LLM. Selepas mengumpul semula, Meta bekerjasama dengan Papers with Code pada November 2022 untuk mengeluarkan robot lain, Galactica, berdasarkan model bahasa yang besar Berbanding dengan BlenderBot3 yang gagal sebelum ini, Galactica mempunyai medan aplikasi yang lebih khusus - kertas ghostwriting.
Menurut pengenalan rasmi, Galactica dilatih daripada 48 juta kertas, buku teks dan bahan lain, sama ada abstrak kertas tulisan hantu, pengenalan, formula atau rujukan. Bukan itu sahaja, selain penjanaan teks, Galactica juga boleh melaksanakan tugas berbilang modal yang melibatkan formula kimia dan jujukan protein.
Tetapi kali ini, Meta masih gagal menyelesaikan masalah ketepatan penjanaan LLM Walaupun kekuatan buku Galactica nampaknya sangat kuat, terdapat banyak ralat malah Ia adalah kandungan palsu. Untuk mengelakkan kesan daripada terus merebak, Meta terpaksa segera mengeluarkan Galactica dari rak hanya tiga hari selepas dikeluarkan.
Kegagalan berturut-turut nampaknya telah menggoyahkan kepercayaan jurumudi Meta AI Yann LeCun, pemenang Anugerah Turing dan ketua saintis AI Meta, dalam LLM terdapat sedikit keraguan. Berita terkini tentang ralat ChatGPT dan Google Bard nampaknya telah memberikan LeCun sedikit sokongan.
Sama ada untuk melindungi mukanya sendiri, atau dia benar-benar menyedari kecacatan maut robot LLM daripada dua kegagalan, hari ini LeCun telah berubah daripada peguam bela LLM yang asal Untuk bashers LLM.
Memandangkan populariti topik berkaitan terus meningkat, LeCun juga telah mula aktif mendedahkan kelemahan model bahasa besar dan robot sembang melalui pelbagai saluran. Dalam perbincangan dalam talian baru-baru ini yang dianjurkan oleh Collective Forecast, LeCun berkata walaupun mereka revolusioner di mata umum, dari segi teknologi asas, chatbots hari ini bukanlah inovasi yang hebat.
Selain itu, LeCun telah meluahkan rasa tidak senangnya terhadap ChatGPT di Twitter berkali-kali: ia tidak boleh berskala dan tidak akan pernah menjadi laluan yang betul untuk kecerdasan buatan yang kuat. Mengembangkan LLM autoregresif tidak boleh membawa chatbots ke tahap kecerdasan manusia. Saya tidak fikir ChatGPT melakukan yang lebih betul daripada membetulkan tatabahasa, melengkapkan ayat atau meringkaskan artikel.
LeCun percaya bahawa syarikat kecil seperti OpenAI tidak akan rugi, dan mereka pastinya boleh menggunakan teknologi dan produk yang tidak matang untuk mencipta gembar-gembur untuk diri mereka sendiri. Tetapi jelas adalah sangat tidak bijak untuk syarikat besar memilih untuk menyeberangi air berlumpur ini, terutamanya selepas semua orang melihat percubaan gagal yang menelan belanja Google $100 bilion.
Malah, pelaburan Meta dalam bidang kecerdasan buatan sentiasa berada di barisan hadapan teknologi utama syarikat untuk masa yang lama Di barisan hadapan, kebanyakan inovasi pasukan kecerdasan buatan Meta telah memasuki perniagaan pengiklanan mereka, dan sehingga kini, mereka masih berusaha keras untuk mengubah model dan algoritma kecerdasan buatan yang dibangunkan sendiri kepada produk yang boleh membawakan. hasil.
LeCun menegaskan bahawa Meta telah lama dikritik kerana menyebarkan maklumat palsu akibat kesilapan oleh BlenderBot dan Galactica. Hari ini, Meta berharap untuk mengawal alat dan kandungan yang mereka terbitkan dengan lebih ketat, bukannya menggunakan chatbots secara membuta tuli untuk menyelinap ke dalam "kegilaan kecerdasan buatan" semasa dan membuat kesilapan yang sama sekali lagi.
Sama ada disebabkan oleh kesakitan yang disebabkan oleh kegagalan sebelumnya atau perubahan dalam konsep orang yang menerajui, Meta sememangnya mengelak pertempuran yang ditonton secara global ini. Dalam temu bual tentang kecerdasan buatan generatif, LeCun berkata: Impian jangka panjang Zuckerberg tentang metaverse masih dalam proses, dan dia juga bersetuju dengan fakta bahawa kecerdasan buatan generatif mungkin yang terbaik dalam realisasi metaverse. Apabila bercakap mengenai model bahasa dan chatbot berskala besar, mereka kini kelihatan lebih bersedia untuk duduk di atas gunung dan menonton harimau bertarung dari jauh, secara aktif mencari kesilapan yang Google, Microsoft atau OpenAI lakukan dan belajar pengalaman yang mencukupi daripada mereka.
https://analyticsindiamag.com/meet-the-ai-genius-who-is-obsessed-with-llms/
http://www.myzaker.com/article/63e3902e8e9f094fe76b7af7/
https://analyticsindiamag.com/why-meta-took-down-its-hallucinating-ai-model-galactica/
Atas ialah kandungan terperinci Dengan tergesa-gesa dikeluarkan dari rak, bos besar menghina, mengapa Facebook mengelakkan pertempuran ChatGPT?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!