


Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel
- Pautan kertas: https://arxiv.org/pdf/2309.07864.pdf
- Senarai kertas Agen berasaskan LLM: https://github.com/WooooDyy/LLM-Agenty-LLM-Agenty Ahli pasukan senarai
Sejak sekian lama, penyelidik telah mengejar
Sejak itu, reka bentuk ejen telah menjadi tumpuan komuniti kecerdasan buatan. Walau bagaimanapun, kerja lepas terutamanya tertumpu pada meningkatkan kebolehan khusus ejen, seperti penaakulan simbolik atau penguasaan tugas tertentu (catur, Pergi, dll.). Kajian-kajian ini lebih menumpukan pada reka bentuk algoritma dan strategi latihan, sambil mengabaikan pembangunan keupayaan am yang wujud bagi model, seperti ingatan pengetahuan, perancangan jangka panjang, generalisasi yang berkesan dan interaksi yang cekap. Ternyata
Kemunculan model bahasa besar (LLM) membawa harapan untuk perkembangan selanjutnya ejen pintar. Jika laluan pembangunan dari NLP ke AGI dibahagikan kepada lima peringkat: korpus, Internet, persepsi, penjelmaan, dan atribut sosial, maka model bahasa berskala besar semasa telah mencapai tahap kedua, dengan input dan output teks berskala Internet. Atas dasar ini, jika Agen berasaskan LLM diberi ruang persepsi dan ruang tindakan, mereka akan mencapai tahap ketiga dan keempat. Tambahan pula, apabila pelbagai ejen berinteraksi dan bekerjasama untuk menyelesaikan tugas yang lebih kompleks, atau mencerminkan tingkah laku sosial dalam dunia sebenar, mereka berpotensi untuk mencapai tahap kelima - masyarakat ejen.
一 Imaginasi pengarang tentang masyarakat harmoni yang terdiri daripada agen pintar juga boleh menyertainya. Adegan ini diambil dari Festival Tanglung Laut dalam "Genshin Impact". . Diilhamkan oleh undang-undang "survival of the fittest" Darwin, pengarang mencadangkan rangka kerja umum untuk ejen pintar berdasarkan model besar. Sekiranya seseorang itu ingin terus hidup dalam masyarakat, dia mesti belajar menyesuaikan diri dengan persekitaran, jadi dia perlu mempunyai kebolehan kognitif dan dapat melihat dan bertindak balas terhadap perubahan di dunia luar. Begitu juga, rangka kerja ejen pintar juga terdiri daripada tiga bahagian:
Sisi mudah alih
-
S Rangka kerja konsep EJEN BERASASKAN LLM mengandungi tiga komponen: terminal kawalan, persepsi dan penamat tindakan. Pengarang menggunakan contoh untuk menggambarkan aliran kerja Ejen berasaskan LLM: apabila manusia bertanya sama ada hujan akan turun, penghujung persepsi (Persepsi) menukar arahan menjadi representasi yang boleh difahami oleh LLM. Kemudian terminal kawalan (Otak) memulakan penaakulan dan perancangan tindakan berdasarkan ramalan cuaca dan cuaca semasa di Internet. Akhirnya, Tindakan bertindak balas dan menyerahkan payung kepada manusia. Dengan mengulangi proses di atas, ejen pintar boleh terus mendapatkan maklum balas dan berinteraksi dengan persekitaran.Control terminal: Brain Sebagai komponen teras ejen pintar, pengarang memperkenalkan keupayaannya dari lima aspek: interaksi bahasa sebuah medium komunikasi yang mengandungi maklumat yang kaya. Terima kasih kepada penjanaan bahasa semula jadi yang berkuasa dan keupayaan pemahaman LLM, ejen pintar boleh berinteraksi dengan dunia luar untuk berbilang pusingan melalui bahasa semula jadi untuk mencapai matlamat mereka. Secara khusus, ia boleh dibahagikan kepada dua aspek: Penjanaan teks berkualiti tinggi: Sebilangan besar eksperimen penilaian menunjukkan bahawa LLM boleh menghasilkan teks yang lancar, pelbagai, novel dan boleh dikawal. Walaupun prestasi lemah dalam bahasa individu, kemahiran berbilang bahasa yang baik secara keseluruhan tersedia. Pemahaman tentang implikasi: Selain kandungan yang dinyatakan secara intuitif, bahasa juga boleh menyampaikan maklumat seperti niat dan pilihan penutur. Implikasinya ialah ia membantu ejen berkomunikasi dan bekerjasama dengan lebih cekap, dan model besar telah pun menunjukkan potensi dalam hal ini.- Pengetahuan: LLM yang dilatih berdasarkan kumpulan besar korpus mempunyai keupayaan untuk menyimpan sejumlah besar pengetahuan. Selain pengetahuan bahasa, pengetahuan akal dan pengetahuan kemahiran profesional adalah komponen penting Agen berasaskan LLM.
Walaupun LLM sendiri masih menghadapi masalah seperti luput pengetahuan dan halusinasi, beberapa penyelidikan sedia ada boleh diringankan pada tahap tertentu melalui kaedah seperti penyuntingan pengetahuan atau memanggil pangkalan pengetahuan luar. Memori:Dalam rangka artikel ini, modul memori (Memori) menyimpan urutan pemerhatian, pemikiran dan tindakan ejen yang lalu. Melalui mekanisme ingatan khusus, ejen boleh merenung dan menggunakan strategi sebelumnya dengan berkesan, membolehkan mereka menggunakan pengalaman lalu untuk menyesuaikan diri dengan persekitaran yang tidak dikenali. Terdapat tiga kaedah yang biasanya digunakan untuk meningkatkan keupayaan ingatan: Melanjutkan had panjang seni bina Backbone: menambah baik masalah had panjang jujukan sedia ada Transformers. Ringkaskan: Meringkaskan ingatan untuk meningkatkan keupayaan ejen untuk mengekstrak butiran penting daripada ingatan.- Memori termampat (Memampatkan): Dengan memampatkan memori menggunakan vektor atau struktur data yang sesuai, kecekapan mendapatkan semula ingatan boleh dipertingkatkan.
Selain itu, kaedah cari semula ingatan juga sangat penting Hanya dengan mendapatkan semula kandungan yang sesuai boleh ejen mengakses maklumat yang paling relevan dan tepat.
Penaakulan & Perancangan:Keupayaan penaakulan adalah penting untuk ejen pintar melaksanakan tugas yang rumit seperti membuat keputusan dan analisis. Khusus untuk LLM, ia adalah satu siri kaedah dorongan yang diwakili oleh Rantaian Pemikiran (CoT). Perancangan adalah strategi yang biasa digunakan apabila menghadapi cabaran besar. Ia membantu ejen mengatur pemikiran mereka, menetapkan matlamat dan mengenal pasti langkah untuk mencapai matlamat tersebut. Dalam pelaksanaan khusus, perancangan boleh merangkumi dua langkah: Penggubalan Rancangan: Ejen membahagikan tugas yang kompleks kepada subtugas yang lebih terurus. Contohnya: penguraian satu kali dan kemudian pelaksanaan dalam urutan, perancangan dan pelaksanaan langkah demi langkah, perancangan berbilang laluan dan pemilihan laluan optimum, dsb. Dalam sesetengah senario yang memerlukan pengetahuan profesional, ejen boleh disepadukan dengan modul Perancang khusus domain untuk meningkatkan keupayaan. Refleksi Rancangan: Selepas membuat perancangan, anda boleh merenung dan menilai kekuatan dan kelemahannya. Refleksi ini secara amnya datang dari tiga aspek: menggunakan mekanisme maklum balas dalaman mendapatkan maklum balas daripada berinteraksi dengan manusia dan mendapatkan maklum balas daripada persekitaran;- Kebolehpindahan & Generalisasi: LLM dengan pengetahuan dunia memberikan agen pintar dengan keupayaan penghijrahan dan generalisasi yang berkuasa. Ejen yang baik bukanlah asas pengetahuan yang statik, tetapi juga harus mempunyai keupayaan pembelajaran dinamik:
Generalisasi kepada tugas yang tidak diketahui: Apabila saiz model dan data latihan meningkat, LLM muncul untuk menyelesaikan tugas yang tidak diketahui Mempunyai kebolehan yang menakjubkan .Model besar diperhalusi dengan arahan berprestasi baik dalam ujian sifar pukulan, mencapai keputusan yang sebaik model pakar dalam banyak tugas. Pembelajaran Dalam Konteks: Model besar bukan sahaja dapat belajar melalui analogi daripada sebilangan kecil contoh dalam konteks, keupayaan ini juga boleh diperluaskan kepada adegan berbilang modal di luar teks, menyediakan aplikasi dunia sebenar untuk ejen Menyediakan lebih banyak kemungkinan. Pembelajaran Berterusan: Cabaran utama pembelajaran berterusan ialah melupakan bencana, iaitu apabila model mempelajari tugasan baru, ia mudah kehilangan pengetahuan dalam tugasan lepas. Ejen pintar dalam domain khusus harus cuba mengelakkan kehilangan pengetahuan dalam domain umum.
Tukar input visual kepada penerangan teks yang sepadan (Kapsyen Imej): ia boleh difahami secara langsung oleh LLM dan mempunyai kebolehtafsiran yang tinggi. Pengekodan dan mewakili maklumat visual: Modul persepsi terdiri daripada model asas visual + paradigma LLM, dan model memahami kandungan modaliti yang berbeza melalui operasi penjajaran, yang boleh dilatih secara hujung ke hujung.
Pemerhatian boleh membantu ejen pintar mengesan kedudukannya sendiri dalam persekitaran, melihat objek dan item, dan mendapatkan maklumat persekitaran yang lain; kepada maklumat alam sekitar. - Dengan menggabungkan tindakan atom ini, ejen boleh menyelesaikan tugas yang lebih kompleks. Contohnya, tugasan QA yang terkandung seperti "Adakah tembikai di dapur lebih besar daripada mangkuk?" Untuk menyelesaikan masalah ini, ejen perlu menavigasi ke dapur dan mendapatkan jawapan selepas memerhatikan saiz kedua-duanya.
Agen dalam Amalan: Senario aplikasi yang pelbagai
的 Tiga peringkat senario aplikasi proksi tunggal: berorientasikan tugas, orientasi inovatif dan orientasi kitaran hayat.
- berorientasikan tugas
- , ejen membantu pengguna manusia mengendalikan tugas harian asas. Mereka perlu mempunyai pemahaman arahan asas, penguraian tugas, dan keupayaan untuk berinteraksi dengan persekitaran. Secara khusus, mengikut jenis tugas sedia ada, aplikasi sebenar ejen boleh dibahagikan kepada persekitaran rangkaian simulasi dan senario kehidupan simulasi.
Dalam penggunaan berorientasikan inovasi - , ejen boleh menunjukkan potensi untuk siasatan bebas dalam bidang saintifik yang canggih. Walaupun kerumitan yang wujud dan kekurangan data latihan dari bidang khusus menghalang pembinaan ejen pintar, sudah ada banyak kerja yang membuat kemajuan dalam bidang seperti kimia, bahan, komputer, dll.
Dalam penggunaan berorientasikan kitaran hayat - , ejen mempunyai keupayaan untuk terus meneroka, mempelajari dan menggunakan kemahiran baharu dalam dunia terbuka, dan bertahan untuk jangka masa yang lama. Dalam bahagian ini, penulis mengambil permainan "Minecraft" sebagai contoh. Memandangkan cabaran kelangsungan hidup dalam permainan boleh dianggap sebagai mikrokosmos dunia sebenar, ramai penyelidik telah menggunakannya sebagai platform unik untuk membangun dan menguji keupayaan komprehensif ejen.
Senario Berbilang Ejen
Apabila semua ejen mengikut peraturan tertentu seperti menyatakan pendapat mereka satu persatu dalam bentuk barisan perhimpunan, keseluruhan proses kerjasama adalah teratur, yang dinamakan kerjasama tertib.
- Ejen pintar berinteraksi secara tit-for-tat. Melalui persaingan, rundingan dan perdebatan, ejen meninggalkan kepercayaan asal mereka yang mungkin salah dan menjalankan refleksi yang bermakna tentang tingkah laku atau proses penaakulan mereka sendiri, yang akhirnya membawa kepada peningkatan dalam kualiti tindak balas keseluruhan sistem.
Senario interaksi manusia-komputer
- Mod Pengajar-Pelaksana
- : Manusia bertindak sebagai pengajar, memberi arahan dan maklum balas, ejen bertindak sebagai pelaksana, secara beransur-ansur menyesuaikan dan mengoptimumkan mengikut arahan. Model ini telah digunakan secara meluas dalam bidang pendidikan, perubatan, perniagaan dan lain-lain.
- Sesetengah kajian mendapati bahawa ejen boleh menunjukkan empati dalam komunikasi dengan manusia, atau mengambil bahagian dalam pelaksanaan tugas secara sama rata. Agen pintar menunjukkan potensi untuk diaplikasikan dalam kehidupan seharian dan diharapkan dapat diintegrasikan ke dalam masyarakat manusia pada masa hadapan.
Sejak sekian lama, penyelidik mengimpikan untuk membina "masyarakat buatan interaktif", daripada permainan kotak pasir "Meta Sims" "Universe", definisi masyarakat simulasi boleh diringkaskan sebagai: persekitaran + individu yang hidup dan berinteraksi dalam persekitaran.
Dalam artikel tersebut, penulis menggunakan gambar rajah untuk menerangkan kerangka konseptual masyarakat Agen:
念 Rangka kerja konsep masyarakat agensi dibahagikan kepada dua bahagian utama: agensi dan persekitaran.
Dalam rangka kerja ini, kita boleh lihat:
- Bahagian kiri:
- Di peringkat individu, ejen yang dicerminkan mempamerkan alasan yang jelas. . Selain itu, ejen mempamerkan ciri personaliti intrinsik yang merangkumi dimensi kognitif, emosi dan personaliti.
- Ejen tunggal boleh membentuk kumpulan dengan ejen individu lain untuk bersama-sama mempamerkan tingkah laku kumpulan seperti kerjasama, seperti kerjasama kolaboratif.
- Persekitaran boleh dalam bentuk persekitaran kotak pasir maya atau dunia fizikal sebenar. Elemen alam sekitar merangkumi aktor manusia dan pelbagai sumber yang ada. Untuk ejen tunggal, ejen lain juga merupakan sebahagian daripada persekitaran.
- Ejen mengambil bahagian secara aktif dalam keseluruhan proses interaksi dengan merasakan persekitaran luaran dan mengambil tindakan.
Tingkah laku sosial dan keperibadian ejen
Artikel mengkaji prestasi ejen dalam masyarakat dari perspektif tingkah laku luaran dan personaliti dalaman
- Tingkah laku kawanan merujuk kepada tingkah laku yang berlaku apabila dua atau lebih agen berinteraksi secara spontan. Ia termasuk tingkah laku positif yang diwakili oleh kerjasama, tingkah laku negatif yang diwakili oleh konflik, dan tingkah laku neutral seperti mengikut kumpulan dan memerhati.
- Personaliti:
- Kecerdasan emosi: melibatkan perasaan subjektif dan keadaan emosi, seperti kegembiraan, kemarahan, kesedihan, dan kegembiraan, serta keupayaan untuk menunjukkan simpati dan empati.
- Penggambaran watak: Untuk memahami dan menganalisis ciri personaliti LLM, penyelidik telah menggunakan kaedah penilaian matang, seperti ujian Personaliti Lima Besar dan MBTI, untuk meneroka kepelbagaian dan kerumitan personaliti.
- Simulasikan persekitaran operasi masyarakat
- Skalabiliti: Pelbagai senario berbeza (Web, permainan, dll.) boleh dibina dan digunakan untuk menjalankan pelbagai eksperimen, menyediakan ruang yang luas untuk ejen meneroka.
- Persekitaran Fizikal Sebenar:
Sesetengah penyelidik percaya bahawa model besar yang diwakili oleh GPT-4 telah dilatih dengan korpus yang mencukupi, dan ejen yang dibina atas dasar ini berpotensi menjadi kunci untuk membuka pintu kepada AGI. Tetapi penyelidik lain percaya bahawa pemodelan bahasa auto-regresif tidak menunjukkan kecerdasan sebenar kerana mereka hanya bertindak balas. Kaedah pemodelan yang lebih lengkap, seperti Model Dunia, boleh membawa kepada AGI.
Namun, adakah "kepintaran" sebenar akan dihasilkan dengan hanya menambah bilangan ejen? Di samping itu, bagaimana untuk menyelaraskan ejen individu untuk membolehkan masyarakat ejen pintar mengatasi "groupthink" dan kecenderungan kognitif peribadi?
Ejen sebagai Perkhidmatan (AaaS). Memandangkan Ejen berasaskan LLM adalah lebih kompleks daripada model besar itu sendiri, dan lebih sukar untuk perusahaan atau individu bersaiz kecil dan sederhana untuk membina secara tempatan, vendor awan boleh mempertimbangkan untuk melaksanakan ejen pintar dalam bentuk perkhidmatan, iaitu, Agen- sebagai-Perkhidmatan. Seperti perkhidmatan awan lain, AaaS berpotensi untuk menyediakan pengguna dengan fleksibiliti tinggi dan layan diri atas permintaan.
Atas ialah kandungan terperinci Pasukan NLP Fudan mengeluarkan gambaran keseluruhan 80 halaman ejen model berskala besar, memberikan gambaran keseluruhan keadaan semasa dan masa depan ejen AI dalam satu artikel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Ia juga merupakan video Tusheng, tetapi PaintsUndo telah mengambil laluan yang berbeza. Pengarang ControlNet LvminZhang mula hidup semula! Kali ini saya menyasarkan bidang lukisan. Projek baharu PaintsUndo telah menerima 1.4kstar (masih meningkat secara menggila) tidak lama selepas ia dilancarkan. Alamat projek: https://github.com/lllyasviel/Paints-UNDO Melalui projek ini, pengguna memasukkan imej statik, dan PaintsUndo secara automatik boleh membantu anda menjana video keseluruhan proses mengecat, daripada draf baris hingga produk siap . Semasa proses lukisan, perubahan garisan adalah menakjubkan Hasil akhir video sangat serupa dengan imej asal: Mari kita lihat lukisan lengkap.

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Dalam proses pembangunan kecerdasan buatan, kawalan dan bimbingan model bahasa besar (LLM) sentiasa menjadi salah satu cabaran utama, bertujuan untuk memastikan model ini adalah kedua-duanya. berkuasa dan selamat untuk masyarakat manusia. Usaha awal tertumpu kepada kaedah pembelajaran pengukuhan melalui maklum balas manusia (RL

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Semua pengarang kertas kerja ini adalah daripada pasukan guru Zhang Lingming di Universiti Illinois di Urbana-Champaign (UIUC), termasuk: Steven Code repair; pelajar kedoktoran tahun empat, penyelidik

Jika jawapan yang diberikan oleh model AI tidak dapat difahami sama sekali, adakah anda berani menggunakannya? Memandangkan sistem pembelajaran mesin digunakan dalam bidang yang lebih penting, menjadi semakin penting untuk menunjukkan sebab kita boleh mempercayai output mereka, dan bila tidak mempercayainya. Satu cara yang mungkin untuk mendapatkan kepercayaan dalam output sistem yang kompleks adalah dengan menghendaki sistem menghasilkan tafsiran outputnya yang boleh dibaca oleh manusia atau sistem lain yang dipercayai, iaitu, difahami sepenuhnya sehingga apa-apa ralat yang mungkin boleh dilakukan. dijumpai. Contohnya, untuk membina kepercayaan dalam sistem kehakiman, kami memerlukan mahkamah memberikan pendapat bertulis yang jelas dan boleh dibaca yang menjelaskan dan menyokong keputusan mereka. Untuk model bahasa yang besar, kita juga boleh menggunakan pendekatan yang sama. Walau bagaimanapun, apabila mengambil pendekatan ini, pastikan model bahasa menjana

Tunjukkan rantai sebab kepada LLM dan ia mempelajari aksiom. AI sudah pun membantu ahli matematik dan saintis menjalankan penyelidikan Contohnya, ahli matematik terkenal Terence Tao telah berulang kali berkongsi pengalaman penyelidikan dan penerokaannya dengan bantuan alatan AI seperti GPT. Untuk AI bersaing dalam bidang ini, keupayaan penaakulan sebab yang kukuh dan boleh dipercayai adalah penting. Penyelidikan yang akan diperkenalkan dalam artikel ini mendapati bahawa model Transformer yang dilatih mengenai demonstrasi aksiom transitiviti sebab pada graf kecil boleh digeneralisasikan kepada aksiom transitiviti pada graf besar. Dalam erti kata lain, jika Transformer belajar untuk melakukan penaakulan sebab yang mudah, ia boleh digunakan untuk penaakulan sebab yang lebih kompleks. Rangka kerja latihan aksiomatik yang dicadangkan oleh pasukan adalah paradigma baharu untuk pembelajaran penaakulan sebab berdasarkan data pasif, dengan hanya demonstrasi

sorakan! Bagaimana rasanya apabila perbincangan kertas adalah perkataan? Baru-baru ini, pelajar di Universiti Stanford mencipta alphaXiv, forum perbincangan terbuka untuk kertas arXiv yang membenarkan soalan dan ulasan disiarkan terus pada mana-mana kertas arXiv. Pautan laman web: https://alphaxiv.org/ Malah, tidak perlu melawati tapak web ini secara khusus. Hanya tukar arXiv dalam mana-mana URL kepada alphaXiv untuk terus membuka kertas yang sepadan di forum alphaXiv: anda boleh mencari perenggan dengan tepat dalam. kertas itu, Ayat: Dalam ruang perbincangan di sebelah kanan, pengguna boleh menyiarkan soalan untuk bertanya kepada pengarang tentang idea dan butiran kertas tersebut Sebagai contoh, mereka juga boleh mengulas kandungan kertas tersebut, seperti: "Diberikan kepada

Baru-baru ini, Hipotesis Riemann, yang dikenali sebagai salah satu daripada tujuh masalah utama milenium, telah mencapai kejayaan baharu. Hipotesis Riemann ialah masalah yang tidak dapat diselesaikan yang sangat penting dalam matematik, berkaitan dengan sifat tepat taburan nombor perdana (nombor perdana ialah nombor yang hanya boleh dibahagikan dengan 1 dan dirinya sendiri, dan ia memainkan peranan asas dalam teori nombor). Dalam kesusasteraan matematik hari ini, terdapat lebih daripada seribu proposisi matematik berdasarkan penubuhan Hipotesis Riemann (atau bentuk umumnya). Dalam erti kata lain, sebaik sahaja Hipotesis Riemann dan bentuk umumnya dibuktikan, lebih daripada seribu proposisi ini akan ditetapkan sebagai teorem, yang akan memberi kesan yang mendalam terhadap bidang matematik dan jika Hipotesis Riemann terbukti salah, maka antara cadangan ini sebahagian daripadanya juga akan kehilangan keberkesanannya. Kejayaan baharu datang daripada profesor matematik MIT Larry Guth dan Universiti Oxford

Pada masa ini, model bahasa berskala besar autoregresif menggunakan paradigma ramalan token seterusnya telah menjadi popular di seluruh dunia Pada masa yang sama, sejumlah besar imej dan video sintetik di Internet telah menunjukkan kepada kami kuasa model penyebaran. Baru-baru ini, pasukan penyelidik di MITCSAIL (salah seorang daripadanya ialah Chen Boyuan, pelajar PhD di MIT) berjaya menyepadukan keupayaan berkuasa model resapan jujukan penuh dan model token seterusnya, dan mencadangkan paradigma latihan dan pensampelan: Diffusion Forcing (DF). ). Tajuk kertas: DiffusionForcing:Next-tokenPredictionMeetsFull-SequenceDiffusion Alamat kertas: https:/
