Jadual Kandungan
Pengawal terperinci" >Pengawal terperinci
Bahagian eksperimen
Rumah Peranti teknologi AI Pasukan Tian Yuandong mengeluarkan versi kedua DOC 'Penjana Cerita Panjang': koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Pasukan Tian Yuandong mengeluarkan versi kedua DOC 'Penjana Cerita Panjang': koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Apr 11, 2023 pm 09:22 PM
penjana

Beberapa masa lalu, pasukan Dr. Tian Yuandong mengeluarkan rangka kerja penjana cerita Re3 (Recursive Reprompting and Revision) berdasarkan model bahasa berskala besar di EMNLP2022 Dengan mereka bentuk gesaan, model boleh menghasilkan cerita yang konsisten tanpa sebarang keperluan. Penalaan halus model besar boleh menghasilkan cerita sehingga 7,500 perkataan.

Baru-baru ini, pasukan pengarang Re3 telah mengeluarkan versi kedua rangka kerja penjanaan cerita panjang DOC (Kawalan Garis Terperinci) , yang menggunakan garis besar hierarki (garis besar). ) untuk menjana cerita Untuk penggambaran yang lebih terperinci dan kesinambungan kandungan yang dijana yang lebih koheren menggunakan model OPT-350m yang diperhalusi, manusia menilai DOC sebagai lebih berkebolehan menulis berbanding Re3 generasi sebelumnya.

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Pautan kertas: https://arxiv.org/abs/2212.10077

Pautan kertas: https://github.com/yangkevin2/doc-story-generation

DOC terdiri daripada dua komponen pelengkap:

1. 🎜>2. Pengawal terperinci (pengawal terperinci) Pastikan lebih terperinci dengan mengawal perenggan cerita agar konsisten dengan butiran rangka Garis besar masih boleh memainkan peranan dalam proses penjanaan.

Dalam penilaian manusia terhadap cerita yang dijana secara automatik, DOC mencapai keuntungan mutlak sebanyak 22.5% dalam konsistensi plot, peningkatan 28.2% dalam perkaitan garis besar dan peningkatan 20.7% dalam minat, yang mana adalah jauh lebih baik daripada model garis dasar Re3 sebelumnya, dan penilai manusia juga mendapati DOC lebih mudah dikawal dalam persekitaran penjanaan interaktif.

Kevin Yang, pengarang pertama artikel itu, ialah pelajar kedoktoran tahun empat di University of California, Berkeley Minat penyelidikan utamanya ialah penjanaan teks bahasa semula jadi yang boleh dikawal dalam tetapan berstruktur , seperti menggunakan kaedah berstruktur Generatif yang boleh dikawal untuk meningkatkan ketekalan teks panjang.

Pengarang kedua, Dr. Tian Yuandong, ialah seorang penyelidik dan pengurus kanan di Institut Penyelidikan Kecerdasan Buatan Meta Minat penyelidikannya termasuk pembelajaran pengukuhan mendalam dan aplikasinya dalam permainan, serta analisis teori model pembelajaran mendalam. Beliau menerima ijazah sarjana muda dan sarjana dari Universiti Shanghai Jiao Tong pada 2005 dan 2008, dan ijazah kedoktorannya dari Institut Robotik Universiti Carnegie Mellon di Amerika Syarikat pada 2013.

Kerangka DOC

Dengan perkembangan berterusan teknologi bahasa semula jadi, pemahaman teks pendek oleh model bahasa berskala besar secara beransur-ansur menghampiri kesesakan, dan orang ramai secara beransur-ansur menjadi semakin berminat untuk menghasilkan teks yang lebih panjang Menjana minat, seperti menghasilkan beribu-ribu perkataan sekaligus.

Berbanding dengan tugas penjanaan teks pendek, teks panjang mengandungi lebih banyak kandungan dan sekatan Model perlu mengekalkan konsistensi keseluruhan, konsistensi fakta jangka panjang dan mengekalkan konsistensi dengan keluaran pengguna atau rancangan kekal relevan.

Berbanding dengan manusia, sistem penjanaan cerita seperti Re3 masih mempunyai kelemahan dalam banyak aspek, seperti ketidakupayaan untuk menjamin keselarasan plot dalam jarak yang jauh, ketidakkonsistenan global dan kandungan cerita yang menyimpang daripada latar rancangan dll.

Untuk merapatkan jurang ini, rangka kerja Kawalan Garis Terperinci (DOC) menggunakan semula struktur penyemakan penggubalan panning peringkat tinggi Re3 melalui dua pendekatan pelengkap meningkatkan ketekalan jangka panjang.

Lukisan Terperinci

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Pertama, garis luar terperinci memperhalusi garis besar awal ringkas menjadi garis besar yang lebih terperinci Garis besar hierarki yang terperinci direka bentuk dengan cara ini kerana pengarang manusia mungkin secara berulang-ulang memperhalusi dan mengembangkan garis besar awal yang pendek sebelum merangka dokumen yang lebih panjang.

Daripada menambah baik titik plot baharu, seorang penulis mungkin merancang plot menyeluruh yang koheren dalam peringkat garis besar peringkat tinggi, menggunakan garis besar yang diperluas untuk memberikan panduan yang lebih terperinci semasa proses penggubalan.

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Semasa peringkat penggubalan, penyelidik menggunakan semula perkaitan garis besar dan penyusunan semula koheren teks daripada peringkat penulisan semula Re3 untuk mengesan di mana item rangka semasa Perenggan artikel disiapkan pada masa yang sama, dan pemberhentian awal dilaksanakan berdasarkan ambang skor.

Terdapat tetapan lengkap dan aksara yang berkaitan dalam rangka, dan setiap item garis besar ditapis dengan teliti untuk kaitan dan keselarasan dalam konteks.

Dalam gesaan berstruktur, model menyerlahkan tetapan semasa, perubahan dalam tetapan dan juga mendapatkan huraian peranan berdasarkan peranan yang dikesan dalam garis besar.

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Sebaliknya, Re3 secara dinamik memilih aksara yang berkaitan untuk setiap segmen semasa proses penggubalan dan tidak menjejaki maklumat tetapan, yang boleh membawa kepada cerita Perubahan yang tidak dijangka dalam tetapan

Pengawal terperinci

Pengawal terperinci komponen kedua mengawal perenggan berdasarkan item garis besar yang sepadan Dijana untuk mengekalkan kesetiaan kepada garis besar terperinci.

Oleh kerana garis besar terperinci mengenakan banyak kekangan lembut yang bertindih, pengawal terperinci mesti menggunakan kekuatan kawalan yang mencukupi Pada masa yang sama, pengawal terperinci juga mesti menyesuaikan diri dengan input bahasa semula jadi yang fleksibel dan menggunakan State model bahasa besar -of-the-art dijana dengan kecekapan pengiraan.

Jadi penyelidik melaksanakan pengawal terperinci sebagai pengawal berasaskan OPT350m dan mereka bentuk program latihan kontrastif untuk menyelaraskan ringkasan dengan awalan perenggan.

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Paling penting, penyelidik juga membina banyak negatif keras fasih untuk memudahkan perenggan yang dijana bukan sahaja Ia bermula relevan dengan tema dan berterusan sepanjang .

Bahagian eksperimen

Dalam percubaan, input kepada model hanyalah premis bahasa Inggeris yang pendek, biasanya 30-60 patah perkataan, dan output adalah cerita yang lengkap .

Para penyelidik tidak mengenakan lebih banyak kekangan peraturan kerana takrifan "cerita" masih belum jelas, apatah lagi definisi "cerita yang baik", dan kualitinya bergantung kepada penilaian manual. indeks.

Terdapat tiga petunjuk utama yang digunakan dalam penilaian, yang lebih sesuai untuk membandingkan perenggan daripada cerita lengkap:

1 Koheren Seksualiti , peratusan perenggan yang dinilai oleh anotasi manusia mempunyai plot yang koheren;

2 mematuhi entri rangka yang sepadan;3

Menarik

, peratusan perenggan yang dianggap menarik. Model garis dasar yang dibandingkan termasuk Re3, ROLLING-OPT dan ROLLING-GPT.

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!Seperti yang dapat dilihat daripada keputusan eksperimen, berbanding dengan Re3, anotasi percaya bahawa plot yang dihasilkan oleh DOC adalah lebih koheren dan lebih relevan kepada garis besar penambahbaikan garis dasar ROLLING adalah lebih tinggi.

Dan hasilnya mengesahkan ketepatan reka bentuk model, iaitu, koheren plot dan perkaitan garis besar mendapat manfaat daripada mengalihkan kerja kreatif daripada perancangan kepada penggubalan, serta mekanisme kawalan yang dipertingkatkan.

Dan yang menghairankan, para anotor juga percaya bahawa perenggan DOC adalah lebih menarik dengan ketara Para penyelidik percaya bahawa ini adalah peningkatan yang dibawa oleh garis besar yang lebih terperinci (lebih berasaskan peristiwa), yang juga disokong oleh lanjutan. eksperimen ablasi ini.

Walau bagaimanapun, analisis kualitatif juga mendedahkan bahawa model itu masih mempunyai ruang yang besar untuk penambahbaikan selanjutnya.

Tidak seperti RE3, DOC biasanya tidak menyimpang dengan ketara daripada garis besar peringkat atas, manakala RE3 kadangkala tersasar hampir sepenuhnya daripada topik, tetapi DOC sering gagal mengikuti bahagian peringkat bawah garis besar terperinci.

Masih terdapat masalah dengan konsistensi dalaman dalam DOC dan RE3, dan ralat sekali-sekala dalam garis besar terperinci boleh memberi kesan negatif, yang membawa kepada tahap kekeliruan yang lebih besar semasa proses penggubalan .

Selain itu, garis besar dalam DOC cenderung tidak konsisten dalam tahap perincian, dengan sesetengahnya terlalu kabur dan yang lain kelihatan terlalu dikembangkan.

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Selain itu, tetapan dan aksara yang dikesan oleh model kadangkala boleh salah atau tidak lengkap, contoh di bawah menunjukkan DOC yang ditulis mengikut garis besar di atas Sebuah kisah yang sangat diringkaskan.

Pasukan Tian Yuandong mengeluarkan versi kedua DOC Penjana Cerita Panjang: koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!

Atas ialah kandungan terperinci Pasukan Tian Yuandong mengeluarkan versi kedua DOC 'Penjana Cerita Panjang': koheren telah dipertingkatkan dengan banyak, dan keseronokan telah meningkat sebanyak 20.7%!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Penjana foto AI ID: Dalam ujian sebenar, perisian AI menunjukkan prestasi yang unik dan berkuasa Penjana foto AI ID: Dalam ujian sebenar, perisian AI menunjukkan prestasi yang unik dan berkuasa Aug 09, 2023 pm 07:33 PM

Selepas ujian sebenar, penjana foto AI ID berfungsi dengan baik dan fungsinya yang hebat sangat menakjubkan. Anda tidak perlu risau lagi untuk mengambil gambar! Ayat ini ditulis semula seperti berikut: Gunakan perisian Chuzhan AI (hak cipta dan tafsiran kepunyaan Chuzhan AI dan hanya digunakan untuk menunjukkan kesan yang dijana) mod lakaran: Sama ada dalam situasi kerja harian atau pejabat perniagaan, imej profesional adalah penting . Foto ID yang cantik boleh meningkatkan imej profesional seseorang. Foto ID yang dijana melalui AI bukan sahaja memenuhi standard foto tradisional, tetapi juga boleh memulihkan ciri wajah unik seseorang. Teknologi AI boleh mengenal pasti kontur muka, warna kulit, pencahayaan dan butiran lain secara bijak untuk menghasilkan foto ID yang paling sesuai. Sama ada rupa atau perangai, ia boleh dipaparkan dengan sempurna dan meninggalkan kesan pertama yang mendalam kepada orang ramai AI menjana foto ID dengan satu klik.

Bagaimana untuk menulis penjana laporan prestasi pelajar yang mudah menggunakan Java? Bagaimana untuk menulis penjana laporan prestasi pelajar yang mudah menggunakan Java? Nov 03, 2023 pm 02:57 PM

Bagaimana untuk menulis penjana laporan prestasi pelajar yang mudah menggunakan Java? Penjana Laporan Prestasi Pelajar ialah alat yang membantu guru atau pendidik menjana laporan prestasi pelajar dengan cepat. Artikel ini akan memperkenalkan cara menggunakan Java untuk menulis penjana laporan prestasi pelajar yang mudah. Pertama, kita perlu menentukan objek pelajar dan objek gred pelajar. Objek pelajar mengandungi maklumat asas seperti nama pelajar dan nombor pelajar, manakala objek skor pelajar mengandungi maklumat seperti skor mata pelajaran pelajar dan gred purata. Berikut ialah definisi objek pelajar mudah: awam

Penjana Seni Animasi AI Percuma Terbaik Penjana Seni Animasi AI Percuma Terbaik Feb 19, 2024 pm 10:50 PM

Jika anda tidak sabar-sabar untuk mencari penjana seni animasi AI percuma teratas, anda boleh menamatkan carian anda. Dunia seni anime telah menawan penonton selama beberapa dekad dengan reka bentuk watak yang unik, warna yang menawan dan plot yang menawan. Walau bagaimanapun, mencipta seni anime memerlukan bakat, kemahiran, dan banyak masa. Walau bagaimanapun, dengan pembangunan kecerdasan buatan (AI) yang berterusan, anda kini boleh meneroka dunia seni animasi tanpa perlu mendalami teknologi yang kompleks dengan bantuan penjana seni animasi AI percuma yang terbaik. Ini akan membuka kemungkinan baharu untuk anda melancarkan kreativiti anda. Apakah penjana seni anime AI? Penjana Seni Animasi AI menggunakan algoritma canggih dan teknik pembelajaran mesin untuk menganalisis pangkalan data karya animasi yang luas. Melalui algoritma ini, sistem mempelajari dan mengenal pasti gaya animasi yang berbeza

Bagaimana untuk menulis penjana kod QR mudah melalui PHP Bagaimana untuk menulis penjana kod QR mudah melalui PHP Sep 24, 2023 am 08:49 AM

Cara menulis penjana kod QR mudah melalui kod QR PHP telah menjadi sangat biasa dalam masyarakat moden Mereka boleh menghantar maklumat dengan cepat dan meningkatkan pengalaman pengguna. Dalam artikel ini, saya akan memperkenalkan anda kepada cara menulis penjana kod QR mudah menggunakan PHP. 1. Pasang alatan dan perpustakaan yang diperlukan Sebelum memulakan, kita perlu memastikan bahawa alatan dan perpustakaan berikut telah dipasang: PHP: Pastikan versi terkini PHP dipasang Anda boleh menyemak versi PHP semasa dengan menjalankan php -v arahan. Komposer: C

Penjana dalam PHP7: Bagaimana untuk mengendalikan sejumlah besar data dan pemuatan malas dengan cekap? Penjana dalam PHP7: Bagaimana untuk mengendalikan sejumlah besar data dan pemuatan malas dengan cekap? Oct 27, 2023 pm 07:31 PM

Konsep penjana (Generator) telah diperkenalkan dalam PHP7, yang menyediakan kaedah untuk mengendalikan sejumlah besar data dan pemuatan malas dengan cekap. Artikel ini akan bermula dengan konsep dan prinsip, digabungkan dengan contoh kod khusus, untuk memperkenalkan penggunaan dan kelebihan penjana dalam PHP7. Penjana ialah fungsi khas yang, bukannya memulangkan semua data sekaligus, menjana data atas permintaan. Apabila fungsi melaksanakan pernyataan hasil, nilai yang dihasilkan pada masa ini akan dikembalikan dan keadaan fungsi akan disimpan. Apabila fungsi penjana dipanggil seterusnya, fungsi itu akan

Penjana dalam PHP7: Bagaimana untuk mengendalikan data berskala besar dengan cekap dan menjimatkan memori? Penjana dalam PHP7: Bagaimana untuk mengendalikan data berskala besar dengan cekap dan menjimatkan memori? Oct 20, 2023 pm 04:42 PM

Penjana dalam PHP7: Bagaimana untuk mengendalikan data berskala besar dengan cekap dan menjimatkan memori? Gambaran Keseluruhan: PHP7 memperkenalkan penjana sebagai alat yang berkuasa dari segi pemprosesan data berskala besar dan penjimatan memori. Penjana ialah jenis fungsi khas dalam bahasa PHP Tidak seperti fungsi biasa, penjana boleh menjeda pelaksanaan dan mengembalikan hasil perantaraan dan bukannya mengembalikan semua hasil sekaligus. Ini menjadikan penjana ideal untuk memproses kumpulan data yang besar, mengurangkan penggunaan memori dan meningkatkan kecekapan pemprosesan. Artikel ini akan memperkenalkan pelajar

Gunakan ChatGPT untuk membina model besar dalam beberapa saat! Pemalam baharu OpenAI adalah gila, sambungkan kepada penterjemah kod dan dapatkannya dengan satu klik Gunakan ChatGPT untuk membina model besar dalam beberapa saat! Pemalam baharu OpenAI adalah gila, sambungkan kepada penterjemah kod dan dapatkannya dengan satu klik Apr 04, 2023 am 11:30 AM

Selepas ChatGPT boleh disambungkan ke Internet, OpenAI juga dengan pantas memperkenalkan penjana kod Dengan sokongan pemalam ini, ChatGPT malah boleh menjana model pembelajaran mesinnya sendiri. Jumaat lalu, OpenAI baru sahaja mengumumkan berita mengejutkan bahawa ChatGPT boleh menyambung ke Internet dan menyambung ke pemalam pihak ketiga! Sebagai tambahan kepada pemalam pihak ketiga, OpenAI juga memperkenalkan "Pentafsir Kod" pemalamnya sendiri dan memberikan beberapa kes penggunaan khas: menyelesaikan masalah matematik kuantitatif dan kualitatif melakukan analisis dan visualisasi data dan menukar format fail dengan cepat; Di samping itu, Greg Brockman menunjukkan bahawa ChatGPT juga boleh memproses fail video yang dimuat naik. Dan pengarang terlaris bernama Andrew Mayne

Apakah perbezaan antara iterator dan penjana dalam Python? Apakah perbezaan antara iterator dan penjana dalam Python? Oct 20, 2023 pm 07:10 PM

Apakah perbezaan antara iterator dan penjana dalam Python? Dalam pengaturcaraan Python, iterator dan penjana ialah alat yang digunakan untuk memproses objek boleh lelaran. Kedua-duanya boleh digunakan untuk melintasi data, tetapi terdapat beberapa perbezaan dalam pelaksanaan. Iterator ialah objek yang melaksanakan protokol iterator. Objek iterator perlu mengandungi dua kaedah: __iter__() dan __next__(). Itu

See all articles