Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?
Penjanaan ringkasan ialah tugas penjanaan bahasa semula jadi (NLG), yang tujuan utamanya adalah untuk memampatkan teks panjang menjadi ringkasan pendek. Ia boleh digunakan pada pelbagai kandungan, seperti artikel berita, kod sumber dan teks merentas bahasa, dsb. Kaedah penalaan halus pada set tidak lagi terpakai.
Kami tidak boleh tidak bertanya, sejauh manakah LLM berkesan menjana ringkasan?
Bagi menjawab soalan ini, penyelidik dari Universiti Peking menjalankan perbincangan terperinci dalam kertas kerja "Ringkasan (Hampir) Mati". Mereka menilai prestasi LLM pada pelbagai tugas ringkasan (berita tunggal, berbilang berita, dialog, kod sumber dan ringkasan merentas bahasa) menggunakan set data penilaian yang dijana manusia
#🎜 🎜# Selepas membandingkan secara kuantitatif dan kualitatif ringkasan yang dijana LLM, ringkasan tulisan manusia dan ringkasan yang dijana model yang diperhalusi, didapati bahawa ringkasan yang dijana LLM amat digemari oleh penilai manusia#🎜🎜 #
Setelah mengambil sampel dan meneliti 100 kertas kerja berkaitan kaedah ringkasan yang diterbitkan dalam ACL, EMNLP, NAACL dan COLING dalam tempoh 3 tahun yang lalu, penyelidik mendapati bahawa sumbangan utama kira-kira 70% daripada kertas kerja adalah untuk mencadangkan ringkasan ringkasan A kaedah dan keberkesanannya telah disahkan pada set data standard. Oleh itu, kajian menyatakan bahawa "Ringkasan sudah (Hampir) Mati"Walaupun begitu, penyelidik berkata bidang itu masih menghadapi beberapa cabaran, Isu seperti keperluan untuk lebih tinggi set data rujukan berkualiti dan kaedah penilaian yang lebih baik masih perlu diselesaikan
Pautan kertas: https ://arxiv. org/pdf/2309.09558.pdf
#🎜Kajian ini digunakan🎜 untuk membina set data, setiap set data mengandungi 50 sampel.
Apabila melaksanakan tugasan ringkasan berita, berbilang berita dan perbualan, kami menggunakan kaedah yang serupa dengan kaedah pembinaan set data CNN/DailyMail dan Multi-News untuk simulasi. Untuk tugas rumusan merentas bahasa, kami menggunakan strategi yang sama seperti yang dicadangkan oleh Zhu et al. Bagi tugasan ringkasan kod, kaedah yang dicadangkan oleh Bahrami et al.
Selepas set data dibina, langkah seterusnya ialah kaedah. Secara khusus, artikel ini menggunakan BART dan T5 untuk tugasan berita tunggal dan BART untuk tugasan berbilang berita;
Dalam eksperimen ini, kajian menggunakan penilai manusia untuk membandingkan kualiti keseluruhan abstrak yang berbeza. Menurut keputusan dalam Rajah 1, ringkasan yang dijana oleh LLM mengatasi ringkasan yang dijana secara manual dan ringkasan yang dijana oleh model yang diperhalusi dalam semua tugasan 🎜#
Ini menimbulkan persoalan mengapa LLM. mampu mengatasi ringkasan tulisan manusia, yang secara tradisinya dianggap sempurna. Tambahan pula, pemerhatian awal menunjukkan bahawa rumusan yang dijana LLM adalah sangat lancar dan koheren
Kertas ini seterusnya merekrut pencatat untuk mengenal pasti isu halusinasi dalam ayat ringkasan manusia dan janaan LLM, dan keputusannya adalah seperti berikut Seperti yang ditunjukkan dalam Jadual 1, ringkasan tulisan manusia mempamerkan bilangan halusinasi yang sama atau lebih tinggi berbanding ringkasan yang dihasilkan oleh GPT-4. Dalam tugas khusus seperti berbilang item berita dan ringkasan kod, ringkasan tulisan manusia menunjukkan konsistensi fakta yang jauh lebih lemah.
Jadual 2 menunjukkan perkadaran halusinasi dalam ringkasan tulisan manusia dan GPT-4 #🎜 ringkasan yang dihasilkan
Artikel ini juga mendapati bahawa rumusan rujukan tulisan manusia mempunyai masalah yang kurang kelancaran. Seperti yang ditunjukkan dalam Rajah 2 (a), ringkasan rujukan tulisan manusia kadangkala mengalami maklumat yang tidak lengkap. Dan dalam Rajah 2(b), beberapa ringkasan rujukan tulisan manusia menunjukkan halusinasi.
Kajian ini juga mendapati ringkasan yang dihasilkan oleh model penalaan halus biasanya mempunyai panjang yang tetap dan ketat, manakala LLM dapat melaraskan panjang output berdasarkan maklumat input. Tambahan pula, apabila input mengandungi berbilang topik, ringkasan yang dijana oleh model yang diperhalusi mempunyai liputan topik yang rendah, seperti yang ditunjukkan dalam Rajah 3, manakala LLM dapat menangkap semua topik apabila menjana ringkasan #🎜🎜 ##🎜🎜 #
Atas ialah kandungan terperinci Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Menggunakan OpenSSL untuk Pengesahan Tandatangan Digital pada Sistem Debian, anda boleh mengikuti langkah -langkah berikut: Penyediaan untuk memasang OpenSSL: Pastikan sistem Debian anda telah dipasang. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasangnya: sudoaptdateudoaptininstallopenssl untuk mendapatkan kunci awam: Pengesahan tandatangan digital memerlukan kunci awam penandatangan. Biasanya, kunci awam akan disediakan dalam bentuk fail, seperti public_key.pe

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession

Menguruskan Log Hadoop pada Debian, anda boleh mengikuti langkah-langkah berikut dan amalan terbaik: Agregasi log membolehkan pengagregatan log: tetapkan benang.log-agregasi-enable untuk benar dalam fail benang-site.xml untuk membolehkan pengagregatan log. Konfigurasikan dasar pengekalan log: tetapkan yarn.log-aggregasi.Retain-seconds Untuk menentukan masa pengekalan log, seperti 172800 saat (2 hari). Nyatakan Laluan Penyimpanan Log: Melalui Benang

Mark Cerny, Ketua Arkitek SonyinterActiveEntainment (SIE, Sony Interactive Entertainment), telah mengeluarkan lebih banyak butiran perkakasan dari PlayStation5Pro hos generasi akan datang (PS5Pro), termasuk GPU seni bina AMDRDNA2.x yang dinamakan, dan Kod Arsitektur AMDRDNA2.x yang dinamakan. Tumpuan peningkatan prestasi PS5Pro masih pada tiga tiang, termasuk GPU yang lebih kuat, jejak sinar maju dan fungsi resolusi super PSSR yang berkuasa AI. GPU mengamalkan seni bina AmdrDNA2 yang disesuaikan, yang Sony menamakan RDNA2.x, dan ia mempunyai beberapa seni bina RDNA3.
