Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?-AI-php.cn

Rumah

Peranti teknologi

Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?

PHPz

Sep 23, 2023 pm 12:05 PM

ai Model

Penjanaan ringkasan ialah tugas penjanaan bahasa semula jadi (NLG), yang tujuan utamanya adalah untuk memampatkan teks panjang menjadi ringkasan pendek. Ia boleh digunakan pada pelbagai kandungan, seperti artikel berita, kod sumber dan teks merentas bahasa, dsb. Kaedah penalaan halus pada set tidak lagi terpakai.

Kami tidak boleh tidak bertanya, sejauh manakah LLM berkesan menjana ringkasan?

Bagi menjawab soalan ini, penyelidik dari Universiti Peking menjalankan perbincangan terperinci dalam kertas kerja "Ringkasan (Hampir) Mati". Mereka menilai prestasi LLM pada pelbagai tugas ringkasan (berita tunggal, berbilang berita, dialog, kod sumber dan ringkasan merentas bahasa) menggunakan set data penilaian yang dijana manusia

#🎜 🎜# Selepas membandingkan secara kuantitatif dan kualitatif ringkasan yang dijana LLM, ringkasan tulisan manusia dan ringkasan yang dijana model yang diperhalusi, didapati bahawa ringkasan yang dijana LLM amat digemari oleh penilai manusia#🎜🎜 #

Setelah mengambil sampel dan meneliti 100 kertas kerja berkaitan kaedah ringkasan yang diterbitkan dalam ACL, EMNLP, NAACL dan COLING dalam tempoh 3 tahun yang lalu, penyelidik mendapati bahawa sumbangan utama kira-kira 70% daripada kertas kerja adalah untuk mencadangkan ringkasan ringkasan A kaedah dan keberkesanannya telah disahkan pada set data standard. Oleh itu, kajian menyatakan bahawa "Ringkasan sudah (Hampir) Mati"

Walaupun begitu, penyelidik berkata bidang itu masih menghadapi beberapa cabaran, Isu seperti keperluan untuk lebih tinggi set data rujukan berkualiti dan kaedah penilaian yang lebih baik masih perlu diselesaikan

Pautan kertas: https ://arxiv. org/pdf/2309.09558.pdf

Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?

Kaedah dan Keputusan

#🎜Kajian ini digunakan🎜 untuk membina set data, setiap set data mengandungi 50 sampel.

Apabila melaksanakan tugasan ringkasan berita, berbilang berita dan perbualan, kami menggunakan kaedah yang serupa dengan kaedah pembinaan set data CNN/DailyMail dan Multi-News untuk simulasi. Untuk tugas rumusan merentas bahasa, kami menggunakan strategi yang sama seperti yang dicadangkan oleh Zhu et al. Bagi tugasan ringkasan kod, kaedah yang dicadangkan oleh Bahrami et al.

Selepas set data dibina, langkah seterusnya ialah kaedah. Secara khusus, artikel ini menggunakan BART dan T5 untuk tugasan berita tunggal dan BART untuk tugasan berbilang berita;

Dalam eksperimen ini, kajian menggunakan penilai manusia untuk membandingkan kualiti keseluruhan abstrak yang berbeza. Menurut keputusan dalam Rajah 1, ringkasan yang dijana oleh LLM mengatasi ringkasan yang dijana secara manual dan ringkasan yang dijana oleh model yang diperhalusi dalam semua tugasan 🎜#

Ini menimbulkan persoalan mengapa LLM. mampu mengatasi ringkasan tulisan manusia, yang secara tradisinya dianggap sempurna. Tambahan pula, pemerhatian awal menunjukkan bahawa rumusan yang dijana LLM adalah sangat lancar dan koheren

Kertas ini seterusnya merekrut pencatat untuk mengenal pasti isu halusinasi dalam ayat ringkasan manusia dan janaan LLM, dan keputusannya adalah seperti berikut Seperti yang ditunjukkan dalam Jadual 1, ringkasan tulisan manusia mempamerkan bilangan halusinasi yang sama atau lebih tinggi berbanding ringkasan yang dihasilkan oleh GPT-4. Dalam tugas khusus seperti berbilang item berita dan ringkasan kod, ringkasan tulisan manusia menunjukkan konsistensi fakta yang jauh lebih lemah.

Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?

Jadual 2 menunjukkan perkadaran halusinasi dalam ringkasan tulisan manusia dan GPT-4 #🎜 ringkasan yang dihasilkan

Artikel ini juga mendapati bahawa rumusan rujukan tulisan manusia mempunyai masalah yang kurang kelancaran. Seperti yang ditunjukkan dalam Rajah 2 (a), ringkasan rujukan tulisan manusia kadangkala mengalami maklumat yang tidak lengkap. Dan dalam Rajah 2(b), beberapa ringkasan rujukan tulisan manusia menunjukkan halusinasi.

Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?

Kajian ini juga mendapati ringkasan yang dihasilkan oleh model penalaan halus biasanya mempunyai panjang yang tetap dan ketat, manakala LLM dapat melaraskan panjang output berdasarkan maklumat input. Tambahan pula, apabila input mengandungi berbilang topik, ringkasan yang dijana oleh model yang diperhalusi mempunyai liputan topik yang rendah, seperti yang ditunjukkan dalam Rajah 3, manakala LLM dapat menangkap semua topik apabila menjana ringkasan #🎜🎜 ##🎜🎜 #

Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?

Menurut keputusan dalam Rajah 4, skor keutamaan manusia untuk model besar melebihi 50%, yang menunjukkan bahawa orang mempunyai keutamaan yang kuat untuknya. ringkasan, dan menyerlahkan keupayaan LLM dalam ringkasan teks

Atas ialah kandungan terperinci Seberapa lancar prestasi GPT-4? Adakah tulisan manusia boleh diatasi?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Arahan sembang dan cara menggunakannya

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7542

Tutorial CakePHP

1381

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Petua Konfigurasi Firewall Pelayan Mel Debian Apr 13, 2025 am 11:42 AM

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Apr 13, 2025 am 09:42 AM

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Kaedah pemasangan sijil SSL Server Server Debian Apr 13, 2025 am 11:39 AM

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Cara Melakukan Pengesahan Tandatangan Digital dengan Debian Openssl Apr 13, 2025 am 11:09 AM

Menggunakan OpenSSL untuk Pengesahan Tandatangan Digital pada Sistem Debian, anda boleh mengikuti langkah -langkah berikut: Penyediaan untuk memasang OpenSSL: Pastikan sistem Debian anda telah dipasang. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasangnya: sudoaptdateudoaptininstallopenssl untuk mendapatkan kunci awam: Pengesahan tandatangan digital memerlukan kunci awam penandatangan. Biasanya, kunci awam akan disediakan dalam bentuk fail, seperti public_key.pe

Baris arahan shutdown centos Apr 14, 2025 pm 09:12 PM

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Bagaimana Debian OpenSSL Menghalang Serangan Man-dalam-Middle Apr 13, 2025 am 10:30 AM

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession

Cara Melakukan Pengurusan Log Debian Hadoop Apr 13, 2025 am 10:45 AM

Menguruskan Log Hadoop pada Debian, anda boleh mengikuti langkah-langkah berikut dan amalan terbaik: Agregasi log membolehkan pengagregatan log: tetapkan benang.log-agregasi-enable untuk benar dalam fail benang-site.xml untuk membolehkan pengagregatan log. Konfigurasikan dasar pengekalan log: tetapkan yarn.log-aggregasi.Retain-seconds Untuk menentukan masa pengekalan log, seperti 172800 saat (2 hari). Nyatakan Laluan Penyimpanan Log: Melalui Benang

Sony mengesahkan kemungkinan menggunakan GPU khas di PS5 Pro untuk membangunkan AI dengan AMD Apr 13, 2025 pm 11:45 PM

Mark Cerny, Ketua Arkitek SonyinterActiveEntainment (SIE, Sony Interactive Entertainment), telah mengeluarkan lebih banyak butiran perkakasan dari PlayStation5Pro hos generasi akan datang (PS5Pro), termasuk GPU seni bina AMDRDNA2.x yang dinamakan, dan Kod Arsitektur AMDRDNA2.x yang dinamakan. Tumpuan peningkatan prestasi PS5Pro masih pada tiga tiang, termasuk GPU yang lebih kuat, jejak sinar maju dan fungsi resolusi super PSSR yang berkuasa AI. GPU mengamalkan seni bina AmdrDNA2 yang disesuaikan, yang Sony menamakan RDNA2.x, dan ia mempunyai beberapa seni bina RDNA3.

See all articles