Rumah Peranti teknologi AI GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Oct 14, 2023 pm 08:13 PM
pembelajaran mesin model besar

Pada masa ini, Model Bahasa Besar (LLM) menunjukkan keupayaan yang menakjubkan pada tugasan inferens, terutamanya apabila contoh dan langkah perantaraan disediakan. Walau bagaimanapun, kaedah segera biasanya bergantung pada pengetahuan tersirat dalam LLM, dan apabila pengetahuan tersirat salah atau tidak konsisten dengan tugas, LLM mungkin memberikan jawapan yang salah

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Sekarang, daripada Google, Institut Mila, dsb. Penyelidik dari penyelidikan institusi bersama-sama meneroka kaedah baharu - membenarkan LLM mempelajari peraturan inferens, dan mencadangkan rangka kerja baharu yang dipanggil Hipotesis-kepada-Teori (HtT). Kaedah baharu ini bukan sahaja menambah baik penaakulan pelbagai langkah, tetapi juga mempunyai kelebihan kebolehtafsiran dan kebolehpindahan

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Alamat kertas: https://arxiv.org/abs/2310.07064

cording

Experience

keputusan mengenai masalah penaakulan berangka dan penaakulan hubungan menunjukkan bahawa kaedah HtT menambah baik kaedah dorongan sedia ada dan meningkatkan ketepatan sebanyak 11-27%. Pada masa yang sama, peraturan yang dipelajari juga boleh dipindahkan kepada model yang berbeza atau bentuk yang berbeza dari masalah yang sama

Pengenalan kepada kaedah

Secara amnya, rangka kerja HtT mengandungi dua peringkat - peringkat induktif dan deduktif peringkat. Sama seperti latihan dan ujian dalam pembelajaran mesin tradisional.

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Dalam fasa induksi, LLM terlebih dahulu perlu menjana dan mengesahkan satu set peraturan untuk contoh latihan. Kajian ini menggunakan CoT untuk mengisytiharkan peraturan dan memperoleh jawapan, menilai kekerapan dan ketepatan peraturan, mengumpul peraturan yang kerap muncul dan membawa kepada jawapan yang betul, dan membentuk asas peraturan

Dengan asas peraturan yang baik, langkah seterusnya ialah bagaimana untuk mengaplikasikan penyelidikan ini Peraturan ini menyelesaikan masalah. Untuk tujuan ini, dalam fasa potongan, kajian ini menambah asas peraturan dengan segera dan memerlukan LLM untuk mendapatkan semula peraturan daripada asas peraturan untuk melakukan potongan, menukar penaakulan tersirat kepada penaakulan eksplisit.

Walau bagaimanapun, kajian mendapati bahawa walaupun LLM yang sangat berkuasa (seperti GPT-4) mengalami kesukaran untuk mendapatkan semula peraturan yang betul pada setiap langkah. Oleh itu, kajian ini membangunkan teknik penanda XML untuk meningkatkan keupayaan mendapatkan semula konteks LLM

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Hasil eksperimen

Untuk menilai HtT, kajian ini menjalankan penaakulan pelbagai penanda aras ke atas dua masalah. Keputusan eksperimen menunjukkan bahawa HtT menambah baik kaedah segera beberapa sampel. Penulis juga melakukan kajian ablasi yang meluas untuk memberikan pemahaman yang lebih komprehensif tentang HtT.

Mereka menilai kaedah baharu mengenai penaakulan berangka dan masalah penaakulan hubungan. Dalam inferens berangka, mereka melihat peningkatan 21.0% dalam ketepatan untuk GPT-4. Dalam penaakulan hubungan, GPT-4 mencapai peningkatan ketepatan 13.7%, dan GPT-3.5 mendapat lebih banyak manfaat, menggandakan prestasi. Keuntungan prestasi terutamanya datang daripada pengurangan ilusi peraturan.

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Secara khusus, Jadual 1 di bawah menunjukkan keputusan pada pangkalan data asas-16, asas-11 dan asas-9 aritmetik. Di antara semua sistem asas, CoT 0-shot mempunyai prestasi paling teruk dalam kedua-dua LLM.

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Jadual 2 membentangkan keputusan membandingkan kaedah berbeza pada CLUTRR. Dapat diperhatikan bahawa CoT 0-shot mempunyai prestasi terburuk dalam GPT3.5 dan GPT4. Untuk kaedah gesaan beberapa pukulan, CoT dan LtM melakukan yang sama. Dari segi ketepatan purata, HtT secara konsisten mengatasi kaedah pembayang untuk kedua-dua model sebanyak 11.1-27.2%. Perlu diingat bahawa GPT3.5 tidak buruk untuk mendapatkan semula peraturan CLUTRR dan mendapat lebih banyak manfaat daripada HtT berbanding GPT4, mungkin kerana terdapat lebih sedikit peraturan dalam CLUTRR daripada dalam aritmetik.

Perlu dinyatakan bahawa menggunakan peraturan GPT4, prestasi CoT pada GPT3.5 dipertingkatkan sebanyak 27.2%, iaitu lebih daripada dua kali ganda prestasi CoT dan hampir dengan prestasi CoT pada GPT4. Oleh itu, penulis percaya bahawa HtT boleh berfungsi sebagai bentuk penyulingan pengetahuan baharu daripada LLM kuat kepada LLM lemah.

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Jadual 3 menunjukkan bahawa HtT meningkatkan prestasi GPT-4 (versi teks) dengan ketara. Peningkatan ini tidak ketara untuk GPT3.5, kerana ia sering menghasilkan ralat selain daripada ilusi peraturan semasa memproses input teks.

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.

Atas ialah kandungan terperinci GPT-4 telah meningkatkan ketepatannya sebanyak 13.7% melalui latihan DeepMind, mencapai keupayaan induksi dan potongan yang lebih baik.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apl model besar Tencent Yuanbao berada dalam talian! Hunyuan dinaik taraf untuk mencipta pembantu AI serba boleh yang boleh dibawa ke mana-mana Apl model besar Tencent Yuanbao berada dalam talian! Hunyuan dinaik taraf untuk mencipta pembantu AI serba boleh yang boleh dibawa ke mana-mana Jun 09, 2024 pm 10:38 PM

Pada 30 Mei, Tencent mengumumkan peningkatan menyeluruh model Hunyuannya Apl "Tencent Yuanbao" berdasarkan model Hunyuan telah dilancarkan secara rasmi dan boleh dimuat turun dari kedai aplikasi Apple dan Android. Berbanding dengan versi applet Hunyuan dalam peringkat ujian sebelumnya, Tencent Yuanbao menyediakan keupayaan teras seperti carian AI, ringkasan AI, dan penulisan AI untuk senario kecekapan kerja untuk senario kehidupan harian, permainan Yuanbao juga lebih kaya dan menyediakan pelbagai ciri , dan kaedah permainan baharu seperti mencipta ejen peribadi ditambah. "Tencent tidak akan berusaha untuk menjadi yang pertama membuat model besar, Liu Yuhong, naib presiden Tencent Cloud dan orang yang bertanggungjawab bagi model besar Tencent Hunyuan, berkata: "Pada tahun lalu, kami terus mempromosikan keupayaan untuk Model besar Tencent Hunyuan Dalam teknologi Poland yang kaya dan besar dalam senario perniagaan sambil mendapatkan cerapan tentang keperluan sebenar pengguna

Model besar Bytedance Beanbao dikeluarkan, perkhidmatan AI tindanan penuh Volcano Engine membantu perusahaan mengubah dengan bijak Model besar Bytedance Beanbao dikeluarkan, perkhidmatan AI tindanan penuh Volcano Engine membantu perusahaan mengubah dengan bijak Jun 05, 2024 pm 07:59 PM

Tan Dai, Presiden Volcano Engine, berkata syarikat yang ingin melaksanakan model besar dengan baik menghadapi tiga cabaran utama: kesan model, kos inferens dan kesukaran pelaksanaan: mereka mesti mempunyai sokongan model besar asas yang baik untuk menyelesaikan masalah yang kompleks, dan mereka juga mesti mempunyai inferens kos rendah. Perkhidmatan membolehkan model besar digunakan secara meluas, dan lebih banyak alat, platform dan aplikasi diperlukan untuk membantu syarikat melaksanakan senario. ——Tan Dai, Presiden Huoshan Engine 01. Model pundi kacang besar membuat kemunculan sulungnya dan banyak digunakan Menggilap kesan model adalah cabaran paling kritikal untuk pelaksanaan AI. Tan Dai menegaskan bahawa hanya melalui penggunaan meluas model yang baik boleh digilap. Pada masa ini, model Doubao memproses 120 bilion token teks dan menjana 30 juta imej setiap hari. Untuk membantu perusahaan melaksanakan senario model berskala besar, model berskala besar beanbao yang dibangunkan secara bebas oleh ByteDance akan dilancarkan melalui gunung berapi

Artikel ini akan membawa anda memahami SHAP: penjelasan model untuk pembelajaran mesin Artikel ini akan membawa anda memahami SHAP: penjelasan model untuk pembelajaran mesin Jun 01, 2024 am 10:58 AM

Dalam bidang pembelajaran mesin dan sains data, kebolehtafsiran model sentiasa menjadi tumpuan penyelidik dan pengamal. Dengan aplikasi meluas model yang kompleks seperti kaedah pembelajaran mendalam dan ensemble, memahami proses membuat keputusan model menjadi sangat penting. AI|XAI yang boleh dijelaskan membantu membina kepercayaan dan keyakinan dalam model pembelajaran mesin dengan meningkatkan ketelusan model. Meningkatkan ketelusan model boleh dicapai melalui kaedah seperti penggunaan meluas pelbagai model yang kompleks, serta proses membuat keputusan yang digunakan untuk menerangkan model. Kaedah ini termasuk analisis kepentingan ciri, anggaran selang ramalan model, algoritma kebolehtafsiran tempatan, dsb. Analisis kepentingan ciri boleh menerangkan proses membuat keputusan model dengan menilai tahap pengaruh model ke atas ciri input. Anggaran selang ramalan model

Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Jun 03, 2024 pm 01:25 PM

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

Amalan lanjutan graf pengetahuan industri Amalan lanjutan graf pengetahuan industri Jun 13, 2024 am 11:59 AM

1. Latar Belakang Pengenalan Pertama, mari kita perkenalkan sejarah pembangunan Teknologi Yunwen. Syarikat Teknologi Yunwen...2023 ialah tempoh apabila model besar berleluasa Banyak syarikat percaya bahawa kepentingan graf telah dikurangkan dengan ketara selepas model besar, dan sistem maklumat pratetap yang dikaji sebelum ini tidak lagi penting. Walau bagaimanapun, dengan promosi RAG dan kelaziman tadbir urus data, kami mendapati bahawa tadbir urus data yang lebih cekap dan data berkualiti tinggi adalah prasyarat penting untuk meningkatkan keberkesanan model besar yang diswastakan Oleh itu, semakin banyak syarikat mula memberi perhatian kepada kandungan berkaitan pembinaan pengetahuan. Ini juga menggalakkan pembinaan dan pemprosesan pengetahuan ke peringkat yang lebih tinggi, di mana terdapat banyak teknik dan kaedah yang boleh diterokai. Dapat dilihat bahawa kemunculan teknologi baru tidak mengalahkan semua teknologi lama, tetapi mungkin juga mengintegrasikan teknologi baru dan lama.

Xiaomi Byte bergabung tenaga! Model besar akses Xiao Ai ke Doubao: sudah dipasang pada telefon mudah alih dan SU7 Xiaomi Byte bergabung tenaga! Model besar akses Xiao Ai ke Doubao: sudah dipasang pada telefon mudah alih dan SU7 Jun 13, 2024 pm 05:11 PM

Menurut berita pada 13 Jun, menurut akaun awam “Volcano Engine” Byte, pembantu kecerdasan buatan Xiaomi “Xiao Ai” telah mencapai kerjasama dengan Volcano Engine Kedua-dua pihak akan mencapai pengalaman interaktif AI yang lebih pintar berdasarkan model besar beanbao . Dilaporkan bahawa model beanbao berskala besar yang dicipta oleh ByteDance boleh memproses sehingga 120 bilion token teks dengan cekap dan menjana 30 juta keping kandungan setiap hari. Xiaomi menggunakan model besar Doubao untuk meningkatkan keupayaan pembelajaran dan penaakulan modelnya sendiri dan mencipta "Xiao Ai Classmate", yang bukan sahaja memahami keperluan pengguna dengan lebih tepat, tetapi juga menyediakan kelajuan tindak balas yang lebih pantas dan perkhidmatan kandungan yang lebih komprehensif. Contohnya, apabila pengguna bertanya tentang konsep saintifik yang kompleks, &ldq

AI yang boleh dijelaskan: Menerangkan model AI/ML yang kompleks AI yang boleh dijelaskan: Menerangkan model AI/ML yang kompleks Jun 03, 2024 pm 10:08 PM

Penterjemah |. Disemak oleh Li Rui |. Chonglou Model kecerdasan buatan (AI) dan pembelajaran mesin (ML) semakin kompleks hari ini, dan output yang dihasilkan oleh model ini adalah kotak hitam – tidak dapat dijelaskan kepada pihak berkepentingan. AI Boleh Dijelaskan (XAI) bertujuan untuk menyelesaikan masalah ini dengan membolehkan pihak berkepentingan memahami cara model ini berfungsi, memastikan mereka memahami cara model ini sebenarnya membuat keputusan, dan memastikan ketelusan dalam sistem AI, Amanah dan akauntabiliti untuk menyelesaikan masalah ini. Artikel ini meneroka pelbagai teknik kecerdasan buatan (XAI) yang boleh dijelaskan untuk menggambarkan prinsip asasnya. Beberapa sebab mengapa AI boleh dijelaskan adalah penting Kepercayaan dan ketelusan: Untuk sistem AI diterima secara meluas dan dipercayai, pengguna perlu memahami cara keputusan dibuat

Untuk menyediakan tanda aras dan sistem penilaian menjawab soalan saintifik dan kompleks baharu untuk model besar, UNSW, Argonne, University of Chicago dan institusi lain bersama-sama melancarkan rangka kerja SciQAG Untuk menyediakan tanda aras dan sistem penilaian menjawab soalan saintifik dan kompleks baharu untuk model besar, UNSW, Argonne, University of Chicago dan institusi lain bersama-sama melancarkan rangka kerja SciQAG Jul 25, 2024 am 06:42 AM

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

See all articles