Jadual Kandungan
Pencapaian dalam Pendidikan Tinggi
Aliran Kerja
Rumah Peranti teknologi AI MIT mengeluarkan versi penyelesai 'Matematik Lanjutan' yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

MIT mengeluarkan versi penyelesai 'Matematik Lanjutan' yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Apr 12, 2023 pm 04:04 PM
openai mit Model terlatih

​Bukan sahaja menyelesaikan masalah perkataan matematik sekolah rendah, AI juga telah mula menakluk matematik lanjutan!

Baru-baru ini, penyelidik MIT mengumumkan bahawa berdasarkan model pra-latihan OpenAI Codex, mereka berjaya mencapai kadar ketepatan 81% pada masalah matematik peringkat sarjana muda melalui pembelajaran beberapa pukulan!

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

  • Pautan kertas: https://arxiv.org/abs/2112.15594
  • Pautan kod: https://github.com/idrori /mathq

Mari kita lihat jawapan kepada beberapa soalan kecil, seperti mengira isipadu yang dijana dengan memutarkan graf fungsi pembolehubah tunggal di sekeliling paksi, mengira penarik Lorenz dan unjuran, mengira dan menggambarkan bentuk geometri penguraian nilai tunggal (SVD), bukan sahaja jawapan yang betul, tetapi juga penjelasan yang sepadan boleh diberikan!

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Sungguh sukar dipercayai, melepasi angka yang tinggi sentiasa dilalui Kini AI boleh memperoleh 81 mata dalam satu pukulan secara unilateral manusia.

Apa yang lebih hebat ialah selain menyelesaikan masalah yang sukar diselesaikan dengan model pembelajaran mesin biasa, penyelidikan ini juga menunjukkan bahawa teknologi ini boleh dipromosikan secara besar-besaran dan boleh menyelesaikan masalah dalam kursusnya dan kursus yang serupa.

Ini juga merupakan kali pertama dalam sejarah bahawa model pembelajaran mesin tunggal boleh menyelesaikan masalah matematik berskala besar itu, dan juga boleh menerangkan, merancang dan juga menjana soalan baharu!

Malah, kertas kerja ini diterbitkan seawal awal tahun Selepas setengah tahun disemak, panjangnya telah ditambah daripada 114 muka surat kepada 181 halaman dinomborkan terus dari A-Z Laman.

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Terdapat empat unit pengarang utama artikel iaitu MIT, Columbia University, Harvard University dan University of Waterloo.

Pengarang pertama Iddo Drori ialah pensyarah di Jabatan AI Jabatan Kejuruteraan Elektrik dan Sains Komputer di MIT dan profesor bersekutu tambahan di Sekolah Kejuruteraan dan Sains Gunaan di Columbia University. Memenangi Anugerah Kertas Terbaik CCAI NeurIPS 2021.

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Arah penyelidikan utamanya ialah pembelajaran mesin untuk pendidikan, yang cuba mendapatkan mesin untuk menyelesaikan, menerangkan dan menjana kursus matematik dan STEM peringkat kolej; , yang berdasarkan data Ribuan tahun data yang meramalkan perubahan iklim yang melampau dan memantau iklim, menyepadukan kerja pelbagai disiplin untuk meramalkan perubahan dalam biogeokimia lautan di Lautan Atlantik selama bertahun-tahun, algoritma pembelajaran mesin untuk pemanduan autonomi, dan banyak lagi;

Beliau juga merupakan pengarang The Science of Deep Learning yang diterbitkan oleh Cambridge University Press.

Pencapaian dalam Pendidikan Tinggi

Sebelum kertas kerja ini, kebanyakan penyelidik percaya bahawa rangkaian saraf tidak dapat menangani masalah nombor tinggi dan hanya boleh menyelesaikan beberapa masalah matematik yang mudah.

Walaupun model Transformer mengatasi prestasi manusia dalam pelbagai tugasan NLP, ia masih tidak buruk dalam menyelesaikan masalah matematik Sebab utama adalah kerana pelbagai model besar seperti GPT-3 hanya berfungsi pada data teks -latihan pada.

Kemudian, beberapa penyelidik mendapati bahawa model bahasa masih boleh dibimbing untuk menaakul dan menjawab beberapa soalan matematik mudah melalui analisis langkah demi langkah (rantai pemikiran), tetapi masalah matematik lanjutan tidak begitu mudah untuk diselesaikan .

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Apabila sasaran adalah masalah nombor tinggi, anda mesti terlebih dahulu mengumpul gelombang data latihan.

Pengarang memilih 25 masalah secara rawak daripada setiap tujuh kursus di MIT, termasuk:

  • 18.01 Kalkulus Pembolehubah Tunggal
  • 18.02 Kamiran Kalkulus Pelbagai Pembolehubah
  • 18.03 Persamaan Pembezaan
  • 18.05 Pengenalan kepada Kebarangkalian dan Statistik
  • 18.06 Algebra Linear
  • 6.042 Sains Komputer Matematik
  • Universiti Kompaun COLUMBIA 3🎜>
  • 18.06 Linear Algebra

Untuk set data MATH, penyelidik memilih 15 soalan secara rawak daripada enam topik set data (Algebra, Pengiraan dan Kebarangkalian, Algebra Pertengahan, Teori Nombor, Pra-Algebra dan Pra-Algebra) .

Untuk mengesahkan bahawa hasil yang dijana oleh model tidak terlalu sesuai dengan data latihan, penyelidik memilih kursus COMS3251 yang belum diterbitkan di Internet untuk mengesahkan hasil yang dijana.

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Aliran Kerja

Model mengambil soalan kursus sebagai input, kemudian melakukan pembesaran automatik dengan konteks di atasnya, menghasilkan atur cara yang disintesis dan akhirnya mengeluarkan jawapan dan penjelasan yang dijana.

Untuk soalan yang berbeza, hasil keluaran mungkin berbeza Contohnya, jawapan kepada 18.01 ialah persamaan, jawapan kepada 18.02 ialah nilai Boolean, jawapan kepada 18.03 dan 18.06 ialah graf atau vektor, dan jawapan kepada 18.05 ialah nilai berangka.

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Apabila anda mendapat soalan, langkah pertama ialah membenarkan model mencari konteks soalan yang berkaitan. Para penyelidik memberi tumpuan terutamanya pada program Python yang dihasilkan oleh Codex, jadi mereka menambah teks "tulis program" sebelum soalan dan meletakkan teks dalam tiga tanda petikan program Python, berpura-pura menjadi docstring dalam program.

Selepas menjana atur cara, gesaan Codex diperlukan untuk menentukan perpustakaan mana yang hendak diimport Pengarang memilih untuk menambah rentetan "use sympy" sebelum soalan sebagai konteks, menyatakan bahawa atur cara yang disintesis untuk menyelesaikan masalah harus gunakan pakej ini.

Dengan mengira pakej pengaturcaraan Python yang digunakan oleh setiap kursus, anda boleh melihat bahawa semua kursus menggunakan NumPy dan Sympy. Matplotlib hanya digunakan dalam kursus dengan masalah yang memerlukan perancangan. Kira-kira separuh daripada kursus menggunakan matematik, rawak dan SciPy. Semasa operasi sebenar, penyelidik hanya menetapkan SymPy atau pakej berkaitan lukisan untuk diimport, dan pakej import lain disintesis secara automatik.

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Menggunakan pembelajaran Zero-shot, iaitu, 71% daripada masalah boleh diselesaikan secara automatik dengan hanya menggunakan peningkatan automatik pada masalah asal.

Jika masalah tidak diselesaikan, penyelidik cuba menggunakan pembelajaran beberapa pukulan untuk menyelesaikan masalah tersebut.

Mula-mula gunakan enjin pembenaman text-similarity-babbag-001 OpenAI untuk mendapatkan pembenaman dimensi 2048 bagi semua masalah, dan kemudian gunakan pengiraan persamaan kosinus pada semua vektor untuk mencari masalah yang tidak dapat diselesaikan yang paling serupa dengan yang diselesaikan soalan masalah. Akhir sekali, masalah yang paling serupa dan kod yang sepadan digunakan sebagai contoh beberapa gambar masalah baharu.

Jika kod yang dijana tidak mengeluarkan jawapan yang betul, tambahkan satu lagi pasangan kod soalan yang diselesaikan, setiap kali menggunakan soalan selesai yang serupa yang seterusnya.

Dalam amalan, boleh didapati bahawa menggunakan sehingga 5 contoh untuk pembelajaran beberapa pukulan mempunyai kesan terbaik, dan jumlah bilangan masalah yang boleh diselesaikan secara automatik meningkat daripada 71% pembelajaran sifar pukulan kepada 81% daripada pembelajaran beberapa pukulan .

Untuk menyelesaikan baki 19% masalah, penyunting manusia dikehendaki campur tangan.

Penyelidik mula-mula mengumpul semua soalan dan mendapati bahawa kebanyakannya adalah samar-samar atau mengandungi maklumat yang berlebihan, seperti rujukan kepada watak filem atau peristiwa semasa, dsb. Soalan-soalan itu perlu diselesaikan untuk mengeluarkan intipati soalan-soalan.

Pengisihan masalah terutamanya melibatkan mengalih keluar maklumat yang berlebihan, memecahkan struktur ayat yang panjang kepada komponen yang lebih kecil dan menukar gesaan kepada format pengaturcaraan.

Situasi lain yang memerlukan campur tangan manual ialah jawapan kepada soalan memerlukan beberapa langkah lukisan untuk dijelaskan, iaitu Codex perlu digesa secara interaktif sehingga kesan visualisasi yang dikehendaki dicapai.

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Selain menjana jawapan, model itu juga harus dapat menjelaskan sebab-sebab jawapan tersebut sedang melakukan: 1." Model menjana hasil yang dijelaskan langkah demi langkah.

Selepas anda boleh menjawab soalan, langkah seterusnya ialah menggunakan Codex untuk menjana soalan baharu bagi setiap kursus.

Penyelidik mencipta senarai soalan bernombor yang ditulis oleh pelajar dalam setiap kelas Senarai ini dipotong selepas bilangan soalan rawak, dan hasilnya digunakan untuk menggesa Codex menjana soalan seterusnya.

Proses ini diulang sehingga cukup soalan baharu dicipta untuk setiap kursus.

Untuk menilai soalan yang dijana, penyelidik meninjau pelajar MIT yang telah mengikuti kursus ini atau yang setaraf dengannya untuk membandingkan kualiti dan kesukaran soalan yang dihasilkan oleh mesin dengan kursus asal.

MIT mengeluarkan versi penyelesai Matematik Lanjutan yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus

Daripada hasil tinjauan pelajar dapat kita lihat:

  • Kualiti pemarkahan mesin sudah setanding dengan soalan manusia;
  • Dari segi kesukaran, soalan manusia lebih sesuai sebagai soalan kursus, manakala keputusan yang dihasilkan oleh mesin adalah lebih sukar sedikit. Beberapa;
  • Lebih separuh daripada soalan kursus boleh dilihat oleh pelajar sebagai dihasilkan oleh model, dan yang paling hampir dengan manusia ialah kursus 18.01

Maklumat Rujukan:

https://www.reddit.com/r/artificial/comments/v8liqh/researchers_built_a_neural_network_that_not_only/​

Atas ialah kandungan terperinci MIT mengeluarkan versi penyelesai 'Matematik Lanjutan' yang dipertingkat: kadar ketepatan mencapai 81% dalam 7 kursus. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Paradigma pengaturcaraan baharu, apabila Spring Boot bertemu OpenAI Paradigma pengaturcaraan baharu, apabila Spring Boot bertemu OpenAI Feb 01, 2024 pm 09:18 PM

Pada tahun 2023, teknologi AI telah menjadi topik hangat dan memberi impak besar kepada pelbagai industri, terutamanya dalam bidang pengaturcaraan. Orang ramai semakin menyedari kepentingan teknologi AI, dan komuniti Spring tidak terkecuali. Dengan kemajuan berterusan teknologi GenAI (General Artificial Intelligence), ia menjadi penting dan mendesak untuk memudahkan penciptaan aplikasi dengan fungsi AI. Dengan latar belakang ini, "SpringAI" muncul, bertujuan untuk memudahkan proses membangunkan aplikasi berfungsi AI, menjadikannya mudah dan intuitif serta mengelakkan kerumitan yang tidak perlu. Melalui "SpringAI", pembangun boleh membina aplikasi dengan lebih mudah dengan fungsi AI, menjadikannya lebih mudah untuk digunakan dan dikendalikan.

Memilih model benam yang paling sesuai dengan data anda: Ujian perbandingan OpenAI dan benam berbilang bahasa sumber terbuka Memilih model benam yang paling sesuai dengan data anda: Ujian perbandingan OpenAI dan benam berbilang bahasa sumber terbuka Feb 26, 2024 pm 06:10 PM

OpenAI baru-baru ini mengumumkan pelancaran model benam generasi terbaru mereka embeddingv3, yang mereka dakwa sebagai model benam paling berprestasi dengan prestasi berbilang bahasa yang lebih tinggi. Kumpulan model ini dibahagikan kepada dua jenis: pembenaman teks-3-kecil yang lebih kecil dan pembenaman teks-3-besar yang lebih berkuasa dan lebih besar. Sedikit maklumat didedahkan tentang cara model ini direka bentuk dan dilatih, dan model hanya boleh diakses melalui API berbayar. Jadi terdapat banyak model pembenaman sumber terbuka Tetapi bagaimana model sumber terbuka ini dibandingkan dengan model sumber tertutup OpenAI? Artikel ini akan membandingkan secara empirik prestasi model baharu ini dengan model sumber terbuka. Kami merancang untuk membuat data

Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Jul 19, 2024 am 01:29 AM

Jika jawapan yang diberikan oleh model AI tidak dapat difahami sama sekali, adakah anda berani menggunakannya? Memandangkan sistem pembelajaran mesin digunakan dalam bidang yang lebih penting, menjadi semakin penting untuk menunjukkan sebab kita boleh mempercayai output mereka, dan bila tidak mempercayainya. Satu cara yang mungkin untuk mendapatkan kepercayaan dalam output sistem yang kompleks adalah dengan menghendaki sistem menghasilkan tafsiran outputnya yang boleh dibaca oleh manusia atau sistem lain yang dipercayai, iaitu, difahami sepenuhnya sehingga apa-apa ralat yang mungkin boleh dilakukan. dijumpai. Contohnya, untuk membina kepercayaan dalam sistem kehakiman, kami memerlukan mahkamah memberikan pendapat bertulis yang jelas dan boleh dibaca yang menjelaskan dan menyokong keputusan mereka. Untuk model bahasa yang besar, kita juga boleh menggunakan pendekatan yang sama. Walau bagaimanapun, apabila mengambil pendekatan ini, pastikan model bahasa menjana

Editor Zed berasaskan Rust telah menjadi sumber terbuka, dengan sokongan terbina dalam untuk OpenAI dan GitHub Copilot Editor Zed berasaskan Rust telah menjadi sumber terbuka, dengan sokongan terbina dalam untuk OpenAI dan GitHub Copilot Feb 01, 2024 pm 02:51 PM

Pengarang丨Disusun oleh TimAnderson丨Dihasilkan oleh Noah|51CTO Technology Stack (WeChat ID: blog51cto) Projek editor Zed masih dalam peringkat pra-keluaran dan telah menjadi sumber terbuka di bawah lesen AGPL, GPL dan Apache. Editor menampilkan prestasi tinggi dan berbilang pilihan dibantu AI, tetapi pada masa ini hanya tersedia pada platform Mac. Nathan Sobo menjelaskan dalam catatan bahawa dalam asas kod projek Zed di GitHub, bahagian editor dilesenkan di bawah GPL, komponen bahagian pelayan dilesenkan di bawah AGPL dan bahagian GPUI (GPU Accelerated User) The interface) mengguna pakai Lesen Apache2.0. GPUI ialah produk yang dibangunkan oleh pasukan Zed

Jangan tunggu OpenAI, tunggu Open-Sora menjadi sumber terbuka sepenuhnya Jangan tunggu OpenAI, tunggu Open-Sora menjadi sumber terbuka sepenuhnya Mar 18, 2024 pm 08:40 PM

Tidak lama dahulu, OpenAISora dengan cepat menjadi popular dengan kesan penjanaan video yang menakjubkan Ia menonjol di kalangan ramai model video sastera dan menjadi tumpuan perhatian global. Berikutan pelancaran proses pembiakan inferens latihan Sora dengan pengurangan kos sebanyak 46% 2 minggu lalu, pasukan Colossal-AI telah menggunakan sumber terbuka sepenuhnya model penjanaan video seni bina mirip Sora pertama di dunia "Open-Sora1.0", meliputi keseluruhan proses latihan, termasuk pemprosesan data, semua butiran latihan dan berat model, dan berganding bahu dengan peminat AI global untuk mempromosikan era baharu penciptaan video. Untuk melihat sekilas, mari lihat video bandar yang sibuk yang dihasilkan oleh model "Open-Sora1.0" yang dikeluarkan oleh pasukan Colossal-AI. Buka-Sora1.0

Microsoft, OpenAI merancang untuk melabur $100 juta dalam robot humanoid! Netizen memanggil Musk Microsoft, OpenAI merancang untuk melabur $100 juta dalam robot humanoid! Netizen memanggil Musk Feb 01, 2024 am 11:18 AM

Microsoft dan OpenAI didedahkan akan melabur sejumlah besar wang ke dalam permulaan robot humanoid pada awal tahun ini. Antaranya, Microsoft merancang untuk melabur AS$95 juta, dan OpenAI akan melabur AS$5 juta. Menurut Bloomberg, syarikat itu dijangka mengumpul sejumlah AS$500 juta dalam pusingan ini, dan penilaian pra-wangnya mungkin mencecah AS$1.9 bilion. Apa yang menarik mereka? Mari kita lihat pencapaian robotik syarikat ini terlebih dahulu. Robot ini semuanya berwarna perak dan hitam, dan penampilannya menyerupai imej robot dalam filem fiksyen sains Hollywood: Sekarang, dia meletakkan kapsul kopi ke dalam mesin kopi: Jika ia tidak diletakkan dengan betul, ia akan menyesuaikan dirinya tanpa sebarang kawalan jauh manusia: Walau bagaimanapun, Selepas beberapa ketika, secawan kopi boleh dibawa pergi dan dinikmati: Adakah anda mempunyai ahli keluarga yang mengenalinya Ya, robot ini telah dicipta suatu masa dahulu?

Prestasi larian tempatan perkhidmatan Embedding melebihi OpenAI Text-Embedding-Ada-002, yang sangat mudah! Prestasi larian tempatan perkhidmatan Embedding melebihi OpenAI Text-Embedding-Ada-002, yang sangat mudah! Apr 15, 2024 am 09:01 AM

Ollama ialah alat super praktikal yang membolehkan anda menjalankan model sumber terbuka dengan mudah seperti Llama2, Mistral dan Gemma secara tempatan. Dalam artikel ini, saya akan memperkenalkan cara menggunakan Ollama untuk mengvektorkan teks. Jika anda belum memasang Ollama secara tempatan, anda boleh membaca artikel ini. Dalam artikel ini kita akan menggunakan model nomic-embed-text[2]. Ia ialah pengekod teks yang mengatasi prestasi OpenAI text-embedding-ada-002 dan text-embedding-3-small pada konteks pendek dan tugas konteks panjang. Mulakan perkhidmatan nomic-embed-text apabila anda telah berjaya memasang o

Tiba-tiba! OpenAI memecat sekutu Ilya kerana disyaki kebocoran maklumat Tiba-tiba! OpenAI memecat sekutu Ilya kerana disyaki kebocoran maklumat Apr 15, 2024 am 09:01 AM

Tiba-tiba! OpenAI memecat orang, sebabnya: kebocoran maklumat yang disyaki. Salah satunya ialah Leopold Aschenbrenner, sekutu ketua saintis Ilya yang hilang dan ahli teras pasukan Superalignment. Orang lain juga tidak mudah. ​​Dia ialah Pavel Izmailov, seorang penyelidik dalam pasukan inferens LLM, yang juga bekerja pada pasukan penjajaran super. Tidak jelas maklumat yang dibocorkan oleh kedua-dua lelaki itu. Selepas berita itu didedahkan, ramai netizen menyatakan "agak terkejut": Saya melihat siaran Aschenbrenner tidak lama dahulu dan merasakan bahawa dia semakin meningkat dalam kerjayanya Saya tidak menjangkakan perubahan sedemikian. Sesetengah netizen dalam gambar berfikir: OpenAI kehilangan Aschenbrenner, I

See all articles