Google DeepMind mengeluarkan Nature sekali lagi, AI siri Alpha kembali, dan tahap matematik bertambah baik dengan pesat.
AlphaGeometry, tidak perlu demonstrasi manusia untuk mencapai tahap geometri pemain pingat emas IMO.
Rasanya AlphaZero belajar permainan "Menguasai permainan Go tanpa pengetahuan manusia" ketika itu.
AlphaGeometry mendapat 25 daripada 30 teorem geometri kesukaran IMO yang membuktikan soalan betul, manakala purata pemain pingat emas manusia mendapat 25.9 betul. Di samping itu, kaedah SOTA sebelumnya (kaedah Wu Wenjun pada tahun 1978) hanya boleh mendapat 10 betul.
IMO pemenang pingat emas Evan Chen(Evan Chen) bertanggungjawab untuk menilai jawapan yang dijana oleh AI Dia mengulas:
Keluaran AlphaGeometry sangat mengagumkan, boleh dipercayai dan bersih. Penyelesaian AI yang lalu telah gagal, menghasilkan output yang kadangkala memerlukan semakan manual.
Penyelesaian AlphaGeometry mempunyai struktur yang boleh disahkan yang boleh disahkan oleh kedua-dua mesin dan difahami oleh manusia. Ia menggunakan peraturan geometri klasik seperti sudut dan segi tiga yang serupa seperti pelajar.
Sebagai tambahan kepada keputusan yang cemerlang, terdapat tiga perkara utama dalam kajian ini yang telah menarik perhatian industri:
Pasukan percaya bahawa AlphaGeometry menyediakan rangka kerja yang berpotensi untuk mencapai keupayaan penaakulan lanjutan dan menemui pengetahuan baharu.
Ini boleh membantu memajukan pembuktian teorem dalam kecerdasan buatan - dilihat sebagai langkah penting dalam membina AGI.
Selain itu, semasa proses komunikasi dengan pasukan pengarang, Qubits bertanyakan sama ada AlphaGeometry benar-benar dibenarkan menyertai pertandingan IMO, sama seperti AlphaGo mencabar juara Go manusia.
Mereka berkata mereka bekerja keras untuk meningkatkan keupayaan sistem dan juga perlu membolehkan AI menyelesaikan masalah matematik yang lebih luas melangkaui geometri.
Sebelum ini, sistem AI tidak dapat menyelesaikan masalah geometri dengan baik, dan ia tersekat kerana kekurangan data latihan berkualiti tinggi.
Manusia yang belajar geometri boleh menggunakan pengetahuan sedia ada pada imej untuk menemui sifat dan hubungan geometri yang baharu dan lebih kompleks dengan bantuan kertas dan pen.
Untuk tujuan ini, pasukan Google menghasilkan 1 bilion graf objek geometri rawak, serta semua hubungan antara titik dan garisnya, dan akhirnya menapis 100 juta teorem unik dan bukti kesukaran yang berbeza telah dilatih sepenuhnya dari awal data ini.
Sistem ini terdiri daripada dua modul yang berfungsi bersama untuk mencari bukti geometri yang kompleks.
Pengarang pertama Trieu Trinh memperkenalkan bahawa proses operasi AlphaGeometry adalah serupa dengan bagaimana otak manusia dibahagikan kepada dua jenis: cepat dan perlahan.
Inilah konsep "Sistem 1, Sistem 2" yang dipopularkan dalam buku terlaris pemenang Hadiah Nobel Daniel Kahneman "Berfikir Cepat dan Lambat".
Sistem 1 menyediakan idea yang pantas dan intuitif, manakala Sistem 2 menyediakan keputusan yang lebih bernas dan rasional.
Di satu pihak, model bahasa pandai mengenal pasti corak dan perhubungan dalam data dan boleh meramalkan struktur bantu yang berpotensi berguna dengan cepat, tetapi selalunya tidak mempunyai keupayaan untuk menaakul atau menjelaskan keputusan mereka dengan teliti.
Sebaliknya, enjin penaakulan simbolik adalah berdasarkan logik formal dan menggunakan peraturan eksplisit untuk membuat kesimpulan. Mereka rasional dan boleh dijelaskan, tetapi mereka lambat dan tidak fleksibel, terutamanya apabila menangani masalah yang besar dan kompleks sahaja.
Sebagai contoh, apabila menyelesaikan soalan pertandingan IMO 2015, bahagian biru ialah struktur tambahan yang ditambahkan oleh model bahasa AlphaGeometry, dan bahagian hijau ialah versi diperkemas bagi bukti akhir, dengan jumlah 109 langkah.
Semasa proses menyelesaikan masalah, AlphaGeometry juga menemui prasyarat yang tidak digunakan dalam masalah persaingan IMO 2004, dan dengan itu menemui versi teorem yang lebih luas.
Boleh dibuktikan bahawa P, B, dan C adalah kolinear tanpa syarat O ialah titik tengah BC.
Selain itu, kajian juga mendapati bagi ketiga-tiga masalah dengan markah manusia yang paling rendah, AlphaGeometry juga memerlukan proses pembuktian yang sangat panjang dan penambahan banyak struktur tambahan untuk diselesaikan.
Tetapi pada soalan yang agak mudah, tiada korelasi yang signifikan antara purata skor manusia dan panjang bukti yang dijana oleh AI (p = −0.06).
Berkenaan kaitan dan perbezaan antara AlphaGeometry dan AlphaGo, semasa proses komunikasi dengan pasukan, saintis Google Quoc Le diperkenalkan:
keputusan yang sangat kompleks membuat Carian ruang, tetapi kaedah AlphaGo adalah lebih tradisional (Nota: Rangkaian saraf bertanggungjawab untuk pengecaman corak) Rangkaian saraf dalam AlphaGeometry bertanggungjawab untuk mencadangkan tindakan seterusnya yang perlu diambil dan membimbing algoritma carian untuk bergerak ke arah yang betul. dalam ruang keputusan.
Walaupun keputusan ini dinamakan sempena siri Alpha, dan unit pertama juga adalah Google DeepMind, penulis sebenarnya adalah bekas ahli Google Brain.
Master Quoc Le tidak memerlukan pengenalan Pengarang pertama Trieu Trinh dan pengarang yang sepadan, Thang Luong, telah bekerja di Google selama enam atau tujuh tahun, Thang Luong sendiri juga merupakan pemain IMO di sekolah menengah.
Antara dua pengarang Cina, He He ialah penolong profesor di Universiti New York. Wu Yuhuai sebelum ini mengambil bahagian dalam penyelidikan model matematik besar Google Minerva, dan kini telah meninggalkan Google untuk menyertai pasukan Musk dan menjadi salah seorang pengasas bersama xAI.
Alamat kertas: https://www.nature.com/articles/s41586-023-06747-5.
Pautan rujukan:
[1]https://www.nature.com/articles/d4186-024-00141-5.
[2]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry.
Atas ialah kandungan terperinci Google Mathematical AI menerbitkan artikel dalam Nature: Proving beyond Wu Wenjun's 1978 theorem, menunjukkan tahap geometri bertaraf dunia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!