Google AI memenangi pingat perak IMO Mathematical Olympiad, model penaakulan matematik AlphaProof telah dilancarkan dan pembelajaran pengukuhan kembali-AI-php.cn

Untuk AI, Olimpik Matematik tidak lagi menjadi masalah.

Pada hari Khamis, kecerdasan buatan Google DeepMind telah menyelesaikan satu kejayaan: menggunakan AI untuk menyelesaikan soalan sebenar IMO Olimpik Matematik Antarabangsa tahun ini, dan ia hanya selangkah lagi untuk memenangi pingat emas.

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

Pertandingan IMO yang baru sahaja berakhir minggu lepas mempunyai enam soalan yang melibatkan algebra, kombinatorik, geometri dan teori nombor. Sistem AI hibrid yang dicadangkan Google mendapat empat soalan dengan betul dan mendapat 28 mata, mencapai tahap pingat perak.

Pada awal bulan ini, profesor UCLA, Terence Tao baru sahaja mempromosikan AI Math Olympiad (Anugerah Kemajuan AIMO) dengan hadiah jutaan dolar Secara tidak dijangka, tahap penyelesaian masalah AI telah meningkat ke tahap ini sebelum Julai.

Selesaikan soalan serentak pada IMO dan dapatkan soalan paling sukar dengan betul

IMO ialah pertandingan tertua, terbesar dan paling berprestij untuk ahli matematik muda, yang diadakan setiap tahun sejak 1959. Baru-baru ini, pertandingan IMO juga telah diiktiraf secara meluas sebagai cabaran besar dalam bidang pembelajaran mesin, menjadi penanda aras yang ideal untuk mengukur keupayaan penaakulan matematik lanjutan sistem kecerdasan buatan.

Pada pertandingan IMO tahun ini, AlphaProof dan AlphaGeometry 2 yang dibangunkan oleh pasukan DeepMind secara bersama-sama mencapai kejayaan penting.

Antaranya, AlphaProof ialah sistem pembelajaran pengukuhan untuk penaakulan matematik formal, manakala AlphaGeometry 2 ialah versi sistem penyelesaian geometri DeepMind AlphaGeometry yang lebih baik.

Kejayaan ini menunjukkan potensi kecerdasan am buatan (AGI) dengan keupayaan penaakulan matematik lanjutan untuk membuka bidang sains dan teknologi baharu.

Jadi, bagaimana sistem AI DeepMind mengambil bahagian dalam pertandingan IMO?

Ringkasnya, pertama masalah matematik ini diterjemahkan secara manual ke dalam bahasa matematik formal supaya sistem AI boleh memahaminya. Dalam pertandingan rasmi, peserta manusia menyerahkan jawapan mereka dalam dua sesi (dua hari), dengan had masa 4.5 jam setiap sesi. Sistem AI AlphaProof+AlphaGeometry 2 gabungan menyelesaikan satu masalah dalam beberapa minit, tetapi mengambil masa tiga hari untuk menyelesaikan yang lain. Walaupun jika anda mematuhi peraturan dengan ketat, sistem DeepMind telah tamat masa. Sesetengah orang membuat spekulasi bahawa ini mungkin melibatkan banyak keretakan kekerasan.

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

Google berkata AlphaProof menyelesaikan dua masalah algebra dan satu masalah teori nombor dengan menentukan jawapan dan membuktikan ketepatannya. Ini termasuk masalah paling sukar dalam pertandingan itu, yang hanya diselesaikan oleh lima peserta pada IMO tahun ini. Dan AlphaGeometry 2 membuktikan masalah geometri.

Penyelesaian yang diberikan oleh AI: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/index.html

Pemenang pingat emas IMO dan pemenang Pingat Fields Timothy Gowers dan Dr. Joseph Myers, pemenang pingat emas IMO dua kali dan pengerusi Jawatankuasa Pemilihan Masalah IMO 2024, menjaringkan penyelesaian yang diberikan oleh sistem gabungan mengikut peraturan pemarkahan IMO.

Setiap enam soalan bernilai 7 mata, untuk jumlah markah maksimum 42 mata. Sistem DeepMind menerima skor akhir 28, bermakna keempat-empat masalah yang diselesaikannya menerima skor sempurna - bersamaan dengan markah tertinggi dalam kategori pingat perak. Ambang pingat emas tahun ini ialah 29 mata, dan 58 daripada 609 pesaing dalam pertandingan rasmi membawa pulang pingat emas.

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

Graf ini menunjukkan prestasi sistem kecerdasan buatan Google DeepMind berbanding pesaing manusia di IMO 2024. Sistem itu memperoleh 28 mata daripada 42, meletakkannya setanding dengan pemenang pingat perak pertandingan itu. Tambahan pula, 29 mata sudah memadai untuk mendapat pingat emas tahun ini.

AlphaProof: kaedah penaakulan formal

Dalam sistem AI hibrid yang digunakan oleh Google, AlphaProof ialah sistem terlatih sendiri yang menggunakan bahasa formal Lean untuk membuktikan pernyataan matematik. Ia menggabungkan model bahasa yang telah dilatih dengan algoritma pembelajaran pengukuhan AlphaZero.

Antaranya, bahasa formal memberikan kelebihan penting untuk mengesahkan secara rasmi ketepatan pembuktian penaakulan matematik. Sehingga kini, penggunaan ini terhad dalam pembelajaran mesin kerana jumlah data tulisan manusia adalah sangat terhad.

Sebaliknya, walaupun kaedah berasaskan bahasa semula jadi mempunyai akses kepada jumlah data yang lebih besar, kaedah tersebut menghasilkan langkah penaakulan pertengahan dan penyelesaian yang kelihatan munasabah tetapi tidak betul.

Google DeepMind membina jambatan antara dua medan pelengkap ini dengan memperhalusi model Gemini untuk menterjemah secara automatik penyataan masalah bahasa semula jadi kepada penyataan rasmi, dengan itu mewujudkan perpustakaan besar masalah formal dengan pelbagai kesukaran.

Memandangkan masalah matematik, AlphaProof akan menjana penyelesaian calon dan kemudian membuktikannya dengan mencari langkah pembuktian yang mungkin dalam Lean. Setiap penyelesaian bukti yang ditemui dan disahkan digunakan untuk mengukuhkan model bahasa AlphaProof dan meningkatkan keupayaannya untuk menyelesaikan masalah yang lebih mencabar seterusnya.

Untuk melatih AlphaProof, Google DeepMind telah membuktikan atau menafikan berjuta-juta masalah matematik yang merangkumi pelbagai kesukaran dan topik dalam minggu-minggu menjelang pertandingan IMO. Gelung latihan juga digunakan semasa pertandingan untuk mengukuhkan bukti varian masalah persaingan yang dijana sendiri sehingga penyelesaian lengkap ditemui.

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back Infografik proses latihan pembelajaran pengukuhan AlphaProof: Kira-kira satu juta masalah matematik tidak formal diterjemahkan ke dalam bahasa matematik formal oleh rangkaian formal. Penyelesai kemudian mencari rangkaian untuk bukti atau penolakan masalah, secara beransur-ansur melatih dirinya sendiri untuk menyelesaikan masalah yang lebih mencabar melalui algoritma AlphaZero.

AlphaGeometry 2 yang lebih kompetitif

AlphaGeometry 2 ialah versi AI matematik AlphaGeometry yang dipertingkatkan dengan ketara yang dipaparkan dalam majalah Nature tahun ini. Ia adalah sistem hibrid neuro-simbolik di mana model bahasa adalah berdasarkan Gemini dan dilatih dari awal pada urutan magnitud lebih banyak data sintetik daripada pendahulunya. Ini membantu model menyelesaikan masalah geometri yang lebih mencabar, termasuk masalah pergerakan objek dan persamaan sudut, perkadaran atau jarak.

AlphaGeometry 2 menggunakan enjin simbolik yang dua urutan magnitud lebih pantas daripada generasi sebelumnya. Apabila masalah baharu dihadapi, mekanisme perkongsian pengetahuan baharu membolehkan gabungan lanjutan pepohon carian berbeza untuk menyelesaikan masalah yang lebih kompleks.

Sebelum pertandingan tahun ini, AlphaGeometry 2 boleh menyelesaikan 83% daripada semua masalah geometri IMO sejarah sejak 25 tahun lalu, berbanding kadar penyelesaian 53% pendahulunya. Dalam IMO 2024, AlphaGeometry 2 menyelesaikan Masalah 4 dalam masa 19 saat selepas menerima pemformalannya.

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

Contoh soalan 4, meminta untuk membuktikan bahawa jumlah ∠KIL dan ∠XPY adalah sama dengan 180°. AlphaGeometry 2 bercadang untuk membina titik E pada garis BI supaya ∠AEB = 90°. Titik E membantu memberi makna kepada titik tengah L segmen garis AB dengan itu mewujudkan banyak pasangan segi tiga yang serupa seperti ABE ~ YBI dan ALE ~ IPC untuk membuktikan kesimpulannya.

Google DeepMind juga melaporkan bahawa sebagai sebahagian daripada kerja IMO, penyelidik juga sedang bereksperimen dengan sistem penaakulan bahasa semula jadi baharu berdasarkan Gemini dan sistem penaakulan bahasa semula jadi yang canggih, dengan harapan dapat mencapai penyelesaian masalah yang lebih maju. kemampuan. Sistem ini tidak memerlukan terjemahan soalan ke dalam bahasa formal dan boleh digabungkan dengan sistem AI yang lain. Dalam ujian soalan pertandingan IMO tahun ini, ia "menunjukkan potensi besar."

Google terus meneroka kaedah AI untuk memajukan penaakulan matematik dan merancang untuk mengeluarkan lebih banyak butiran teknikal tentang AlphaProof tidak lama lagi.

Kami teruja dengan masa depan di mana ahli matematik akan menggunakan alatan AI untuk meneroka hipotesis, mencuba cara baharu yang berani untuk menyelesaikan masalah yang telah lama wujud, dan dengan cepat menyelesaikan elemen bukti yang memakan masa—dan sistem AI seperti Gemini akan merevolusikan matematik dan penaakulan yang lebih luas aspek menjadi lebih berkuasa.

Pasukan penyelidik

Google berkata bahawa penyelidikan baharu itu disokong oleh International Mathematical Olympiad Organization Selain itu:

Pembangunan AlphaProof diketuai oleh Thomas Hubert, Rishi Mehta dan Laurent Sartran, termasuk Hussain Masoom; Aja Huang, Miklós Z. Horváth, Tom Zahavy, Vivek Veeriah, Eric Wieser, Jessica Yung, Lei Yu, Yannick Schroecker, Julian Schrittwieser, Ottavia Bertolli, Borja Ibarz, Edward Lockhart, Edward Hughes, Mark Rowland dan Grace Margand.

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

Antaranya, Aja Huang, Julian Schrittwieser, Yannick Schroecker dan ahli lain juga merupakan ahli teras kertas AlphaGo 8 tahun lalu (2016). Lapan tahun lalu, AlphaGo mereka, berdasarkan pembelajaran pengukuhan, menjadi terkenal. Lapan tahun kemudian, pembelajaran pengukuhan kembali bersinar dengan AlphaProof. Seseorang mengeluh dalam kalangan rakan-rakan: RL sangat kembali!

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

AlphaGeometry 2 dan kerja inferens bahasa semula jadi diketuai oleh Thang Luong. Pembangunan AlphaGeometry 2 diketuai oleh Trieu Trinh dan Yuri Chervonyi, dengan sumbangan penting daripada Mirek Olšák, Xiaomeng Yang, Hoang Nguyen, Junehyuk Jung, Dawsen Hwang dan Marcelo Menegali.

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

Selain itu, David Silver, Quoc Le, Hassabis dan Pushmeet Kohli bertanggungjawab untuk menyelaras dan mengurus keseluruhan projek.

Kandungan rujukan:

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

Atas ialah kandungan terperinci Google AI memenangi pingat perak IMO Mathematical Olympiad, model penaakulan matematik AlphaProof telah dilancarkan dan pembelajaran pengukuhan kembali. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!