


Terence Tao menggunakan pembantu kalis model berskala besar Lean untuk menunjukkan keutamaannya
"Saya meramalkan bahawa, jika digunakan dengan betul, AI akan menjadi pengarang bersama yang dipercayai dalam penyelidikan matematik dan banyak bidang lain menjelang 2026, kata Ahli Matematik Terence Tao dalam blog sebelumnya.
Tao Zhexuan berkata ini dan melakukannya.
Beliau baru-baru ini menjalankan penyelidikan matematik menggunakan alatan seperti GPT-4, Copilot dan Lean, dan juga menemui pepijat tersembunyi dalam kertas kerjanya dengan bantuan AI.
Baru-baru ini, Terence Tao berkata bahawa projek Lean4 telah berjaya menyelesaikan pemformalkan bukti Konjektur Polinomial Freiman-Ruzsa (PFR), yang hanya mengambil masa tiga minggu. Pada masa yang sama, pengkompil Lean juga melaporkan bahawa konjektur itu mematuhi aksiom piawai. Ini merupakan satu kejayaan besar bagi pembuktian komputer dan bantuan AI, dan ia menarik
Untuk maklumat lanjut tentang penyelidikan di atas, pembaca yang berminat boleh merujuk kepada "Apakah bukti rasmi Tao Zhexuan menggunakan AI?" Fahami kehidupan masa lalu dan masa kini tekaan PFR dalam satu artikel.
Melihat perkara ini, pembaca yang teliti mungkin telah menemui petunjuk Master Tao menyebut Lean berkali-kali semasa menjalankan penyelidikan matematik. Ringkasnya, Lean ialah bahasa pengaturcaraan yang membantu ahli matematik mengesahkan teorem, di mana pengguna boleh menulis dan mengesahkan bukti. Berbanding dengan Lean yang asal, versi Lean 4 yang terkini mempunyai banyak pengoptimuman, termasuk pengkompil yang lebih pantas, pengendalian ralat yang lebih baik dan penyepaduan yang lebih baik dengan alatan luaran.
Lean digunakan secara meluas dalam bidang matematik Hari ini, apabila model besar (LLM) popular, adakah cara yang lebih baik untuk menggabungkan kedua-duanya?
Seseorang telah melaksanakannya Pasukan LeanDojo platform terbuka (untuk LeanDojo, sila rujuk "Model besar AI membantu Tao Zhexuan menyelesaikan masalah, bolehkah ia juga membuktikan teorem matematik? ") dan penyelidikan dari California Institute of Technology Penulis melancarkan Lean Copilot, alat kerjasama yang direka untuk LLM dan interaksi manusia, bertujuan untuk memberikan 100% bukti matematik formal yang tepat melalui kerjasama manusia-mesin.
Ia perlu diperhatikan bahawa penyelidikan pasukan Leandojo terutamanya memberi tumpuan kepada menggunakan LLM untuk mengautomasikan teorem mengejutkan. . . Kini dengan kemajuan AI, penyelidik telah mula menggunakan kecerdasan buatan untuk menjalankan penerokaan yang mendalam, tetapi masalah ini tidak dapat dielakkan, iaitu, LLM kadang-kadang tidak begitu boleh dipercayai dalam tugasan matematik dan penaakulan, dan terdedah kepada kesilapan dan halusinasi.
Fungsi Lean Copilot adalah untuk membolehkan pengguna menggunakan model bahasa yang besar untuk mengautomasikan proses pembuktian dalam Lean dan meningkatkan kelajuan sintesis bukti. Pengguna juga boleh campur tangan dan mengubah suai dengan lancar apabila diperlukan, mencapai kerjasama seimbang antara kecerdasan mesin dan kecerdasan manusia
Menggunakan Lean Copilot, LLM boleh digunakan dalam Lean untuk mencapai automasi bukti, termasuk cadangan strategi, premis dan Bukti carian
Pengguna boleh memilih untuk menggunakan model terbina dalam yang disediakan oleh LeanDojo, atau mengimport model mereka sendiri. Model ini boleh dijalankan secara tempatan (dengan atau tanpa GPU), atau dalam awan
Ciri-ciri utama Lean Copilot boleh diringkaskan sebagai:
Untuk menjadikan LLM lebih mudah diakses oleh pengguna Lean, Lean Copilot berharap untuk memulakan gelung maklum balas yang positif: membuktikan bahawa automasi akan membawa kepada data yang lebih baik dan akhirnya meningkatkan prestasi matematik LLM. Demonstrasi kesan kopilot Anda boleh mengkonfigurasi Lean Copilot mengikut tutorial rasmi Selepas konfigurasi selesai, anda boleh memulakan percubaan. Pengarang projek juga menyediakan beberapa contoh rasmi untuk rujukan penyelesaian yang disyorkan. Selepas mengimport LeanCopilot, anda boleh menggunakan suggest_tactics untuk menjana penyelesaian yang disyorkan. Semasa penggunaan, anda juga boleh mengklik pada penyelesaian yang disyorkan dan menggunakannya dalam bukti (rujuk gambar di bawah) Anda boleh menggunakan awalan, seperti simp, untuk mengehadkan strategi yang dihasilkan Cari bukti. Gunakan search_proof untuk menggabungkan dasar yang dijana LLM dengan aesop (projek automasi kotak putih Lean 4) untuk mencari berbilang bukti dasar. Sebaik sahaja anda menemui buktinya, anda boleh klik pada strategi untuk memasukkannya ke dalam editor Kandungan yang ditulis semula: Memilih premis ialah strategi penting. Tujuan strategi ini adalah untuk mendapatkan semula senarai premis yang berpotensi berguna. Pada masa ini, Lean Copilot menggunakan alat dapatkan semula dalam LeanDojo untuk memilih premis daripada petikan tetap Lean dan mathlib4 (iaitu perpustakaan matematik Lean 4) Anda boleh menjalankan LLM. Sama ada pembuktian teorem atau alasan lain, anda boleh menjalankan LLM dalam Lean. Anda boleh menjalankan mana-mana model secara tempatan atau jauh (lihat Membawa Model Anda Sendiri) Beberapa penggunaan lanjutan juga disebut dalam projek. Pembaca yang berminat boleh pergi ke projek asal untuk mengetahui lebih lanjut.
Atas ialah kandungan terperinci Terence Tao menggunakan pembantu kalis model berskala besar Lean untuk menunjukkan keutamaannya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



0. Apakah fungsi artikel ini? Kami mencadangkan DepthFM: model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens. Mari kita baca karya ini bersama-sama ~ 1. Tajuk maklumat kertas: DepthFM: FastMonocularDepthEstimationwithFlowMatching Pengarang: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Apa? Adakah Zootopia dibawa menjadi realiti oleh AI domestik? Didedahkan bersama-sama dengan video itu ialah model penjanaan video domestik berskala besar baharu yang dipanggil "Keling". Sora menggunakan laluan teknikal yang serupa dan menggabungkan beberapa inovasi teknologi yang dibangunkan sendiri untuk menghasilkan video yang bukan sahaja mempunyai pergerakan yang besar dan munasabah, tetapi juga mensimulasikan ciri-ciri dunia fizikal dan mempunyai keupayaan gabungan konsep dan imaginasi yang kuat. Mengikut data, Keling menyokong penjanaan video ultra panjang sehingga 2 minit pada 30fps, dengan resolusi sehingga 1080p dan menyokong berbilang nisbah aspek. Satu lagi perkara penting ialah Keling bukanlah demo atau demonstrasi hasil video yang dikeluarkan oleh makmal, tetapi aplikasi peringkat produk yang dilancarkan oleh Kuaishou, pemain terkemuka dalam bidang video pendek. Selain itu, tumpuan utama adalah untuk menjadi pragmatik, bukan untuk menulis cek kosong, dan pergi ke dalam talian sebaik sahaja ia dikeluarkan Model besar Ke Ling telah pun dikeluarkan di Kuaiying.

Saya menangis hingga mati. Dunia sedang membina model besar. Data di Internet tidak mencukupi. Model latihan kelihatan seperti "The Hunger Games", dan penyelidik AI di seluruh dunia bimbang tentang cara memberi makan data ini kepada pemakan yang rakus. Masalah ini amat ketara dalam tugas berbilang modal. Pada masa mereka mengalami kerugian, pasukan pemula dari Jabatan Universiti Renmin China menggunakan model baharu mereka sendiri untuk menjadi yang pertama di China untuk menjadikan "suapan data yang dijana model itu sendiri" menjadi kenyataan. Selain itu, ia merupakan pendekatan serampang dua mata dari segi pemahaman dan sisi penjanaan Kedua-dua pihak boleh menjana data baharu berbilang modal yang berkualiti tinggi dan memberikan maklum balas data kepada model itu sendiri. Apakah model? Awaker 1.0, model berbilang modal besar yang baru sahaja muncul di Forum Zhongguancun. Siapa pasukan itu? Enjin Sophon. Diasaskan oleh Gao Yizhao, pelajar kedoktoran di Sekolah Kecerdasan Buatan Hillhouse Universiti Renmin.

Baru-baru ini, bulatan tentera telah terharu dengan berita: jet pejuang tentera AS kini boleh melengkapkan pertempuran udara automatik sepenuhnya menggunakan AI. Ya, baru-baru ini, jet pejuang AI tentera AS telah didedahkan buat pertama kali, mendedahkan misterinya. Nama penuh pesawat pejuang ini ialah Variable Stability Simulator Test Aircraft (VISTA). Ia diterbangkan sendiri oleh Setiausaha Tentera Udara AS untuk mensimulasikan pertempuran udara satu lawan satu. Pada 2 Mei, Setiausaha Tentera Udara A.S. Frank Kendall berlepas menggunakan X-62AVISTA di Pangkalan Tentera Udara Edwards Ambil perhatian bahawa semasa penerbangan selama satu jam, semua tindakan penerbangan telah diselesaikan secara autonomi oleh AI! Kendall berkata - "Sejak beberapa dekad yang lalu, kami telah memikirkan tentang potensi tanpa had pertempuran udara-ke-udara autonomi, tetapi ia sentiasa kelihatan di luar jangkauan." Namun kini,
