Anugerah VLDB 2023 diumumkan, kertas kerja bersama dari Universiti Tsinghua, 4Paradigm, dan NUS memenangi Anugerah Kertas Perindustrian Terbaik-AI-php.cn

Rumah

Anugerah VLDB 2023 diumumkan, kertas kerja bersama dari Universiti Tsinghua, 4Paradigm, dan NUS memenangi Anugerah Kertas Perindustrian Terbaik

王林

Sep 14, 2023 am 10:01 AM

projek

Persidangan Antarabangsa VLDB 2023 telah berjaya diadakan di Vancouver, Kanada. Persidangan VLDB adalah salah satu daripada tiga persidangan teratas dengan sejarah panjang dalam bidang pangkalan data Nama penuhnya ialah Persidangan Pangkalan Data Berskala Besar. Setiap persidangan memfokuskan pada memaparkan hala tuju terkini penyelidikan pangkalan data, teknologi terkini dalam industri, dan peringkat R&D pelbagai negara, menarik penyertaan daripada institusi penyelidikan terkemuka dunia

VLDB 2023奖项公布，清华、第四范式、NUS联合论文获最佳工业界论文奖

Persidangan itu memfokuskan pada inovasi sistem, kesempurnaan, dan reka bentuk eksperimen Terdapat keperluan yang sangat tinggi dalam aspek lain. Kadar penerimaan kertas VLDB secara amnya rendah, kira-kira 18%. Persaingan lebih sengit tahun ini. Menurut data rasmi, sebanyak 9 kertas kerja VLDB memenangi anugerah kertas terbaik tahun ini, termasuk daripada Universiti Stanford, Universiti Carnegie Mellon, Penyelidikan Microsoft, Penyelidikan VMware, Meta dan universiti terkenal dunia, institusi penyelidikan dan gergasi teknologi Among mereka, kertas kerja "FEBench: Penanda Aras untuk Pengekstrakan Ciri Data Hubungan Masa Nyata" yang disiapkan bersama oleh 4Paradigm, Universiti Tsinghua dan Universiti Nasional Singapura memenangi anugerah Naib Johan untuk kertas industri terbaik.

VLDB 2023奖项公布，清华、第四范式、NUS联合论文获最佳工业界论文奖 Kertas kerja ini adalah kerjasama antara 4Paradigm, Universiti Tsinghua dan Universiti Nasional Singapura. Kertas kerja mencadangkan penanda aras ujian pengiraan ciri masa nyata berdasarkan pengumpulan senario sebenar dalam industri, yang digunakan untuk menilai sistem membuat keputusan masa nyata berdasarkan pembelajaran mesin Sila klik pautan berikut untuk melihat kertas: https ://github.com/decis -bench/febench/blob/main/report/febench.pdf

Alamat projek: https://github.com/decis-bench/febench Kandungan yang perlu ditulis semula ialah: Alamat projek ialah https://github.com/decis-bench/febench VLDB 2023奖项公布，清华、第四范式、NUS联合论文获最佳工业界论文奖

Latar belakang projek
Sistem membuat keputusan berdasarkan kecerdasan buatan digunakan secara meluas dalam banyak industri senario. Antaranya, banyak senario melibatkan pengiraan berdasarkan data masa nyata, seperti anti-penipuan dalam industri kewangan dan cadangan dalam talian masa nyata dalam industri runcit. Sistem membuat keputusan masa nyata yang didorong oleh pembelajaran mesin biasanya termasuk dua pautan pengkomputeran utama: ciri dan model. Disebabkan oleh kepelbagaian logik perniagaan dan keperluan untuk kependaman rendah dan konkurensi tinggi dalam talian, pengiraan ciri sering menjadi hambatan bagi keseluruhan sistem membuat keputusan. Oleh itu, banyak amalan kejuruteraan diperlukan untuk membina platform pengiraan ciri masa nyata yang tersedia, stabil dan cekap. Rajah 1 di bawah menunjukkan senario pengiraan ciri masa nyata biasa untuk aplikasi anti-penipuan. Dengan melakukan pengiraan ciri berdasarkan jadual rekod transaksi kad kredit asal, ciri baharu (seperti amaun kad kredit maksimum/minimum/purata dalam 10 saat terakhir, dsb.) dijana, dan kemudian dimasukkan ke dalam model hiliran untuk sebenar- inferens masa

Kandungan ditulis semula: Rajah 1. Aplikasi pengiraan ciri masa nyata dalam aplikasi anti-penipuan

Secara umumnya, platform pengiraan ciri masa nyata perlu memenuhi dua keperluan asas berikut:

VLDB 2023奖项公布，清华、第四范式、NUS联合论文获最佳工业界论文奖 Konsistensi dalam talian dan luar talian: kerana aplikasi Pembelajaran mesin secara amnya dibahagikan kepada dua proses: latihan berdasarkan data sejarah dan penaakulan berdasarkan data masa nyata. Oleh itu, memastikan ketekalan logik pengiraan ciri dalam talian dan luar talian adalah penting untuk memastikan keputusan akhir perniagaan dalam talian dan luar talian yang konsisten.

Kecekapan perkhidmatan dalam talian: Perkhidmatan dalam talian disasarkan kepada data dan pengiraan masa nyata, memenuhi keperluan kependaman rendah, konkurensi tinggi dan ketersediaan tinggi.

Seperti yang ditunjukkan dalam Rajah 2 di atas, seni bina platform pengiraan ciri masa nyata biasa disenaraikan. Ringkasnya, ia terutamanya termasuk enjin pengkomputeran luar talian dan enjin pengkomputeran dalam talian Perkara utama ialah memastikan konsistensi logik pengkomputeran antara enjin pengkomputeran luar talian dan dalam talian. Pada masa ini, terdapat banyak platform ciri di pasaran yang boleh memenuhi keperluan di atas dan membentuk platform pengkomputeran ciri masa nyata yang lengkap, termasuk sistem tujuan umum seperti Flink, atau sistem khusus seperti OpenMLDB, Tecton, Feast, dll. Walau bagaimanapun, industri pada masa ini tidak mempunyai penanda aras khusus yang berorientasikan ciri masa nyata untuk menjalankan penilaian yang rapi dan saintifik terhadap prestasi sistem tersebut. Sebagai tindak balas kepada permintaan ini, pengarang kertas kerja ini membina FEBench, ujian penanda aras pengkomputeran ciri masa nyata, untuk menilai prestasi platform pengkomputeran ciri dan menganalisis kependaman keseluruhan, kependaman ekor panjang dan prestasi serentak sistem.

Prinsip Teknikal VLDB 2023奖项公布，清华、第四范式、NUS联合论文获最佳工业界论文奖

Pembinaan penanda aras FEBench terutamanya merangkumi tiga aspek kerja: pengumpulan set data, kandungan yang dijana pertanyaan perlu ditulis semula dan apabila kandungan itu ditulis semula, templat yang sesuai perlu dipilih

Pengumpulan Set Data

Pasukan penyelidik telah mengumpulkan sejumlah 118 set data yang boleh digunakan dalam senario pengiraan ciri masa nyata ini datang daripada tapak web data awam seperti Kaggle, Tianchi, UCI ML, KiltHub dan. data awam dalaman dalam Paradigma Keempat , meliputi senario penggunaan biasa dalam dunia perindustrian, seperti kewangan, runcit, perubatan, pembuatan, pengangkutan dan senario industri lain. Pasukan penyelidik selanjutnya mengelaskan set data yang dikumpul mengikut bilangan jadual dan saiz set data, seperti yang ditunjukkan dalam Rajah 3 di bawah.

Kandungan yang ditulis semula: Carta bilangan jadual dan saiz set data dalam FEBench adalah seperti berikut:

Kandungan yang dijana oleh pertanyaan perlu ditulis semula
kepada yang besar bilangan set data, untuk setiap data Beban kerja logik pengiraan pengekstrakan ciri yang dijana secara manual adalah sangat besar, jadi penyelidik menggunakan teknologi pembelajaran mesin automatik seperti AutoCross (kertas rujukan: AutoCross: Automatic Feature Crossing for Tabular Data in Real-World Applications) untuk menyediakan data yang dikumpul dengan Set menjana pertanyaan secara automatik. Pemilihan ciri dan kandungan yang dijana pertanyaan FEBench perlu ditulis semula Proses ini merangkumi empat langkah berikut (seperti yang ditunjukkan dalam Rajah 4 di bawah):

Dengan mengenal pasti jadual utama (menyimpan data penstriman) dan jadual tambahan (seperti statik. / Lampiran/jadual syot kilat) boleh dimulakan. Selepas itu, lajur dengan nama yang serupa atau hubungan utama dalam jadual primer dan sekunder dianalisis, dan hubungan satu-dengan-satu/satu-ke-banyak antara lajur dikira, yang sepadan dengan mod operasi ciri yang berbeza.

Peta hubungan lajur dengan pengendali ciri.

Selepas mengekstrak semua ciri calon, gunakan algoritma carian Beam untuk menjana set ciri yang berkesan secara berulang.

Ciri yang dipilih ditukar kepada pertanyaan SQL semantik yang setara. . pilih pertanyaan wakil sebagai templat pertanyaan untuk mengurangkan ujian berulang tugasan yang serupa. Untuk 118 set data dan pertanyaan ciri yang dikumpul, gunakan algoritma DBSCAN untuk mengumpulkan pertanyaan ini. Langkah-langkah khusus adalah seperti berikut:

Bahagikan ciri setiap pertanyaan kepada lima bahagian: bilangan lajur output, jumlah bilangan. pengendali pertanyaan , kekerapan kejadian pengendali kompleks, bilangan peringkat subkueri bersarang dan bilangan tupel maksimum dalam tetingkap masa. Memandangkan pertanyaan kejuruteraan ciri biasanya melibatkan tetingkap masa dan kerumitan pertanyaan tidak dipengaruhi oleh saiz data kelompok, saiz set data tidak disertakan sebagai salah satu ciri pengelompokan.

Gunakan model regresi logistik untuk menilai hubungan antara ciri pertanyaan dan ciri pelaksanaan pertanyaan, menggunakan ciri sebagai input model dan masa pelaksanaan pertanyaan ciri sebagai output model. Kepentingan ciri yang berbeza pada hasil pengelompokan dipertimbangkan dengan menggunakan berat regresi setiap ciri sebagai berat pengelompokan

Berdasarkan ciri pertanyaan berwajaran, algoritma DBSCAN digunakan untuk membahagikan pertanyaan ciri kepada berbilang kelompok.

Carta berikut menunjukkan taburan 118 set data di bawah pelbagai penunjuk pertimbangan. Rajah (a) menunjukkan penunjuk sifat statistik, termasuk bilangan lajur keluaran, jumlah bilangan pengendali pertanyaan dan bilangan tahap subkueri bersarang Rajah (b) menunjukkan penunjuk dengan korelasi tertinggi dengan masa pelaksanaan pertanyaan, termasuk bilangan operasi pengagregatan, Bilangan tahap subkueri bersarang dan bilangan tetingkap masa

Rajah 5. 118 pertanyaan ciri memperoleh 6 kluster melalui analisis kluster, dan templat pertanyaan (Q0-5) telah dijana

Akhirnya, mengikut kepada hasil pengelompokan , bahagikan 118 pertanyaan ciri kepada 6 kelompok. Untuk setiap kelompok, pertanyaan berhampiran centroid dipilih sebagai templat calon. Di samping itu, memandangkan aplikasi kecerdasan buatan dalam senario aplikasi yang berbeza mungkin mempunyai keperluan kejuruteraan ciri yang berbeza, cuba pilih pertanyaan daripada senario berbeza di sekeliling pusat setiap kelompok untuk merangkumi senario kejuruteraan ciri yang berbeza dengan lebih baik. Akhirnya, 6 templat pertanyaan telah dipilih daripada 118 pertanyaan ciri, sesuai untuk senario yang berbeza, termasuk pengangkutan, penjagaan kesihatan, tenaga, jualan dan transaksi kewangan. Enam templat pertanyaan ini akhirnya membentuk set data teras dan pertanyaan FEBench, yang digunakan untuk ujian prestasi platform pengiraan ciri masa nyata.

Apa yang perlu ditulis semula ialah: Penilaian penanda aras (OpenMLDB dan Flink)

Dalam kajian itu, penyelidik menggunakan FEBench untuk menguji dua sistem perindustrian biasa, iaitu Flink dan OpenMLDB. Flink ialah platform pengkomputeran yang konsisten pemprosesan kumpulan dan strim, manakala OpenMLDB ialah platform pengkomputeran ciri masa nyata khusus. Melalui ujian dan analisis, para penyelidik menemui kebaikan dan keburukan setiap sistem dan sebab di sebaliknya. Keputusan eksperimen menunjukkan bahawa disebabkan reka bentuk seni bina yang berbeza, terdapat perbezaan dalam prestasi antara Flink dan OpenMLDB. Pada masa yang sama, ini juga menggambarkan kepentingan FEBench dalam menganalisis keupayaan sistem sasaran. Secara ringkasnya, kesimpulan utama kajian adalah seperti berikut

Flink adalah dua urutan magnitud lebih perlahan daripada OpenMLDB dalam kependaman (Rajah 6). Penyelidik menganalisis bahawa sebab utama jurang terletak pada kaedah pelaksanaan yang berbeza bagi kedua-dua seni bina sistem, sebagai sistem khusus untuk pengiraan ciri masa nyata, termasuk jadual langkau dua lapisan berasaskan memori dan struktur data lain yang dioptimumkan untuk masa. Data siri Akhirnya, Berbanding dengan Flink, ia mempunyai kelebihan prestasi yang jelas dalam senario pengiraan ciri. Sudah tentu, sebagai sistem tujuan umum, Flink mempunyai rangkaian senario terpakai yang lebih luas daripada OpenMLDB. . Ambil perhatian bahawa nombor berikut menunjukkan prestasi kependaman yang dinormalkan kepada OpenMLDB dan TP-50 Flink masing-masing, dan tidak mewakili perbandingan prestasi mutlak. Ditulis semula sebagai: OpenMLDB mempunyai masalah yang jelas dengan kependaman ekor, manakala kependaman ekor Flink lebih stabil (lihat Rajah 7). Perlu diingat bahawa nombor berikut menormalkan prestasi kependaman kepada prestasi OpenMLDB dan Flink di bawah TP-50 masing-masing, bukannya perbandingan prestasi mutlak

Rajah 7. Hujung ekor OpenMLDB dan Flink Perbandingan kependaman (dinormalkan kepada kependaman TP-50 masing-masing)

Para penyelidik menjalankan analisis yang lebih mendalam tentang keputusan prestasi di atas:
Analisis teardown berdasarkan masa pelaksanaan, penunjuk mikro-seni bina termasuk penyiapan arahan, ralat ramalan cawangan, belakang kebergantungan -hujung, kebergantungan bahagian hadapan, dsb. Templat pertanyaan yang berbeza mempunyai kesesakan prestasi yang berbeza di peringkat mikrostruktur. Seperti yang ditunjukkan dalam Rajah 8, kesesakan prestasi Q0-Q2 adalah bergantung terutamanya pada bahagian hadapan, menyumbang lebih daripada 45% daripada keseluruhan masa berjalan. Dalam kes ini, operasi yang dilakukan adalah agak mudah, dan kebanyakan masa dihabiskan untuk memproses permintaan pengguna dan bertukar antara arahan pengekstrakan ciri. Untuk Q3-Q5, kebergantungan bahagian belakang (seperti ketidaksahihan cache) dan pelaksanaan arahan (termasuk arahan yang lebih kompleks) menjadi faktor yang lebih penting. OpenMLDB menjadikannya lebih baik dalam prestasi melalui pengoptimuman yang disasarkan

Rajah 8 menunjukkan analisis penunjuk mikroarkitektur OpenMLDB dan Flink

Pahami analisis pelan pelaksanaan Q0 sebagai contoh: perbezaan dalam rancangan pelaksanaan antara Flink dan OpenMLDB. Pengendali pengiraan dalam Flink mengambil masa paling banyak, manakala OpenMLDB mengurangkan kependaman pelaksanaan dengan mengoptimumkan tetingkap dan menggunakan teknik pengoptimuman seperti fungsi agregat tersuai.

Gambar kesembilan menunjukkan perbandingan antara OpenMLDB dan Flink dari segi pelan pelaksanaan (Q0)

Jika pengguna menjangkakan untuk menghasilkan semula keputusan eksperimen di atas, atau menjalankan ujian penanda aras pada sistem tempatan pengarang kertas juga Keputusan ujian digalakkan untuk diserahkan dan dikongsi dalam komuniti), anda boleh melawati laman utama projek FEBench untuk mendapatkan maklumat lanjut.
Projek FEBench: https://github.com/decis-bench/febench

Projek Flink: https://github.com/apache/flink
Projek OpenMLDB: https://github.com/apache/flink .com/4paradigm/OpenMLDB

Atas ialah kandungan terperinci Anugerah VLDB 2023 diumumkan, kertas kerja bersama dari Universiti Tsinghua, 4Paradigm, dan NUS memenangi Anugerah Kertas Perindustrian Terbaik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Penjimatan di R.E.P.O. Dijelaskan (dan simpan fail)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Cara Mencari Orang Panda

4 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7563

Tutorial CakePHP

1385

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari Jul 17, 2024 am 01:56 AM

Ia juga merupakan video Tusheng, tetapi PaintsUndo telah mengambil laluan yang berbeza. Pengarang ControlNet LvminZhang mula hidup semula! Kali ini saya menyasarkan bidang lukisan. Projek baharu PaintsUndo telah menerima 1.4kstar (masih meningkat secara menggila) tidak lama selepas ia dilancarkan. Alamat projek: https://github.com/lllyasviel/Paints-UNDO Melalui projek ini, pengguna memasukkan imej statik, dan PaintsUndo secara automatik boleh membantu anda menjana video keseluruhan proses mengecat, daripada draf baris hingga produk siap . Semasa proses lukisan, perubahan garisan adalah menakjubkan Hasil akhir video sangat serupa dengan imej asal: Mari kita lihat lukisan lengkap.

Mendahului senarai jurutera perisian AI sumber terbuka, penyelesaian tanpa ejen UIUC dengan mudah menyelesaikan masalah pengaturcaraan sebenar SWE-bench Jul 17, 2024 pm 10:02 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Semua pengarang kertas kerja ini adalah daripada pasukan guru Zhang Lingming di Universiti Illinois di Urbana-Champaign (UIUC), termasuk: Steven Code repair; pelajar kedoktoran tahun empat, penyelidik

Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Jul 19, 2024 am 01:29 AM

Jika jawapan yang diberikan oleh model AI tidak dapat difahami sama sekali, adakah anda berani menggunakannya? Memandangkan sistem pembelajaran mesin digunakan dalam bidang yang lebih penting, menjadi semakin penting untuk menunjukkan sebab kita boleh mempercayai output mereka, dan bila tidak mempercayainya. Satu cara yang mungkin untuk mendapatkan kepercayaan dalam output sistem yang kompleks adalah dengan menghendaki sistem menghasilkan tafsiran outputnya yang boleh dibaca oleh manusia atau sistem lain yang dipercayai, iaitu, difahami sepenuhnya sehingga apa-apa ralat yang mungkin boleh dilakukan. dijumpai. Contohnya, untuk membina kepercayaan dalam sistem kehakiman, kami memerlukan mahkamah memberikan pendapat bertulis yang jelas dan boleh dibaca yang menjelaskan dan menyokong keputusan mereka. Untuk model bahasa yang besar, kita juga boleh menggunakan pendekatan yang sama. Walau bagaimanapun, apabila mengambil pendekatan ini, pastikan model bahasa menjana

Daripada RLHF kepada DPO kepada TDPO, algoritma penjajaran model besar sudah pun 'peringkat token' Jun 24, 2024 pm 03:04 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Dalam proses pembangunan kecerdasan buatan, kawalan dan bimbingan model bahasa besar (LLM) sentiasa menjadi salah satu cabaran utama, bertujuan untuk memastikan model ini adalah kedua-duanya. berkuasa dan selamat untuk masyarakat manusia. Usaha awal tertumpu kepada kaedah pembelajaran pengukuhan melalui maklum balas manusia (RL

Kertas arXiv boleh disiarkan sebagai 'bertubi-tubi', platform perbincangan Stanford alphaXiv dalam talian, LeCun menyukainya Aug 01, 2024 pm 05:18 PM

sorakan! Bagaimana rasanya apabila perbincangan kertas adalah perkataan? Baru-baru ini, pelajar di Universiti Stanford mencipta alphaXiv, forum perbincangan terbuka untuk kertas arXiv yang membenarkan soalan dan ulasan disiarkan terus pada mana-mana kertas arXiv. Pautan laman web: https://alphaxiv.org/ Malah, tidak perlu melawati tapak web ini secara khusus. Hanya tukar arXiv dalam mana-mana URL kepada alphaXiv untuk terus membuka kertas yang sepadan di forum alphaXiv: anda boleh mencari perenggan dengan tepat dalam. kertas itu, Ayat: Dalam ruang perbincangan di sebelah kanan, pengguna boleh menyiarkan soalan untuk bertanya kepada pengarang tentang idea dan butiran kertas tersebut Sebagai contoh, mereka juga boleh mengulas kandungan kertas tersebut, seperti: "Diberikan kepada

Satu kejayaan ketara dalam Hipotesis Riemann! Tao Zhexuan amat mengesyorkan kertas kerja baharu daripada MIT dan Oxford, dan pemenang Fields Medal berusia 37 tahun mengambil bahagian Aug 05, 2024 pm 03:32 PM

Baru-baru ini, Hipotesis Riemann, yang dikenali sebagai salah satu daripada tujuh masalah utama milenium, telah mencapai kejayaan baharu. Hipotesis Riemann ialah masalah yang tidak dapat diselesaikan yang sangat penting dalam matematik, berkaitan dengan sifat tepat taburan nombor perdana (nombor perdana ialah nombor yang hanya boleh dibahagikan dengan 1 dan dirinya sendiri, dan ia memainkan peranan asas dalam teori nombor). Dalam kesusasteraan matematik hari ini, terdapat lebih daripada seribu proposisi matematik berdasarkan penubuhan Hipotesis Riemann (atau bentuk umumnya). Dalam erti kata lain, sebaik sahaja Hipotesis Riemann dan bentuk umumnya dibuktikan, lebih daripada seribu proposisi ini akan ditetapkan sebagai teorem, yang akan memberi kesan yang mendalam terhadap bidang matematik dan jika Hipotesis Riemann terbukti salah, maka antara cadangan ini sebahagian daripadanya juga akan kehilangan keberkesanannya. Kejayaan baharu datang daripada profesor matematik MIT Larry Guth dan Universiti Oxford

MLLM berasaskan Mamba yang pertama ada di sini! Berat model, kod latihan, dsb. semuanya telah menjadi sumber terbuka Jul 17, 2024 am 02:46 AM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com. Pengenalan Dalam beberapa tahun kebelakangan ini, aplikasi model bahasa besar multimodal (MLLM) dalam pelbagai bidang telah mencapai kejayaan yang luar biasa. Walau bagaimanapun, sebagai model asas untuk banyak tugas hiliran, MLLM semasa terdiri daripada rangkaian Transformer yang terkenal, yang

Latihan aksiomatik membolehkan LLM mempelajari penaakulan kausal: model 67 juta parameter adalah setanding dengan trilion tahap parameter GPT-4 Jul 17, 2024 am 10:14 AM

Tunjukkan rantai sebab kepada LLM dan ia mempelajari aksiom. AI sudah pun membantu ahli matematik dan saintis menjalankan penyelidikan Contohnya, ahli matematik terkenal Terence Tao telah berulang kali berkongsi pengalaman penyelidikan dan penerokaannya dengan bantuan alatan AI seperti GPT. Untuk AI bersaing dalam bidang ini, keupayaan penaakulan sebab yang kukuh dan boleh dipercayai adalah penting. Penyelidikan yang akan diperkenalkan dalam artikel ini mendapati bahawa model Transformer yang dilatih mengenai demonstrasi aksiom transitiviti sebab pada graf kecil boleh digeneralisasikan kepada aksiom transitiviti pada graf besar. Dalam erti kata lain, jika Transformer belajar untuk melakukan penaakulan sebab yang mudah, ia boleh digunakan untuk penaakulan sebab yang lebih kompleks. Rangka kerja latihan aksiomatik yang dicadangkan oleh pasukan adalah paradigma baharu untuk pembelajaran penaakulan sebab berdasarkan data pasif, dengan hanya demonstrasi

See all articles