Jadual Kandungan
Menilai pemetaan makna perkataan yang dipelajari
Mengerti paradigma visual baharu
Konsistensi pelbagai mod sangat baik
Rumah Peranti teknologi AI Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Jun 03, 2024 am 10:08 AM
data Model

Hebat, untuk melatih model AI, seorang profesor dari Universiti Negeri New York mengikat kamera seperti GoPro ke kepala anak perempuannya!

Walaupun bunyinya luar biasa, gelagat profesor ini sebenarnya berasas.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Untuk melatih rangkaian saraf kompleks di belakang LLM, data besar diperlukan.

Adakah proses latihan LLM semasa kami semestinya cara yang paling mudah dan paling berkesan?

Sudah tentu tidak! Para saintis telah menemui bahawa pada kanak-kanak kecil manusia, otak menyerap air seperti span, dengan cepat membentuk pandangan dunia yang koheren. .

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharuRahsia kanak-kanak menguasai bahasa

Bagaimana untuk melatih LLM dengan cara yang lebih baik?

Apabila saintis hairan, anak-anak manusia membuat mata mereka bercahaya -

Cara mereka belajar bahasa boleh dipanggil mahir dalam pemerolehan bahasa.

Kita semua tahu kisah ini: buang seorang anak kecil ke negara dengan bahasa dan budaya yang sama sekali berbeza Dalam masa beberapa bulan, penguasaannya terhadap bahasa tempatan mungkin hampir dengan tahap ibunda.

Dan model bahasa yang besar tidak dapat dibandingkan.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Pertama sekali, mereka terlalu intensif data!

Kini, syarikat utama yang melatih model hampir kehabisan semua data di dunia. Kerana pembelajaran LLM memerlukan jumlah astronomi teks yang dilombong dari Internet dan pelbagai tempat.

Untuk mereka menguasai bahasa, anda perlu memberi mereka makan trilion perkataan.

Brenden Lake dan para sarjana NYU yang menyertai kajian ini

Kedua, LLM mungkin tidak dapat belajar dengan tepat walaupun begitu banyak data dicurahkan dengan usaha yang gigih.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Keluaran banyak LLM adalah untuk meramal perkataan seterusnya dengan ketepatan tertentu. Dan ketepatan ini semakin mengganggu.

Sebaliknya, kanak-kanak tidak memerlukan banyak pengalaman untuk belajar bercakap bahasa dengan lancar.

Brenden Lake, ahli psikologi di State University of New York yang mengkaji manusia dan AI, telah memberi tumpuan kepada perkara ini.

Dia memutuskan untuk menjalankan eksperimen ke atas anak perempuannya Luna yang berusia 1 tahun dan 9 bulan.

Dalam tempoh 11 bulan yang lalu, Lake telah membenarkan anak perempuannya memakai kamera selama sejam setiap minggu untuk merakam video masa bermainnya daripada perspektifnya.

Dengan video yang dirakam oleh kamera Luna, Lake berharap dapat melatih model menggunakan data yang sama yang terdedah kepada kanak-kanak. . !

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Oleh itu, Lake melancarkan projek penyelidikan sebegini: mengkaji rangsangan yang dialami kanak-kanak ketika mempelajari ayat pertama, untuk meningkatkan kecekapan latihan LLM.

Untuk melakukan ini, pasukan Lake perlu mengumpul data video dan audio daripada 25 kanak-kanak di seluruh Amerika Syarikat.

Ini adalah adegan di awal artikel - mereka mengikat kamera seperti GoPro pada kepala kanak-kanak ini, termasuk anak perempuan Lake, Luna.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Lake menjelaskan bahawa model mereka cuba menyambungkan klip video dan perkara yang dikatakan oleh penjaga kanak-kanak daripada perspektif kanak-kanak, sama seperti cara model OpenAI's Clip menghubungkan anotasi dan imej.

Klip boleh mengambil imej sebagai input dan output anotasi deskriptif sebagai cadangan berdasarkan data latihan pasangan anotasi imej.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Alamat kertas: https://openai.com/index/clip/

Selain itu, model pasukan Lake juga boleh menggabungkan imej adegan berdasarkan data latihan daripada rakaman GoPro dan audio daripada penjaga Sebagai input, ia kemudian mengeluarkan bahasa yang menerangkan tempat kejadian.

Selain itu, model ini juga boleh menukar penerangan kepada bingkai yang sebelum ini dilihat dalam latihan.

Pada pandangan pertama, ia kelihatan agak mudah, bukan? Iaitu, model belajar memadankan perkataan yang dituturkan dengan objek yang diperhatikan dalam bingkai video, sama seperti kanak-kanak manusia.

Tetapi dalam pelaksanaan sebenar, kita masih akan menghadapi banyak situasi yang kompleks.

Sebagai contoh, kanak-kanak tidak selalu melihat objek atau aksi yang diterangkan.

Malah ada situasi yang lebih abstrak, seperti kita memberi susu kepada anak-anak kita, tetapi susu berada dalam cawan legap, yang membawa kepada sambungan yang sangat longgar.

Oleh itu, Lake menjelaskan: Percubaan ini tidak bertujuan untuk membuktikan sama ada kita boleh melatih model untuk memadankan objek dalam imej dengan perkataan yang sepadan (OpenAI telah menunjukkan perkara ini).

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Sebaliknya, apa yang pasukan mahu lakukan adalah untuk melihat sama ada model itu benar-benar boleh belajar mengenali objek hanya menggunakan tahap data yang jarang tersedia untuk kanak-kanak (yang sangat jarang).

Seperti yang anda lihat, ini bertentangan sama sekali dengan idea membina model oleh syarikat besar seperti OpenAI, Google dan Meta.

Anda tahu, Meta menggunakan 15 trilion token untuk melatih Llama 3.

Jika percubaan pasukan Lake berjaya, mungkin kekurangan data LLM yang dihadapi oleh seluruh dunia akan dapat diselesaikan - kerana itu, latihan LLM tidak akan memerlukan begitu banyak data sama sekali!

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Dalam erti kata lain, idea baharu adalah untuk membiarkan model AI belajar daripada input terhad dan kemudian membuat generalisasi daripada data yang kita lihat.

Saya rasa tumpuan kita tidak seharusnya terhad kepada melatih LLM yang lebih besar dan lebih besar daripada lebih banyak data. Ya, anda boleh mendapatkan prestasi hebat dari LLM dengan cara ini, tetapi ia semakin jauh daripada keajaiban kecerdasan manusia yang kita tahu...

Eksperimen awal telah berjaya

Awal Keputusan eksperimen telah terbukti bahawa idea pasukan Lake mungkin betul.

Pada Februari tahun ini, mereka menggunakan 61 jam rakaman video untuk melatih rangkaian saraf bagi merakam pengalaman seorang kanak-kanak kecil.

Kajian mendapati model itu dapat menghubungkan pelbagai perkataan dan frasa yang dituturkan oleh subjek dengan pengalaman yang dirakam dalam bingkai video - selagi perkataan atau frasa itu dipersembahkan, model itu dapat mengingati imej yang berkaitan . Makalah ini telah diterbitkan dalam Sains.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Alamat kertas: https://www.science.org/doi/10.1126/science.adi1374

Tasik berkata bahawa perkara yang paling mengejutkan ialah model itu boleh menyamaratakan nama objek dalam imej yang tidak terlatih!

Sudah tentu, ketepatannya mungkin tidak hebat. Tetapi model itu pada asalnya hanya untuk mengesahkan sesuatu konsep.

Projek ini masih belum lengkap kerana model itu belum mempelajari semua yang kanak-kanak akan tahu.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Lagipun, hanya kira-kira 60 jam pertuturan beranotasi, iaitu hanya satu peratus daripada pengalaman yang diperoleh kanak-kanak dalam tempoh dua tahun. Dan pasukan memerlukan lebih banyak data untuk mengetahui perkara yang boleh dipelajari.

Dan Lake juga mengakui kaedah yang digunakan oleh model pertama masih mempunyai batasan -

Hanya menganalisis klip video yang berkaitan dengan kata-kata penjaga, hanya rakaman yang ditukar kepada imej pada kelajuan 5 bingkai sesaat , berdasarkan ini sahaja, AI tidak benar-benar mempelajari apa itu kata kerja dan apa itu perkataan abstrak. Ia hanya memperoleh kepingan statik tentang rupa dunia.

Oleh kerana ia tidak tahu apa-apa tentang apa yang berlaku sebelum, apa yang berlaku selepas, atau konteks perbualan, sukar untuk mengetahui apa itu "berjalan", "berlari" dan "melompat".

Tetapi pada masa hadapan, apabila teknologi di sebalik pemodelan video menjadi lebih matang, Lake percaya pasukan itu akan membina model yang lebih berkesan.

Jika kita boleh membina model bagaimana pemerolehan bahasa sebenarnya bermula, ia akan membuka aplikasi penting untuk memahami pembelajaran dan perkembangan manusia, mungkin membantu kita memahami gangguan perkembangan, atau cara kanak-kanak belajar bahasa.

Akhirnya, model sedemikian juga boleh digunakan untuk menguji berjuta-juta terapi pertuturan yang berbeza.

Bercakap mengenainya, bagaimanakah kanak-kanak menguasai bahasa dengan mantap melalui mata dan telinga mereka sendiri?

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Mari kita lihat dengan lebih dekat artikel yang disiarkan oleh pasukan Lake dalam Sains ini.

Sambungkan perkataan dengan objek fizikal dan imej visual

Bagaimanakah anak manusia menghilangkan kejahilan mereka tentang dunia dan memperoleh pengetahuan? Misteri "kotak hitam" ini bukan sahaja menarik minat para pendidik yang berterusan, tetapi juga merupakan persoalan yang terperangkap dalam hati setiap daripada kita tentang asal usul kebijaksanaan individu.

Penulis fiksyen sains Korea Kim Cho Ye menulis andaian ini dalam "Symbiosis Hypothesis": Kebijaksanaan yang ditunjukkan oleh kanak-kanak manusia pada awal kanak-kanak mereka sebenarnya membawa tamadun asing yang hilang Mereka memilih untuk menggunakan kaedah ini untuk berkomunikasi dengan manusia Simbiosis, tetapi ia hanya bertahan selama lima tahun yang singkat Selepas manusia membesar dan mempunyai ingatan yang benar-benar kukuh, kenangan indah zaman kanak-kanak mereka terpadam.

Netizen sering berkongsi cerita dalam talian tentang anak manusia yang "terlupa minum sup Meng Po".

Mengenai zaman kanak-kanak yang penuh misteri, ia adalah tempat misteri yang sukar untuk kita jelaskan dan sukar untuk kembali. Seperti yang tertulis pada sehelai rumput emas, "Jangan pergi." Jangan ambil dunia yang indah itu. Apabila saya besar, sila tinggal bersama saya.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Bagaimanakah kanak-kanak kecil menyambung perkataan baharu dengan objek atau konsep visual tertentu?

Sebagai contoh, apabila mendengar perkataan "bola", bagaimanakah kanak-kanak berfikir tentang objek anjal dan bulat

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Untuk tujuan ini, pasukan Lake meletakkan kamera yang dipasang di kepala pada seorang kanak-kanak, menjejakinya pertumbuhan dari 6 hingga 25 bulan, dan merekodkan aliran data bahasa visual 61 jam.

Pada set data klip kanak-kanak 1.5 tahun ini (termasuk 600,000 bingkai video dan 37,500 pasangan ujaran yang ditranskripsi), para penyelidik melatih model, model pembelajaran kontrastif perspektif kanak-kanak CVCL.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Model ini mewujudkan satu bentuk pembelajaran bersekutu merentas situasi, mengenal pasti pemetaan antara perkataan dan rujukan visual yang mungkin.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Model ini menyelaraskan objektif perbandingan dua rangkaian saraf, pengekod visual dan pengekod linguistik, dan dilatih dengan cara yang diselia sendiri (iaitu menggunakan rakaman perspektif kanak-kanak sahaja, tanpa label luaran), berbanding The matlamatnya adalah untuk menggabungkan pembenaman (vektor) bingkai video dan ujaran bahasa yang berlaku bersama secara sementara (memproses pembenaman bingkai video dan sebutan bahasa serentak)

Sudah tentu, set data yang dipanggil SAYCam-S ini terhad, kerana ia hanya menangkap kira-kira 1% daripada waktu terjaga kanak-kanak, kehilangan banyak pengalaman mereka.

Tetapi walaupun begitu, CVCL masih boleh mempelajari representasi pelbagai mod yang berkuasa daripada pengalaman kanak-kanak yang terhad!

Pasukan berjaya menunjukkan bahawa model itu memperoleh banyak pemetaan rujukan yang wujud dalam pengalaman harian kanak-kanak, dan oleh itu dapat membuat generalisasi rujukan visual baharu dengan sampel sifar dan melaraskan sistem konsep visual dan linguistik.

Menilai pemetaan makna perkataan yang dipelajari

Secara khusus, selepas latihan selesai, pasukan menilai kualiti pemetaan rujukan perkataan yang dipelajari oleh CVCL dan pelbagai model alternatif.

Keputusan menunjukkan ketepatan klasifikasi CVCL ialah 61.6%.

Dan Rajah 2D menunjukkan bahawa untuk 11 daripada 22 konsep, prestasi CVCL berada dalam 5% daripada ralat CLIP, tetapi data latihan CLIP adalah beberapa susunan magnitud yang lebih besar (400 juta daripada rangkaian imej- pasangan teks).

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Hasil penyelidikan menunjukkan bahawa banyak pemetaan rujukan perkataan terawal boleh diperoleh daripada sekurang-kurangnya 10 hingga 100 pasangan rujukan perkataan yang wujud secara semula jadi.

Mengerti paradigma visual baharu

Selain itu, penyelidik juga menilai sama ada perkataan yang dipelajari oleh CVCL boleh digeneralisasikan kepada rangsangan visual di luar pengedaran.

Rajah 3A menunjukkan bahawa CVCL juga menunjukkan beberapa pemahaman tentang konsep visual ini, dengan ketepatan keseluruhan 34.7%.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Jelas sekali, tugasan ini memerlukan set konsep yang lebih besar, dan kesukaran tambahan dalam generalisasi luar pengedaran.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Di sebelah kiri adalah dua kes latihan yang dipilih secara rawak, dan di sebelah kanan adalah empat kes ujian Peratusan di bawah mewakili ketepatan dan prestasi model dalam mengenali imej ini dua nilai tertinggi, median dan nilai minimum. Dapat dilihat apabila kes ujian dan kes latihan lebih serupa dalam warna dan bentuk, ketepatan pengecaman model juga lebih tinggi

Konsistensi pelbagai mod sangat baik

Akhirnya, penyelidik menguji Kesepaduan sistem konsep visual dan linguistik CVCL.

Sebagai contoh, jika kedua-dua pembenaman visual dan perkataan pembenaman "kereta" lebih serupa dengan "jalan" daripada "bola", ini menunjukkan bahawa penjajaran berbilang modal berfungsi dengan baik.

Gambar di bawah menunjukkan penjajaran tinggi sistem visual dan bahasa CVCL.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Hubungan antara imej dan teks, garis putus-putus mewakili jarak antara centroid visual yang sepadan dengan setiap konsep dan perkataan embedding

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Konsep visual yang berbeza berbeza mengikut ketepatan contoh mereka dikelompokkan. Kerana garis penglihatan bayi akan merayau di antara objek yang sangat dekat, model tidak membentuk pemetaan rujukan yang jelas apabila membezakan "tangan" dan "mainan" "Kereta" dan "buaian" mempunyai prestasi yang lebih baik

Dalam setiap satu. Rajah, kami menunjukkan secara visual perbandingan ramalan CVCL dengan contoh berlabel menggunakan t-SNE.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Titik biru di sebelah kiri sepadan dengan 100 bingkai yang tergolong dalam kategori tertentu, dan titik hijau di sebelah kanan sepadan dengan 100 bingkai yang diaktifkan tertinggi (berdasarkan persamaan kosinus dengan perkataan yang dibenamkan untuk setiap konsep dalam CVCL). Di bawah setiap rajah terdapat berbilang bingkai contoh kepunyaan satu atau lebih subkluster dalam setiap konsep, merakam cara benam perkataan berinteraksi dengan benam imej dalam ruang benam bersama. Sebagai contoh, untuk perkataan "tangga", kita melihat satu gugusan mewakili imej tangga kayu dalaman, manakala satu lagi gugusan utama mewakili imej set tangga biru di luar rumah. Semua graf t-SNE dalam rajah ini diperoleh daripada set gabungan imej dan teks yang sama.

Gambar di bawah menunjukkan bahawa model boleh mengesan sasaran dalam pandangan yang berbeza.

Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu

Dalam peta perhatian yang dinormalkan, kuning menunjukkan kawasan yang mendapat perhatian tertinggi. Dalam dua kategori pertama (bola dan benteng) kita dapat melihat bahawa model boleh mengesan sasaran dalam pandangan yang berbeza. Walau bagaimanapun, dalam dua kategori bawah (kucing dan kertas), peta perhatian kadangkala tidak sejajar dengan rujukan, menunjukkan bahawa keupayaan untuk mencari rujukan tidak konsisten merentas kategori.

Sudah tentu, masih terdapat banyak perbezaan dalam pembelajaran kanak-kanak dan model pembelajaran mesin.

Tetapi penyelidikan pasukan Lake sudah pasti banyak memberi inspirasi kepada kami.

Atas ialah kandungan terperinci Seorang profesor Amerika menggunakan anak perempuannya yang berusia 2 tahun untuk melatih model AI untuk muncul dalam Sains! Anak manusia menggunakan kamera yang dipasang di kepala untuk melatih AI baharu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1664
14
Tutorial PHP
1267
29
Tutorial C#
1239
24
Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat! Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat! Apr 03, 2024 pm 12:04 PM

0. Apakah fungsi artikel ini? Kami mencadangkan DepthFM: model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens. Mari kita baca karya ini bersama-sama ~ 1. Tajuk maklumat kertas: DepthFM: FastMonocularDepthEstimationwithFlowMatching Pengarang: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Kelajuan Internet Data Selular Perlahan pada iPhone: Pembetulan Kelajuan Internet Data Selular Perlahan pada iPhone: Pembetulan May 03, 2024 pm 09:01 PM

Menghadapi ketinggalan, sambungan data mudah alih perlahan pada iPhone? Biasanya, kekuatan internet selular pada telefon anda bergantung pada beberapa faktor seperti rantau, jenis rangkaian selular, jenis perayauan, dsb. Terdapat beberapa perkara yang boleh anda lakukan untuk mendapatkan sambungan Internet selular yang lebih pantas dan boleh dipercayai. Betulkan 1 – Paksa Mulakan Semula iPhone Kadangkala, paksa memulakan semula peranti anda hanya menetapkan semula banyak perkara, termasuk sambungan selular. Langkah 1 – Hanya tekan kekunci naikkan kelantangan sekali dan lepaskan. Seterusnya, tekan kekunci Turun Kelantangan dan lepaskannya semula. Langkah 2 - Bahagian seterusnya proses adalah untuk menahan butang di sebelah kanan. Biarkan iPhone selesai dimulakan semula. Dayakan data selular dan semak kelajuan rangkaian. Semak semula Betulkan 2 – Tukar mod data Walaupun 5G menawarkan kelajuan rangkaian yang lebih baik, ia berfungsi lebih baik apabila isyarat lemah

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24) Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24) Apr 23, 2024 pm 01:20 PM

Pautan projek ditulis di hadapan: https://nianticlabs.github.io/mickey/ Memandangkan dua gambar, pose kamera di antara mereka boleh dianggarkan dengan mewujudkan kesesuaian antara gambar. Biasanya, surat-menyurat ini adalah 2D hingga 2D, dan anggaran pose kami adalah skala-tak tentu. Sesetengah aplikasi, seperti realiti tambahan segera pada bila-bila masa, di mana-mana sahaja, memerlukan anggaran pose metrik skala, jadi mereka bergantung pada penganggar kedalaman luaran untuk memulihkan skala. Makalah ini mencadangkan MicKey, proses pemadanan titik utama yang mampu meramalkan korespondensi metrik dalam ruang kamera 3D. Dengan mempelajari padanan koordinat 3D merentas imej, kami dapat membuat kesimpulan relatif metrik

See all articles