Jadual Kandungan
Hasil eksperimen
Kesimpulan
Rumah Peranti teknologi AI Adakah penalaan halus 'soal jawab imej berasaskan pengetahuan' tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Adakah penalaan halus 'soal jawab imej berasaskan pengetahuan' tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Aug 24, 2023 pm 07:21 PM
Model kereta api

Dengan sokongan model bahasa besar (LLM), hasil yang ketara telah dicapai dalam tugasan berbilang modal digabungkan dengan penglihatan, seperti penerangan imej, jawapan soalan visual (VQA) dan pengesanan objek perbendaharaan kata terbuka

Walau bagaimanapun, model bahasa visual (VLM) semasa pada asasnya hanya menggunakan maklumat visual dalam imej untuk menyelesaikan tugasan, dan selalunya berprestasi lemah pada set data seperti informeek dan OK-VQA yang memerlukan pengetahuan luaran untuk membantu menjawab soalan.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Baru-baru ini Google telah mengeluarkan kaedah carian maklumat visual autonomi baharu AVIS, yang menggunakan model bahasa besar (LLM) untuk merangka strategi secara dinamik untuk menggunakan alat luaran, termasuk memanggil API, menganalisis hasil output, membuat keputusan dan lain-lain operasi. Soal Jawab Imej menyediakan pengetahuan kritikal.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Sila klik pautan berikut untuk membaca kertas: https://arxiv.org/pdf/2306.08129.pdf

AVIS terutamanya mengintegrasikan tiga jenis alatan:

imej Alat untuk mengekstrak maklumat visual

2. Alat carian web untuk mendapatkan semula pengetahuan dan fakta dunia terbuka

3. Alat carian imej yang boleh digunakan untuk mendapatkan imej yang serupa secara visual

dan kemudian gunakanAdakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

mereka berdasarkan besar Perancang model bahasa memilih alat dan hasil pertanyaan pada setiap langkah untuk menjana jawapan kepada soalan secara dinamik.

Simulasi pembuatan keputusan manusia

Banyak masalah visual dalam dataset Infoseek dan OK-VQA agak sukar walaupun untuk manusia dan biasanya memerlukan bantuan pelbagai alat luaran, jadi penyelidik memilih untuk menjalankan tinjauan pengguna terlebih dahulu dan memerhatikan Manusia penyelesaian kepada masalah penglihatan yang kompleks.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Pertama, kami akan menyediakan pengguna dengan set alat yang tersedia, termasuk PALI, PALM dan carian web. Seterusnya, kami menunjukkan imej input, soalan, pemangkasan objek yang dikesan, entiti graf pengetahuan yang dipautkan daripada hasil carian imej, tajuk imej yang serupa, tajuk produk yang berkaitan dan penerangan imej

Seterusnya, penyelidik merekodkan operasi dan output pengguna, dan menggunakan dua kaedah untuk membimbing sistem menjawab:

1 Bina graf peralihan dengan menganalisis urutan keputusan yang dibuat oleh pengguna, yang mengandungi keadaan berbeza dan set operasi yang tersedia di setiap negeri Semua berbeza.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Kandungan yang ditulis semula: rajah penukaran AVIS Gambar rajah penukaran AVIS yang direka bentuk semula ialah perwakilan grafik yang digunakan untuk menggambarkan proses penukaran AVIS. Gambar rajah ini dengan jelas menggambarkan pelbagai peringkat dan langkah AVIS dan membentangkannya kepada pengguna dengan cara yang mudah difahami. Melalui gambarajah penukaran ini, pengguna boleh memahami dengan lebih baik prinsip kerja dan proses operasi AVIS. Reka bentuk carta ini ringkas dan jelas, membolehkan pengguna memahami proses penukaran AVIS dengan cepat. Kedua-dua pengguna pemula dan berpengalaman boleh dengan mudah memahami dan menggunakan proses penukaran melalui gambar rajah penukaran AVIS ini

Sebagai contoh, dalam keadaan permulaan, sistem hanya boleh melakukan tiga operasi: penerangan PALI, PALI VQA atau pengesanan sasaran .

Untuk meningkatkan prestasi dan keberkesanan sistem, contoh pembuatan keputusan manusia boleh digunakan untuk membimbing perancang dan penaakulan untuk berinteraksi dengan contoh konteks yang relevan

Rangka Kerja Keseluruhan

Pendekatan AVIS mengamalkan Keputusan dinamik -membuat strategi yang direka untuk menjawab pertanyaan untuk maklumat visual

Sistem ini terdiri daripada tiga komponen utama:

Kandungan yang perlu ditulis semula ialah: 1. Perancang (planner), digunakan untuk menentukan operasi seterusnya, termasuk panggilan API yang sesuai dan pertanyaan yang perlu diproses

2. Memori kerja (working memory) working memory, dikekalkan Maklumat keputusan yang diperoleh daripada pelaksanaan API.

3 Penaakulan digunakan untuk memproses output panggilan API dan boleh menentukan sama ada maklumat yang diperolehi mencukupi untuk menjana respons akhir, atau sama ada pengambilan data tambahan diperlukan

Anda perlu memutuskan alat yang mana. untuk digunakan setiap kali Serta pertanyaan yang dihantar kepada sistem, perancang akan melaksanakan beberapa siri operasi berdasarkan status semasa, perancang juga akan menyediakan tindakan susulan yang berpotensi

Untuk menyelesaikan masalah; bahawa ruang carian mungkin terlalu besar disebabkan terlalu banyak ruang tindakan yang berpotensi Masalahnya ialah perancang perlu merujuk kepada graf peralihan untuk menghapuskan tindakan yang tidak berkaitan, tidak termasuk tindakan yang telah diambil sebelum ini dan disimpan dalam memori kerja.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Kemudian perancang mengumpulkan satu set contoh konteks daripada data penyelidikan pengguna, digabungkan dengan rekod interaksi alat sebelumnya, perancang merumuskan gesaan dan memasukkannya ke dalam model bahasa, dan LLM mengembalikan jawapan berstruktur , menentukan alat seterusnya untuk diaktifkan dan pertanyaan untuk dihantar.

Keseluruhan proses reka bentuk boleh didorong oleh pelbagai panggilan kepada perancang untuk memacu keputusan dinamik dan menjana jawapan langkah demi langkah

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Penyelidik menggunakan penaakulan untuk menganalisis output pelaksanaan alat, mengekstrak maklumat berguna, dan tentukan Kategori output alat: jawapan bermaklumat, tidak bermaklumat atau muktamad

Jika penaakulan mengembalikan hasil daripada "menyediakan jawapan", ia akan dikeluarkan secara langsung sebagai hasil akhir dan menamatkan tugas jika hasilnya tiada maklumat, ia akan kembali kepada perancangan dan memilih tindakan lain berdasarkan keadaan semasa; jika penaakulan menganggap output alat berguna, ia mengubah keadaan dan memindahkan kawalan kembali kepada perancang untuk membuat keputusan baharu dalam keadaan baharu.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

AVIS menggunakan strategi membuat keputusan yang dinamik untuk bertindak balas kepada pertanyaan carian maklumat visual

Hasil eksperimen

Apa yang perlu ditulis semula ialah: Set alat 1

model B , model penerangan imej boleh Menjana penerangan untuk imej input dan imej terpotong objek yang dikesan

Model menjawab soalan visual, menggunakan model VQA PALI 17B, mengambil imej dan soalan sebagai input dan jawapan berasaskan teks sebagai output.

Pengesanan objek, menggunakan pengesan objek yang dilatih pada superset set data Open Images, yang disediakan oleh Google Lens API khusus kategori menggunakan ambang keyakinan tinggi, hanya mengekalkan kotak pengesanan kedudukan teratas dalam imej input.

Gunakan Carian Imej Google untuk mendapatkan maklumat pemangkasan imej yang berkaitan dengan kotak yang dikesan

Apabila membuat keputusan, perancang menganggap penggunaan setiap maklumat sebagai operasi yang berasingan, kerana setiap Maklumat mungkin mengandungi beratus-ratus token, yang memerlukan pemprosesan dan penaakulan yang kompleks.

Dalam sesetengah kes, imej mungkin mengandungi kandungan teks, seperti nama jalan atau nama jenama. Anda boleh menggunakan ciri Pengecaman Aksara Optik (OCR) dalam API Google Lens untuk mengekstrak teks ini

Dengan menggunakan API Carian Google untuk carian web, anda boleh memasukkan pertanyaan teks dan mendapatkan hasil output pautan dan coretan dokumen yang berkaitan sambil juga Boleh menyediakan panel graf pengetahuan dengan jawapan langsung, dan sehingga lima soalan yang berkaitan dengan pertanyaan input

Hasil eksperimen

Para penyelidik menjalankan eksperimen pada rangka kerja AVIS pada Infoseek dan OK-VQA dataset Evaluasi ,Ia boleh dilihat daripada keputusan bahawa walaupun model bahasa visual yang sangat teguh seperti model OFA dan PALI tidak dapat, mencapai ketepatan yang tinggi selepas penalaan halus pada Infoseek, set data.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Tanpa penalaan halus, kaedah AVIS berjaya mencapai ketepatan 50.7%

Pada set data OK-VQA, sistem AVIS mencapai ketepatan 60.2% di bawah tetapan beberapa tangkapan kedua , model PALI yang diperhalusi.

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Kebanyakan contoh soal jawab dalam OK-VQA bergantung pada pengetahuan akal dan bukannya pengetahuan halus, jadi perbezaan prestasi mungkin disebabkan oleh perkara ini. PALI dapat mengeksploitasi pengetahuan am yang dikodkan dalam parameter model tanpa bergantung pada bantuan pengetahuan luaran

Adakah penalaan halus soal jawab imej berasaskan pengetahuan tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda

Ciri utama AVIS ialah keupayaan untuk membuat keputusan secara dinamik dan bukannya melaksanakan urutan tetap contoh Contoh menunjukkan fleksibiliti AVIS dalam menggunakan alat yang berbeza pada peringkat yang berbeza.

Perlu diingat bahawa reka bentuk penaakulan dalam artikel ini membolehkan AVIS mengenal pasti maklumat yang tidak berkaitan, kembali ke keadaan sebelumnya dan mengulangi carian.

Sebagai contoh, dalam contoh kedua tentang taksonomi kulat, AVIS pada mulanya membuat keputusan yang salah dengan memilih objek daun, mendapati ia tidak berkaitan dengan masalah, mendorong AVIS untuk merancang semula, dan kemudian berjaya memilih objek; yang berkaitan dengan masalah. Objek berkaitan kulat ekor ayam belanda palsu, sehingga tiba di jawapan yang betul, Stereum

Kesimpulan

Para penyelidik mencadangkan kaedah baru AVIS, menggunakan LLM sebagai pusat perhimpunan untuk menjawab pengetahuan menggunakan pelbagai luaran alatan Masalah visual yang intensif.

Dalam pendekatan ini, penyelidik memilih untuk menggunakan data pembuatan keputusan manusia yang dikumpul daripada kajian pengguna sebagai sauh, menerima pakai rangka kerja berstruktur dan menggunakan perancang berasaskan LLM untuk membuat keputusan secara dinamik pemilihan alat dan pembentukan pertanyaan

The Penaakulan yang didorong oleh LLM boleh memproses dan mengekstrak maklumat penting daripada output alat yang dipilih, dengan menggunakan perancang dan penaakulan secara berulang untuk memilih alat yang berbeza sehingga semua maklumat yang diperlukan untuk menjawab soalan visual dikumpulkan

Atas ialah kandungan terperinci Adakah penalaan halus 'soal jawab imej berasaskan pengetahuan' tidak berguna? Google mengeluarkan sistem carian AVIS: beberapa sampel mengatasi PALI yang diselia, dan ketepatannya meningkat tiga kali ganda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat! Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat! Apr 03, 2024 pm 12:04 PM

0. Apakah fungsi artikel ini? Kami mencadangkan DepthFM: model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens. Mari kita baca karya ini bersama-sama ~ 1. Tajuk maklumat kertas: DepthFM: FastMonocularDepthEstimationwithFlowMatching Pengarang: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

Daya hidup kecerdasan super membangkitkan! Tetapi dengan kedatangan AI yang mengemas kini sendiri, ibu tidak perlu lagi bimbang tentang kesesakan data Daya hidup kecerdasan super membangkitkan! Tetapi dengan kedatangan AI yang mengemas kini sendiri, ibu tidak perlu lagi bimbang tentang kesesakan data Apr 29, 2024 pm 06:55 PM

Saya menangis hingga mati. Dunia sedang membina model besar. Data di Internet tidak mencukupi. Model latihan kelihatan seperti "The Hunger Games", dan penyelidik AI di seluruh dunia bimbang tentang cara memberi makan data ini kepada pemakan yang rakus. Masalah ini amat ketara dalam tugas berbilang modal. Pada masa mereka mengalami kerugian, pasukan pemula dari Jabatan Universiti Renmin China menggunakan model baharu mereka sendiri untuk menjadi yang pertama di China untuk menjadikan "suapan data yang dijana model itu sendiri" menjadi kenyataan. Selain itu, ia merupakan pendekatan serampang dua mata dari segi pemahaman dan sisi penjanaan Kedua-dua pihak boleh menjana data baharu berbilang modal yang berkualiti tinggi dan memberikan maklum balas data kepada model itu sendiri. Apakah model? Awaker 1.0, model berbilang modal besar yang baru sahaja muncul di Forum Zhongguancun. Siapa pasukan itu? Enjin Sophon. Diasaskan oleh Gao Yizhao, pelajar kedoktoran di Sekolah Kecerdasan Buatan Hillhouse Universiti Renmin.

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

See all articles