Jadual Kandungan
Kecekapan perancangan dan prestasi berdimensi tinggi
Gambaran Keseluruhan Kaedah
Hasil eksperimen
Beberapa kajian hirisan
Rumah Peranti teknologi AI GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Apr 13, 2023 am 10:43 AM
algoritma Model

Sebelum ini kami telah memperkenalkan aplikasi kaedah pemodelan jujukan berdasarkan Model Transformer dan Diffusion dalam pembelajaran pengukuhan khususnya dalam bidang kawalan berterusan luar talian. Antaranya, Trajectory Transformer (TT) dan Diffusser ialah algoritma perancangan berasaskan model Mereka menunjukkan ramalan trajektori berketepatan tinggi dan fleksibiliti yang baik, tetapi kelewatan membuat keputusan agak tinggi. Khususnya, TT mendiskrisikan setiap dimensi secara bebas sebagai simbol dalam jujukan, yang menjadikan keseluruhan jujukan sangat panjang, dan penggunaan masa penjanaan jujukan akan meningkat dengan cepat apabila dimensi keadaan dan tindakan meningkat.

Untuk membolehkan model penjanaan trajektori mencapai kelajuan membuat keputusan tahap praktikal, kami memulakan projek penjanaan trajektori yang cekap dan membuat keputusan selari dengan Diffusser (bertindih tetapi harus nanti). Pemikiran pertama kami adalah untuk menyesuaikan keseluruhan taburan trajektori menggunakan Transformer+Mixture of Gaussian dalam ruang berterusan dan bukannya taburan diskret. Walaupun masalah pelaksanaan tidak diketepikan, kami tidak dapat memperoleh model penjanaan yang agak stabil di bawah pendekatan ini. Kemudian kami mencuba Variational Autoencoder (VAE) dan membuat beberapa penemuan. Walau bagaimanapun, ketepatan pembinaan semula VAE tidak begitu ideal, menjadikan prestasi kawalan hiliran agak berbeza daripada TT. Selepas beberapa pusingan lelaran, akhirnya kami memilih VQ-VAE sebagai model asas untuk penjanaan trajektori, dan akhirnya memperoleh algoritma baharu yang boleh membuat sampel dan merancang dengan cekap, dan melakukan jauh lebih baik daripada kaedah berasaskan model lain pada tugas kawalan dimensi tinggi. Kami Memanggil Perancang Autoenkod Trajektori (TAP).

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

  • Laman utama projek: https://sites.google .com/view/latentplan
  • Halaman utama kertas: https://arxiv.org/abs/2208.10291

Kecekapan perancangan dan prestasi berdimensi tinggi

Di bawah satu GPU, TAP boleh membuat keputusan dalam talian dengan mudah dengan kecekapan membuat keputusan 20Hz Dalam tugasan D4RL berdimensi rendah, keputusan-. membuat kelewatan hanya TT Sekitar 1%. Lebih penting lagi, apabila keadaan tugas dan dimensi tindakan D meningkat, kelewatan keputusan teoritikal TT akan berkembang dengan kubus GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan, dan Peresap secara teorinya akan berkembang secara linear GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan , manakala kelajuan membuat keputusan TAP tidak dipengaruhi oleh dimensi GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan. Dari segi prestasi membuat keputusan ejen, apabila dimensi tindakan meningkat, prestasi TAP bertambah baik berbanding kaedah lain, dan peningkatan berbanding kaedah berasaskan model (seperti TT) amat ketara.

Kepentingan kelewatan membuat keputusan terhadap tugasan membuat keputusan dan kawalan adalah sangat jelas Walaupun algoritma seperti MuZero berprestasi baik dalam persekitaran simulasi, ia memerlukan respons masa nyata dan pantas dalam dunia sebenar, kelewatan membuat keputusan yang berlebihan akan menjadi kesukaran utama dalam penggunaannya. Di samping itu, di bawah premis mempunyai persekitaran simulasi, kelajuan membuat keputusan yang perlahan juga akan membawa kepada kos ujian yang tinggi untuk algoritma yang serupa, dan kos penggunaan dalam pembelajaran pengukuhan dalam talian juga akan menjadi agak tinggi.

Selain itu, kami percaya bahawa membenarkan kaedah pemodelan penjanaan jujukan diperluaskan dengan lancar kepada tugasan dengan dimensi yang lebih tinggi juga merupakan sumbangan TAP yang sangat penting. Dalam dunia nyata, kebanyakan masalah yang kami harap pembelajaran pengukuhan akhirnya dapat diselesaikan sebenarnya mempunyai dimensi keadaan dan tindakan yang lebih tinggi. Contohnya, untuk pemanduan autonomi, input daripada pelbagai penderia tidak mungkin kurang daripada 100 walaupun selepas prapemprosesan pada pelbagai peringkat persepsi. Kawalan robot kompleks selalunya juga mempunyai ruang tindakan yang tinggi Darjah kebebasan semua sendi manusia adalah kira-kira 240, yang sepadan dengan ruang tindakan sekurang-kurangnya 240 dimensi Robot yang fleksibel seperti manusia juga memerlukan tindakan berdimensi tinggi angkasa lepas.

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Empat set tugasan dengan dimensi yang semakin meningkat secara beransur-ansur

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Perubahan dalam kependaman keputusan dan prestasi model relatif apabila dimensi tugas berkembang

Gambaran Keseluruhan Kaedah

Pertama, latih bahagian pengekod auto VQ-VAE Terdapat dua perbezaan daripada VQ-VAE yang asal. Perbezaan pertama ialah kedua-dua pengekod dan penyahkod adalah berdasarkan Causal Transformer dan bukannya CNN. Perbezaan kedua ialah kita mempelajari taburan kebarangkalian bersyarat, dan trajektori yang mungkin dimodelkan mesti bermula dari keadaan semasa GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan. Pengekod automatik mempelajari pemetaan dua arah antara trajektori bermula daripada keadaan semasa GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan dan kod pendam. Kod terpendam ini disusun dalam susunan kronologi seperti trajektori asal dan setiap kod terpendam akan dipetakan ke trajektori langkah GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan sebenar. Disebabkan kami menggunakan Pengubah Sebab, kod terpendam dengan kedudukan temporal yang lebih rendah (seperti GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan) tidak akan menghantar maklumat kepada urutan yang lebih tinggi (seperti GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan ), yang membenarkan TAP untuk menyahkod trajektori panjang NL melalui bahagian pengekodan tersembunyi N pertama, yang sangat berguna apabila menggunakannya untuk perancangan seterusnya.

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Kami kemudiannya akan menggunakan Transformer gaya GPT-2 yang lain untuk memodelkan taburan kebarangkalian bersyarat bagi kod pendam ini GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan:

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Apabila membuat keputusan, kita boleh mencari trajektori masa depan yang terbaik dengan mengoptimumkan dalam ruang pembolehubah terpendam, bukannya dalam ruang tindakan asal Optimize . Kaedah yang sangat mudah tetapi berkesan adalah dengan mengambil sampel terus daripada pengedaran pengekodan terpendam, dan kemudian pilih trajektori yang berprestasi terbaik, seperti yang ditunjukkan di bawah:

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Skor objektif yang dirujuk semasa memilih trajektori optimum akan mempertimbangkan pulangan jangkaan trajektori (ganjaran ditambah penilaian langkah terakhir) dan kemungkinan atau kebarangkalian trajektori itu sendiri. Seperti formula berikut, dengan GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan ialah nombor yang jauh lebih besar daripada pulangan tertinggi Apabila kebarangkalian trajektori lebih tinggi daripada ambang GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan, kriteria untuk. menilai trajektori ini ialah Pulangan yang dijangkakan (diserlahkan dalam warna merah), jika tidak, kebarangkalian trajektori ini sendiri akan menjadi komponen dominan (diserlahkan dengan warna biru). Dalam erti kata lain, TAP akan memilih satu dengan jangkaan pulangan tertinggi di antara trajektori yang lebih besar daripada ambang.

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Walaupun pensampelan langsung boleh menjadi sangat berkesan apabila jujukan ramalan adalah pendek apabila bilangan sampel cukup besar, di bawah premis mengehadkan bilangan sampel dan jumlah masa yang diperlukan untuk perancangan, adalah lebih baik untuk menggunakan pengoptimum yang lebih baik akan membawa kepada prestasi yang lebih baik. Dua animasi berikut menunjukkan perbezaan antara trajektori yang dijana oleh pensampelan langsung dan carian rasuk apabila meramalkan 144 langkah ke masa hadapan. Trajektori ini disusun mengikut skor sasaran akhir Trajektori di bahagian atas lapisan atas mempunyai skor yang lebih tinggi, dan trajektori yang disusun di belakangnya mempunyai skor yang lebih rendah. Selain itu, trajektori dengan skor rendah juga akan mempunyai ketelusan yang lebih rendah.

Dalam gambar kita dapat melihat bahawa banyak dinamik trajektori yang dihasilkan oleh pensampelan langsung tidak stabil dan tidak mematuhi undang-undang fizikal, khususnya, trajektori yang lebih ringan di latar belakang hampir semua terapung. Ini semua adalah trajektori dengan kebarangkalian yang agak rendah dan akan dihapuskan apabila pelan akhir dipilih. Trajektori di barisan hadapan kelihatan lebih dinamik, tetapi prestasi yang sepadan agak lemah, dan nampaknya ia akan jatuh. Sebaliknya, carian rasuk secara dinamik akan mempertimbangkan kebarangkalian trajektori apabila mengembangkan pembolehubah tersembunyi seterusnya, supaya cawangan dengan kebarangkalian yang sangat rendah akan ditamatkan lebih awal, supaya trajektori calon yang dihasilkan akan menumpukan pada prestasi dan kemungkinan yang lebih baik berada di sekeliling.

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Pensampelan langsung

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Carian rasuk

Hasil eksperimen

Jika tiada penilaian dan penambahbaikan strategi yang lebih maju, bergantung semata-mata pada kelebihan ketepatan ramalan, dalam Hidup tugasan berdimensi rendah, TAP telah mencapai prestasi yang setanding dengan pembelajaran pengukuhan luar talian yang lain:

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

kawalan pergerakan gim

Pada tugasan berdimensi tinggi, TAP telah mencapai prestasi yang jauh lebih baik daripada kaedah berasaskan model yang lain, dan juga mengatasi prestasi biasa tanpa model. Sebenarnya ada dua soalan terbuka yang masih belum terjawab. Yang pertama ialah sebab kaedah berasaskan model terdahulu berprestasi lemah dalam tugas pembelajaran tetulang luar talian berdimensi tinggi ini, dan yang kedua ialah sebab TAP boleh mengatasi banyak kaedah tanpa model pada tugasan ini. Salah satu andaian kami ialah amat sukar untuk mengoptimumkan dasar mengenai masalah dimensi tinggi sambil turut mengambil kira menghalang dasar daripada menyimpang terlalu banyak daripada dasar tingkah laku. Apabila model dipelajari, ralat dalam model itu sendiri boleh menguatkan kesukaran ini. TAP mengalihkan ruang pengoptimuman ke ruang pembolehubah terpendam diskret yang kecil, yang menjadikan keseluruhan proses pengoptimuman lebih mantap.

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

kawalan tangan robotik adroit

Beberapa kajian hirisan

Untuk banyak reka bentuk dalam TAP, kami juga menjalankan satu siri kajian hirisan mengenai tugas kawalan pergerakan gim. Yang pertama ialah bilangan langkah trajektori yang setiap kod pendam sebenarnya sepadan dengan GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan (histogram kuning Fakta telah membuktikan bahawa membiarkan pembolehubah pendam sepadan dengan peralihan keadaan berbilang langkah bukan sahaja). kelebihan pengiraan, tetapi juga prestasi model akhir Terdapat juga peningkatan. Dengan melaraskan ambang yang mencetuskan penalti trajektori berkemungkinan rendah dalam fungsi objektif carian GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan (histogram merah), kami juga mengesahkan bahawa kedua-dua bahagian fungsi objektif sememangnya membantu prestasi akhir model. . Perkara lain ialah bilangan langkah yang dirancang ke masa hadapan (ufuk perancangan, histogram biru) mempunyai sedikit kesan ke atas prestasi model Dalam carian pasca penempatan, walaupun hanya satu pembolehubah terpendam dikembangkan, prestasi ejen akhir hanya akan dikurangkan. sebanyak 10%.

Akhirnya kami mencuba prestasi TAP di bawah pensampelan langsung (histogram hijau). Ambil perhatian bahawa bilangan sampel yang diambil di sini ialah 2048, manakala bilangan dalam animasi di atas hanyalah 256, dan animasi di atas menjana pelan untuk 144 langkah seterusnya, tetapi sebenarnya model asas kami mengarahkan perancangan untuk 15 langkah. Kesimpulannya ialah persampelan langsung boleh mencapai prestasi yang sama dengan carian rasuk apabila bilangan sampel mencukupi dan laluan yang dirancang tidak panjang. Tetapi ini adalah satu kes pensampelan daripada taburan bersyarat yang dipelajari bagi pembolehubah terpendam Jika kita mengambil sampel secara langsung dengan kebarangkalian yang sama daripada pengekodan terpendam, ia akan menjadi lebih teruk daripada model TAP yang lengkap pada akhirnya.

GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan

Hasil kajian hirisan

Atas ialah kandungan terperinci GPU tunggal merealisasikan pembuatan keputusan dalam talian 20Hz, tafsiran kaedah perancangan trajektori yang cekap terkini berdasarkan model penjanaan jujukan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Jun 03, 2024 pm 01:25 PM

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

Satu kad menjalankan Llama 70B lebih pantas daripada dua kad, Microsoft hanya meletakkan FP6 ke dalam A100 | Satu kad menjalankan Llama 70B lebih pantas daripada dua kad, Microsoft hanya meletakkan FP6 ke dalam A100 | Apr 29, 2024 pm 04:55 PM

FP8 dan ketepatan pengiraan titik terapung yang lebih rendah bukan lagi "paten" H100! Lao Huang mahu semua orang menggunakan INT8/INT4, dan pasukan Microsoft DeepSpeed ​​​​memaksa diri mereka menjalankan FP6 pada A100 tanpa sokongan rasmi daripada Nvidia. Keputusan ujian menunjukkan bahawa kaedah baharu TC-FPx FP6 kuantisasi pada A100 adalah hampir atau kadangkala lebih pantas daripada INT4, dan mempunyai ketepatan yang lebih tinggi daripada yang terakhir. Selain itu, terdapat juga sokongan model besar hujung ke hujung, yang telah bersumberkan terbuka dan disepadukan ke dalam rangka kerja inferens pembelajaran mendalam seperti DeepSpeed. Keputusan ini juga mempunyai kesan serta-merta pada mempercepatkan model besar - di bawah rangka kerja ini, menggunakan satu kad untuk menjalankan Llama, daya pemprosesan adalah 2.65 kali lebih tinggi daripada dua kad. satu

Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24) Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24) Apr 23, 2024 pm 01:20 PM

Pautan projek ditulis di hadapan: https://nianticlabs.github.io/mickey/ Memandangkan dua gambar, pose kamera di antara mereka boleh dianggarkan dengan mewujudkan kesesuaian antara gambar. Biasanya, surat-menyurat ini adalah 2D hingga 2D, dan anggaran pose kami adalah skala-tak tentu. Sesetengah aplikasi, seperti realiti tambahan segera pada bila-bila masa, di mana-mana sahaja, memerlukan anggaran pose metrik skala, jadi mereka bergantung pada penganggar kedalaman luaran untuk memulihkan skala. Makalah ini mencadangkan MicKey, proses pemadanan titik utama yang mampu meramalkan korespondensi metrik dalam ruang kamera 3D. Dengan mempelajari padanan koordinat 3D merentas imej, kami dapat membuat kesimpulan relatif metrik

See all articles