


Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.
Memandangkan teknologi pemanduan autonomi terus berulang, gelagat kenderaan dan ramalan trajektori amat penting untuk pemanduan yang cekap dan selamat. Walaupun kaedah ramalan trajektori tradisional seperti potongan model dinamik dan analisis kebolehcapaian mempunyai kelebihan bentuk yang jelas dan kebolehtafsiran yang kuat, keupayaan mereka untuk memodelkan interaksi antara persekitaran dan objek agak terhad dalam persekitaran trafik yang kompleks. Oleh itu, dalam beberapa tahun kebelakangan ini, sejumlah besar penyelidikan dan aplikasi telah berdasarkan pelbagai kaedah pembelajaran mendalam (seperti LSTM, CNN, Transformer, GNN, dll.), dan pelbagai set data seperti BDD100K, nuScenes, Stanford Drone, ETH /UCY, INTERACTION, ApolloScape, dsb. juga telah muncul , menyediakan sokongan kuat untuk latihan dan menilai model rangkaian saraf dalam Banyak model SOTA seperti GroupNet, Trajectron++, MultiPath, dll. telah menunjukkan prestasi yang baik.
Model dan set data di atas tertumpu dalam senario pemanduan jalan biasa, dan menggunakan sepenuhnya infrastruktur dan ciri seperti garisan lorong dan lampu isyarat untuk membantu dalam proses ramalan kerana batasan peraturan lalu lintas, Corak pergerakan kebanyakan kenderaan juga agak jelas. Walau bagaimanapun, dalam "batu terakhir" pemanduan autonomi - senario tempat letak kereta autonomi, kami akan menghadapi banyak kesukaran baharu:
- Peraturan lalu lintas di tempat letak kereta Keperluan untuk garisan lorong dan garisan lorong tidak ketat, dan kenderaan sering memandu sesuka hati dan "mengambil jalan pintas"
- Untuk menyelesaikan tugas parkir, kenderaan perlu menyelesaikan tindakan parkir yang lebih kompleks, termasuk kerap mengundur , Tempat letak kereta, stereng, dsb. Jika pemandu tidak berpengalaman, tempat letak kereta mungkin menjadi satu proses yang panjang
- Terdapat banyak halangan dan kekusutan di tempat letak kereta, dan jarak antara kenderaan adalah dekat dan calar
-
Pejalan kaki selalunya berjalan melalui tempat letak kereta sesuka hati, dan kenderaan memerlukan lebih banyak tindakan mengelak
Dalam senario sedemikian, gunakan sahaja yang sedia ada. sukar bagi model ramalan trajektori untuk mencapai hasil yang ideal, dan model latihan semula tidak mempunyai sokongan data yang sepadan. Set data berasaskan tempat letak kereta semasa seperti CNRPark+EXT dan CARPK hanya direka untuk pengesanan ruang letak kereta percuma. Gambar-gambar itu datang daripada perspektif orang pertama bagi kamera pengawasan, mempunyai kadar pensampelan yang rendah dan mempunyai banyak oklusi, menjadikannya tidak dapat. digunakan untuk ramalan trajektori.
Dalam Persidangan Antarabangsa IEEE ke-25 mengenai Sistem Pengangkutan Pintar (IEEE ITSC 2022) yang baru sahaja berakhir pada Oktober 2022, daripada Universiti California, Penyelidik Berkeley mengeluarkan set data video & trajektori berdefinisi tinggi pertama untuk adegan tempat letak kereta, dan berdasarkan set data ini, menggunakan seni bina CNN dan Transformer untuk mencadangkan model ramalan trajektori yang dipanggil "ParkPredict+" .
- Pautan kertas: https://arxiv.org/abs/2204.10777
- Halaman utama set data, aplikasi percubaan dan muat turun: https://sites.google.com/berkeley.edu/dlp-dataset (Jika anda tidak boleh mengakses, anda boleh Cuba halaman alternatif https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 )
- Dataset Python API: https://github.com/ MPC- Berkeley/dlp-dataset
Maklumat set data
Set data dikumpul menggunakan dron, dengan tempoh keseluruhan 3.5 jam, video peleraian Untuk 4K, kadar pensampelan ialah 25Hz. Pemandangan meliputi kawasan tempat letak kereta kira-kira 140m x 80m, dengan jumlah lebih kurang 400 tempat letak kereta. Set data dianotasi dengan tepat dan sejumlah 1216 kenderaan bermotor, 3904 basikal dan 3904 trajektori pejalan kaki telah dikumpulkan.
Selepas diproses semula, data trajektori boleh dibaca dalam bentuk JSON dan dimuatkan ke dalam struktur data graf sambungan (Graf ):
- Individu (Agen): Setiap ejen (Agen) ialah objek yang bergerak dalam adegan semasa (Scene) Ia mempunyai sifat-sifat seperti bentuk dan jenis geometrik yang disimpan sebagai objek yang mengandungi Senarai Contoh Terpaut
- Instance: Setiap kejadian ialah keadaan individu (Ejen) dalam bingkai (Bingkai), Mengandungi kedudukan, sudut, kelajuan dan pecutannya. Setiap tika mengandungi penuding kepada tika individu dalam bingkai sebelumnya dan bingkai seterusnya
- Bingkai (Bingkai): Setiap bingkai (Bingkai) ialah titik pensampelan dan Mengandungi semua yang boleh dilihat kejadian (Instance) pada masa semasa, dan penunjuk ke bingkai sebelumnya dan seterusnya
- Halangan: halangan ada dalam rekod ini Objek yang tidak bergerak sama sekali, termasuk kedudukan, sudut dan saiz geometri setiap objek
- Adegan: Setiap adegan (Adegan) sepadan dengan fail video yang dirakam, yang mengandungi penunjuk , menunjuk ke bingkai pertama dan terakhir rakaman, semua individu ( Ejen) dan semua halangan (Halangan)
disediakan oleh set data Dua format muat turun:
JSON sahaja (disyorkan) : Fail JSON mengandungi semua jenis individu, bentuk, trajektori dan maklumat lain yang boleh dibaca terus, dipratonton dan dijana semantik imej (Imej Semantik) melalui API Python sumber terbuka. Jika matlamat penyelidikan hanyalah ramalan trajektori dan tingkah laku, format JSON boleh memenuhi semua keperluan.
Video dan anotasi asal: Jika penyelidikan berdasarkan kamera asal Untuk topik dalam bidang penglihatan mesin seperti pengesanan sasaran, pemisahan dan penjejakan imej mentah, anda mungkin perlu memuat turun video dan anotasi asal. Jika ini diperlukan, penyelidikan perlu diterangkan dengan jelas dalam aplikasi set data. Selain itu, fail anotasi perlu dihuraikan dengan sendirinya.
Model ramalan tingkah laku dan trajektori: ParkPredict+
Sebagai contoh aplikasi, dalam kertas kerja IEEE ITSC 2022 "ParkPredict+: Niat Pelbagai Mod dan Ramalan Gerakan untuk Kenderaan dengan Tempat Letak Kereta CNN dan Transformer", pasukan penyelidik menggunakan set data ini untuk meramalkan niat (Niat) dan trajektori (Trajektori) kenderaan di tempat letak kereta berdasarkan seni bina CNN dan Transformer.
Pasukan menggunakan model CNN untuk meramalkan kebarangkalian pengedaran niat kenderaan (Intent) dengan membina imej semantik. Model ini hanya perlu membina maklumat persekitaran tempatan kenderaan, dan boleh terus menukar bilangan niat yang tersedia berdasarkan persekitaran semasa.
Pasukan menambah baik model Transformer dan memberikan hasil ramalan niat, sejarah pergerakan kenderaan dan peta semantik persekitaran sekitar sebagai input kepada mencapai pelbagai modal niat dan ramalan tingkah laku.
Ringkasan
- Sebagai set data berketepatan tinggi pertama untuk senario tempat letak kereta, set data Dragon Lake Parking (DLP) boleh mencapai pengiktirafan dan penjejakan sasaran berskala besar, terbiar Penyelidikan mengenai pengesanan ruang letak kereta, tingkah laku kenderaan dan pejalan kaki serta ramalan trajektori, pembelajaran tiruan, dsb. menyediakan data dan sokongan API
- Dengan menggunakan seni bina CNN dan Transformer, ParkPredict + gelagat model dalam senario tempat letak kereta Selain itu untuk menunjukkan keupayaan yang baik dalam ramalan trajektori
- Set data Dragon Lake Parking (DLP) dibuka untuk percubaan dan aplikasi Anda boleh melawati halaman utama set data di https://sites.google. com /berkeley.edu/dlp-dataset Ketahui lebih lanjut (jika anda tidak boleh mengakses, anda boleh mencuba halaman alternatif https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 )
Atas ialah kandungan terperinci Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Anotasi teks ialah kerja label atau teg yang sepadan dengan kandungan tertentu dalam teks. Tujuan utamanya adalah untuk memberikan maklumat tambahan kepada teks untuk analisis dan pemprosesan yang lebih mendalam, terutamanya dalam bidang kecerdasan buatan. Anotasi teks adalah penting untuk tugas pembelajaran mesin yang diawasi dalam aplikasi kecerdasan buatan. Ia digunakan untuk melatih model AI untuk membantu memahami maklumat teks bahasa semula jadi dengan lebih tepat dan meningkatkan prestasi tugasan seperti klasifikasi teks, analisis sentimen dan terjemahan bahasa. Melalui anotasi teks, kami boleh mengajar model AI untuk mengenali entiti dalam teks, memahami konteks dan membuat ramalan yang tepat apabila data baharu yang serupa muncul. Artikel ini terutamanya mengesyorkan beberapa alat anotasi teks sumber terbuka yang lebih baik. 1.LabelStudiohttps://github.com/Hu

Anotasi imej ialah proses mengaitkan label atau maklumat deskriptif dengan imej untuk memberi makna dan penjelasan yang lebih mendalam kepada kandungan imej. Proses ini penting untuk pembelajaran mesin, yang membantu melatih model penglihatan untuk mengenal pasti elemen individu dalam imej dengan lebih tepat. Dengan menambahkan anotasi pada imej, komputer boleh memahami semantik dan konteks di sebalik imej, dengan itu meningkatkan keupayaan untuk memahami dan menganalisis kandungan imej. Anotasi imej mempunyai pelbagai aplikasi, meliputi banyak bidang, seperti penglihatan komputer, pemprosesan bahasa semula jadi dan model penglihatan graf Ia mempunyai pelbagai aplikasi, seperti membantu kenderaan dalam mengenal pasti halangan di jalan raya, dan membantu dalam proses. pengesanan dan diagnosis penyakit melalui pengecaman imej perubatan. Artikel ini terutamanya mengesyorkan beberapa alat anotasi imej sumber terbuka dan percuma yang lebih baik. 1.Makesen

DDREASE ialah alat untuk memulihkan data daripada fail atau peranti sekat seperti cakera keras, SSD, cakera RAM, CD, DVD dan peranti storan USB. Ia menyalin data dari satu peranti blok ke peranti lain, meninggalkan blok data yang rosak dan hanya memindahkan blok data yang baik. ddreasue ialah alat pemulihan yang berkuasa yang automatik sepenuhnya kerana ia tidak memerlukan sebarang gangguan semasa operasi pemulihan. Selain itu, terima kasih kepada fail peta ddasue, ia boleh dihentikan dan disambung semula pada bila-bila masa. Ciri-ciri utama lain DDREASE adalah seperti berikut: Ia tidak menimpa data yang dipulihkan tetapi mengisi jurang sekiranya pemulihan berulang. Walau bagaimanapun, ia boleh dipotong jika alat itu diarahkan untuk melakukannya secara eksplisit. Pulihkan data daripada berbilang fail atau blok kepada satu

0. Apakah fungsi artikel ini? Kami mencadangkan DepthFM: model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens. Mari kita baca karya ini bersama-sama ~ 1. Tajuk maklumat kertas: DepthFM: FastMonocularDepthEstimationwithFlowMatching Pengarang: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Menghadapi ketinggalan, sambungan data mudah alih perlahan pada iPhone? Biasanya, kekuatan internet selular pada telefon anda bergantung pada beberapa faktor seperti rantau, jenis rangkaian selular, jenis perayauan, dsb. Terdapat beberapa perkara yang boleh anda lakukan untuk mendapatkan sambungan Internet selular yang lebih pantas dan boleh dipercayai. Betulkan 1 – Paksa Mulakan Semula iPhone Kadangkala, paksa memulakan semula peranti anda hanya menetapkan semula banyak perkara, termasuk sambungan selular. Langkah 1 – Hanya tekan kekunci naikkan kelantangan sekali dan lepaskan. Seterusnya, tekan kekunci Turun Kelantangan dan lepaskannya semula. Langkah 2 - Bahagian seterusnya proses adalah untuk menahan butang di sebelah kanan. Biarkan iPhone selesai dimulakan semula. Dayakan data selular dan semak kelajuan rangkaian. Semak semula Betulkan 2 – Tukar mod data Walaupun 5G menawarkan kelajuan rangkaian yang lebih baik, ia berfungsi lebih baik apabila isyarat lemah

Teknologi pengesanan dan pengecaman muka adalah teknologi yang agak matang dan digunakan secara meluas. Pada masa ini, bahasa aplikasi Internet yang paling banyak digunakan ialah JS Melaksanakan pengesanan muka dan pengecaman pada bahagian hadapan Web mempunyai kelebihan dan kekurangan berbanding dengan pengecaman muka bahagian belakang. Kelebihan termasuk mengurangkan interaksi rangkaian dan pengecaman masa nyata, yang sangat memendekkan masa menunggu pengguna dan meningkatkan pengalaman pengguna termasuk: terhad oleh saiz model, ketepatannya juga terhad. Bagaimana untuk menggunakan js untuk melaksanakan pengesanan muka di web? Untuk melaksanakan pengecaman muka di Web, anda perlu biasa dengan bahasa dan teknologi pengaturcaraan yang berkaitan, seperti JavaScript, HTML, CSS, WebRTC, dll. Pada masa yang sama, anda juga perlu menguasai visi komputer yang berkaitan dan teknologi kecerdasan buatan. Perlu diingat bahawa kerana reka bentuk bahagian Web

Saya menangis hingga mati. Dunia sedang membina model besar. Data di Internet tidak mencukupi. Model latihan kelihatan seperti "The Hunger Games", dan penyelidik AI di seluruh dunia bimbang tentang cara memberi makan data ini kepada pemakan yang rakus. Masalah ini amat ketara dalam tugas berbilang modal. Pada masa mereka mengalami kerugian, pasukan pemula dari Jabatan Universiti Renmin China menggunakan model baharu mereka sendiri untuk menjadi yang pertama di China untuk menjadikan "suapan data yang dijana model itu sendiri" menjadi kenyataan. Selain itu, ia merupakan pendekatan serampang dua mata dari segi pemahaman dan sisi penjanaan Kedua-dua pihak boleh menjana data baharu berbilang modal yang berkualiti tinggi dan memberikan maklum balas data kepada model itu sendiri. Apakah model? Awaker 1.0, model berbilang modal besar yang baru sahaja muncul di Forum Zhongguancun. Siapa pasukan itu? Enjin Sophon. Diasaskan oleh Gao Yizhao, pelajar kedoktoran di Sekolah Kecerdasan Buatan Hillhouse Universiti Renmin.
