Apakah yang perlu saya lakukan jika AI tidak dapat memahami 'dia, dia, itu'? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.-AI-php.cn

Jadual Kandungan

Kata nama penutup membolehkan AI "melihat gambar untuk mencari objek"

Ketepatan pengesanan sasaran meningkat sebanyak 10.9%

Rumah

Apakah yang perlu saya lakukan jika AI tidak dapat memahami 'dia, dia, itu'? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 07:46 PM

ai Model kata kerja

Apabila memberi arahan kepada AI, adakah anda sentiasa merasakan bahawa berkomunikasi dengan orang lain adalah berbeza?

Ya, walaupun AI boleh memahami beberapa arahan khusus manusia, seperti:

Bantu alihkan kerusi dari restoran.

Tetapi jika ia digantikan dengan arahan yang samar-samar dengan hanya kata ganti nama (dia/dia/it/this/that/thing...) dan kata kerja, AI akan keliru:

Bantu cari seseorang yang boleh melangkah dalam sesuatu.

Kini, sesetengah penyelidik akhirnya menghasilkan cara baharu untuk menanganinya: tidakkah cukup untuk membiarkan AI belajar memahami kata kerja?

Kata kerja itu sendiri terikat kepada beberapa kata nama tertentu Sebagai contoh, tindakan "menebar mentega" tidak boleh dipisahkan daripada kata nama seperti "pisau" dan "garpu".

Anda hanya perlu memadankannya. Tiada perintah kata nama seperti "pisau dan garpu" diperlukan dan AI boleh mencari objek sasaran dengan tepat:

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Pada masa ini, Kertas kerja ini telah dimasukkan secara rasmi dalam NeurIPS 2022, dan model yang berkaitan juga telah menjadi sumber terbuka:

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Jadi bagaimanakah ia melatih AI untuk memahami kata kerja?

Kata nama penutup membolehkan AI "melihat gambar untuk mencari objek"

Kertas itu mencadangkan rangka kerja yang dipanggil TOIST.

TOIST ialah singkatan kepada "Task Oriented Instance Segmentation Transformer", yang merupakan penyelesaian pembahagian tika baharu berdasarkan Transformer.

Segmentasi contoh adalah berbeza daripada "pemotongan imej penuh" segmentasi semantik Ia juga mempunyai ciri pengesanan sasaran Sebagai contoh, gambar berikut menggunakan kata nama "kereta hatchback" untuk mencari secara langsung objek yang sepadan. :

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Sebelum ini, model segmentasi contoh biasanya dibahagikan kepada "dua langkah", langkah pertama adalah untuk mengesan sasaran yang mungkin, dan langkah kedua ialah untuk mengisih sasaran yang mungkin, ramalkan hasil yang paling mungkin.

Tetapi tidak seperti pendekatan ini, rangka kerja TOIST secara langsung menggunakan keseluruhan seni bina Transformer, di mana mekanisme perhatian kendiri dalam penyahkod boleh mewujudkan hubungan keutamaan antara sasaran calon.

Rangka kerja TOIST dibahagikan kepada tiga bahagian.

Antaranya, pengekod berbilang modal (bahagian coklat) bertanggungjawab untuk mengekstrak penanda ciri, dan pengekod Transformer (bahagian hijau) bertanggungjawab untuk mengagregatkan ciri dua modaliti dan berdasarkan penyahkod Transformer ( bahagian biru) mekanisme perhatian untuk meramalkan sasaran yang paling sesuai.

Seterusnya, kertas kerja mencadangkan kaedah penyulingan kata nama-kata ganti nama baharu (penyulingan kata ganti nama diri) untuk melatih model tersebut.

Secara khusus, berdasarkan rangka kerja penyulingan pengetahuan (model guru-pelajar di atas), AI dilatih untuk "meneka" prototaip kata nama berdasarkan konteks dalam cara pembelajaran tanpa pengawasan.

Sebagai contoh, tugas pembahagian contoh asal ialah "menggali lubang dengan papan selaju", tetapi apabila melatih model, kata nama "papan luncur" digantikan dengan kata ganti nama "sesuatu":

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Dengan cara ini, AI boleh meneka kata nama yang betul daripada udara nipis walaupun ia tidak mengetahui kata nama itu, dan membahagikan sasaran yang betul dalam gambar:

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Bagaimanakah prestasi kesan segmentasi ini dalam kes sebenar?

Ketepatan pengesanan sasaran meningkat sebanyak 10.9%

Kertas tersebut menguji TOIST pada set data tugasan berskala besar COCO-Tasks.

Kaedah penilaian menggunakan mAP (min Purata Ketepatan), yang biasa dalam tugas visual seperti pengesanan sasaran.

Ringkasnya, TOIST berprestasi lebih baik daripada model pengesanan contoh dan model SOTA model pengesanan sasaran sebelumnya, dan dengan "versi dipertingkatkan" TOIST ditambah dengan kaedah penyulingan kata ganti nama, prestasinya lebih baik daripada TOIST.

Antaranya, dalam tugas pengesanan sasaran, berbanding dengan Yolo+GGNN terbaik semasa, peta ketepatan kotak keputusan TOIST "versi dipertingkatkan" meningkat sebanyak 10.9%. daripada Mask -RCNN+GGNN ialah 6.6% lebih tinggi.

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Bagi kaedah penyulingan kata ganti nama diri yang dicadangkan, berbanding dengan versi asal TOIST, ketepatan tugas pembahagian contoh telah dipertingkatkan masing-masing sebanyak 2.8% dan 3.8% .

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Dari segi prestasi kes, kesan model juga sangat hampir dengan nilai sebenar segmentasi sebenar.

Sebagai contoh, dalam Rajah (d), algoritma itu juga mengiktiraf bahawa penutup botol bir boleh dibuka menggunakan jadual Ia boleh dikatakan bahawa keupayaan pemahaman adalah sempurna:

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Untuk melakukan ini Berkenaan dengan tujuan asal penyelidikan, penulis menjawab:

Makmal kami sebenarnya bertanggungjawab untuk menyelidik robot, tetapi dalam penyelidikan harian, kami mendapati bahawa pengguna kadangkala lebih cenderung untuk menerangkan "keperluan" kepada robot dan bukannya memberitahu robot apa yang perlu dilakukan.

Dalam erti kata lain, algoritma AI digunakan untuk membuat robot "berfikir satu langkah lagi" dan bukannya hanya menjadi pembantu yang mengikut perintah.

Pengenalan kepada pengarang

Pengarang kertas kerja ini berasal dari Institut Penyelidikan Industri Pintar Universiti Tsinghua (AIR), Universiti Peking dan Institut Penyelidikan Intel Zhang Yaqin, Dekan AIR daripada pengarang.

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Li Pengfei, pengarang pertama kertas kerja, ialah calon kedoktoran di Institut Industri Pintar Universiti Tsinghua. Beliau lulus dari Akademi Sains China ijazah sarjana muda minat penyelidikannya termasuk pemanduan autonomi dan penglihatan komputer.

Pengarang yang sepadan, Zhao Hao, ialah Penolong Profesor yang akan datang di Institut Penyelidikan Industri Pintar Universiti Tsinghua, seorang saintis penyelidikan di Institut Penyelidikan Intel China dan rakan pasca doktoral bersama di Peking Beliau lulus dari Universiti Tsinghua dalam jurusan kejuruteraan elektronik, minat penyelidikan adalah ke arah robotik dan penglihatan komputer.

Apakah yang perlu saya lakukan jika AI tidak dapat memahami dia, dia, itu? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.

Alamat kertas: https://arxiv.org/abs/2210.10775

Alamat projek: https://github.com/AIR-DISCOVER/ TOIST

Atas ialah kandungan terperinci Apakah yang perlu saya lakukan jika AI tidak dapat memahami 'dia, dia, itu'? Kata kerja telah menjadi kejayaan baru Apabila robot mendengar mentega, ia tahu cara mengambil pisau dan garpu.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Akan R.E.P.O. Ada Crossplay?

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7546

Tutorial CakePHP

1381

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Petua Konfigurasi Firewall Pelayan Mel Debian Apr 13, 2025 am 11:42 AM

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Kaedah pemasangan sijil SSL Server Server Debian Apr 13, 2025 am 11:39 AM

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Baris arahan shutdown centos Apr 14, 2025 pm 09:12 PM

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Sony mengesahkan kemungkinan menggunakan GPU khas di PS5 Pro untuk membangunkan AI dengan AMD Apr 13, 2025 pm 11:45 PM

Mark Cerny, Ketua Arkitek SonyinterActiveEntainment (SIE, Sony Interactive Entertainment), telah mengeluarkan lebih banyak butiran perkakasan dari PlayStation5Pro hos generasi akan datang (PS5Pro), termasuk GPU seni bina AMDRDNA2.x yang dinamakan, dan Kod Arsitektur AMDRDNA2.x yang dinamakan. Tumpuan peningkatan prestasi PS5Pro masih pada tiga tiang, termasuk GPU yang lebih kuat, jejak sinar maju dan fungsi resolusi super PSSR yang berkuasa AI. GPU mengamalkan seni bina AmdrDNA2 yang disesuaikan, yang Sony menamakan RDNA2.x, dan ia mempunyai beberapa seni bina RDNA3.

Apakah kaedah sandaran untuk gitlab di centos Apr 14, 2025 pm 05:33 PM

Dasar sandaran dan pemulihan Gitlab di bawah sistem CentOS untuk memastikan keselamatan data dan pemulihan, Gitlab pada CentOS menyediakan pelbagai kaedah sandaran. Artikel ini akan memperkenalkan beberapa kaedah sandaran biasa, parameter konfigurasi dan proses pemulihan secara terperinci untuk membantu anda menubuhkan strategi sandaran dan pemulihan GitLab lengkap. 1. Backup Manual Gunakan Gitlab-Rakegitlab: Backup: Buat Perintah untuk Melaksanakan Backup Manual. Perintah ini menyokong maklumat utama seperti repositori Gitlab, pangkalan data, pengguna, kumpulan pengguna, kunci, dan kebenaran. Fail sandaran lalai disimpan dalam direktori/var/opt/gitlab/sandaran. Anda boleh mengubah suai /etc /gitlab

Apakah kaedah penalaan prestasi zookeeper di CentOS Apr 14, 2025 pm 03:18 PM

Penalaan prestasi zookeeper pada centOs boleh bermula dari pelbagai aspek, termasuk konfigurasi perkakasan, pengoptimuman sistem operasi, pelarasan parameter konfigurasi, pemantauan dan penyelenggaraan, dan lain -lain. Memori yang cukup: memperuntukkan sumber memori yang cukup untuk zookeeper untuk mengelakkan cakera kerap membaca dan menulis. CPU multi-teras: Gunakan CPU multi-teras untuk memastikan bahawa zookeeper dapat memprosesnya selari.

Akhirnya berubah! Fungsi carian Microsoft Windows akan membawa kemas kini baru Apr 13, 2025 pm 11:42 PM

Penambahbaikan Microsoft ke fungsi carian Windows telah diuji pada beberapa saluran Windows Insider di EU. Sebelum ini, fungsi carian Windows bersepadu dikritik oleh pengguna dan mempunyai pengalaman yang buruk. Kemas kini ini membahagikan fungsi carian ke dalam dua bahagian: carian tempatan dan carian web berasaskan Bing untuk meningkatkan pengalaman pengguna. Versi baru antara muka carian melakukan carian fail tempatan secara lalai. Jika anda perlu mencari dalam talian, anda perlu mengklik tab "Microsoft Bingwebsearch" untuk menukar. Selepas bertukar, bar carian akan memaparkan "Microsoft Bingwebsearch:", di mana pengguna boleh memasukkan kata kunci. Langkah ini berkesan mengelakkan pencampuran hasil carian tempatan dengan hasil carian Bing

Cara Melatih Model Pytorch di CentOs Apr 14, 2025 pm 03:03 PM

Latihan yang cekap model pytorch pada sistem CentOS memerlukan langkah -langkah, dan artikel ini akan memberikan panduan terperinci. 1. Penyediaan Persekitaran: Pemasangan Python dan Ketergantungan: Sistem CentOS biasanya mempamerkan python, tetapi versi mungkin lebih tua. Adalah disyorkan untuk menggunakan YUM atau DNF untuk memasang Python 3 dan menaik taraf PIP: Sudoyumupdatepython3 (atau SudodnfupdatePython3), pip3install-upgradepip. CUDA dan CUDNN (Percepatan GPU): Jika anda menggunakan Nvidiagpu, anda perlu memasang Cudatool

See all articles