


Prompt tidak lagi diperlukan Anda boleh memainkan sistem dialog berbilang modal hanya dengan iChat ada di sini!
Xi Xiaoyao Technology Talk Original
Pengarang |. IQ telah menurun di mana-mana
Baru-baru ini, banyak pasukan telah mencipta semula berdasarkan ChatGPT yang mesra pengguna, dan banyak daripada mereka telah mencapai keputusan yang cemerlang . Kerja InternChat menekankan kemesraan pengguna dengan berinteraksi dengan chatbot dengan cara yang melampaui bahasa (kursor dan gerak isyarat) untuk tugasan pelbagai mod. Nama InternChat juga menarik Ia adalah singkatan untuk interaksi, nonverbal dan chatbots Ia boleh dirujuk sebagai iChat. Tidak seperti sistem interaktif sedia ada yang bergantung pada bahasa tulen, iChat meningkatkan kecekapan komunikasi antara pengguna dan chatbots dengan menambahkan arahan menunjuk. Selain itu, penulis juga menyediakan model bahasa visual besar yang dipanggil Husky yang boleh melakukan penangkapan dan menjawab soalan visual, dan juga boleh menarik perhatian GPT-3.5-turbo dengan hanya 7 bilion parameter.
Namun, kerana populariti laman web Demo, pasukan secara rasmi menutup halaman pengalaman buat sementara waktu Mari kita fahami kandungan karya ini melalui video di bawah~
Tajuk tesis: InternChat: Menyelesaikan Tugasan Berpusatkan Visi dengan Berinteraksi dengan Chatbots Melangkaui Bahasa
https://www.php.cn/link/7c9966afcc510cf5a40621d1d92bdaf1
https://www.php.cn/link/e355ad06c5a89f911fbb0aff2de52435
https://www.php.cn /link/ 2d13d901966a8eaa7f9c943eba6a540b
- Tugas bertumpu penglihatan: Untuk membolehkan komputer memahami perkara yang mereka lihat di dunia dan bertindak balas dengan sewajarnya .
- Komunikasi dalam bentuk arahan bukan lisan: pergerakan menunjuk seperti kursor dan isyarat tangan.
- Unit persepsi yang memproses arahan menunjuk pada imej atau video
- Mempunyai kawalan tambahan yang boleh menghuraikan bahasa dengan tepat arahan LLM pengawal mekanisme;
- Kit alat dunia terbuka yang menyepadukan pelbagai model dalam talian HuggingFace, model peribadi terlatih pengguna dan aplikasi lain (seperti kalkulator, enjin carian).
- Interaksi asas;
- Interaksi berpandukan bahasa;
- Oleh itu, seperti yang ditunjukkan dalam Rajah 2, apabila sistem bahasa tulen tidak dapat menyelesaikan tugas, sistem masih boleh berjaya melaksanakan tugas interaktif yang kompleks.
▲Rajah 2 Menunjuk kepada kelebihan sistem interaktif dipacu bahasa
Eksperimen
Pertama sekali, mari kita lihat gabungan bahasa dan bukan bahasa pada masa yang sama Perintah untuk meningkatkan komunikasi dengan sistem interaktif. Untuk menunjukkan kelebihan model hibrid ini berbanding arahan bahasa tulen, pasukan penyelidik menjalankan tinjauan pengguna. Peserta berbual dengan Visual ChatGPT dan iChat dan memberi maklum balas tentang pengalaman mereka menggunakannya. Keputusan dalam Jadual 1 dan 2 menunjukkan bahawa iChat lebih cekap dan mesra pengguna daripada Visual ChatGPT.
▲Jadual 1 Tinjauan pengguna tentang “Alih keluar sesuatu”
▲Jadual 2 “Ganti dengan sesuatu” "Sesuatu " tinjauan pengguna
Ringkasan
Walau bagaimanapun, sistem masih mempunyai beberapa batasan, termasuk:
Kecekapan iChat adalah sangat tinggi Tahap bergantung kepada kualiti dan ketepatan model sumber terbuka asasnya. Walau bagaimanapun, model ini mungkin mempunyai had atau berat sebelah yang menjejaskan prestasi iChat.- Apabila interaksi pengguna menjadi lebih kompleks atau bilangan kejadian meningkat, sistem perlu mengekalkan ketepatan dan masa tindak balas, yang boleh mencabar untuk iChat.
- Selain itu, terdapat kekurangan kerjasama yang boleh dipelajari antara visi semasa dan model berasaskan bahasa, seperti kekurangan fungsi yang boleh dilaraskan oleh data arahan.
- iChat mungkin mengalami kesukaran untuk bertindak balas terhadap situasi baru atau luar biasa di luar data latihan, menyebabkan prestasi terjejas.
- Mencapai penyepaduan yang lancar merentas peranti dan platform yang berbeza boleh menjadi mencabar kerana keupayaan perkakasan yang berbeza-beza, pengehadan perisian dan keperluan kebolehaksesan.
- Pada senarai pelan yang disenaraikan di laman utama projek, masih terdapat beberapa matlamat yang masih belum tercapai Antaranya ialah interaksi Cina yang mesti dialami oleh editor setiap kali pada sistem dialog baharu. Pada masa ini, Sistem ini mungkin masih tidak menyokong bahasa Cina buat masa ini, tetapi nampaknya tiada penyelesaian Memandangkan kebanyakan set data berbilang modal adalah berdasarkan bahasa Inggeris, terjemahan Bahasa Inggeris-Cina membazirkan sumber dalam talian dan masa pemprosesan bahawa jalan menuju Chinaisasi masih akan mengambil sedikit masa.
Atas ialah kandungan terperinci Prompt tidak lagi diperlukan Anda boleh memainkan sistem dialog berbilang modal hanya dengan iChat ada di sini!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Bagaimana untuk mendapatkan item menggunakan arahan dalam Terraria? 1. Apakah arahan untuk memberikan item dalam Terraria Dalam permainan Terraria, memberi arahan kepada item adalah fungsi yang sangat praktikal. Melalui arahan ini, pemain boleh terus mendapatkan barangan yang mereka perlukan tanpa perlu melawan raksasa atau teleport ke lokasi tertentu. Ini boleh menjimatkan masa dengan banyak, meningkatkan kecekapan permainan dan membolehkan pemain memberi lebih tumpuan kepada meneroka dan membina dunia. Secara keseluruhan, ciri ini menjadikan pengalaman permainan lebih lancar dan menyeronokkan. 2. Cara menggunakan Terraria untuk memberikan arahan item 1. Buka permainan dan masukkan antara muka permainan. 2. Tekan kekunci "Enter" pada papan kekunci untuk membuka tetingkap sembang. 3. Masukkan format arahan dalam tetingkap sembang: "/berikan [nama pemain][ID item][kuantiti item]".

Robot humanoid Ameca telah dinaik taraf kepada generasi kedua! Baru-baru ini, di Persidangan Komunikasi Mudah Alih Sedunia MWC2024, robot Ameca paling canggih di dunia muncul semula. Di sekitar venue, Ameca menarik sejumlah besar penonton. Dengan restu GPT-4, Ameca boleh bertindak balas terhadap pelbagai masalah dalam masa nyata. "Jom kita menari." Apabila ditanya sama ada dia mempunyai emosi, Ameca menjawab dengan beberapa siri mimik muka yang kelihatan sangat hidup. Hanya beberapa hari yang lalu, EngineeredArts, syarikat robotik British di belakang Ameca, baru sahaja menunjukkan hasil pembangunan terkini pasukan itu. Dalam video tersebut, robot Ameca mempunyai keupayaan visual dan boleh melihat serta menerangkan keseluruhan bilik dan objek tertentu. Perkara yang paling menakjubkan ialah dia juga boleh

Hari ini saya ingin berkongsi kerja penyelidikan terbaru dari University of Connecticut yang mencadangkan kaedah untuk menyelaraskan data siri masa dengan model pemprosesan bahasa semula jadi (NLP) yang besar pada ruang terpendam untuk meningkatkan prestasi peramalan siri masa. Kunci kepada kaedah ini ialah menggunakan petunjuk spatial terpendam (prompt) untuk meningkatkan ketepatan ramalan siri masa. Tajuk kertas: S2IP-LLM: SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting Alamat muat turun: https://arxiv.org/pdf/2403.05798v1.pdf 1. Model latar belakang masalah besar

Dalam bidang teknologi automasi perindustrian, terdapat dua titik panas terkini yang sukar diabaikan: kecerdasan buatan (AI) dan Nvidia. Jangan ubah maksud kandungan asal, perhalusi kandungan, tulis semula kandungan, jangan teruskan: “Bukan itu sahaja, kedua-duanya berkait rapat, kerana Nvidia tidak terhad kepada unit pemprosesan grafik asalnya (GPU ), ia sedang mengembangkan GPUnya Teknologi ini meluas ke bidang kembar digital dan berkait rapat dengan teknologi AI yang baru muncul "Baru-baru ini, NVIDIA telah mencapai kerjasama dengan banyak syarikat industri, termasuk syarikat automasi industri terkemuka seperti Aveva, Rockwell Automation, Siemens. dan Schneider Electric, serta Teradyne Robotics dan syarikat MiR dan Universal Robotsnya. Baru-baru ini, Nvidiahascoll

Minggu ini, FigureAI, sebuah syarikat robotik yang dilaburkan oleh OpenAI, Microsoft, Bezos, dan Nvidia, mengumumkan bahawa ia telah menerima hampir $700 juta dalam pembiayaan dan merancang untuk membangunkan robot humanoid yang boleh berjalan secara bebas dalam tahun hadapan. Dan Optimus Prime Tesla telah berulang kali menerima berita baik. Tiada siapa yang meragui bahawa tahun ini akan menjadi tahun apabila robot humanoid meletup. SanctuaryAI, sebuah syarikat robotik yang berpangkalan di Kanada, baru-baru ini mengeluarkan robot humanoid baharu, Phoenix. Pegawai mendakwa bahawa ia boleh menyelesaikan banyak tugas secara autonomi pada kelajuan yang sama seperti manusia. Pheonix, robot pertama di dunia yang boleh menyelesaikan tugas secara autonomi pada kelajuan manusia, boleh mencengkam, menggerakkan dan meletakkan setiap objek secara elegan di sisi kiri dan kanannya dengan perlahan. Ia boleh mengenal pasti objek secara autonomi

Editor Laporan Kuasa Mesin: Wu Xin Versi domestik robot humanoid + pasukan model besar menyelesaikan tugas operasi bahan fleksibel yang kompleks seperti melipat pakaian buat kali pertama. Dengan pelancaran Figure01, yang mengintegrasikan model besar berbilang modal OpenAI, kemajuan berkaitan rakan domestik telah menarik perhatian. Baru semalam, UBTECH, "stok robot humanoid nombor satu" China, mengeluarkan demo pertama robot humanoid WalkerS yang disepadukan secara mendalam dengan model besar Baidu Wenxin, menunjukkan beberapa ciri baharu yang menarik. Kini, WalkerS, diberkati oleh keupayaan model besar Baidu Wenxin, kelihatan seperti ini. Seperti Rajah01, WalkerS tidak bergerak, tetapi berdiri di belakang meja untuk menyelesaikan satu siri tugasan. Ia boleh mengikut perintah manusia dan melipat pakaian

10 robot humanoid berikut sedang membentuk masa depan kita: 1. ASIMO: Dibangunkan oleh Honda, ASIMO ialah salah satu robot humanoid yang paling terkenal. Berdiri setinggi 4 kaki dan seberat 119 paun, ASIMO dilengkapi dengan penderia termaju dan keupayaan kecerdasan buatan yang membolehkannya menavigasi persekitaran yang kompleks dan berinteraksi dengan manusia. Fleksibiliti ASIMO menjadikannya sesuai untuk pelbagai tugas, daripada membantu orang kurang upaya kepada menyampaikan pembentangan di acara. 2. Pepper: Dicipta oleh Softbank Robotics, Pepper bertujuan untuk menjadi teman sosial bagi manusia. Dengan wajah ekspresif dan keupayaan untuk mengenali emosi, Pepper boleh mengambil bahagian dalam perbualan, membantu dalam tetapan runcit, dan juga memberikan sokongan pendidikan. Lada punya

Robot menyapu dan mengemop adalah salah satu perkakas rumah pintar yang paling popular di kalangan pengguna sejak beberapa tahun kebelakangan ini. Kemudahan operasi yang dibawanya, atau bahkan keperluan tanpa operasi, membolehkan orang yang malas membebaskan tangan mereka, membolehkan pengguna "membebaskan" daripada kerja rumah harian dan menghabiskan lebih banyak masa untuk perkara yang mereka sukai Peningkatan kualiti hidup dalam bentuk yang menyamar. Menunggang kegilaan ini, hampir semua jenama perkakas rumah di pasaran membuat robot menyapu dan mengemop mereka sendiri, menjadikan keseluruhan pasaran robot menyapu dan mengemop sangat meriah. Walau bagaimanapun, perkembangan pesat pasaran pasti akan membawa bahaya tersembunyi: banyak pengeluar akan menggunakan taktik laut mesin untuk menduduki lebih banyak bahagian pasaran dengan cepat, menyebabkan banyak produk baru tanpa sebarang titik peningkatan mereka adalah model "matryoshka" Tidak keterlaluan. Walau bagaimanapun, tidak semua robot menyapu dan mengemop
