Rumah Peranti teknologi AI Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan 'Prompt' terus pada imej

Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan 'Prompt' terus pada imej

Nov 24, 2023 am 08:10 AM
bermula penglihatan mesin

Selepas popular Grounded SAM, IDEA Research Team🎜🎜 dengan kerja baharu: gesaan visual baharu Visual Prompt) modelT -Re 🎜#x, kenali gambar dengan gambar, sedia untuk digunakan terus dari kotak, # 🎜🎜#Buka dunia baharu ujian episod terbuka! Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan Prompt terus pada imejTarik kotak, semak, lengkapkan! Pada persidangan IDEA 2023 yang baru sahaja tamat, Shen Xiangyang, pengerusi pengasas Institut Penyelidikan IDEA dan ahli akademik asing Akademi Kejuruteraan Kebangsaan, menunjukkan pengalaman pengesanan sasaran baharu berdasarkan isyarat visual dan mengeluarkan makmal model (taman permainan) baharu model isyarat visual T-Rex ), Prompt Visual Interaktif (iVP), mencetuskan gelombang klimaks percubaan di tapak.

Pada iVP, pengguna secara peribadi boleh membuka kunci pengalaman menggesa "gambar bernilai seribu perkataan": tandakan objek yang menarik pada gambar dan berikan model dengan contoh Visual, model kemudian mengesan semua kejadian serupa dalam imej sasaran. Keseluruhan proses adalah interaktif dan boleh diselesaikan dengan mudah hanya dalam beberapa langkah. Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan Prompt terus pada imej

The Grounded SAM (Grounding DINO + SAM) yang dikeluarkan oleh IDEA Research Institute pada bulan April telah menjadi sangat popular di Github dan telah mengumpul 11K bintang setakat ini. Berbeza daripada Grounded SAM, yang hanya menyokong gesaan teks, model T-Rex yang dikeluarkan kali ini menyediakan fungsi gesaan visual yang memfokuskan pada mencipta interaksi yang kuat. Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan Prompt terus pada imej

T-Rex mempunyai ciri luar biasa yang kukuh dan boleh mengesan objek yang model tidak pernah lihat semasa fasa latihan tanpa memerlukan latihan semula atau penalaan halus. Model ini bukan sahaja boleh digunakan pada semua tugas pengesanan termasuk mengira, tetapi juga menyediakan penyelesaian baharu untuk senario anotasi interaktif pintar. Pasukan itu mendedahkan bahawa pembangunan teknologi segera visual diperoleh daripada pemerhatian titik kesakitan dalam adegan sebenar. Sesetengah rakan kongsi berharap untuk menggunakan model visual untuk mengira bilangan barangan pada trak Walau bagaimanapun, model itu tidak boleh mengenal pasti setiap barangan secara individu melalui gesaan teks sahaja. Sebabnya, objek dalam adegan industri jarang berlaku dalam kehidupan seharian dan sukar untuk digambarkan dengan kata-kata. Dalam kes ini, isyarat visual jelas merupakan pendekatan yang lebih cekap. Pada masa yang sama, maklum balas visual intuitif dan interaktiviti yang kuat juga membantu meningkatkan kecekapan dan ketepatan pengesanan.

Berdasarkan cerapan tentang keperluan penggunaan sebenar, pasukan mereka bentuk T-Rex sebagai model yang boleh menerima pelbagai isyarat visual dan mempunyai keupayaan untuk menggesa merentas imej. Sebagai tambahan kepada mod gesaan satu pusingan yang paling asas, model semasa juga menyokong tiga mod lanjutan berikut. mod positif: Sesuai untuk senario di mana isyarat visual tidak cukup tepat dan mengakibatkan pengesanan terlepas

Mod Contoh Positif + Negatif: Sesuai untuk senario di mana isyarat visual adalah samar-samar dan menghasilkan pengesanan palsu

# 🎜🎜#Mod Gambar silang: Sesuai untuk mengesan imej lain melalui gesaan imej rujukan tunggal Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan Prompt terus pada imej

Dalam laporan teknikal yang dikeluarkan pada masa yang sama, pasukan meringkaskan empat ciri utama Model T-Rex: #🎜 🎜#

Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan Prompt terus pada imejSet terbuka: tidak dihadkan oleh kategori yang telah ditetapkan, dengan keupayaan untuk mengesan semua objek#🎜🎜 🎜🎜#Petua Visual: Gunakan contoh Visual menentukan sasaran pengesanan, mengatasi masalah objek yang jarang ditemui dan kompleks sukar untuk dinyatakan sepenuhnya dalam perkataan, dan meningkatkan kecekapan segera

    Maklum balas visual intuitif: Berikan maklum balas visual intuitif seperti sebagai kotak sempadan untuk membantu pengguna menilai hasil pengesanan dengan cekap# 🎜🎜#
  • Interaktiviti: Pengguna boleh dengan mudah mengambil bahagian dalam proses pengesanan dan membetulkan keputusan model
  • Pasukan penyelidik menunjukkan bahawa dalam senario pengesanan sasaran, penambahan isyarat visual boleh menggantikan Beberapa pepijat dalam gesaan teks. Pada masa hadapan, gabungan kedua-duanya akan menyerlahkan lagi potensi teknologi CV dalam bidang yang lebih menegak.
  • Untuk butiran teknikal model T-Rex, sila rujuk laporan teknikal yang dikeluarkan pada masa yang sama.

Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan Prompt terus pada imej

    iVP
  • Model Lab: ##🎜🎜🎜 //deepdataspace.com/playground/ivp
  • Pautan Github: trex-counting.github.io

    Karya ini datang dari Pusat Penyelidikan Visi Komputer dan Robotik Institut IDEA. Model pengesanan sasaran sumber terbuka DINO sebelum ini ialah model DETR pertama yang mencapai tempat pertama dalam kedudukan pengesanan sasaran COCO pengesan sifar pukulan Grounding DINO pada Github dan DINO juga boleh mengesan dan membahagikan sebarang objek hasil kerja pasukan ini

Atas ialah kandungan terperinci Teknologi baharu dilancarkan, Institut Penyelidikan IDEA mengeluarkan model T-Rex, membenarkan pengguna memilih gesaan 'Prompt' terus pada imej. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tutorial Model Penyebaran Bernilai Masa Anda, dari Universiti Purdue Tutorial Model Penyebaran Bernilai Masa Anda, dari Universiti Purdue Apr 07, 2024 am 09:01 AM

Penyebaran bukan sahaja boleh meniru lebih baik, tetapi juga "mencipta". Model resapan (DiffusionModel) ialah model penjanaan imej. Berbanding dengan algoritma yang terkenal seperti GAN dan VAE dalam bidang AI, model resapan mengambil pendekatan yang berbeza. Idea utamanya ialah proses menambah hingar pada imej dan kemudian secara beransur-ansur menolaknya. Cara mengecilkan dan memulihkan imej asal adalah bahagian teras algoritma. Algoritma akhir mampu menghasilkan imej daripada imej bising rawak. Dalam beberapa tahun kebelakangan ini, pertumbuhan luar biasa AI generatif telah membolehkan banyak aplikasi menarik dalam penjanaan teks ke imej, penjanaan video dan banyak lagi. Prinsip asas di sebalik alat generatif ini ialah konsep resapan, mekanisme pensampelan khas yang mengatasi batasan kaedah sebelumnya.

Hasilkan PPT dengan satu klik! Kimi: Biarlah 'pekerja migran PPT' menjadi popular dahulu Hasilkan PPT dengan satu klik! Kimi: Biarlah 'pekerja migran PPT' menjadi popular dahulu Aug 01, 2024 pm 03:28 PM

Kimi: Hanya dalam satu ayat, dalam sepuluh saat sahaja, PPT akan siap. PPT sangat menjengkelkan! Untuk mengadakan mesyuarat, anda perlu mempunyai PPT; untuk menulis laporan mingguan, anda perlu mempunyai PPT untuk membuat pelaburan, anda perlu menunjukkan PPT walaupun anda menuduh seseorang menipu, anda perlu menghantar PPT. Kolej lebih seperti belajar jurusan PPT Anda menonton PPT di dalam kelas dan melakukan PPT selepas kelas. Mungkin, apabila Dennis Austin mencipta PPT 37 tahun lalu, dia tidak menyangka satu hari nanti PPT akan berleluasa. Bercakap tentang pengalaman sukar kami membuat PPT membuatkan kami menitiskan air mata. "Ia mengambil masa tiga bulan untuk membuat PPT lebih daripada 20 muka surat, dan saya menyemaknya berpuluh-puluh kali. Saya rasa ingin muntah apabila saya melihat PPT itu." ialah PPT." Jika anda mengadakan mesyuarat dadakan, anda harus melakukannya

Semua anugerah CVPR 2024 diumumkan! Hampir 10,000 orang menghadiri persidangan itu di luar talian dan seorang penyelidik Cina dari Google memenangi anugerah kertas terbaik Semua anugerah CVPR 2024 diumumkan! Hampir 10,000 orang menghadiri persidangan itu di luar talian dan seorang penyelidik Cina dari Google memenangi anugerah kertas terbaik Jun 20, 2024 pm 05:43 PM

Pada awal pagi 20 Jun, waktu Beijing, CVPR2024, persidangan penglihatan komputer antarabangsa teratas yang diadakan di Seattle, secara rasmi mengumumkan kertas kerja terbaik dan anugerah lain. Pada tahun ini, sebanyak 10 kertas memenangi anugerah, termasuk 2 kertas terbaik dan 2 kertas pelajar terbaik Selain itu, terdapat 2 pencalonan kertas terbaik dan 4 pencalonan kertas pelajar terbaik. Persidangan teratas dalam bidang visi komputer (CV) ialah CVPR, yang menarik sejumlah besar institusi penyelidikan dan universiti setiap tahun. Mengikut statistik, sebanyak 11,532 kertas telah diserahkan tahun ini, 2,719 daripadanya diterima, dengan kadar penerimaan 23.6%. Menurut analisis statistik data CVPR2024 Institut Teknologi Georgia, dari perspektif topik penyelidikan, bilangan kertas terbesar ialah sintesis dan penjanaan imej dan video (Imageandvideosyn

Daripada logam kosong kepada model besar dengan 70 bilion parameter, berikut ialah tutorial dan skrip sedia untuk digunakan Daripada logam kosong kepada model besar dengan 70 bilion parameter, berikut ialah tutorial dan skrip sedia untuk digunakan Jul 24, 2024 pm 08:13 PM

Kami tahu bahawa LLM dilatih pada kelompok komputer berskala besar menggunakan data besar-besaran Tapak ini telah memperkenalkan banyak kaedah dan teknologi yang digunakan untuk membantu dan menambah baik proses latihan LLM. Hari ini, perkara yang ingin kami kongsikan ialah artikel yang mendalami teknologi asas dan memperkenalkan cara menukar sekumpulan "logam kosong" tanpa sistem pengendalian pun menjadi gugusan komputer untuk latihan LLM. Artikel ini datang daripada Imbue, sebuah permulaan AI yang berusaha untuk mencapai kecerdasan am dengan memahami cara mesin berfikir. Sudah tentu, mengubah sekumpulan "logam kosong" tanpa sistem pengendalian menjadi gugusan komputer untuk latihan LLM bukanlah proses yang mudah, penuh dengan penerokaan dan percubaan dan kesilapan, tetapi Imbue akhirnya berjaya melatih LLM dengan 70 bilion parameter proses terkumpul

Lima perisian pengaturcaraan untuk memulakan pembelajaran bahasa C Lima perisian pengaturcaraan untuk memulakan pembelajaran bahasa C Feb 19, 2024 pm 04:51 PM

Sebagai bahasa pengaturcaraan yang digunakan secara meluas, bahasa C merupakan salah satu bahasa asas yang mesti dipelajari bagi mereka yang ingin melibatkan diri dalam pengaturcaraan komputer. Walau bagaimanapun, bagi pemula, mempelajari bahasa pengaturcaraan baharu boleh menjadi sukar, terutamanya disebabkan kekurangan alat pembelajaran dan bahan pengajaran yang berkaitan. Dalam artikel ini, saya akan memperkenalkan lima perisian pengaturcaraan untuk membantu pemula memulakan bahasa C dan membantu anda bermula dengan cepat. Perisian pengaturcaraan pertama ialah Code::Blocks. Code::Blocks ialah persekitaran pembangunan bersepadu sumber terbuka (IDE) percuma untuk

Panduan Pemasangan PyCharm Edisi Komuniti: Kuasai semua langkah dengan cepat Panduan Pemasangan PyCharm Edisi Komuniti: Kuasai semua langkah dengan cepat Jan 27, 2024 am 09:10 AM

Mula Pantas dengan PyCharm Edisi Komuniti: Tutorial Pemasangan Terperinci Analisis Penuh Pengenalan: PyCharm ialah persekitaran pembangunan bersepadu (IDE) Python yang berkuasa yang menyediakan set alat yang komprehensif untuk membantu pembangun menulis kod Python dengan lebih cekap. Artikel ini akan memperkenalkan secara terperinci cara memasang Edisi Komuniti PyCharm dan menyediakan contoh kod khusus untuk membantu pemula bermula dengan cepat. Langkah 1: Muat turun dan pasang Edisi Komuniti PyCharm Untuk menggunakan PyCharm, anda perlu memuat turunnya dari tapak web rasminya terlebih dahulu

AI sedang digunakan |. AI mencipta vlog kehidupan seorang gadis yang tinggal bersendirian, yang menerima berpuluh ribu suka dalam masa 3 hari AI sedang digunakan |. AI mencipta vlog kehidupan seorang gadis yang tinggal bersendirian, yang menerima berpuluh ribu suka dalam masa 3 hari Aug 07, 2024 pm 10:53 PM

Editor Laporan Kuasa Mesin: Yang Wen Gelombang kecerdasan buatan yang diwakili oleh model besar dan AIGC telah mengubah cara kita hidup dan bekerja secara senyap-senyap, tetapi kebanyakan orang masih tidak tahu cara menggunakannya. Oleh itu, kami telah melancarkan lajur "AI dalam Penggunaan" untuk memperkenalkan secara terperinci cara menggunakan AI melalui kes penggunaan kecerdasan buatan yang intuitif, menarik dan padat serta merangsang pemikiran semua orang. Kami juga mengalu-alukan pembaca untuk menyerahkan kes penggunaan yang inovatif dan praktikal. Pautan video: https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ Baru-baru ini, vlog kehidupan seorang gadis yang tinggal bersendirian menjadi popular di Xiaohongshu. Animasi gaya ilustrasi, ditambah dengan beberapa perkataan penyembuhan, boleh diambil dengan mudah dalam beberapa hari sahaja.

Mesti dibaca untuk pemula teknikal: Analisis tahap kesukaran bahasa C dan Python Mesti dibaca untuk pemula teknikal: Analisis tahap kesukaran bahasa C dan Python Mar 22, 2024 am 10:21 AM

Tajuk: Wajib dibaca untuk pemula teknikal: Analisis kesukaran bahasa C dan Python, memerlukan contoh kod khusus Dalam era digital hari ini, teknologi pengaturcaraan telah menjadi keupayaan yang semakin penting. Sama ada anda ingin bekerja dalam bidang seperti pembangunan perisian, analisis data, kecerdasan buatan, atau hanya belajar pengaturcaraan kerana minat, memilih bahasa pengaturcaraan yang sesuai ialah langkah pertama. Di antara banyak bahasa pengaturcaraan, bahasa C dan Python adalah dua bahasa pengaturcaraan yang digunakan secara meluas, masing-masing mempunyai ciri tersendiri. Artikel ini akan menganalisis tahap kesukaran bahasa C dan Python

See all articles