Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China-AI-php.cn

Jadual Kandungan

Rumah

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

王林

Apr 12, 2023 pm 05:31 PM

ai Model

Artikel ini dicetak semula dengan kebenaran AI New Media Qubit (ID akaun awam: QbitAI Sila hubungi sumber untuk mencetak semula).

Kini tiba masanya untuk bulatan AI bersaing dengan kelajuan tangan.

Tidak, SAM Meta baru sahaja dilancarkan beberapa hari yang lalu, dan pengaturcara domestik telah datang dengan gelombang tindanan buff, termasuk pengesanan sasaran, pembahagian dan penjanaan fungsi AI visual semuanya dalam satu!

Sebagai contoh, berdasarkan Stable Diffusion dan SAM, anda boleh menggantikan kerusi dalam foto dengan sofa dengan lancar:

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Ia juga sangat mudah untuk tukar baju dan warna rambut :

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Sebaik sahaja projek itu dikeluarkan, ramai yang berseru: Laju tangan terlalu laju!

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Orang lain berkata: Ada gambar perkahwinan baharu saya dan Yui Aragaki.

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Di atas ialah kesan yang dibawa oleh Gounded-SAM Projek ini telah menerima 1.8k bintang di GitHub.

Ringkasnya, ini adalah aplikasi penglihatan sifar tangkapan yang hanya perlu memasukkan imej untuk mengesan dan membahagikan imej secara automatik.

Penyelidikan ini datang daripada Institut Penyelidikan IDEA (Institut Penyelidikan Ekonomi Digital Kawasan Teluk Guangdong-Hong Kong-Macao), yang pengasas dan pengerusinya ialah Shun Xiangyang.

Tiada latihan tambahan diperlukan

Grounded SAM terutamanya terdiri daripada dua model: Grounding DINO dan SAM.

Antaranya SAM (Segmen Anything) ialah model segmentasi sampel sifar yang baru dilancarkan oleh Meta 4 hari lalu.

Ia boleh menjana topeng untuk sebarang objek dalam imej/video, termasuk objek dan imej yang belum muncul semasa proses latihan.

Dengan meminta SAM memulangkan topeng yang sah untuk sebarang gesaan, model boleh mengeluarkan topeng yang munasabah di antara semua kemungkinan, walaupun gesaan itu samar-samar atau menunjuk kepada berbilang objek. Tugasan ini digunakan untuk melatih model dan menyelesaikan tugasan segmentasi hiliran umum melalui pembayang.

Rangka kerja model terutamanya terdiri daripada pengekod imej, pengekod pembayang dan penyahkod topeng pantas. Selepas mengira pembenaman imej, SAM dapat menjana pembahagian berdasarkan sebarang gesaan dalam web dalam masa 50 milisaat.

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Grounding DINO ialah pencapaian sedia ada pasukan penyelidik ini.

Ini ialah model pengesanan sifar tangkapan yang boleh menjana kotak objek dan label dengan penerangan teks.

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Selepas menggabungkan kedua-duanya, anda boleh menemui sebarang objek dalam gambar melalui penerangan teks, dan kemudian menggunakan keupayaan segmentasi berkuasa SAM untuk membahagikan topeng dalam butiran halus cara.

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Selain kebolehan ini, mereka juga menambah keupayaan Stable Diffusion, iaitu penjanaan imej terkawal yang ditunjukkan pada mulanya.

Perlu dinyatakan bahawa Stable Diffusion telah dapat mencapai fungsi yang sama sebelum ini. Hanya padamkan elemen imej yang ingin anda gantikan dan masukkan gesaan teks.

Kali ini, Grounded SAM boleh menyimpan langkah pemilihan manual dan mengawalnya terus melalui penerangan teks.

Selain itu, digabungkan dengan BLIP (Bootstrapping Language-Image Pra-latihan), ia menjana tajuk imej, mengekstrak label, dan kemudian menjana kotak objek dan topeng.

Pada masa ini, terdapat lebih banyak ciri menarik yang sedang dibangunkan.

Contohnya, beberapa pengembangan watak: menukar pakaian, warna rambut, warna kulit, dsb.

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Kaedah makan khusus mempunyai juga telah Diberikan pada GitHub. Projek ini memerlukan Python 3.8 ke atas, pytorch 1.7 ke atas, torchvision 0.8 ke atas dan kebergantungan yang berkaitan mesti dipasang. Sila lihat halaman projek GitHub untuk kandungan tertentu.

Pasukan penyelidik adalah daripada Institut Penyelidikan IDEA (Institut Penyelidikan Ekonomi Digital Kawasan Teluk Guangdong-Hong Kong-Macao).

Maklumat awam menunjukkan bahawa institut itu ialah sebuah institusi penyelidikan inovatif antarabangsa untuk kecerdasan buatan, industri ekonomi digital dan teknologi canggih bekas ketua saintis Microsoft Asia Research Institute dan bekas naib presiden Microsoft Global Intelligence Shen Xiangyang Dr. . berkhidmat sebagai pengasas dan pengerusi.

One More Thing

Untuk kerja masa depan Grounded SAM, pasukan mempunyai beberapa prospek:

Menjana imej secara automatik untuk membentuk set data baharu
Model asas yang berkuasa dengan pra-latihan segmentasi
bekerjasama dengan (Chat-)GPT
untuk membentuk saluran paip yang menjana label imej, kotak dan topeng secara automatik serta boleh menjana imej baharu .

Perlu dinyatakan bahawa ramai ahli pasukan projek ini adalah responden aktif dalam bidang AI pada Zhihu Kali ini mereka juga menjawab soalan mengenai Grounded SAM pada Zhihu boleh tinggalkan mesej untuk nasihat~

Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China

Atas ialah kandungan terperinci Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Arahan sembang dan cara menggunakannya

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7532

Tutorial CakePHP

1379

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Petua Konfigurasi Firewall Pelayan Mel Debian Apr 13, 2025 am 11:42 AM

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Apr 13, 2025 am 09:42 AM

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Cara Menetapkan Tahap Log Debian Apache Apr 13, 2025 am 08:33 AM

Artikel ini menerangkan cara menyesuaikan tahap pembalakan pelayan Apacheweb dalam sistem Debian. Dengan mengubah suai fail konfigurasi, anda boleh mengawal tahap maklumat log yang direkodkan oleh Apache. Kaedah 1: Ubah suai fail konfigurasi utama untuk mencari fail konfigurasi: Fail konfigurasi apache2.x biasanya terletak di direktori/etc/apache2/direktori. Nama fail mungkin apache2.conf atau httpd.conf, bergantung pada kaedah pemasangan anda. Edit Fail Konfigurasi: Buka Fail Konfigurasi dengan Kebenaran Root Menggunakan Editor Teks (seperti Nano): Sudonano/ETC/APACHE2/APACHE2.CONF

Cara Mengoptimumkan Prestasi Debian Readdir Apr 13, 2025 am 08:48 AM

Dalam sistem Debian, panggilan sistem Readdir digunakan untuk membaca kandungan direktori. Jika prestasinya tidak baik, cuba strategi pengoptimuman berikut: Memudahkan bilangan fail direktori: Split direktori besar ke dalam pelbagai direktori kecil sebanyak mungkin, mengurangkan bilangan item yang diproses setiap panggilan readdir. Dayakan Caching Kandungan Direktori: Bina mekanisme cache, kemas kini cache secara teratur atau apabila kandungan direktori berubah, dan mengurangkan panggilan kerap ke Readdir. Cafh memori (seperti memcached atau redis) atau cache tempatan (seperti fail atau pangkalan data) boleh dipertimbangkan. Mengamalkan struktur data yang cekap: Sekiranya anda melaksanakan traversal direktori sendiri, pilih struktur data yang lebih cekap (seperti jadual hash dan bukannya carian linear) untuk menyimpan dan mengakses maklumat direktori

Cara Melaksanakan Penyortiran Fail oleh Debian Readdir Apr 13, 2025 am 09:06 AM

Dalam sistem Debian, fungsi Readdir digunakan untuk membaca kandungan direktori, tetapi urutan yang dikembalikannya tidak ditentukan sebelumnya. Untuk menyusun fail dalam direktori, anda perlu membaca semua fail terlebih dahulu, dan kemudian menyusunnya menggunakan fungsi QSORT. Kod berikut menunjukkan cara menyusun fail direktori menggunakan ReadDir dan QSORT dalam sistem Debian:#termasuk#termasuk#termasuk#termasuk // fungsi perbandingan adat, yang digunakan untuk qSortintCompare (Constvoid*A, Constvoid*b) {Returnstrcmp (*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(

Kaedah pemasangan sijil SSL Server Server Debian Apr 13, 2025 am 11:39 AM

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Cara Melakukan Pengesahan Tandatangan Digital dengan Debian Openssl Apr 13, 2025 am 11:09 AM

Menggunakan OpenSSL untuk Pengesahan Tandatangan Digital pada Sistem Debian, anda boleh mengikuti langkah -langkah berikut: Penyediaan untuk memasang OpenSSL: Pastikan sistem Debian anda telah dipasang. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasangnya: sudoaptdateudoaptininstallopenssl untuk mendapatkan kunci awam: Pengesahan tandatangan digital memerlukan kunci awam penandatangan. Biasanya, kunci awam akan disediakan dalam bentuk fail, seperti public_key.pe

Bagaimana Debian OpenSSL Menghalang Serangan Man-dalam-Middle Apr 13, 2025 am 10:30 AM

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession

See all articles