


Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China
Artikel ini dicetak semula dengan kebenaran AI New Media Qubit (ID akaun awam: QbitAI Sila hubungi sumber untuk mencetak semula).
Kini tiba masanya untuk bulatan AI bersaing dengan kelajuan tangan.
Tidak, SAM Meta baru sahaja dilancarkan beberapa hari yang lalu, dan pengaturcara domestik telah datang dengan gelombang tindanan buff, termasuk pengesanan sasaran, pembahagian dan penjanaan fungsi AI visual semuanya dalam satu!
Sebagai contoh, berdasarkan Stable Diffusion dan SAM, anda boleh menggantikan kerusi dalam foto dengan sofa dengan lancar:
Ia juga sangat mudah untuk tukar baju dan warna rambut :
Sebaik sahaja projek itu dikeluarkan, ramai yang berseru: Laju tangan terlalu laju!
Orang lain berkata: Ada gambar perkahwinan baharu saya dan Yui Aragaki.
Di atas ialah kesan yang dibawa oleh Gounded-SAM Projek ini telah menerima 1.8k bintang di GitHub.
Ringkasnya, ini adalah aplikasi penglihatan sifar tangkapan yang hanya perlu memasukkan imej untuk mengesan dan membahagikan imej secara automatik.
Penyelidikan ini datang daripada Institut Penyelidikan IDEA (Institut Penyelidikan Ekonomi Digital Kawasan Teluk Guangdong-Hong Kong-Macao), yang pengasas dan pengerusinya ialah Shun Xiangyang.
Tiada latihan tambahan diperlukan
Grounded SAM terutamanya terdiri daripada dua model: Grounding DINO dan SAM.
Antaranya SAM (Segmen Anything) ialah model segmentasi sampel sifar yang baru dilancarkan oleh Meta 4 hari lalu.
Ia boleh menjana topeng untuk sebarang objek dalam imej/video, termasuk objek dan imej yang belum muncul semasa proses latihan.
Dengan meminta SAM memulangkan topeng yang sah untuk sebarang gesaan, model boleh mengeluarkan topeng yang munasabah di antara semua kemungkinan, walaupun gesaan itu samar-samar atau menunjuk kepada berbilang objek. Tugasan ini digunakan untuk melatih model dan menyelesaikan tugasan segmentasi hiliran umum melalui pembayang.
Rangka kerja model terutamanya terdiri daripada pengekod imej, pengekod pembayang dan penyahkod topeng pantas. Selepas mengira pembenaman imej, SAM dapat menjana pembahagian berdasarkan sebarang gesaan dalam web dalam masa 50 milisaat.
Grounding DINO ialah pencapaian sedia ada pasukan penyelidik ini.
Ini ialah model pengesanan sifar tangkapan yang boleh menjana kotak objek dan label dengan penerangan teks.
Selepas menggabungkan kedua-duanya, anda boleh menemui sebarang objek dalam gambar melalui penerangan teks, dan kemudian menggunakan keupayaan segmentasi berkuasa SAM untuk membahagikan topeng dalam butiran halus cara.
Selain kebolehan ini, mereka juga menambah keupayaan Stable Diffusion, iaitu penjanaan imej terkawal yang ditunjukkan pada mulanya.
Perlu dinyatakan bahawa Stable Diffusion telah dapat mencapai fungsi yang sama sebelum ini. Hanya padamkan elemen imej yang ingin anda gantikan dan masukkan gesaan teks.
Kali ini, Grounded SAM boleh menyimpan langkah pemilihan manual dan mengawalnya terus melalui penerangan teks.
Selain itu, digabungkan dengan BLIP (Bootstrapping Language-Image Pra-latihan), ia menjana tajuk imej, mengekstrak label, dan kemudian menjana kotak objek dan topeng.
Pada masa ini, terdapat lebih banyak ciri menarik yang sedang dibangunkan.
Contohnya, beberapa pengembangan watak: menukar pakaian, warna rambut, warna kulit, dsb.
Kaedah makan khusus mempunyai juga telah Diberikan pada GitHub. Projek ini memerlukan Python 3.8 ke atas, pytorch 1.7 ke atas, torchvision 0.8 ke atas dan kebergantungan yang berkaitan mesti dipasang. Sila lihat halaman projek GitHub untuk kandungan tertentu.
Pasukan penyelidik adalah daripada Institut Penyelidikan IDEA (Institut Penyelidikan Ekonomi Digital Kawasan Teluk Guangdong-Hong Kong-Macao).
Maklumat awam menunjukkan bahawa institut itu ialah sebuah institusi penyelidikan inovatif antarabangsa untuk kecerdasan buatan, industri ekonomi digital dan teknologi canggih bekas ketua saintis Microsoft Asia Research Institute dan bekas naib presiden Microsoft Global Intelligence Shen Xiangyang Dr. . berkhidmat sebagai pengasas dan pengerusi.
One More Thing
Untuk kerja masa depan Grounded SAM, pasukan mempunyai beberapa prospek:
- Menjana imej secara automatik untuk membentuk set data baharu
- Model asas yang berkuasa dengan pra-latihan segmentasi
- bekerjasama dengan (Chat-)GPT
- untuk membentuk saluran paip yang menjana label imej, kotak dan topeng secara automatik serta boleh menjana imej baharu .
Perlu dinyatakan bahawa ramai ahli pasukan projek ini adalah responden aktif dalam bidang AI pada Zhihu Kali ini mereka juga menjawab soalan mengenai Grounded SAM pada Zhihu boleh tinggalkan mesej untuk nasihat~
Atas ialah kandungan terperinci Keupayaan AI visual bersatu! Pengesanan dan pembahagian imej automatik, dan imej Vincentian yang boleh dikawal, yang dihasilkan oleh pasukan China. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Artikel ini menerangkan cara menyesuaikan tahap pembalakan pelayan Apacheweb dalam sistem Debian. Dengan mengubah suai fail konfigurasi, anda boleh mengawal tahap maklumat log yang direkodkan oleh Apache. Kaedah 1: Ubah suai fail konfigurasi utama untuk mencari fail konfigurasi: Fail konfigurasi apache2.x biasanya terletak di direktori/etc/apache2/direktori. Nama fail mungkin apache2.conf atau httpd.conf, bergantung pada kaedah pemasangan anda. Edit Fail Konfigurasi: Buka Fail Konfigurasi dengan Kebenaran Root Menggunakan Editor Teks (seperti Nano): Sudonano/ETC/APACHE2/APACHE2.CONF

Dalam sistem Debian, panggilan sistem Readdir digunakan untuk membaca kandungan direktori. Jika prestasinya tidak baik, cuba strategi pengoptimuman berikut: Memudahkan bilangan fail direktori: Split direktori besar ke dalam pelbagai direktori kecil sebanyak mungkin, mengurangkan bilangan item yang diproses setiap panggilan readdir. Dayakan Caching Kandungan Direktori: Bina mekanisme cache, kemas kini cache secara teratur atau apabila kandungan direktori berubah, dan mengurangkan panggilan kerap ke Readdir. Cafh memori (seperti memcached atau redis) atau cache tempatan (seperti fail atau pangkalan data) boleh dipertimbangkan. Mengamalkan struktur data yang cekap: Sekiranya anda melaksanakan traversal direktori sendiri, pilih struktur data yang lebih cekap (seperti jadual hash dan bukannya carian linear) untuk menyimpan dan mengakses maklumat direktori

Dalam sistem Debian, fungsi Readdir digunakan untuk membaca kandungan direktori, tetapi urutan yang dikembalikannya tidak ditentukan sebelumnya. Untuk menyusun fail dalam direktori, anda perlu membaca semua fail terlebih dahulu, dan kemudian menyusunnya menggunakan fungsi QSORT. Kod berikut menunjukkan cara menyusun fail direktori menggunakan ReadDir dan QSORT dalam sistem Debian:#termasuk#termasuk#termasuk#termasuk // fungsi perbandingan adat, yang digunakan untuk qSortintCompare (Constvoid*A, Constvoid*b) {Returnstrcmp (*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Menggunakan OpenSSL untuk Pengesahan Tandatangan Digital pada Sistem Debian, anda boleh mengikuti langkah -langkah berikut: Penyediaan untuk memasang OpenSSL: Pastikan sistem Debian anda telah dipasang. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasangnya: sudoaptdateudoaptininstallopenssl untuk mendapatkan kunci awam: Pengesahan tandatangan digital memerlukan kunci awam penandatangan. Biasanya, kunci awam akan disediakan dalam bentuk fail, seperti public_key.pe

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession
