Rumah > Peranti teknologi > AI > Cara AI generatif mentakrifkan semula carian imej

Cara AI generatif mentakrifkan semula carian imej

王林
Lepaskan: 2023-09-29 21:25:08
ke hadapan
846 orang telah melayarinya

Untuk menulis semula kandungan tanpa mengubah maksud asal, bahasa perlu ditulis semula ke dalam bahasa Cina, dan ayat asal tidak perlu muncul

Kandungan Chonglou perlu ditulis semula

Baru-baru ini bulan, kecerdasan buatan generatif Kecerdasan telah menarik minat yang besar dengan keupayaannya untuk mencipta teks, bunyi dan imej yang unik. Walau bagaimanapun, potensi AI generatif tidak terhad kepada mencipta data baharu

Teknik asas AI generatif (seperti Transformers dan model resapan) boleh menggerakkan banyak aplikasi lain, termasuk carian dan penemuan maklumat. Khususnya, AI generatif boleh merevolusikan carian imej, membolehkan orang ramai meneroka maklumat visual dengan cara yang sebelum ini mustahil

Cara AI generatif mentakrifkan semula carian imej

Berikut ialah perkara yang perlu diketahui oleh orang ramai tentang cara AI generatif boleh mentakrifkan semula kandungan pengalaman carian imej.

Pembenaman Imej dan Teks

Kaedah carian imej tradisional bergantung pada penerangan teks, teg dan metadata lain yang mengiringi imej, yang mengehadkan pilihan carian pengguna kepada maklumat yang telah dilampirkan secara eksplisit pada imej. Orang yang memuat naik imej mesti mempertimbangkan dengan teliti jenis pertanyaan carian yang mereka masukkan untuk memastikan imej mereka boleh ditemui oleh orang lain. Dan apabila mencari imej, pengguna yang menanyakan maklumat mesti cuba membayangkan jenis penerangan yang mungkin telah ditambahkan oleh pemuat naik imej pada imej

Bak kata pepatah, "gambar bernilai seribu perkataan". Walau bagaimanapun, terdapat had untuk apa yang boleh ditulis tentang perihalan imej. Sudah tentu, ini boleh diterangkan dalam banyak cara bergantung pada cara orang melihat imej tersebut. Orang kadangkala mencari berdasarkan objek dalam gambar, dan kadangkala mereka mencari berdasarkan ciri seperti gaya, cahaya, lokasi, dsb. Malangnya, imej jarang disertakan dengan maklumat kaya itu. Ramai orang memuat naik banyak imej dengan sedikit atau tiada maklumat yang dilampirkan, menjadikannya sukar ditemui dalam carian.

Pencarian imej kecerdasan buatan memainkan peranan penting dalam hal ini. Terdapat banyak pendekatan untuk carian imej AI, dan syarikat yang berbeza mempunyai teknologi proprietari mereka sendiri. Walau bagaimanapun, terdapat juga teknologi yang dimiliki oleh syarikat-syarikat ini

Di tengah-tengah carian imej kecerdasan buatan dan banyak sistem pembelajaran mendalam yang lain adalah pembenaman. Pembenaman ialah kaedah perwakilan berangka bagi jenis data yang berbeza. Contohnya, imej beresolusi 512×512 mengandungi kira-kira 260,000 piksel (atau ciri). Model pembenaman mempelajari perwakilan berdimensi rendah data visual dengan melatih berjuta-juta imej. Pembenaman imej boleh digunakan dalam banyak kawasan berguna, termasuk pemampatan imej, menjana imej baharu atau membandingkan sifat visual imej yang berbeza Mekanisme yang sama berfungsi untuk bentuk lain seperti teks. Model pembenaman teks ialah perwakilan berdimensi rendah kandungan petikan teks. Pembenaman teks mempunyai banyak aplikasi, termasuk carian persamaan dan peningkatan perolehan untuk model bahasa besar (LLM).

Cara Carian Imej Kecerdasan Buatan BerfungsiCara AI generatif mentakrifkan semula carian imej

Tetapi perkara menjadi lebih menarik apabila pembenaman imej dan teks dilatih bersama. Set data sumber terbuka seperti LAION mengandungi berjuta-juta imej dan perihalan teks yang sepadan. Apabila pembenaman teks dan imej pada pasangan imej/kapsyen ini dilatih atau diperhalusi bersama, mereka mempelajari perkaitan antara maklumat visual dan teks. Inilah idea di sebalik teknik pembelajaran mendalam seperti Contrastive Image Language Pretraining (CLIP).

Bahasa Perbandingan pada Model Pra-latihan Imej (CLIP) mempelajari pembenaman bersama teks dan imej

Cara AI generatif mentakrifkan semula carian imejKini kami mempunyai alatan yang boleh menukar teks kepada pembenaman visual. Apabila kami memberi penerangan teks kepada model bersama ini, ia menjana pembenaman teks dan pembenaman imej yang sepadan. Kami kemudiannya boleh membandingkan benam imej dengan imej dalam pangkalan data dan mendapatkan semula yang paling berkaitan. Ini adalah prinsip asas carian imej kecerdasan buatan

Keindahan mekanisme ini ialah pengguna akan dapat mendapatkan semula imej berdasarkan penerangan teks ciri visual imej, walaupun penerangan ini tidak didaftarkan dalam metadata. Anda boleh menggunakan istilah carian yang kaya yang tidak mungkin sebelum ini, seperti "Hutan yang subur diselubungi kabus pagi, cahaya matahari yang terang menembusi hutan pain yang tinggi, dan beberapa cendawan tumbuh di atas rumput."

Dalam contoh di atas, carian AI mengembalikan set imej yang ciri visualnya sepadan dengan pertanyaan ini. Kebanyakan huraian teks tidak mengandungi kata kunci pertanyaan. Tetapi pembenaman mereka adalah serupa dengan pertanyaan. Tanpa carian imej AI, mencari imej yang betul akan menjadi lebih sukar.

From Discovery to Creation

Kadangkala, imej yang dicari orang tidak wujud, malah carian AI tidak dapat menjumpainya. Dalam kes ini, AI generatif boleh membantu pengguna mencapai hasil yang diingini dalam satu daripada dua cara.

Pertama, kita boleh mencipta imej baharu dari awal berdasarkan pertanyaan pengguna. Pendekatan ini melibatkan penggunaan model penjanaan teks-ke-imej (seperti Stable Diffusion atau DALL-E) untuk mencipta pembenaman untuk pertanyaan pengguna dan memanfaatkan pembenaman itu untuk menjana imej. Model generatif memanfaatkan model benam bersama seperti Contrastive Image Language Pra-training (CLIP) dan seni bina lain seperti Transformers atau model resapan untuk menukar nilai terbenam kepada imej yang menakjubkan

Cara AI generatif mentakrifkan semula carian imejDALL-E menggunakan Contrastive Image Language Pra-training (CLIP) dan resapan untuk menjana imej daripada teks

Kaedah kedua ialah menggunakan imej sedia ada dan mengeditnya mengikut keutamaan peribadi menggunakan model generatif. Contohnya, dalam imej yang menunjukkan hutan pain, cendawan hilang dari rumput. Pengguna boleh memilih imej yang sesuai sebagai titik permulaan dan menambah cendawan padanya melalui model generatif

Cara AI generatif mentakrifkan semula carian imej

AI Generatif mencipta paradigma baharu yang mengaburkan garis antara penemuan dan kreativiti. Dan dalam antara muka tunggal, pengguna boleh mencari imej, mengedit imej, atau mencipta imej baharu sepenuhnya.

Tajuk asal: Cara AI generatif mentakrifkan semula carian imej, pengarang: Ben Dickson



🎜🎜 🎜

Atas ialah kandungan terperinci Cara AI generatif mentakrifkan semula carian imej. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan