AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia-AI-php.cn

Jadual Kandungan

Dapat Diperluaskan kepada 20 bilion parameter: lebih realistik dan "lebih bijak"

Semua komponen adalah Transformers

Google "bergerak sendiri"

One More Thing

Rumah

Peranti teknologi

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

王林

Apr 09, 2023 pm 09:51 PM

Google ai parti

Kawan, adakah anda tahu apa itu perkataan Inggeris?

Pneumonoultramicroscopicsilicovolcanoconiosis.

Ini adalah perkataan yang paling lama dikenali di dunia - terdiri daripada 45 huruf, yang bermaksud "penyakit yang disebabkan oleh pemendapan zarah silika gunung berapi dalam paru-paru" (biasanya dikenali sebagai silikosis gunung berapi).

Tetapi bagaimana jika, daripada meminta anda mengeja perkataan, anda... melukisnya?

(Anda tidak boleh membaca pun, tetapi anda masih melukis???)

Parti, AI terbaharu yang dicadangkan oleh Google, boleh mengendalikan perkara ini dengan mudah.

Selepas "menyuapkan" perkataan ini kepada Parti, ia akan dapat menghasilkan beberapa gambaran munasabah tentang penyakit paru-paru:

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Tetapi ini hanyalah ujian kecil daripada keupayaan Parti Menurut Google, ia kini merupakan AI "teks-ke-imej" yang paling maju.

Sebagai contoh, jika anda memberitahunya: "Gabungkan Sydney Opera House dengan Menara Eiffel," outputnya adalah seperti berikut:

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

(Saya tidak 't know) (Saya benar-benar fikir ia adalah bergambar)

Selain itu, dari segi algoritma, ia berbeza daripada Imagen Parti Google sendiri boleh dikatakan telah membawa "lukisan AI" ke tahap yang baru.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Malah Jeff Dean, ketua Google AI, tweet beberapa kali dan berseronok:

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Dapat Diperluaskan kepada 20 bilion parameter: lebih realistik dan "lebih bijak"

Malah, keupayaan Parti tidak terhenti di situ.

Terima kasih kepada skalabiliti model kepada 20 bilion parameter, di satu pihak, imej yang dihasilkannya lebih terperinci dan realistik.

Sama ada hanya beberapa perkataan atau perenggan pendek lebih daripada lima puluh perkataan, ia boleh dipaparkan dengan jelas.

Contohnya, Bahagian belakang biola, bahagian belakang biola.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Atau mungkin ia adalah adegan malam yang diterangkan berdasarkan "Starry Night" Van Gogh. ps, terdapat 67 perkataan dalam perenggan ini.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Parti tiada masalah, dan saya telah melukis semua gambar pelbagai gaya untuk anda dalam satu pakej~

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Ini juga merupakan keupayaan kedua terbesar Parti Bukan sahaja perincian yang sempurna, tetapi gayanya juga boleh dipelbagaikan.

Terdapat juga perihalan aneh seperti "raccoon memakai sut formal, topi atas, rotan dan beg sampah", yang juga boleh mencipta karya berbunga-bunga tanpa melupakan butirannya.

Dari segi gaya, terdapat gaya Van Gogh, gaya Firaun Mesir, gaya piksel, gaya lukisan tradisional Cina, gaya abstrak...

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Malah kadang-kadang Ia juga membuat jenaka.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

(Toad'ay, toad)

Khususnya dari segi keputusan ujian, MS-COCO, Localized Narrative (LN, huraian 4 kali lebih panjang) FID markah, Parti kedua-duanya mencapai keputusan terkini.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Terutamanya skor FID bagi sampel sifar MS-COCO hanya 7.23, dan skor FID yang diperhalusi ialah 3.22, melebihi Imagen dan DALL-E 2 sebelumnya.

Semua komponen adalah Transformers

Selepas sebulan, Google telah membawa lukisan AI ke tahap yang baru, tetapi penulis berkata: rahsianya mudah.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Sebahagian terutamanya menganggap imej yang dijana teks sebagai pemodelan urutan ke jujukan. Ini agak serupa dengan terjemahan mesin, di mana token teks diberikan sebagai input kepada pengekod, dan output sasaran berubah daripada teks kepada imej.

Secara struktur, semua komponennya hanya mempunyai tiga bahagian: pengekod, penyahkod dan penanda imej, dan semuanya berdasarkan Transformer standard.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Pertama, imej dikodkan ke dalam urutan diskret teg menggunakan penanda imej berasaskan Transformer ViT-VQGAN.

Kemudian parameter dikembangkan kepada 20 bilion melalui struktur pengekodan-penyahkodan Transformer.

Penyelidikan terdahulu tentang penjanaan imej daripada teks, kecuali GAN terawal, boleh dibahagikan secara kasar kepada dua idea.

Satu adalah berdasarkan model autoregresif Pertama, ciri teks dipetakan kepada ciri imej, dan kemudian seni bina jujukan yang serupa dengan Transformer digunakan untuk mempelajari hubungan antara input bahasa dan output imej.

Komponen utama pendekatan ini ialah penanda imej, yang menukarkan setiap imej kepada jujukan unit diskret. Sebagai contoh, DALL-E dan CogView menerima pakai idea ini.

Laluan lain ialah laluan yang kerap mengalami kemajuan dalam tempoh ini - model teks-ke-imej berdasarkan resapan, seperti DALL-E 2 dan Imagen.

Mereka meninggalkan penanda imej dan sebaliknya menggunakan model resapan untuk menjana imej secara langsung. Apa yang boleh dilihat ialah model ini menghasilkan imej berkualiti tinggi dan mendapat skor yang lebih baik pada FID tangkapan sifar MS-COCO.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Kejayaan model Parti membuktikan bahawa model autoregresif boleh digunakan untuk meningkatkan kesan imej yang dihasilkan teks.

Pada masa yang sama, Parti turut memperkenalkan dan mengeluarkan ujian penanda aras baharu - PartiPrompts, yang digunakan untuk mengukur keupayaan model dalam 12 kategori dan 11 cabaran.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Tetapi Parti masih mempunyai batasan tertentu, dan penyelidik juga menunjukkan beberapa pepijat:

Sebagai contoh, perihalan penafian tidak berguna~

Pinggan tanpa pisang, dan segelas tanpa jus oren di sebelahnya.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Juga membuat beberapa kesilapan akal, seperti menskala secara tidak munasabah. Sebagai contoh, dalam gambar ini, robot itu beberapa kali lebih tinggi daripada kereta lumba.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Robot berkilat memakai sut lumba dan visor hitam berdiri dengan bangga di hadapan kereta F1. Matahari terbenam di atas landskap bandar. Ilustrasi buku komik.

Google "bergerak sendiri"

Kajian ini datang daripada Google Research dan kebanyakan ahli pasukan adalah orang Cina.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Kakitangan penyelidikan teras termasuk Yuanzhong Xu, Thang Luong, dsb., yang kini bekerja di Google dalam penyelidikan berkaitan AI.

(Thang Luong telah disebut sehingga 20,000+ kali di Google Scholar)

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

△Kiri: Yuanzhong Xu Kanan: Thang Luong

Tetapi apa yang menarik ialah Imagen, yang kedua-duanya "sebut satu perkataan dan biarkan AI melukis" dan dihasilkan oleh Google, mempunyai kaitan yang tidak dapat dipisahkan dengan Parti.

Ia disebut dalam dokumentasi projek GitHub Parti:

Terima kasih kepada pasukan Imagen kerana berkongsinya dengan kami sebelum mengeluarkan Imagen yang lengkap terkini keputusan.

Penemuan penting mereka dalam panduan CF sangat membantu untuk model Parti akhir.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Dan Burcu Karagol Ayan, salah seorang pengarang Imagen, turut mengambil bahagian dalam projek Parti.

(Ia seperti Google "gulung sendiri")

Bukan itu sahaja, malah Aditya Ramesh, pengarang "Next Door" DALL-E 2, juga menilai Parti dalam kerja Perbincangan MS-COCO telah dilakukan pada aspek ini.

dan pengarang DALL-Eval juga memberikan bantuan dengan kerja data Parti.

One More Thing

Dikatakan bahawa "imej janaan teks" bukan sekadar kegemaran penyelidik.

Netizen tidak pernah jemu "bermain" dengannya (jangan terlalu berimaginasi).

Sebentar tadi, saya meminta Imagen melukis Dinasti Song "Tiger wearing VR", yang secara langsung berkembang menjadi pertempuran lukisan AI.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

△Gambar: Seni oleh Imagen

DALL·E, MidJourney dan lain-lain "datang selepas mendengar berita" untuk mengambil bahagian.

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

△ Dilukis oleh DALL·E

Malah ada orang yang menggabungkan Wordle dan DALL-E 2:

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

......

Tetapi kembali ke Parti kali ini memang seronok, namun segelintir netizen masih menimbulkan persoalan yang "menyentuh terus ke jiwa":

AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia

Bilakah ia akan dikomersialkan? Tidak ada gunanya "bermain di belakang pintu tertutup" sendiri.

Alamat kertas bahagian:

https://parti.research.google/

Alamat projek GitHub :

https://github.com/google-research/parti

Pautan rujukan:

[1]https:/ /twitter.com/lmthang/status/1539664610596225024[2]https://gizmodo.com/new-browser-game-combines-dall-e-mini-and-wordle-1849105289[3]https://imagen.research .google/

Atas ialah kandungan terperinci AI baharu Google sedang hangat! Anda boleh melukis perkataan terpanjang di dunia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7503

Tutorial CakePHP

1377

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Cara Mengkonfigurasi Format Log Debian Apache Apr 12, 2025 pm 11:30 PM

Artikel ini menerangkan cara menyesuaikan format log Apache pada sistem Debian. Langkah -langkah berikut akan membimbing anda melalui proses konfigurasi: Langkah 1: Akses fail konfigurasi Apache Fail konfigurasi Apache utama sistem Debian biasanya terletak di /etc/apache2/apache2.conf atau /etc/apache2/httpd.conf. Buka fail konfigurasi dengan kebenaran root menggunakan arahan berikut: Sudonano/etc/Apache2/Apache2.conf atau Sudonano/etc/Apache2/httpd.conf Langkah 2: Tentukan format log tersuai untuk mencari atau

Bagaimana log tomcat membantu menyelesaikan masalah kebocoran memori Apr 12, 2025 pm 11:42 PM

Log Tomcat adalah kunci untuk mendiagnosis masalah kebocoran memori. Dengan menganalisis log tomcat, anda boleh mendapatkan wawasan mengenai kelakuan memori dan pengumpulan sampah (GC), dengan berkesan mencari dan menyelesaikan kebocoran memori. Berikut adalah cara menyelesaikan masalah kebocoran memori menggunakan log Tomcat: 1. GC Log Analysis terlebih dahulu, membolehkan pembalakan GC terperinci. Tambah pilihan JVM berikut kepada parameter permulaan TOMCAT: -XX: PrintGCDetails-XX: PrintGCDATestamps-XLogGC: GC.LOG Parameter ini akan menghasilkan log GC terperinci (GC.LOG), termasuk maklumat seperti jenis GC, saiz dan masa yang dikitar semula. Analisis GC.Log

Cara Melaksanakan Penyortiran Fail oleh Debian Readdir Apr 13, 2025 am 09:06 AM

Dalam sistem Debian, fungsi Readdir digunakan untuk membaca kandungan direktori, tetapi urutan yang dikembalikannya tidak ditentukan sebelumnya. Untuk menyusun fail dalam direktori, anda perlu membaca semua fail terlebih dahulu, dan kemudian menyusunnya menggunakan fungsi QSORT. Kod berikut menunjukkan cara menyusun fail direktori menggunakan ReadDir dan QSORT dalam sistem Debian:#termasuk#termasuk#termasuk#termasuk // fungsi perbandingan adat, yang digunakan untuk qSortintCompare (Constvoid*A, Constvoid*b) {Returnstrcmp (*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(

Cara Mengoptimumkan Prestasi Debian Readdir Apr 13, 2025 am 08:48 AM

Dalam sistem Debian, panggilan sistem Readdir digunakan untuk membaca kandungan direktori. Jika prestasinya tidak baik, cuba strategi pengoptimuman berikut: Memudahkan bilangan fail direktori: Split direktori besar ke dalam pelbagai direktori kecil sebanyak mungkin, mengurangkan bilangan item yang diproses setiap panggilan readdir. Dayakan Caching Kandungan Direktori: Bina mekanisme cache, kemas kini cache secara teratur atau apabila kandungan direktori berubah, dan mengurangkan panggilan kerap ke Readdir. Cafh memori (seperti memcached atau redis) atau cache tempatan (seperti fail atau pangkalan data) boleh dipertimbangkan. Mengamalkan struktur data yang cekap: Sekiranya anda melaksanakan traversal direktori sendiri, pilih struktur data yang lebih cekap (seperti jadual hash dan bukannya carian linear) untuk menyimpan dan mengakses maklumat direktori

Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Apr 13, 2025 am 09:42 AM

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Cara Mengkonfigurasi Peraturan Firewall Untuk Debian Syslog Apr 13, 2025 am 06:51 AM

Artikel ini menerangkan cara mengkonfigurasi peraturan firewall menggunakan iptables atau UFW dalam sistem debian dan menggunakan syslog untuk merakam aktiviti firewall. Kaedah 1: Gunakan IPTableSiptable adalah alat firewall baris perintah yang kuat dalam sistem Debian. Lihat peraturan yang ada: Gunakan arahan berikut untuk melihat peraturan iptables semasa: sudoiptables-l-n-v membolehkan akses IP tertentu: sebagai contoh, membenarkan alamat IP 192.168.1.100 untuk mengakses port 80: sudoiptables-ainput-pTCP-Dport80-S192.16

Cara Belajar Debian Syslog Apr 13, 2025 am 11:51 AM

Panduan ini akan membimbing anda untuk belajar cara menggunakan syslog dalam sistem Debian. SYSLOG adalah perkhidmatan utama dalam sistem Linux untuk sistem pembalakan dan mesej log aplikasi. Ia membantu pentadbir memantau dan menganalisis aktiviti sistem untuk mengenal pasti dan menyelesaikan masalah dengan cepat. 1. Pengetahuan asas syslog Fungsi teras syslog termasuk: mengumpul dan menguruskan mesej log secara terpusat; menyokong pelbagai format output log dan lokasi sasaran (seperti fail atau rangkaian); Menyediakan fungsi tontonan log dan penapisan masa nyata. 2. Pasang dan konfigurasikan syslog (menggunakan rsyslog) Sistem Debian menggunakan rsyslog secara lalai. Anda boleh memasangnya dengan arahan berikut: sudoaptupdatesud

Di mana laluan log nginx debian Apr 12, 2025 pm 11:33 PM

Dalam sistem Debian, lokasi penyimpanan lalai log akses dan log ralat Nginx adalah seperti berikut: Log Akses (AccessLog):/var/log/nginx/akses.log log ralat (errorLog):/var/log/nginx/error.log Jalan di atas adalah konfigurasi lalai pemasangan debiannginx standard. Jika anda telah mengubahsuai lokasi storan fail log semasa proses pemasangan, sila periksa fail konfigurasi Nginx anda (biasanya terletak di /etc/nginx/nginx.conf atau/etc/nginx/sites-available/direktori). Dalam fail konfigurasi

See all articles