Rumah > Peranti teknologi > AI > teks badan

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

王林
Lepaskan: 2023-04-09 16:51:03
ke hadapan
764 orang telah melayarinya

Baru-baru ini, seorang penyelidik AI dan artis digital bernama Xander Steenbrugge telah memuat naik video yang sangat mengejutkan "Journey Across Time".

Evolusi besar kehidupan di bumi, bermula dari lautan primitif, kepada cicak purba, dinosaur, mamalia, kepada monyet, orang utan, beruk, homo sapiens... dan akhirnya fiksyen sains muncul di dunia masa depan.

Dan Steenbrugge juga mengulas dengan teruja: Kami melintasi ambang di mana AI generatif bukan lagi hanya mengenai estetika novel, tetapi telah berkembang menjadi alat yang menakjubkan yang boleh dibina Perkasa, berpusatkan manusia naratif. Steenbrugge berkata video itu menggunakan 36 frasa berturut-turut. Untuk mencari susunan yang terbaik, dia mencuba lebih daripada seribu petunjuk dan benih yang berbeza, dan menggunakan banyak teknik "kejuruteraan pembayang" pada kod untuk mengetahui apa yang berkesan dan apa yang tidak.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Bekas Pengarah Kanan Tesla AI Andrej Karpathy sangat terkejut selepas membacanya sehingga dia tidak dapat menahan diri untuk mencubanya.

"Mesin rangkaian neural steampunk surreal, dalam bentuk otak, diletakkan di atas tapak yang ditutup dengan neuron yang diperbuat daripada gear", masukkan teks ini Kemudian, karya agungnya dihasilkan.

Video 2 minit (~1 jam dipaparkan pada A100), dijana oleh interpolasi lancar antara model dengan input hingar rawak.

Model yang dipanggil Stable Diffusion ini menggunakan kaedah "interpolasi" antara makna dua ayat. Sisipan ialah jurang semantik dan bukannya visual, jadi ia secara dramatik mengubah cara cerita itu disampaikan.

Dan ini hanyalah permulaan revolusi penciptaan kandungan digital yang dipacu oleh kecerdasan buatan generatif.

‍Resapan Stabil: Satu Pencapaian untuk Model Sumber Terbuka

Sejak awal tahun 2021, kecerdasan buatan yang boleh menjana imej daripada huraian teks telah berkembang pesat. Pada masa itu, OpenAI menunjukkan hasil yang mengagumkan dengan DALL-E 1 dan CLIP.

Pada tahun 2022, OpenAI mengeluarkan DALL-E 2 yang mengagumkan, Google mempamerkan Imagen dan Parti, Midjourney melancarkan beta awam, dan Craiyon mencipta imej AI di mana-mana jenis media sosial.

Dan kini baru-baru ini, Stability AI telah mengeluarkan model baharu - Stable Diffusion.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Walau bagaimanapun, tidak seperti DALL-E 2, Stable Diffusion boleh melahirkan pelbagai orang terkenal yang diharamkan oleh OpenAI.

Walaupun sistem seperti Midjourney, Pixelz.ai, dsb. juga boleh melakukannya, kualiti yang dihasilkannya adalah jauh daripada setanding dengan Stable Diffusion , dan tiada satu pun daripadanya sumber terbuka.

Kini kami menjemput rakan lama kami Musk untuk melakukan transformasi saat kedua menjadi "Black Widow" (Scarlett Johansson).

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Jelas sekali, Stability AI, sebagai peneraju pembangun, berharap lebih daripada satu syarikat atau pasukan akan dapat melatih varian Stable Diffusion.

Sebagai contoh, anda seorang penyelidik yang tidak mempunyai kuasa pengkomputeran GPU yang besar. Jangan risau, Stable Diffusion tidak lama lagi akan dapat dijalankan pada kad grafik dengan hanya 5.1GB VRAM.

Sebagai contoh lain, jika anda peminat MacBook yang dilengkapi dengan cip Apple M1, Stable Diffusion juga boleh dijalankan. Walau bagaimanapun, masa untuk penjanaan imej akan berubah daripada beberapa saat kepada beberapa minit.

Nampaknya model multimodal sedang menuju ke laluan yang telah diambil oleh model bahasa besar sebelum ini: beralih daripada vendor tunggal dan menjadikan banyak alternatif tersedia secara meluas melalui sumber terbuka.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Selain itu, Runway sudah pun mengkaji cara melaksanakan penyuntingan teks-ke-video berdasarkan Stable Diffusion.

Dalam satu perkataan, biarlah gelanggang tenis menjadi pantai

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Tidak kira kilat dan guruh, atau angin dan cahaya matahari;

Sama ada di bulan atau di Marikh; tenis...

Menggunakan pengiraan untuk mempercepatkan sumber terbuka AI asasModel ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Selepas fasa ujian, Stable Diffusion akan menjadi percuma dan kod serta model terlatih akan dikeluarkan sebagai sumber terbuka. Terdapat juga versi yang dihoskan dengan antara muka web untuk pengguna menguji sistem.

Stable Diffusion ialah hasil kerjasama antara penyelidik di Stability AI, RunwayML, LMU Munich, EleutherAI dan LAION. EleutherAI terkenal dengan model bahasa sumber terbukanya GPT-J-6B dan GPT-NeoX-20B, dsb.

Organisasi bukan untung LAION (Large Scale Artificial Intelligence Open Network) menyediakan set data LAION 5B sumber terbuka untuk data latihan, yang ditapis oleh pasukan berdasarkan maklum balas manusia semasa fasa ujian awal untuk Mencipta set data latihan LAION-Aesthetics akhir.

Patrick Esser dari Runway dan Robin Rombach dari LMU Munich mengetuai projek itu, yang penyelidikannya dalam kumpulan CompVis di Universiti Heidelberg meletakkan asas bagi projek itu. Di Universiti Heidelberg mereka mencipta VQGAN dan Latent Diffusion yang digunakan secara meluas. Kedua-dua model ini, ditambah dengan hasil OpenAI dan Google Brain, mendayakan Stable Diffusion.

Stability AI diasaskan pada 2020, dan pelabur di belakangnya ialah ahli matematik dan saintis komputer Emad Mostaque. Beliau telah bekerja sebagai penganalisis di pelbagai dana lindung nilai.

Dengan Stability AI dan kekayaan peribadinya, Mostaque berharap dapat memupuk komuniti penyelidikan AI sumber terbuka. Permulaannya sebelum ini telah menyokong penciptaan set data "LAION 5B". Untuk melatih model Stable Diffusion, Stability AI menyediakan pelayan dengan 4,000 GPU Nvidia A100.

"Tiada orang lain yang mempunyai kuasa membuat keputusan kecuali 75 pekerja kami - bukan bilionair, dana besar atau kerajaan. Kami bebas sepenuhnya." "Kami merancang untuk menggunakan pengkomputeran kami untuk mempercepatkan sumber terbuka kecerdasan buatan asas."

Netizen menjadi gila

Selain dua video pada mulanya, sesetengah netizen juga menggunakan Stable Diffusion menjana animasi penuaan.

Dia menyatakan bahawa menukar perkataan dalam gesaan yang panjang semasa pengeluaran mempunyai kesan yang lebih halus berbanding dengan gesaan yang pendek. Selain itu, menggunakan perihalan seperti tua, pertengahan umur atau muda selalunya berfungsi lebih baik daripada menyatakan umur tertentu seperti 10, 40 atau 80 tahun.

Selain itu, terdapat pelbagai gambar pegun termenung.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

「Kekasih」

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

「Singa」

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

"Dark Soul" yang ditulis oleh Leyendecker dan Maxence

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

"Cyber ​​​​Peking Opera"

Easter EggModel ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Alami perjalanan mental yang terseksa oleh bekas pengarah kecerdasan buatan dan penglihatan pemanduan autonomi Tesla Andrej Karpathy.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Selepas menonton video yang dibuat oleh tuannya, Karpathy sangat teruja.

Keputusan yang dicapai melalui beberapa siri operasi tidak akan terasa terkeluar walaupun dalam kelas tadika kecil. Karpathy yang terdesak berkata bahawa dia ingin mengupah "jurutera segera" untuk menciptanya untuknya. Akhirnya Karpathy akhirnya sedar dan mencipta karya baru yang sangat dia berpuas hati - mesin rangkaian saraf tiruan steampunk dan pasta blueberry.

Atas ialah kandungan terperinci Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!