Jadual Kandungan
‍Resapan Stabil: Satu Pencapaian untuk Model Sumber Terbuka
Stable Diffusion ialah hasil kerjasama antara penyelidik di Stability AI, RunwayML, LMU Munich, EleutherAI dan LAION. EleutherAI terkenal dengan model bahasa sumber terbukanya GPT-J-6B dan GPT-NeoX-20B, dsb.
Dia menyatakan bahawa menukar perkataan dalam gesaan yang panjang semasa pengeluaran mempunyai kesan yang lebih halus berbanding dengan gesaan yang pendek. Selain itu, menggunakan perihalan seperti tua, pertengahan umur atau muda selalunya berfungsi lebih baik daripada menyatakan umur tertentu seperti 10, 40 atau 80 tahun.
Rumah Peranti teknologi AI Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Apr 09, 2023 pm 04:51 PM
ai Model

Baru-baru ini, seorang penyelidik AI dan artis digital bernama Xander Steenbrugge telah memuat naik video yang sangat mengejutkan "Journey Across Time".

Evolusi besar kehidupan di bumi, bermula dari lautan primitif, kepada cicak purba, dinosaur, mamalia, kepada monyet, orang utan, beruk, homo sapiens... dan akhirnya fiksyen sains muncul di dunia masa depan.

Dan Steenbrugge juga mengulas dengan teruja: Kami melintasi ambang di mana AI generatif bukan lagi hanya mengenai estetika novel, tetapi telah berkembang menjadi alat yang menakjubkan yang boleh dibina Perkasa, berpusatkan manusia naratif. Steenbrugge berkata video itu menggunakan 36 frasa berturut-turut. Untuk mencari susunan yang terbaik, dia mencuba lebih daripada seribu petunjuk dan benih yang berbeza, dan menggunakan banyak teknik "kejuruteraan pembayang" pada kod untuk mengetahui apa yang berkesan dan apa yang tidak.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Bekas Pengarah Kanan Tesla AI Andrej Karpathy sangat terkejut selepas membacanya sehingga dia tidak dapat menahan diri untuk mencubanya.

"Mesin rangkaian neural steampunk surreal, dalam bentuk otak, diletakkan di atas tapak yang ditutup dengan neuron yang diperbuat daripada gear", masukkan teks ini Kemudian, karya agungnya dihasilkan.

Video 2 minit (~1 jam dipaparkan pada A100), dijana oleh interpolasi lancar antara model dengan input hingar rawak.

Model yang dipanggil Stable Diffusion ini menggunakan kaedah "interpolasi" antara makna dua ayat. Sisipan ialah jurang semantik dan bukannya visual, jadi ia secara dramatik mengubah cara cerita itu disampaikan.

Dan ini hanyalah permulaan revolusi penciptaan kandungan digital yang dipacu oleh kecerdasan buatan generatif.

‍Resapan Stabil: Satu Pencapaian untuk Model Sumber Terbuka

Sejak awal tahun 2021, kecerdasan buatan yang boleh menjana imej daripada huraian teks telah berkembang pesat. Pada masa itu, OpenAI menunjukkan hasil yang mengagumkan dengan DALL-E 1 dan CLIP.

Pada tahun 2022, OpenAI mengeluarkan DALL-E 2 yang mengagumkan, Google mempamerkan Imagen dan Parti, Midjourney melancarkan beta awam, dan Craiyon mencipta imej AI di mana-mana jenis media sosial.

Dan kini baru-baru ini, Stability AI telah mengeluarkan model baharu - Stable Diffusion.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Walau bagaimanapun, tidak seperti DALL-E 2, Stable Diffusion boleh melahirkan pelbagai orang terkenal yang diharamkan oleh OpenAI.

Walaupun sistem seperti Midjourney, Pixelz.ai, dsb. juga boleh melakukannya, kualiti yang dihasilkannya adalah jauh daripada setanding dengan Stable Diffusion , dan tiada satu pun daripadanya sumber terbuka.

Kini kami menjemput rakan lama kami Musk untuk melakukan transformasi saat kedua menjadi "Black Widow" (Scarlett Johansson).

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Jelas sekali, Stability AI, sebagai peneraju pembangun, berharap lebih daripada satu syarikat atau pasukan akan dapat melatih varian Stable Diffusion.

Sebagai contoh, anda seorang penyelidik yang tidak mempunyai kuasa pengkomputeran GPU yang besar. Jangan risau, Stable Diffusion tidak lama lagi akan dapat dijalankan pada kad grafik dengan hanya 5.1GB VRAM.

Sebagai contoh lain, jika anda peminat MacBook yang dilengkapi dengan cip Apple M1, Stable Diffusion juga boleh dijalankan. Walau bagaimanapun, masa untuk penjanaan imej akan berubah daripada beberapa saat kepada beberapa minit.

Nampaknya model multimodal sedang menuju ke laluan yang telah diambil oleh model bahasa besar sebelum ini: beralih daripada vendor tunggal dan menjadikan banyak alternatif tersedia secara meluas melalui sumber terbuka.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Selain itu, Runway sudah pun mengkaji cara melaksanakan penyuntingan teks-ke-video berdasarkan Stable Diffusion.

Dalam satu perkataan, biarlah gelanggang tenis menjadi pantai

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Tidak kira kilat dan guruh, atau angin dan cahaya matahari;

Sama ada di bulan atau di Marikh; tenis...

Menggunakan pengiraan untuk mempercepatkan sumber terbuka AI asasModel ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Selepas fasa ujian, Stable Diffusion akan menjadi percuma dan kod serta model terlatih akan dikeluarkan sebagai sumber terbuka. Terdapat juga versi yang dihoskan dengan antara muka web untuk pengguna menguji sistem.

Stable Diffusion ialah hasil kerjasama antara penyelidik di Stability AI, RunwayML, LMU Munich, EleutherAI dan LAION. EleutherAI terkenal dengan model bahasa sumber terbukanya GPT-J-6B dan GPT-NeoX-20B, dsb.

Organisasi bukan untung LAION (Large Scale Artificial Intelligence Open Network) menyediakan set data LAION 5B sumber terbuka untuk data latihan, yang ditapis oleh pasukan berdasarkan maklum balas manusia semasa fasa ujian awal untuk Mencipta set data latihan LAION-Aesthetics akhir.

Patrick Esser dari Runway dan Robin Rombach dari LMU Munich mengetuai projek itu, yang penyelidikannya dalam kumpulan CompVis di Universiti Heidelberg meletakkan asas bagi projek itu. Di Universiti Heidelberg mereka mencipta VQGAN dan Latent Diffusion yang digunakan secara meluas. Kedua-dua model ini, ditambah dengan hasil OpenAI dan Google Brain, mendayakan Stable Diffusion.

Stability AI diasaskan pada 2020, dan pelabur di belakangnya ialah ahli matematik dan saintis komputer Emad Mostaque. Beliau telah bekerja sebagai penganalisis di pelbagai dana lindung nilai.

Dengan Stability AI dan kekayaan peribadinya, Mostaque berharap dapat memupuk komuniti penyelidikan AI sumber terbuka. Permulaannya sebelum ini telah menyokong penciptaan set data "LAION 5B". Untuk melatih model Stable Diffusion, Stability AI menyediakan pelayan dengan 4,000 GPU Nvidia A100.

"Tiada orang lain yang mempunyai kuasa membuat keputusan kecuali 75 pekerja kami - bukan bilionair, dana besar atau kerajaan. Kami bebas sepenuhnya." "Kami merancang untuk menggunakan pengkomputeran kami untuk mempercepatkan sumber terbuka kecerdasan buatan asas."

Netizen menjadi gila

Selain dua video pada mulanya, sesetengah netizen juga menggunakan Stable Diffusion menjana animasi penuaan.

Dia menyatakan bahawa menukar perkataan dalam gesaan yang panjang semasa pengeluaran mempunyai kesan yang lebih halus berbanding dengan gesaan yang pendek. Selain itu, menggunakan perihalan seperti tua, pertengahan umur atau muda selalunya berfungsi lebih baik daripada menyatakan umur tertentu seperti 10, 40 atau 80 tahun.

Selain itu, terdapat pelbagai gambar pegun termenung.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

「Kekasih」

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

「Singa」

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

"Dark Soul" yang ditulis oleh Leyendecker dan Maxence

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

"Cyber ​​​​Peking Opera"

Easter EggModel ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Alami perjalanan mental yang terseksa oleh bekas pengarah kecerdasan buatan dan penglihatan pemanduan autonomi Tesla Andrej Karpathy.

Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!

Selepas menonton video yang dibuat oleh tuannya, Karpathy sangat teruja.

Keputusan yang dicapai melalui beberapa siri operasi tidak akan terasa terkeluar walaupun dalam kelas tadika kecil. Karpathy yang terdesak berkata bahawa dia ingin mengupah "jurutera segera" untuk menciptanya untuknya. Akhirnya Karpathy akhirnya sedar dan mencipta karya baru yang sangat dia berpuas hati - mesin rangkaian saraf tiruan steampunk dan pasta blueberry.

Atas ialah kandungan terperinci Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

Repo: Cara menghidupkan semula rakan sepasukan
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Cara mendapatkan biji gergasi
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Elakkan kesilapan yang disebabkan secara lalai dalam penyataan suis C Elakkan kesilapan yang disebabkan secara lalai dalam penyataan suis C Apr 03, 2025 pm 03:45 PM

Strategi untuk mengelakkan kesilapan yang disebabkan oleh lalai dalam pernyataan suis C: Gunakan enums dan bukannya pemalar, mengehadkan nilai pernyataan kes kepada ahli yang sah dari enum. Gunakan kejatuhan dalam pernyataan kes terakhir untuk membiarkan program terus melaksanakan kod berikut. Untuk pernyataan suis tanpa kejatuhan, selalu tambahkan pernyataan lalai untuk pengendalian ralat atau memberikan tingkah laku lalai.

Kepentingan lalai dalam pernyataan kes suis (bahasa c) Kepentingan lalai dalam pernyataan kes suis (bahasa c) Apr 03, 2025 pm 03:57 PM

Pernyataan lalai adalah penting dalam pernyataan kes suis kerana ia menyediakan laluan pemprosesan lalai yang memastikan bahawa blok kod dilaksanakan apabila nilai pembolehubah tidak sepadan dengan sebarang pernyataan kes. Ini menghalang tingkah laku atau kesilapan yang tidak dijangka dan meningkatkan keteguhan kod.

Apakah jenis nilai pulangan fungsi bahasa C? Ringkasan jenis nilai pulangan fungsi bahasa C? Apakah jenis nilai pulangan fungsi bahasa C? Ringkasan jenis nilai pulangan fungsi bahasa C? Apr 03, 2025 pm 11:18 PM

Jenis nilai pulangan fungsi bahasa C termasuk int, float, double, char, void dan jenis penunjuk. Int digunakan untuk mengembalikan bilangan bulat, terapung dan dua kali digunakan untuk mengembalikan terapung, dan char mengembalikan aksara. Kekosongan bermaksud bahawa fungsi tidak mengembalikan sebarang nilai. Jenis penunjuk mengembalikan alamat memori, berhati -hati untuk mengelakkan kebocoran ingatan. Struktur atau konsortium boleh mengembalikan pelbagai data yang berkaitan.

Konsep fungsi bahasa c Konsep fungsi bahasa c Apr 03, 2025 pm 10:09 PM

F Fungsi bahasa adalah blok kod yang boleh diguna semula. Mereka menerima input, melakukan operasi, dan hasil pulangan, yang secara modular meningkatkan kebolehgunaan dan mengurangkan kerumitan. Mekanisme dalaman fungsi termasuk parameter lulus, pelaksanaan fungsi, dan nilai pulangan. Seluruh proses melibatkan pengoptimuman seperti fungsi dalam talian. Fungsi yang baik ditulis mengikut prinsip tanggungjawab tunggal, bilangan parameter kecil, penamaan spesifikasi, dan pengendalian ralat. Penunjuk yang digabungkan dengan fungsi dapat mencapai fungsi yang lebih kuat, seperti mengubahsuai nilai pembolehubah luaran. Pointer fungsi meluluskan fungsi sebagai parameter atau alamat kedai, dan digunakan untuk melaksanakan panggilan dinamik ke fungsi. Memahami ciri dan teknik fungsi adalah kunci untuk menulis program C yang cekap, boleh dipelihara, dan mudah difahami.

Apakah julat nilai char dalam bahasa c Apakah julat nilai char dalam bahasa c Apr 03, 2025 pm 03:39 PM

Julat nilai char dalam bahasa C bergantung kepada kaedah pelaksanaan: ditandatangani char: -128 hingga 127 char unsigned: 0 hingga 255 Julat khusus dipengaruhi oleh seni bina komputer dan pilihan penyusun. Secara lalai, Char ditetapkan kepada jenis yang ditandatangani.

Bahasa C bermula dari 0 Bahasa C bermula dari 0 Apr 03, 2025 pm 08:24 PM

Ia mungkin agak sukar untuk memulakan pembelajaran bahasa C, tetapi selepas menguasai kaedah yang betul, anda akan dengan cepat menguasai asas -asas dan secara beransur -ansur menguasai mereka. Panduan ini akan membimbing anda langkah demi langkah untuk mempelajari konsep teras bahasa C, dari asas -asas ke topik lanjutan. Direktori C Language Asas dan Jenis Data Input Pengguna Sambungan Singkatan Ekspresi Bersyarat Penyataan Bahasa C Array bahasa bersarang gelang C Function Struktur Penunjuk C Language Asas dan Jenis Data C Program mengikuti struktur standard dan gunakan pelbagai jenis data untuk menentukan pembolehubah. Struktur program asas adalah seperti berikut: #includeIntMain () {printf ("hello, dunia!"); Ret

Cara Mengira C-SubScript 3 Subscript 5 C-SubScript 3 Subscript 5 Algoritma Tutorial Cara Mengira C-SubScript 3 Subscript 5 C-SubScript 3 Subscript 5 Algoritma Tutorial Apr 03, 2025 pm 10:33 PM

Pengiraan C35 pada dasarnya adalah matematik gabungan, yang mewakili bilangan kombinasi yang dipilih dari 3 dari 5 elemen. Formula pengiraan ialah C53 = 5! / (3! * 2!), Yang boleh dikira secara langsung oleh gelung untuk meningkatkan kecekapan dan mengelakkan limpahan. Di samping itu, memahami sifat kombinasi dan menguasai kaedah pengiraan yang cekap adalah penting untuk menyelesaikan banyak masalah dalam bidang statistik kebarangkalian, kriptografi, reka bentuk algoritma, dll.

C Programmer &#S Panduan Tingkah Laku Tidak Ditentukan C Programmer &#S Panduan Tingkah Laku Tidak Ditentukan Apr 03, 2025 pm 07:57 PM

Meneroka tingkah laku yang tidak ditentukan dalam pengaturcaraan C: Panduan terperinci artikel ini memperkenalkan e-book mengenai tingkah laku yang tidak ditentukan dalam pengaturcaraan C, sejumlah 12 bab yang meliputi beberapa aspek pengaturcaraan C yang paling sukar dan kurang dikenali. Buku ini bukan buku teks pengenalan untuk bahasa C, tetapi bertujuan untuk pembaca yang biasa dengan pengaturcaraan bahasa C, dan meneroka pelbagai situasi yang mendalam dan akibat yang berpotensi dari tingkah laku yang tidak ditentukan. Pengarang Dmitrysviridkin, editor Andrey Karpov. Selepas enam bulan penyediaan yang teliti, e-book ini akhirnya bertemu dengan pembaca. Versi bercetak juga akan dilancarkan pada masa akan datang. Buku ini pada asalnya dirancang untuk memasukkan 11 bab, tetapi semasa proses penciptaan, kandungannya terus diperkaya dan akhirnya diperluas kepada 12 bab-ini sendiri adalah kes klasik yang luar bounds, dan boleh dikatakan setiap pengaturcara C

See all articles