Baru-baru ini, Stability.ai, sebuah syarikat yang diasaskan dan dibiayai oleh Emad Mostaque, mengumumkan keluaran umum karya seni yang dicipta oleh AI.
Anda mungkin fikir ini hanyalah satu lagi percubaan AI dalam bidang seni, tetapi ia sebenarnya lebih daripada itu. Terdapat dua sebab. Pertama, tidak seperti DALL-E 2, Stable Diffusion ialah sumber terbuka. Ini bermakna sesiapa sahaja boleh memanfaatkan tulang belakangnya untuk membina aplikasi bagi tugasan penciptaan teks-ke-imej khusus secara percuma. Selain itu, pembangun Midjourney melaksanakan ciri yang membolehkan pengguna menggabungkannya dengan Stable Diffusion, yang telah membawa kepada beberapa hasil yang menakjubkan.
Cuba bayangkan apa yang akan berlaku dalam beberapa bulan akan datang. Kedua, tidak seperti DALL-E mini dan Disco Diffusion, Stable Diffusion boleh mencipta karya realistik dan artistik yang menakjubkan, tiada apa yang perlu dicemburui OpenAI atau model Google. Orang ramai juga mendakwa bahawa ia adalah SOTA baharu di kalangan "enjin carian generatif". (Melainkan dinyatakan sebaliknya, semua imej dalam artikel ini dibuat menggunakan Resapan Stabil).
Resapan Stabil merangkumi ciri terbaik dunia seni AI: ia boleh dikatakan model seni AI terbaik yang tersedia, dan ia adalah sumber terbuka. Perkara ini tidak pernah didengari dan akan memberi impak yang besar. Apa yang lebih menarik ialah berita tentang perkhidmatan ini mungkin sampai kepada anda melalui sumber yang paling tidak dijangka. Ibu bapa anda, anak-anak anda, pasangan anda, rakan anda atau rakan sekerja anda. Mereka ini selalunya orang luar terhadap apa yang berlaku dalam bidang kecerdasan buatan, dan mereka akan menemui trend terkini dalam bidang ini. Seni boleh menjadi cara AI akhirnya mengetuk pintu mereka yang buta tentang masa depan. Bukankah ini sangat puitis?
Stability.ai dilahirkan untuk mencipta "alat AI terbuka yang membolehkan kita merealisasikan potensi kita." Bukan sahaja model penyelidikan yang tidak pernah sampai ke tangan kebanyakan orang, tetapi alat dengan aplikasi dunia sebenar, terbuka untuk saya dan anda untuk menggunakan dan meneroka.
Inilah yang membezakannya daripada syarikat teknologi lain, seperti OpenAI, yang dengan cemburu menjaga rahsia sistem terbaiknya (GPT-3 dan DALL-E 2), atau Google, yang tidak pernah berhasrat untuk mengeluarkannya. anda sendiri (PaLM, LaMDA, Imagen atau Parti) sebagai beta peribadi. Keluaran awam Stability.ai ini melangkaui perkongsian berat dan kod model—yang, walaupun penting kepada kesihatan sains dan teknologi, bukanlah sesuatu yang diutamakan oleh kebanyakan orang. Dan juga menyediakan tapak web bebas kod, sedia untuk digunakan untuk kita yang tidak mahu atau tidak tahu cara membuat kod.
Laman web ini dipanggil DreamStudio Lite, yang percuma untuk digunakan dan boleh menjana sehingga 200 gambar. Seperti DALL-E 2, ia mempunyai model langganan berbayar, yang memberi anda 1,000 imej untuk £10 (OpenAI menambah 15 kredit setiap bulan, tetapi untuk mendapatkan lebih banyak kredit anda perlu membeli pek 115 dengan harga $15). Kos DALL-E ialah US$0.03/imej, manakala kos Stable Diffusion ialah £0.01/imej. Selain itu, Resapan Stabil boleh digunakan pada skala melalui API (skala kos secara linear, jadi anda boleh mendapatkan 100K generasi untuk £1000). Selain penjanaan imej, Stability.ai akan mengumumkan DreamStudio Pro (audio/video) dan Enterprise (studio) tidak lama lagi. Ciri lain yang mungkin dilaksanakan oleh DreamStudio tidak lama lagi ialah keupayaan untuk menjana imej daripada imej lain, bukannya persediaan teks ke imej biasa. Seperti ini:
Di tapak web, terdapat juga sumber tentang kejuruteraan segera, yang mungkin berguna jika anda baru dalam bidang ini. Selain itu, tidak seperti DALL-E 2, anda boleh mengawal parameter untuk mempengaruhi hasil dan mengekalkan lebih banyak agensi ke atasnya. Stability.ai telah melakukan segala-galanya untuk memudahkan akses kepada model. OpenAI adalah yang pertama dan terpaksa berjalan lebih perlahan untuk menilai potensi risiko dan berat sebelah yang wujud dalam model, tetapi mereka tidak perlu mengekalkan model dalam beta tertutup untuk sekian lama atau membina model perniagaan sedemikian yang menyekat kreativiti. Kedua-dua Midjourney dan Stable Diffusion telah membuktikannya.
Teknologi sumber terbuka mempunyai hadnya sendiri. Keterbukaan harus didahulukan sebelum privasi dan kawalan ketat, tetapi bukan sebelum keselamatan. Seperti yang dijelaskan oleh syarikat dalam pengumuman itu, ia adalah "lesen yang membenarkan penggunaan komersil dan bukan komersial," dengan tumpuan pada penggunaan model hiliran terbuka dan bertanggungjawab. Ia juga memberi mandat bahawa karya terbitan tertakluk kepada sekurang-kurangnya sekatan berasaskan pengguna yang sama.
Model sumber terbuka adalah model yang baik dengan sendirinya, tetapi jika kita tidak mahu teknologi ini akhirnya mencederakan orang, atau menambahkan lagi keangkuhan kepada internet dalam bentuk maklumat salah, Ia adalah sama penting untuk mewujudkan pagar yang munasabah. “Oleh kerana model ini dilatih pada pelbagai pasangan teks imej yang dikikis Internet, model tersebut mungkin menghasilkan semula beberapa berat sebelah sosial dan menghasilkan kandungan yang tidak selamat, jadi strategi mitigasi terbuka dan perbincangan awam tentang berat sebelah ini boleh membenarkan semua orang untuk Menjadi sebahagian daripada perbualan ini . Dalam apa jua keadaan, keterbukaan + keselamatan > privasi dan kawalan.
Dengan asas nilai etika dan keterbukaan yang kukuh, Stable Diffusion berjanji untuk mengatasi pesaingnya dalam impak dunia nyata.
Bagi mereka yang ingin memuat turun dan menjalankannya pada komputer mereka, anda harus tahu bahawa ia memerlukan 6.9Gb VRAM - ini sesuai untuk GPU gred pengguna mewah, menjadikannya lebih kecil daripada DALL- E 2 Menjadi ringan, tetapi masih tidak dapat dicapai oleh kebanyakan pengguna. Anda yang lain, seperti saya, boleh mula menggunakan Dream Studio dengan segera.
Stable Diffusion secara meluas dianggap sebagai model seni AI terbaik pada masa ini, dan ia akan menjadi asas untuk banyak aplikasi, rangkaian dan perkhidmatan, mentakrifkan semula cara kami mencipta dan berinteraksi dengan seni. Tetapi kini, apl yang direka khusus untuk kes penggunaan yang berbeza akan dibina dari bawah untuk digunakan oleh semua orang. Orang ramai mempertingkatkan lukisan kanak-kanak, membuat kolaj dengan lukisan luar + lukisan dalam, mereka bentuk muka depan majalah, melukis komik, mencipta video yang diubah suai dan animasi, menjana imej daripada imej dan banyak lagi. Sesetengah aplikasi ini sudah boleh dilakukan dalam DALL-E dan Midjourney, tetapi Stable Diffusion boleh mendorong revolusi kreatif semasa ke peringkat seterusnya. Dalam kata-kata bekas pengarah Tesla AI dan pengikut Li Feifei Andrej Karpathy, "penciptaan artistik telah memasuki era baharu kerjasama manusia + AI." model seni melibatkan kelas alat baharu yang harus difahami dengan kerangka pemikiran baharu untuk realiti baharu yang kita jalani. Kita tidak boleh hanya melukis analogi atau persamaan dengan era lain dan mengharapkan dapat menjelaskan atau meramal masa depan dengan tepat. Sesetengah perkara akan serupa, ada yang tidak. Kita mesti menganggap masa depan yang akan datang ini sebagai wilayah yang belum dipetakan.
Ditulis pada penghujungnya
Tidak dinafikan bahawa keluaran awam Stable Diffusion adalah acara paling penting dan berpengaruh yang pernah ada dalam bidang kecerdasan buatan model seni, Dan ini hanyalah permulaan.
Emad Mostaque, salah seorang pengarang, berkata di Twitter: "Jangkakan kualiti akan terus meningkat apabila kami mengeluarkan model yang lebih pantas, lebih baik dan lebih spesifik. Bukan hanya imej, tetapi audio bulan depan, Kemudian bergerak ke 3D, video, bahasa dan banyak lagi latihanKami berada di ambang revolusi berbilang tahun dalam cara kami berinteraksi, berhubung dan memahami seni serta kreativiti secara umum. Dan bukan sahaja dalam bidang falsafah, intelektual, tetapi sebagai sesuatu yang kini dikongsi dan dialami oleh semua orang. Dunia kreatif akan berubah selama-lamanya dan kita mesti mempunyai perbualan terbuka dan hormat untuk mencipta masa depan yang lebih baik untuk semua. Hanya apabila teknologi sumber terbuka digunakan secara bertanggungjawab, kita boleh mencipta perubahan yang ingin kita lihat.
Atas ialah kandungan terperinci Bukan sahaja DALL·E! Kini pelukis AI boleh membuat model dan membuat video Saya tidak dapat membayangkan apa yang akan berlaku pada masa hadapan.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!