Rumah Peranti teknologi AI Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

Mar 05, 2024 am 09:46 AM
ai data

Pada masa ini, keupayaan inovatif yang menakjubkan bagi model berskala besar terus memberi impak kepada bidang kreatif, terutamanya wakil teknologi penjanaan video seperti Sora. Walaupun Sora telah menerajui trend generasi baharu, ia mungkin patut diberi perhatian kepada hasil penyelidikan terkini Apple sekarang.

Para penyelidik Apple baru-baru ini mengeluarkan rangka kerja yang dipanggil "Keyframer", yang boleh menggunakan model bahasa yang besar untuk menjana animasi. Rangka kerja ini membolehkan pengguna membuat animasi dengan mudah untuk imej 2D statik melalui gesaan bahasa semula jadi. Penyelidikan ini menunjukkan potensi model bahasa dalam mereka bentuk animasi, menyediakan pereka animasi dengan alat yang lebih cekap dan intuitif. Alamat kertas: https://arxiv.org/pdf/2402.06071.pdf alat animasi dipacu AI baharu Keyframer. Keyframer membenarkan pengguna mencipta ilustrasi animasi daripada imej 2D statik melalui gesaan bahasa semula jadi. Dengan GPT-4, Keyframer boleh menjana kod animasi CSS untuk menghidupkan input SVG (Grafik Vektor Boleh Skala).

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.Selain itu, Keyframer menyokong pengguna untuk terus mengedit animasi yang dihasilkan melalui pelbagai jenis editor.

Pengguna boleh menambah baik reka bentuk mereka secara berterusan menggunakan varian reka bentuk yang dijana oleh LLM melalui gesaan dan permintaan berulang, dengan itu berfikir dalam arah reka bentuk baharu. Bagaimanapun, Keyframer masih belum didedahkan kepada umum.

Sebab untuk melakukan penyelidikan ini adalah kerana Apple menyatakan bahawa aplikasi LLM dalam animasi belum diterokai sepenuhnya dan membawa cabaran baharu, seperti bagaimana pengguna boleh menerangkan gerakan secara berkesan dalam bahasa semula jadi. Walaupun alat grafik Vincentian seperti Dall・E dan Midjourney pada masa ini hebat, reka bentuk animasi memerlukan pertimbangan yang lebih kompleks, seperti masa dan penyelarasan, yang sukar untuk diringkaskan sepenuhnya dalam satu gesaan.

Pengguna hanya memuat naik imej, masukkan sesuatu seperti "biar bintang berkelip" dalam kotak gesaan, dan klik jana untuk melihat kesan kajian ini.

Pengguna boleh menjana berbilang reka bentuk animasi dalam satu kelompok dan melaraskan sifat seperti kod warna dan tempoh animasi dalam tetingkap berasingan. Tiada pengalaman pengekodan diperlukan kerana Keyframer menukar perubahan ini kepada CSS secara automatik dan kod itu sendiri boleh diedit sepenuhnya. Pendekatan berasaskan penerangan ini jauh lebih mudah daripada bentuk animasi janaan AI yang lain, yang selalunya memerlukan beberapa aplikasi berbeza dan beberapa pengalaman pengekodan.

Pengenalan kepada Keyframer

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.Keyframer ialah aplikasi berkuasa LLM yang direka untuk mencipta animasi daripada imej statik. Keyframer memanfaatkan keupayaan penjanaan kod LLM dan struktur semantik grafik vektor statik (SVG) untuk menjana animasi berdasarkan isyarat bahasa semula jadi yang disediakan oleh pengguna.

Input

: Sistem ini menyediakan kawasan input di mana pengguna boleh menampal kod imej SVG yang mereka mahu animasikan (SVG ialah format imej standard dan popular yang digunakan dalam ilustrasi yang biasa digunakan untuk skala dan keserasiannya pada pelbagai platform). Dalam Keyframer, pemaparan SVG dipaparkan di sebelah editor kod supaya pengguna boleh pratonton reka bentuk visual imej Seperti yang ditunjukkan dalam Rajah 2, kod SVG untuk ilustrasi Zuhal mengandungi pengecam seperti langit, cincin, dsb. .

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

GPT Tips: Sistem ini membenarkan pengguna memasukkan gesaan bahasa semula jadi untuk mencipta animasi. Pengguna boleh meminta satu reka bentuk (membuat planet berputar) atau berbilang variasi reka bentuk (cipta reka bentuk dengan 3 bintang berkelip), dan kemudian klik butang Jana Animasi untuk memulakan permintaan. Sebelum menghantar permintaan pengguna kepada GPT, kajian memperhalusi gesaannya dengan XML SVG mentah penuh dan menentukan format respons LLM.

GPT Output: Sebaik sahaja permintaan segera bermula, GPT menghantar respons, yang terdiri daripada satu atau lebih serpihan CSS, seperti yang ditunjukkan dalam Rajah 3.

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

Rendering: Bahagian rendering termasuk (1) rendering visual setiap animasi dan penjelasan 1 ayat yang dihasilkan oleh LLM (2) siri editor untuk mengubah suai reka bentuk.

Editor kod dilaksanakan menggunakan CodeMirror; editor hartanah menyediakan UI khusus harta untuk mengedit kod, contohnya, untuk mengedit warna, kajian menyediakan pemilih warna. Rajah 5 menunjukkan editor kod dan ikon editor harta.

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

Lelaran: Untuk menyokong pengguna meneroka lebih mendalam dalam proses penciptaan animasi (DG1), kajian itu juga menyediakan ciri yang membolehkan pengguna membina secara berulang pada animasi yang dijana menggunakan gesaan . Terdapat butang " + Tambah Prompt Baharu " di bawah setiap reka bentuk yang dijana dengan mengklik butang ini membuka borang baharu di bahagian bawah halaman untuk pengguna melanjutkan reka bentuk mereka dengan gesaan baharu.

Simpan bar sisi dan ringkasan anda yang direka bentuk. Sistem ini membenarkan pengguna membintangi reka bentuk dan menambahkannya pada bar sisi, seperti yang ditunjukkan di sebelah kanan Rajah 6. Selain itu, sistem ini mempunyai mod ringkasan yang menyembunyikan semua editor teks dan memaparkan animasi serta gesaannya, membolehkan pengguna menyemak semula gesaan dan reka bentuk sebelumnya dengan pantas.

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

Semasa percubaan, pasukan Apple memilih 13 peserta (6 wanita, 7 lelaki) untuk mencuba Keyframer. Jadual 1 menyediakan beberapa maklumat tentang peserta dan kemahiran yang mereka kuasai.

Malah pereka gerakan profesional "EP13" juga melihat potensi Keyframer untuk mengembangkan keupayaannya: "Saya agak bimbang alat ini akan menggantikan kerja kami kerana potensinya sangat besar. Tetapi jika anda memikirkannya dengan teliti, penyelidikan ini Ia hanya akan meningkatkan kemahiran kita. Ia sepatutnya menjadi sesuatu yang menggembirakan."

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

Secara keseluruhannya, para peserta berpuas hati dengan pengalaman menggunakan Keyframer. Para peserta memberikan skor purata 3.9, antara berpuas hati (4) dan neutral (3). Peserta menghasilkan 223 reka bentuk. Secara purata, setiap peserta menghasilkan 17.2 reka bentuk. Rajah 8 menunjukkan contoh animasi akhir untuk dua peserta.

Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.

Sila rujuk kertas asal untuk butiran lanjut teknikal.

Atas ialah kandungan terperinci Hanya satu ayat untuk membuat gambar bergerak Apple menggunakan animasi model besar untuk menjana, dan hasilnya boleh diedit terus.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Apr 08, 2025 pm 12:24 PM

Cecair memproses 7 juta rekod dan membuat peta interaktif dengan teknologi geospatial. Artikel ini meneroka cara memproses lebih dari 7 juta rekod menggunakan Laravel dan MySQL dan mengubahnya menjadi visualisasi peta interaktif. Keperluan Projek Cabaran Awal: Ekstrak Wawasan berharga menggunakan 7 juta rekod dalam pangkalan data MySQL. Ramai orang mula -mula mempertimbangkan bahasa pengaturcaraan, tetapi mengabaikan pangkalan data itu sendiri: Bolehkah ia memenuhi keperluan? Adakah penghijrahan data atau pelarasan struktur diperlukan? Bolehkah MySQL menahan beban data yang besar? Analisis awal: Penapis utama dan sifat perlu dikenalpasti. Selepas analisis, didapati bahawa hanya beberapa atribut yang berkaitan dengan penyelesaiannya. Kami mengesahkan kemungkinan penapis dan menetapkan beberapa sekatan untuk mengoptimumkan carian. Carian Peta Berdasarkan Bandar

Cara menetapkan masa tamat vue axios Cara menetapkan masa tamat vue axios Apr 07, 2025 pm 10:03 PM

Untuk menetapkan masa untuk Vue Axios, kita boleh membuat contoh Axios dan menentukan pilihan masa tamat: dalam tetapan global: vue.prototype. $ Axios = axios.create ({timeout: 5000}); Dalam satu permintaan: ini. $ axios.get ('/api/pengguna', {timeout: 10000}).

Cara menyelesaikan MySQL tidak dapat dimulakan Cara menyelesaikan MySQL tidak dapat dimulakan Apr 08, 2025 pm 02:21 PM

Terdapat banyak sebab mengapa permulaan MySQL gagal, dan ia boleh didiagnosis dengan memeriksa log ralat. Penyebab umum termasuk konflik pelabuhan (periksa penghunian pelabuhan dan ubah suai konfigurasi), isu kebenaran (periksa keizinan pengguna yang menjalankan perkhidmatan), ralat fail konfigurasi (periksa tetapan parameter), rasuah direktori data (memulihkan data atau membina semula ruang meja), isu ruang jadual InnoDB (semak fail ibdata1) Apabila menyelesaikan masalah, anda harus menganalisisnya berdasarkan log ralat, cari punca utama masalah, dan mengembangkan tabiat sandaran data secara teratur untuk mencegah dan menyelesaikan masalah.

Cara Menggunakan MySQL Selepas Pemasangan Cara Menggunakan MySQL Selepas Pemasangan Apr 08, 2025 am 11:48 AM

Artikel ini memperkenalkan operasi pangkalan data MySQL. Pertama, anda perlu memasang klien MySQL, seperti MySqlworkbench atau Command Line Client. 1. Gunakan perintah MySQL-Uroot-P untuk menyambung ke pelayan dan log masuk dengan kata laluan akaun root; 2. Gunakan CreateTatabase untuk membuat pangkalan data, dan gunakan Pilih pangkalan data; 3. Gunakan createtable untuk membuat jadual, menentukan medan dan jenis data; 4. Gunakan InsertInto untuk memasukkan data, data pertanyaan, kemas kini data dengan kemas kini, dan padam data dengan padam. Hanya dengan menguasai langkah -langkah ini, belajar menangani masalah biasa dan mengoptimumkan prestasi pangkalan data anda boleh menggunakan MySQL dengan cekap.

Jurutera Backend Senior Remote (Platform) memerlukan kalangan Jurutera Backend Senior Remote (Platform) memerlukan kalangan Apr 08, 2025 pm 12:27 PM

Jurutera Backend Senior Remote Company Kekosongan Syarikat: Lokasi Lokasi: Jauh Pejabat Jauh Jenis: Gaji sepenuh masa: $ 130,000- $ 140,000 Penerangan Pekerjaan Mengambil bahagian dalam penyelidikan dan pembangunan aplikasi mudah alih Circle dan ciri-ciri berkaitan API awam yang meliputi keseluruhan kitaran hayat pembangunan perisian. Tanggungjawab utama kerja pembangunan secara bebas berdasarkan rubyonrails dan bekerjasama dengan pasukan react/redux/relay front-end. Membina fungsi teras dan penambahbaikan untuk aplikasi web dan bekerjasama rapat dengan pereka dan kepimpinan sepanjang proses reka bentuk berfungsi. Menggalakkan proses pembangunan positif dan mengutamakan kelajuan lelaran. Memerlukan lebih daripada 6 tahun backend aplikasi web kompleks

Bolehkah mysql kembali json Bolehkah mysql kembali json Apr 08, 2025 pm 03:09 PM

MySQL boleh mengembalikan data JSON. Fungsi JSON_EXTRACT mengekstrak nilai medan. Untuk pertanyaan yang kompleks, pertimbangkan untuk menggunakan klausa WHERE untuk menapis data JSON, tetapi perhatikan kesan prestasinya. Sokongan MySQL untuk JSON sentiasa meningkat, dan disyorkan untuk memberi perhatian kepada versi dan ciri terkini.

Memahami sifat asid: tiang pangkalan data yang boleh dipercayai Memahami sifat asid: tiang pangkalan data yang boleh dipercayai Apr 08, 2025 pm 06:33 PM

Penjelasan terperinci mengenai atribut asid asid pangkalan data adalah satu set peraturan untuk memastikan kebolehpercayaan dan konsistensi urus niaga pangkalan data. Mereka menentukan bagaimana sistem pangkalan data mengendalikan urus niaga, dan memastikan integriti dan ketepatan data walaupun dalam hal kemalangan sistem, gangguan kuasa, atau pelbagai pengguna akses serentak. Gambaran keseluruhan atribut asid Atomicity: Transaksi dianggap sebagai unit yang tidak dapat dipisahkan. Mana -mana bahagian gagal, keseluruhan transaksi dilancarkan kembali, dan pangkalan data tidak mengekalkan sebarang perubahan. Sebagai contoh, jika pemindahan bank ditolak dari satu akaun tetapi tidak meningkat kepada yang lain, keseluruhan operasi dibatalkan. Begintransaction; UpdateAcCountSsetBalance = Balance-100Wh

Kunci utama MySQL boleh menjadi batal Kunci utama MySQL boleh menjadi batal Apr 08, 2025 pm 03:03 PM

Kunci utama MySQL tidak boleh kosong kerana kunci utama adalah atribut utama yang secara unik mengenal pasti setiap baris dalam pangkalan data. Jika kunci utama boleh kosong, rekod tidak dapat dikenal pasti secara unik, yang akan membawa kepada kekeliruan data. Apabila menggunakan lajur integer sendiri atau UUIDs sebagai kunci utama, anda harus mempertimbangkan faktor-faktor seperti kecekapan dan penghunian ruang dan memilih penyelesaian yang sesuai.

See all articles