Apple menunjukkan model AI baharu MGIE, yang boleh memperhalusi gambar dalam satu ayat-AI-php.cn

Apple menunjukkan model AI baharu MGIE, yang boleh memperhalusi gambar dalam satu ayat

PHPz

Lepaskan： 2024-02-08 11:33:25

ke hadapan

1333 orang telah melayarinya

苹果展示 AI 新模型 MGIE，可一句话精修图片

Berita 8 Februari Berbanding dengan kemakmuran Microsoft, susun atur Apple dalam bidang AI adalah lebih rendah, tetapi ini tidak bermakna Apple tidak membuat sebarang pencapaian dalam bidang ini. Apple baru-baru ini mengeluarkan model kecerdasan buatan sumber terbuka baharu yang dipanggil "MGIE", yang boleh mengedit imej berdasarkan arahan bahasa semula jadi.

苹果展示 AI 新模型 MGIE，可一句话精修图片

Sumber imej: VentureBeat dengan kerjasama Midjourney

MGIE (Penyuntingan Imej Berpandukan MLLM) ialah teknologi yang menggunakan model bahasa besar berbilang mod (MLLM) untuk melaksanakan arahan pengguna peringkat piksel dan Ia boleh memahami arahan bahasa semula jadi pengguna dan melakukan pengubahsuaian seperti Photoshop, pengoptimuman foto global dan penyuntingan tempatan. Melalui MGIE, pengguna boleh melakukan pelbagai suntingan pada gambar dengan mudah tanpa mengetahui perisian pemprosesan imej yang kompleks. Teknologi ini memudahkan proses penyuntingan imej di samping menyediakan kaedah penyuntingan yang lebih intuitif dan cekap.

苹果展示 AI 新模型 MGIE，可一句话精修图片

Apple, dengan kerjasama penyelidik di University of California, Santa Barbara, mengumumkan hasil penyelidikan berkaitan MGIE pada Persidangan Antarabangsa mengenai Perwakilan Pembelajaran (ICLR) 2024. ICLR adalah salah satu persidangan terpenting dalam bidang penyelidikan kecerdasan buatan.

Sebelum memperkenalkan MGIE, laman web ini akan memperkenalkan secara ringkas MLLM (Model Pembelajaran Bahasa Pelbagai Modal). MLLM ialah model kecerdasan buatan berkuasa yang unik kerana ia boleh memproses teks dan imej secara serentak, sekali gus meningkatkan keupayaan penyuntingan imej berasaskan arahan. MLLM telah menunjukkan keupayaan yang sangat baik dalam pemahaman silang mod dan penjanaan tindak balas persepsi visual, namun, ia masih belum digunakan secara meluas dalam tugas penyuntingan imej.

苹果展示 AI 新模型 MGIE，可一句话精修图片

MGIE mengintegrasikan MLLM ke dalam proses penyuntingan imej dalam dua cara: Pertama, ia memanfaatkan MLLM untuk memperoleh arahan yang tepat dan ekspresif daripada input pengguna. Arahan ini ringkas dan jelas, memberikan panduan yang jelas untuk proses penyuntingan.

Contohnya, apabila menaip "Jadikan langit lebih biru", MGIE boleh menjana arahan "Tingkatkan ketepuan kawasan langit sebanyak 20%".

Kedua, ia menggunakan MLLM untuk menjana imaginasi visual, iaitu, perwakilan terpendam bagi suntingan yang dikehendaki. Perwakilan ini menangkap intipati pengeditan dan boleh digunakan untuk membimbing operasi peringkat piksel. MGIE menggunakan skim latihan hujung ke hujung novel yang mengoptimumkan derivasi arahan, imaginasi visual dan modul penyuntingan imej secara bersama.

苹果展示 AI 新模型 MGIE，可一句话精修图片

MGIE boleh mengendalikan pelbagai situasi penyuntingan, daripada pelarasan warna mudah kepada manipulasi objek yang kompleks. Model ini juga boleh melakukan pengeditan global dan tempatan berdasarkan pilihan pengguna. Beberapa ciri dan fungsi MGIE termasuk:

Suntingan ungkapan berasaskan arahan: MGIE boleh menjana arahan ringkas dan jelas untuk membimbing proses penyuntingan dengan berkesan. Ini bukan sahaja meningkatkan kualiti penyuntingan tetapi juga meningkatkan keseluruhan pengalaman pengguna.
Suntingan Gaya Photoshop: MGIE boleh melakukan pengeditan gaya Photoshop biasa seperti memangkas, mengubah saiz, memutar, membalik dan menambah penapis. Mockup juga boleh menggunakan pengeditan yang lebih maju, seperti menukar latar belakang, menambah atau mengalih keluar objek dan menggabungkan imej.
Pengoptimuman Foto Global: MGIE boleh mengoptimumkan kualiti keseluruhan foto anda seperti kecerahan, kontras, ketajaman dan keseimbangan warna. Model ini juga boleh mengaplikasikan kesan artistik seperti lakaran, lukisan dan karikatur.
Suntingan Separa: MGIE boleh mengedit kawasan atau objek tertentu dalam imej, seperti muka, mata, rambut, pakaian dan aksesori. Model juga boleh mengubah suai sifat kawasan atau objek ini, seperti bentuk, saiz, warna, tekstur dan gaya.

苹果展示 AI 新模型 MGIE，可一句话精修图片

MGIE ialah projek sumber terbuka di GitHub Pengguna boleh klik di sini untuk mencari kod, data dan model yang telah dilatih. Projek ini juga menyediakan buku nota demo yang menunjukkan cara menggunakan MGIE untuk menyelesaikan pelbagai tugas penyuntingan.

Atas ialah kandungan terperinci Apple menunjukkan model AI baharu MGIE, yang boleh memperhalusi gambar dalam satu ayat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!