Kemunculan AI dalam penjanaan imej semakin meningkat hari ini. Tetapi AI mempunyai penggunaan potensi lain. Sebagai contoh, anda boleh menggunakan model untuk imej yang dihasilkan kelas atas; AURASR adalah berguna untuk menyelesaikan tugas-tugas ini. Satu ciri terbaik model ini adalah keupayaannya untuk menaikkan imej dari resolusi rendah ke resolusi yang lebih tinggi tanpa mengorbankan kualiti imej. Kami akan membincangkan beberapa aspek penting bagaimana model ini berfungsi.
Artikel ini diterbitkan sebagai sebahagian daripada Blogathon Sains Data.
Model ini memanfaatkan rangkaian adversarial generatif (GAN) kepada imej kelas atas. Ia mengambil imej resolusi rendah sebagai input dan menghasilkan versi resolusi tinggi imej yang sama. Ia membesarkan imej ini kepada empat kali yang asal tetapi mengisi butiran input untuk memastikan output tidak kehilangan kualitinya.
Aurasr berfungsi dengan sempurna dengan pelbagai jenis imej dan format. Anda boleh meningkatkan imej dalam format JPG, PNG, JPEG, dan WEBP.
Terdapat tiga sifat utama model ini. Walaupun kita akan kebanyakannya meneroka ciri -ciri upscaling, mari kita bercakap secara ringkas mengenai ketiga -tiga keupayaan model ini;
Salah satu faktor penting dalam kecekapan model ini ialah seni bina berasaskan GAN untuk resolusi imej. Model ini terdiri daripada dua komponen utama: penjana dan diskriminator. Penjana mencipta imej resolusi tinggi dari input resolusi rendah, manakala diskriminator menilai imej yang dihasilkan terhadap imej resolusi tinggi sebenar untuk memperbaiki prestasi penjana.
'Proses latihan adversarial' ini adalah yang menjadikan AURASR berkesan dan melaksanakan keupayaan untuk memahami butiran imej resolusi tinggi. Rangka kerja GAN AutoSR menawarkan kelajuan dalam masa pemprosesan sambil mengekalkan kualiti berbanding dengan penyebaran dan model autoregressive, yang boleh dikira secara intensif.
Prestasi yang mengagumkan AURASR datang dari keupayaannya untuk mengendalikan pelbagai faktor upscaling tanpa had resolusi yang telah ditetapkan, menjadikannya serba boleh untuk keperluan peningkatan imej yang berbeza. Kelajuannya adalah ciri yang menonjol: ia boleh menjana imej 1024 PX dalam hanya 0.25 saat.
Masa pemprosesan yang lebih cepat, digabungkan dengan skalabilitasnya, menjadikan AURASR penyelesaian yang sangat berkesan untuk aplikasi dunia nyata yang memerlukan peningkatan imej yang cepat dan fleksibel.
Running Inference pada model ini dipermudahkan dengan keperluan, perpustakaan, dan pakej yang lebih sedikit. Model ini memerlukan imej input dengan resolusi yang lebih rendah, kerana ia menghasilkan imej yang ditingkatkan. Berikut adalah langkah -langkah;
Kita mesti memasang pakej AURASR di Python untuk mendapatkan model ini berjalan. Anda boleh melakukan ini dengan hanya satu arahan, iaitu '! Pip pemasangan' seperti yang ditunjukkan di bawah:
! Pip memasang aura-sr
Langkah seterusnya adalah untuk mengimport perpustakaan yang diperlukan, yang, dalam kes ini, hanya perpustakaan Aura_SR buat masa ini. Kami juga perlu memuatkan model pra-terlatih, dan persediaan ini membolehkan anda menggunakan model AURASR untuk tugas upscaling imej dengan segera tanpa perlu melatih model itu sendiri.
dari aura_sr import aurasr aura_sr = aurasr.from_pretrained ("fal/aurasr-v2")
permintaan import Dari Import Bytesio IO dari gambar import pil
Ini adalah perpustakaan lain yang boleh membantu dengan tugas pemprosesan imej. 'Permintaan' adalah penting untuk memuat turun imej dari URL, sementara Bytesio membolehkan model untuk merawat imej sebagai fail. PIL adalah alat yang menakjubkan untuk pemprosesan imej dalam persekitaran Python, yang akan menjadi penting dalam tugas ini.
Berfungsi untuk menjalankan model ini
def load_image_from_url (url): respons = requests.get (url) image_data = bytesio (response.content) kembali image.open (image_data)
Fungsi di sini menjalankan satu siri arahan untuk melaksanakan tugas ini. Yang pertama adalah memuat turun imej dari URL tertentu menggunakan perintah 'LOAD_FROM_URL' dan menyiapkannya untuk diproses. Selepas itu, ia mengambil imej dari URL. Ia menggunakan Byteio untuk mengendalikan imej sebagai fail dalam memori sebelum membuka dan menukarnya ke format yang sesuai untuk model.
image = load_image_from_url ("https://mingkkang.github.io/gigagan/static/images/iguana_output.jpg") .resize ((256, 256)) upscaled_image = aura_sr.upscale_4x_overlapped (imej)
Kod ini memuat turun imej input dari URL, mengubah saiznya kepada 256 × 256 piksel menggunakan fungsi LOAD_IMAGE_FROM_URL, dan kemudian meningkatkannya dengan model AURASR. Anda boleh meningkatkan Imej Saiz 4X, memastikan keputusan berkualiti tinggi dengan memproses kawasan bertindih untuk meminimumkan artifak.
Imej asal
imej
Imej yang dinaikkan
Anda hanya boleh mendapatkan output imej anda menggunakan 'upscaled_image', dan ia memaparkan input dengan resolusi empat kali tetapi ciri yang sama seperti yang asal.
upscaled_image
Aura Canva
Model ini telah menunjukkan potensi dalam penggunaannya di banyak aplikasi. Berikut adalah beberapa cara keupayaan resolusi model ini digunakan:
AURASR adalah alat yang berkuasa untuk imej -imej yang lebih tinggi. Senibina berasaskan GANnya memberikan output resolusi tinggi dan serba boleh dan cepat dalam menghasilkan imej-imej ini. Ciri -ciri lanjutan seperti pengendalian ketelusan memastikan kecekapan model ini. Pada masa yang sama, aplikasinya merentasi bidang seperti pencitraan seni digital, pengeluaran filem, dan pembangunan permainan menetapkan penanda aras untuk teknologi peningkatan imej moden.
A. Model ini boleh menawarkan resolusi imej tanpa batas kepada imej AI yang dihasilkan tanpa mengubah butiran imej asal.
S2. Bagaimanakah AURASR mengendalikan ketelusan dalam imej?A. Ciri ini penting untuk model ini. Topeng ketelusan dan memohon semula ketelusan memastikan bahawa kawasan telus dalam imej input dipelihara dalam imej output.
Q3. Apakah format fail yang menyokong model ini?A. Walaupun model mempunyai fasa untuk pra -proses imej, ia dapat menyokong beberapa format fail. Imej -imej yang lebih tinggi dalam format PNG, JPG, JPEG, dan WEBP tidak akan menjadi masalah.
Media yang ditunjukkan dalam artikel ini tidak dimiliki oleh Analytics Vidhya dan digunakan atas budi bicara penulis.
Atas ialah kandungan terperinci AURASR: Terokai Masterclass Upscaling dengan model ini. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!