Jadual Kandungan
AltDiffusion Cina Profesional
1. Penjanaan Long Prompt, kesan gambar tidak lebih rendah
2 Memahami bahasa Cina dengan lebih baik dan lebih mahir dalam lukisan Cina
3 Cina dan Inggeris, penjajaran kesan yang dijana
Buka ekosistem asal StableDiffusion
1 Stable Diffusion WebUI
3 Gunakan sepenuhnya Buku Gesaan Stable komuniti
4. Mudah untuk pencipta Cina untuk memperhalusi
Berdasarkan AltCLIP dwibahasa pertama
Rumah Peranti teknologi AI Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Apr 14, 2023 pm 02:58 PM
ai Model

Beberapa hari lalu, pasukan penyelidikan model besar Institut Penyelidikan Zhiyuan menggunakan sumber terbuka model AltDiffusion dwibahasa terkini, membawa kuasa kukuh penciptaan teks dan grafik AI peringkat profesional ke dunia China:

sokongan ciptaan Cina yang baik dan panjang; dan bahasa Inggeris diselaraskan, kesan visual yang mengejutkan tahap Stable Diffusion asal, ia boleh dikatakan sebagai mahir lukisan AI penceramah Cina bertaraf dunia.

Model inovatif AltCLIP ialah asas kerja ini, melengkapkan model CLIP asal dengan tiga keupayaan merentas bahasa yang lebih kukuh. Kedua-dua model AltDiffusion dan AltCLIP ialah model berbilang bahasa Cina dan Inggeris adalah peringkat pertama kerja, dan kod serta model telah menjadi sumber terbuka.

AltDiffusion

https://github.com/FlagAI-Open/FlagAI/tree/ master/examples/AltDiffusion

AltCLIP

https://github.com/ FlagAI-Open/FlagAI/examples/AltCLIP

Alamat percubaan angkasa HuggingFace:

https://huggingface.co/spaces/BAAI/bilingual_stable_diffusion

Laporan Teknikal

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka


https://arxiv.org/abs/2211.06679

AltDiffusion Cina Profesional

——Lukisan halus Long Prompt + gaya Cina asli, memenuhi keperluan tinggi pakar penciptaan AI Cina

Terima kasih kepada dwibahasa Cina dan Inggeris yang berkuasa berdasarkan AltCLIP Dari segi keupayaan penjajaran, AltDiffusion telah mencapai tahap kesan visual yang serupa dengan Stable Diffusion Khususnya, ia mempunyai kelebihan unik untuk memahami bahasa Cina dan menjadi lebih baik dalam lukisan Cina pencipta gambar.

1. Penjanaan Long Prompt, kesan gambar tidak lebih rendah

Panjang Prompt ialah kawasan aliran air untuk menguji keupayaan model menjana teks dan grafik the Prompt, semakin sukar untuk menguji pemahaman bahasa , penjajaran imej dan teks serta keupayaan merentas bahasa.

Di bawah pelarasan input segera panjang bahasa Cina dan Inggeris yang sama, AltDiffusion adalah lebih ekspresif dalam banyak kes penjanaan imej: komposisi elemen yang kaya dan menarik, dan butirannya diterangkan dengan teliti dan tepat .

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

2 Memahami bahasa Cina dengan lebih baik dan lebih mahir dalam lukisan Cina

Kecuali untuk gesaan bahasa Cina dan Inggeris , prestasi input adalah serupa Selain itu, AltDiffusion juga boleh mengimbangi kekurangan gaya lukisan Cina di dunia Barat, menggunakan pasangan imej dan teks Cina untuk terus memperhalusi penjanaan ciri Cina, seperti gaya lukisan Cina model generasi, untuk menghasilkan "gaya Cina" yang sebenar.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

AltDiffusion lebih memahami bahasa Cina Ia boleh menerangkan maksud dalam konteks budaya Cina dan memahami niat pencipta dengan serta-merta. Contohnya, perihalan "The Grand Scene of the Tang Dynasty" mengelak daripada keluar topik kerana salah faham budaya.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Terutama untuk konsep yang berasal daripada budaya Cina, kami memahami dan menyatakannya dengan lebih tepat, bagi mengelakkan kekeliruan antara "gaya Jepun" dan "Cina gaya". Situasi yang tidak masuk akal. Contohnya, dengan Stable Diffusion, gesaan input yang sepadan dengan gaya watak sut Tang dalam bahasa Cina dan Inggeris, dan perbezaannya jelas sekali pandang:

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Dalam penjanaan gaya tertentu, Ia akan menggunakan konteks budaya Cina secara asli sebagai subjek identiti untuk penciptaan gaya Contohnya, untuk gesaan dengan "seni bina purba" di bawah, seni bina Cina purba akan dijana secara lalai. Gaya kreatif lebih sesuai dengan identiti pencipta Cina.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

3 Cina dan Inggeris, penjajaran kesan yang dijana

AltDiffusion adalah berdasarkan Stable Diffusion, dengan menggantikan CLIP dalam Stable Diffusion asal ke dalam AltCLIP, dan seterusnya melatih model menggunakan pasangan imej dan teks bahasa Cina dan Inggeris. Terima kasih kepada keupayaan penjajaran bahasa AltCLIP yang berkuasa, kesan penjanaan AltDiffusion sangat hampir dengan Resapan Stabil dalam bahasa Inggeris, dan ia juga mencerminkan ketekalan dalam prestasi dwibahasa Cina dan Inggeris.

Sebagai contoh, selepas memasukkan Prompt Bahasa Cina dan Inggeris bagi "puppy in a hat" ke dalam AltDiffusion, kesan gambar yang dihasilkan pada asasnya diselaraskan, dengan ketekalan yang sangat tinggi:

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Setelah menambah deskriptor "budak Cina" pada gambar "budak lelaki", berdasarkan imej asal budak kecil itu, dia telah disesuaikan dengan tepat untuk menjadi tipikal " Kanak-kanak Cina, yang dipaparkan dalam generasi kawalan bahasa Menghasilkan keupayaan pemahaman bahasa yang sangat baik dan hasil ekspresi yang tepat.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Buka ekosistem asal StableDiffusion

- alatan ekologi yang kaya dan aplikasi PromptsBook , anda boleh Kebolehmainan yang sangat baik

Perlu dinyatakan bahawa keupayaan penyepaduan ekologi AltDiffusion:

Semua alatan yang menyokong Stable Diffusion seperti Stable Diffusion WebUI, DreamBooth, dsb. boleh digunakan dalam model Penyebaran dwibahasa Cina-Inggeris kami menyediakan banyak pilihan untuk penciptaan AI Cina:

1 Stable Diffusion WebUI

Alat web yang sangat baik untuk penjanaan teks dan imej serta teks. dan penyuntingan imej; Apabila kita menukar pemandangan malam Universiti Peking menjadi Hogwarts (prompt: Hogwarts), dunia ajaib yang termenung dapat dipersembahkan dalam sekelip mata; 2. DreamBooth

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaAlat untuk nyahpepijat model melalui sebilangan kecil sampel untuk menjana gaya tertentu melalui alat ini, gaya tertentu boleh dijana menggunakan sebilangan kecil imej Cina pada AltDiffusion, seperti gaya "Havoc in Heaven". Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

3 Gunakan sepenuhnya Buku Gesaan Stable komuniti

Gesaan sangat penting untuk menjana model pengguna komuniti telah mengumpul kes kesan generasi kaya melalui a sejumlah besar percubaan gesaan. Pengalaman gesaan yang berharga ini hampir semuanya terpakai kepada pengguna AltDiffusion!

Selain itu, anda juga boleh menggabungkan bahasa Cina dan Inggeris untuk memadankan beberapa gaya dan unsur ajaib, atau terus meneroka gesaan bahasa Cina yang sesuai untuk AltDiffusion.

4. Mudah untuk pencipta Cina untuk memperhalusi

Sumber terbuka AltDiffusion menyediakan asas untuk model generasi Cina medan khusus Data digunakan untuk memperhalusi model untuk memudahkan ekspresi oleh pencipta Cina.

Berdasarkan AltCLIP dwibahasa pertama

- Meningkatkan secara menyeluruh tiga keupayaan merentas bahasa utama, penjajaran Cina-Inggeris, bahasa Cina yang lebih baik, ambang yang sangat rendah

Pemahaman bahasa, penjajaran gambar dan teks serta keupayaan merentas bahasa ialah tiga kebolehan yang diperlukan untuk penyelidikan merentas bahasa.

Banyak keupayaan peringkat profesional AltDiffusion diperoleh daripada idea perubahan menara inovatif AltCLIP, yang telah dipertingkatkan sepenuhnya dalam tiga keupayaan utama ini: keupayaan penjajaran bahasa Cina dan Inggeris dengan yang asal CLIP telah banyak dipertingkatkan dengan lancar menyambung kepada semua model dan alatan ekologi yang dibina pada CLIP asal, seperti Stable Diffusion pada masa yang sama, ia dikurniakan dengan keupayaan Cina yang berkuasa untuk mencapai hasil yang lebih baik dalam bahasa Cina pada beberapa set data. (Sila rujuk laporan teknikal untuk penjelasan terperinci)

Perlu dinyatakan bahawa kaedah penjajaran ini sangat mengurangkan ambang untuk melatih model perwakilan berbilang bahasa dan berbilang modal Berbanding dengan semula -melakukan pralatihan pasangan imej dan teks bahasa Cina Atau Inggeris, yang hanya memerlukan kira-kira 1% daripada sumber pengkomputeran dan data pasangan imej dan teks.

Mencapai kesan yang sama seperti versi asal Inggeris dalam penanda aras CLIP komprehensif

Dalam beberapa pengambilan semula data Contohnya, Flicker-30K mempunyai prestasi yang lebih baik daripada versi asal

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Flicker-30K mempunyai prestasi yang lebih baik daripada yang asal KLIP

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Hasil sifar tangkapan terbaik pada ImageNet Cina

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Atas ialah kandungan terperinci Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Tag artikel panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Di belakang akses Android pertama ke DeepSeek: Melihat Kekuatan Wanita Di belakang akses Android pertama ke DeepSeek: Melihat Kekuatan Wanita Mar 12, 2025 pm 12:27 PM

Di belakang akses Android pertama ke DeepSeek: Melihat Kekuatan Wanita

Kedudukan terbaru dari sepuluh aplikasi perdagangan teratas pada tahun 2025 Kedudukan terbaru dari sepuluh aplikasi perdagangan teratas pada tahun 2025 Mar 11, 2025 pm 04:06 PM

Kedudukan terbaru dari sepuluh aplikasi perdagangan teratas pada tahun 2025

DeepSeek Web Version Masuk Rasmi DeepSeek Web Version Masuk Rasmi Mar 12, 2025 pm 01:42 PM

DeepSeek Web Version Masuk Rasmi

Cara menyelesaikan masalah pelayan yang sibuk untuk DeepSeek Cara menyelesaikan masalah pelayan yang sibuk untuk DeepSeek Mar 12, 2025 pm 01:39 PM

Cara menyelesaikan masalah pelayan yang sibuk untuk DeepSeek

Pintu Laman Web Rasmi DeepSeek yang mendalam Pintu Laman Web Rasmi DeepSeek yang mendalam Mar 12, 2025 pm 01:33 PM

Pintu Laman Web Rasmi DeepSeek yang mendalam

Satu lagi produk kebangsaan dari Baidu disambungkan ke Deepseek. Satu lagi produk kebangsaan dari Baidu disambungkan ke Deepseek. Mar 12, 2025 pm 01:48 PM

Satu lagi produk kebangsaan dari Baidu disambungkan ke Deepseek.

Top 10 Disyorkan untuk App Perdagangan Aset Digital Crypto (2025 Global Ranking) Top 10 Disyorkan untuk App Perdagangan Aset Digital Crypto (2025 Global Ranking) Mar 18, 2025 pm 12:15 PM

Top 10 Disyorkan untuk App Perdagangan Aset Digital Crypto (2025 Global Ranking)

Midea melancarkan penghawa dingin DeepSeek yang pertama: Interaksi Suara AI boleh mencapai 400,000 arahan! Midea melancarkan penghawa dingin DeepSeek yang pertama: Interaksi Suara AI boleh mencapai 400,000 arahan! Mar 12, 2025 pm 12:18 PM

Midea melancarkan penghawa dingin DeepSeek yang pertama: Interaksi Suara AI boleh mencapai 400,000 arahan!

See all articles