Pada 8 Jun, Tencent mengeluarkan perpustakaan pecutan untuk model sumber terbuka yang besar bagi graf penjanaan teks Tencent Hunyuan (dirujuk sebagai model Hunyuan DiT), yang telah meningkatkan kecekapan inferens dan memendekkan masa penjanaan graf sebanyak 75%.
Ambang untuk menggunakan model Hunyuan DiT juga telah dikurangkan dengan banyaknya. Pengguna boleh menggunakan keupayaan model graf Tencent Hunyuan Wensheng berdasarkan antara muka grafik ComfyUI. Pada masa yang sama, model Hunyuan DiT telah digunakan ke perpustakaan model umum Hugging Face Diffusers Pengguna boleh menghubungi model Hunyuan DiT dengan hanya tiga baris kod tanpa memuat turun perpustakaan kod asal.
Sebelum ini, Tencent mengumumkan bahawa model penjanaan teks Hunyuan berskala besar telah dinaik taraf sepenuhnya dan sumber terbuka, serta boleh digunakan oleh perusahaan dan pembangun individu untuk kegunaan komersial percuma. Ini adalah model sumber terbuka graf penjanaan teks seni bina asli Cina asli Cina dan Inggeris, menyokong input dan pemahaman dwibahasa Cina dan Inggeris menggunakan seni bina DiT yang sama seperti Sora, ia bukan sahaja boleh menyokong penjanaan teks, tetapi juga digunakan sebagai multi-; model penjanaan visual modal seperti Video.
Tencent HunyuanDiT modelsumber terbuka telah diiktiraf oleh ramai pembangun komuniti. Kurang daripada satu bulan, kiraan Github Star projek telah melebihi 2100, kedudukan antara model DiT popular dalam komuniti
Hunyuan DiT Github page
Untuk meningkatkan pengalaman pembangun, Tencent Hunyuan secara rasmi melancarkan perpustakaan pecutan khusus, yang memendekkan kecekapan dan masa operasi besar sebanyak 75% . Pembangun boleh memuat turun alat pecutan inferens melalui Hugging Face. Pasukan projek
mencapai pemampatan langkah pensampelan dan penggunaan inferens yang cekap bagi model DiT melalui penyulingan pengetahuan dan rangka kerja inferens berprestasi tinggi TensorRT. Penyulingan terutamanya merujuk kepada mengurangkan bilangan langkah lelaran model resapan untuk mencapai pecutan. Struktur keseluruhan dan jumlah parameter model kekal tidak berubah Pengguna boleh mengurangkan bilangan langkah lelaran sebanyak 50% dengan menggunakan pemberat penyulingan tanpa sebarang operasi tambahan dan keperluan peralatan, dan penggunaan masa boleh dikurangkan separuh. Penyelesaian pecutan inferens TensorRT boleh mengurangkan lagi penggunaan masa melalui pengoptimuman kejuruteraan dan dipisahkan daripada berat model. Menggunakan kedua-duanya secara serentak untuk penggunaan inferens boleh mengurangkan masa inferens sebanyak 75%.
Pengguna boleh terus menggunakan antara muka grafik ComfyUI untuk memanfaatkan usaha kolektif komuniti berdasarkan berita terkininya. Pada masa yang sama, melalui kerjasama dengan pasukan Hugging Face, model DiT hibrid telah digunakan ke perpustakaan model rasmi Hugging Face, dan penggunaan dan kod penjanaan perpustakaan model telah diselaraskan semula. Pengguna boleh menghubungi terus model DiT hibrid melalui saluran ini, yang sangat memudahkan Kos penggunaan pengguna.
ComfyUI ialah reka bentuk antara muka WebUI dalam bidang graf Vincentian Ia memodulasi dan mengambarkan algoritma penyebaran dalam bidang graf Vincentian, meningkatkan kecekapan penjanaan dan penggunaan sumber, dan juga mengurangkan ambang penggunaan untuk pembangun. Pengguna boleh menggunakan model graf Hunyuan DiT Wensheng melalui aliran kerja grafik untuk mencapai kesan yang sama seperti model rasmi.
Antara muka pengguna ComfyUI bagi model graf Hunyuan DiT Vincent
Selain itu, komuniti sumber terbuka yang kukuh telah muncul di sekitar ekologi penggunaan ComfyUI. Sokongan Hunyuan DiT untuk ComfyUI juga membolehkan ahli komuniti mengalami model graf Vincentian berdasarkan seni bina DiT terkini.
Sebagai komuniti sumber terbuka AI yang terkenal, Hugging Face's Diffusers kini merupakan perpustakaan universal untuk memanggil pelbagai model graf Vincentian arus perdana, dan telah menjadi standard komuniti untuk penggunaan model graf Vincentian yang besar hari ini.
Menyesuaikan model Hugging DiT ke dalam Hugging Face Diffusers boleh meningkatkan kemudahan penggunaan dan pangkalan pengguna model dengan sangat baik. Pengguna tidak perlu memuat turun dan menggunakan pustaka kod asal ke persekitaran mereka sendiri Pembangun yang telah memasang pustaka Diffusers hanya perlu menjalankan beberapa baris kod untuk memanggil model Hunyuan DiT, yang sangat mudah untuk dikonfigurasikan dan dipanggil. Pada masa yang sama, pasukan Hugging Face dan Tencent Hunyuan bersama-sama mengoptimumkan rangka kerja algoritma untuk mempercepatkan penjanaan imej.
Ini juga bersamaan dengan menyediakan sokongan asas untuk semua penggunaan dan pembangunan seterusnya berdasarkan Hunyuan DiT, meliputi sebarang senario di mana Hunyuan DiT perlu dipanggil, termasuk kaedah ComfyUI yang disebutkan di atas. Pada masa yang sama, bagi pembangun, aliran kerja dan pemalam yang dikonfigurasikan sebelum ini berdasarkan Peresap boleh digunakan terus dalam Hunyuan DiT dengan sedikit pengubahsuaian.
Lu Qinglin, ketua Tencent Wenshengtu, berkata: "Model Hunyuan Wenshengtu Tencent telah menerima sokongan dan maklum balas daripada banyak pembangun selepas ia menjadi sumber terbuka. Kami sangat gembira, dan kami juga bekerjasama dengan komuniti untuk menambah baik dan bertindak balas kepada maklum balas pembangun Mengoptimumkan ekosistem sumber terbuka berdasarkan Hunyuan DiT membolehkan lebih ramai pembangun menikmati hasil penyelidikan terkini dengan lebih mudah Kami juga mengalu-alukan semua orang untuk menyertai kami dalam membina ekosistem sumber terbuka generasi visual dan menggalakkan pembangunan dipercepatkan. industri model.”
🎜Dilampirkan adalah model besar sumber terbuka Tencent Hunyuan Wenshengtu (Hunyuan DiT model) pautan projek
Laman web rasmi: 18b/b1.php5c1/b1. a49bd8fdf 61878246
Kod: https://www.php.cn/link/bb4b90201e39e55c4a9ccfec8436cfb8
Model: https://www.php.cn /link /5dacab03c06f42f75c3f21a2c9f98997
Kertas: https://www.php.cn/6bc7 d 35
Atas ialah kandungan terperinci Tencent Hunyuan mengeluarkan perpustakaan pecutan sumber terbuka, memendekkan masa penjanaan imej sebanyak 75%. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!