Le 8 juin, Tencent a publié une bibliothèque d'accélération pour le grand modèle open source du graphique de génération de texte Tencent Hunyuan (appelé modèle Hunyuan DiT), qui a considérablement amélioré l'efficacité de l'inférence et réduit le temps de génération du graphique de 75 %.
Le seuil d'utilisation du modèle Hunyuan DiT a également été considérablement réduit. Les utilisateurs peuvent utiliser les capacités du modèle graphique Tencent Hunyuan Wensheng basées sur l'interface graphique de ComfyUI. Dans le même temps, le modèle Hunyuan DiT a été déployé dans la bibliothèque de modèles généraux Hugging Face Diffusers. Les utilisateurs peuvent appeler le modèle Hunyuan DiT avec seulement trois lignes de code sans télécharger la bibliothèque de codes d'origine.
Précédemment, Tencent a annoncé que le modèle de génération de texte Hunyuan à grande échelle a été entièrement mis à niveau et open source, et peut être utilisé par les entreprises et les développeurs individuels pour un usage commercial gratuit. Il s'agit du premier modèle open source de graphique de génération de texte à architecture DiT native chinoise de l'industrie, prenant en charge la saisie et la compréhension bilingues chinois et anglais en utilisant la même architecture DiT que Sora, il peut non seulement prendre en charge la génération de texte, mais également être utilisé comme multi-; modèle de génération visuelle modale tel que la vidéo.
Tencent HunyuanDiT modèleopen source a été reconnu par de nombreux développeurs communautaires. En moins de un mois, le nombre d'étoiles Github du projet a dépassé 2100, se classant parmi les modèles DiT les plus populaires de la communauté open source
.Page Github Hunyuan DiT
Afin d'améliorer l'expérience des développeurs, Tencent Hunyuan a officiellement lancé une bibliothèque d'accélération dédiée, qui réduit le temps d'inférence de 75 % et améliore l'efficacité du fonctionnement des grands modèles . Les développeurs peuvent télécharger l'outil d'accélération d'inférence via Hugging Face. L'équipe du projet
a réalisé la compression des étapes d'échantillonnage et le déploiement d'inférence efficace du modèle Di
T grâce à la distillation des connaissances et au cadre d'inférence haute performance TensorRT. La distillation fait principalement référence à la réduction du nombre d'étapes d'itération du modèle de diffusion pour obtenir une accélération. La structure globale et la quantité de paramètres du modèle restent inchangées. Les utilisateurs peuvent réduire le nombre d'étapes d'itération de 50 % en utilisant des poids de distillation sans aucune opération ni équipement supplémentaire, et la consommation de temps peut être réduite de moitié. La solution d'accélération d'inférence TensorRT peut réduire davantage la consommation de temps grâce à l'optimisation technique et est découplée des pondérations du modèle. L’utilisation simultanée des deux pour le déploiement d’inférence peut réduire le temps d’inférence de 75 %.Les utilisateurs peuvent directement utiliser l'interface graphique de ComfyUI pour tirer parti des efforts collectifs de la communauté en fonction de ses dernières actualités. Dans le même temps, grâce à la coopération avec l'équipe de Hugging Face, le modèle hybride DiT a été déployé dans la bibliothèque de modèles officielle de Hugging Face, et l'utilisation et le code de génération de la bibliothèque de modèles ont été réajustés. Les utilisateurs peuvent directement appeler le. modèle DiT hybride via ce canal, ce qui simplifie grandement le coût d'utilisation par l'utilisateur.
ComfyUI est une conception d'interface WebUI dans le domaine des graphiques vincentiens. Elle modularise et graphique l'algorithme de diffusion dans le domaine des graphiques vincentiens, améliore l'efficacité de la génération et l'utilisation des ressources, et réduit également considérablement le seuil d'utilisation pour les développeurs. Les utilisateurs peuvent utiliser le modèle graphique Hunyuan DiT Wensheng via un flux de travail graphique pour obtenir le même effet que le modèle officiel.
L'interface utilisateur ComfyUI du modèle graphique Hunyuan DiT Vincent
De plus, une forte communauté open source a vu le jour autour de l'écologie d'utilisation de ComfyUI. La prise en charge de ComfyUI par Hunyuan DiT permet également aux membres de la communauté de découvrir le modèle de graphique vincentien basé sur la dernière architecture DiT.
En tant que communauté open source d'IA bien connue, Hugging Face's Diffusers est actuellement une bibliothèque universelle pour appeler divers grands modèles de graphiques vincentiens grand public, et est devenu aujourd'hui la norme communautaire pour l'utilisation de grands modèles de graphiques vincentiens.
Adapter le modèle Hugging DiT aux diffuseurs Hugging Face peut grandement améliorer la facilité d'utilisation et la base d'utilisateurs du modèle. Les utilisateurs n'ont pas besoin de télécharger et de déployer la bibliothèque de codes d'origine dans leur propre environnement. Les développeurs qui ont installé la bibliothèque Diffusers n'ont besoin que d'exécuter quelques lignes de code pour appeler le modèle Hunyuan DiT, ce qui est très pratique à configurer et à appeler. Dans le même temps, l'équipe de Hugging Face et de Tencent Hunyuan a optimisé conjointement le cadre algorithmique pour accélérer la génération d'images.
Cela équivaut également à fournir un support sous-jacent pour toute utilisation et développement ultérieurs basés sur Hunyuan DiT, couvrant tout scénario dans lequel Hunyuan DiT doit être appelé, y compris la méthode ComfyUI mentionnée ci-dessus. Dans le même temps, pour les développeurs, les workflows et plug-ins préalablement configurés basés sur les diffuseurs peuvent être directement utilisés dans Hunyuan DiT avec un petit nombre de modifications.
Lu Qinglin, directeur de Tencent Wenshengtu, a déclaré : « Le modèle Hunyuan Wenshengtu de Tencent a reçu le soutien et les commentaires de nombreux développeurs après son lancement en open source. Nous sommes très heureux et nous travaillons également avec la communauté pour l'améliorer et y répondre. aux commentaires des développeurs. L'optimisation de l'écosystème open source basé sur Hunyuan DiT permet à davantage de développeurs de profiter plus facilement des derniers résultats de recherche. Nous invitons également tout le monde à nous rejoindre pour construire l'écosystème open source de nouvelle génération visuelle et promouvoir le développement accéléré du grand. industrie du mannequinat. »🎜🎜
Ci-joint le lien du projet grand modèle open source Tencent Hunyuan Wenshengtu (Hunyuan DiT model)
Site officiel https://www.php.cn/link/35817bda28b111 aa49bd8fdf 61878246
Code : https://www.php.cn/link/bb4b90201e39e55c4a9ccfec8436cfb8
Modèle : https://www.php.cn /link /5dacab03c06f42f75c3f21a2c9f98997
Papier : https://www.php.cn/link/a0b173044f2019316bebc411696e7d 35
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!