6 月 8 日、Tencent は、Tencent Hunyuan テキスト生成グラフの大規模なオープンソース モデル (Hunyuan DiT モデルと呼ばれる) の高速化ライブラリをリリースしました。これにより、推論効率が大幅に向上し、グラフ生成時間が 75% 短縮されました。
Hunyuan DiT モデルを使用するための敷居も大幅に引き下げられました。 ユーザーは、ComfyUI のグラフィカル インターフェイスに基づいた Tencent Hunyuan Wensheng グラフ モデル機能を使用できます。同時に、Hunyuan DiT モデルは Hugging Face Diffusers 一般モデル ライブラリにデプロイされ、ユーザーはオリジナルのコード ライブラリをダウンロードせずに、わずか 3 行のコードで Hunyuan DiT モデルを呼び出すことができます。
以前、Tencentは、大規模なHunyuanテキスト生成モデルが完全にアップグレードされ、オープンソース化され、企業や個人の開発者が無料で商用利用できるようになったと発表しました。これは業界初の中国語ネイティブの DiT アーキテクチャ テキスト生成グラフ オープン ソース モデルであり、Sora と同じ DiT アーキテクチャを使用して中国語と英語のバイリンガル入力と理解をサポートしており、テキスト生成をサポートするだけでなく、マルチ インターフェイスとしても使用できます。ビデオなどのモーダルビジュアル生成モデル。
Tencent HunyuanDiTモデルオープンソースは多くのコミュニティ開発者によって認められています。 1 か月も経たないうちに、プロジェクトの Github スター数 は 2100 を超え、オープンソースコミュニティで人気の DiT モデルの上位にランクされています。
Hunyuan DiT Github ページ
開発者のエクスペリエンスを向上させるために、Tencent Hunyuan は専用のアクセラレーション ライブラリを正式にリリースしました。これにより、推論時間が 75% 短縮され、大規模モデルの操作効率が向上します。 。開発者は、Hugging Face を通じて推論高速化ツールをダウンロードできます。
プロジェクト チームは、知識の蒸留と TensorRT 高性能推論フレームワークを通じて、サンプリング ステップの圧縮と DiT モデルの効率的な推論展開を実現しました。蒸留とは主に、加速を達成するために拡散モデルの反復ステップの数を減らすことを指します。モデルの全体的な構造とパラメータの量は変わりません。追加の操作や機器を必要とせずに、蒸留重みを使用することで反復ステップの数を 50% 削減でき、時間の消費を半分にできます。 TensorRT 推論高速化ソリューションは、エンジニアリングの最適化を通じて時間の消費をさらに削減でき、モデルの重みから切り離されています。両方を同時に使用して推論を展開すると、推論時間を 75% 削減できます。
ユーザーは ComfyUI のグラフィカル インターフェイスを直接使用して、最新ニュースに基づいたコミュニティの共同作業を活用できます。同時に、Hugging Face チームとの協力により、ハイブリッド DiT モデルが Hugging Face 公式モデル ライブラリ ディフューザーに展開され、モデル ライブラリの使用と生成コードが再調整され、ユーザーはモデル ライブラリを直接呼び出すことができます。このチャネルを介したハイブリッド DiT モデルにより、ユーザーの使用コストが大幅に簡素化されます。
ComfyUI は、Vincentian グラフ分野の WebUI インターフェイス設計であり、Vincentian グラフ分野の拡散アルゴリズムをモジュール化してグラフィカル化し、生成効率とリソース使用率を向上させ、開発者の使用しきい値を大幅に削減します。ユーザーは、グラフィカル ワークフローを通じて Hunyuan DiT Wensheng グラフ モデルを使用して、公式モデルと同じ効果を実現できます。
Hunyuan DiT Vincent グラフ モデルの ComfyUI ユーザー インターフェイス
さらに、ComfyUI の使用エコロジーを中心に強力なオープンソース コミュニティが誕生しました。 Hunyuan DiT による ComfyUI のサポートにより、コミュニティ メンバーは最新の DiT アーキテクチャに基づいた Wensheng ダイアグラム モデルを体験することもできます。
有名な AI オープンソース コミュニティとして、Hugging Face の Diffusers は現在、さまざまな主流の大規模なヴィンセント グラフ モデルを呼び出すためのユニバーサル ライブラリであり、今日の大規模なヴィンセント グラフ モデルを使用するためのコミュニティ標準となっています。
ハギング DiT モデルをハギング フェイス ディフューザーに適応させると、モデルの使いやすさとユーザー ベースが大幅に向上します。ユーザーは、オリジナルのコード ライブラリをダウンロードして自分の環境にデプロイする必要はありません。Diffusers ライブラリをインストールした開発者は、数行のコードを実行するだけで Hunyuan DiT モデルを呼び出すことができるため、構成と呼び出しが非常に便利です。同時に、Hugging Face と Tencent Hunyuan チームは共同でアルゴリズム フレームワークを最適化し、画像生成を高速化しました。
これは、Hunyuan DiT に基づくその後のすべての使用と開発に対する基礎的なサポートを提供することにも相当し、上記の ComfyUI メソッドを含む、Hunyuan DiT を呼び出す必要があるあらゆるシナリオをカバーします。同時に、開発者にとっては、ディフューザーに基づいて以前に構成されたワークフローとプラグインを、少し変更するだけで Hunyuan DiT で直接使用できます。 Tencent Wenshengtu の責任者、Lu Qinglin 氏は次のように述べています。「Tencent の Hunyuan Wenshengtu モデルは、オープンソース化されてから多くの開発者からサポートとフィードバックを受けています。私たちは非常に満足しており、改善と対応のためにコミュニティとも協力しています」 Hunyuan DiT に基づいてオープンソース エコシステムを最適化することで、より多くの開発者が最新の研究成果をより便利に享受できるようになります。また、次世代ビジュアル世代のオープンソース エコシステムの構築に参加し、大規模な開発を促進することも歓迎します。モデル業界。」
Tencent Hunyuan Wenshengtu オープンソース大型モデル (Hunyuan DiT モデル) プロジェクトのリンクを添付します
公式ウェブサイト: https://www.php.cn/link/35817bda28b11 1aa49bd8fdf 61878246 コード:モデル:
https://www.php.cn /link /5dacab03c06f42f75c3f21a2c9f98997論文:
以上がTencent Hunyuan がオープンソース アクセラレーション ライブラリをリリース、画像生成時間を 75% 短縮の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。