ホームページ テクノロジー周辺機器 AI Stable Diffusion XL Turbo は「リアルタイム」速度で AI 画像を生成できます

Stable Diffusion XL Turbo は「リアルタイム」速度で AI 画像を生成できます

Nov 30, 2023 pm 05:25 PM

Stable Diffusion XL Turbo (SDXL Turbo) は、自宅でも驚くほどのスピードで詳細な画像を作成します。

火曜日、Stability AI は「Stable Diffusion XL Turbo」と呼ばれる人工知能画像合成モデルをリリースしました。モデルは、書かれたプロンプトに基づいて画像を迅速に生成できます。実際、このモデルは非常に高速なので、Web カメラなどのソースからの画像を迅速に変換することもできるため、同社はこのモデルを「リアルタイム」画像ジェネレーターとして宣伝しています。

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

SDXL Turbo の主な革新は、1 ステップで画像出力を生成できる機能であり、以前のバージョンで必要だった 20 ~ 50 ステップから大幅に削減されます。 Stability AI は、この効率の飛躍的な向上は、敵対的拡散蒸留 (ADD) と呼ばれる技術によるものであると考えています。 ADD は、モデルが既存の画像合成モデルから学習する部分抽出と、実際の画像と生成された画像を区別するモデルの能力を強化する敵対的損失を使用し、出力の信頼性を向上させます。

火曜日に公開された ADD テクノロジーに焦点を当てた研究論文では、Stability AI がモデルの内部動作について詳しく説明しています。 SDXL Turbo の利点の 1 つは、特にシングルステップ画像出力の生成における敵対的生成ネットワーク (GAN) との類似性です。

SDXL Turbo の画像は、SDXL で高解像度で生成された画像ほど詳細ではないため、以前のモデルを完全に置き換えるものではありません。ただし、驚くべきスピードで時間を節約できます

それを試すために、Automatic111 (SDXL の重みと同じ重みの低下) を使用して Nvidia RTX 3060 で SDXL Turbo をネイティブに実行しました。20 ステップと比較して約 4 秒で 3 ステップの 1024×1024 画像が生成されました。同様の詳細の SDXL 画像には 26.4 秒かかります。小さい画像の生成ははるかに速くなります (512×768 の場合は 1 秒未満)。もちろん、RTX 3090 や 4090 などのより強力なグラフィックス カードを使用すると、生成時間も短縮されます。 Stability のマーケティングとは対照的に、SDXL Turbo 画像は画像あたり約 3 ~ 5 ステップで最も詳細な画像が得られることがわかりました。

SDXL Turboの生成速度はいわゆる「リアルタイム」です。 Stability AI によると、AI によって調整された強力なグラフィックス プロセッサである NVIDIA A100 では、このモデルはエンコード、1 回のノイズ除去ステップ、デコードを含めて 512×512 の画像を 207 ミリ秒で生成できるそうです。一貫性の問題が解決できれば、このような速度により、AI ビデオ フィルターのリアルタイム生成や実験的なビデオ ゲーム画像の生成につながる可能性があります。この場合、一貫性とは、複数のフレームまたは世代にわたって同じテーマを維持することを意味します。

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

現在、SDXL Turbo は非営利研究ライセンスに基づいて提供されており、その使用は個人的、非営利目的に限定されています。この動きはすでにStable Diffusionコミュニティである程度の批判を受けているが、Stability AIは商用アプリケーションにオープンであり、詳細については興味のある人に問い合わせるよう呼びかけている。

一方、Stability AIは内部経営上の問題に直面しており、最近ある投資家がCEOのエマド・モスタク氏に辞任を勧告した。伝えられるところによると、Stability AI の経営陣は会社をより大きな企業に売却する可能性を模索しているとのことですが、これは Stability AI が新製品をリリースするペースに影響を与えていません。つい先週、同社は静止画像を短いビデオクリップに変換する Stable Video Diffusion というソフトウェアを発売しました

Stability AI は、画像編集プラットフォーム Clipdrop で SDXL Turbo 機能のベータ デモを提供しました。 Hugging Face では非公式のライブデモを無料で試すこともできます。明らかに、トレーニング データの出所の欠如や悪用の可能性など、通常の注意事項がすべて適用されます。こうした未解決の疑問があるにもかかわらず、AI 画像合成における技術進歩は確かに減速していません。

お友達が気に入ったら、「Zhixin」に注目してください!

以上がStable Diffusion XL Turbo は「リアルタイム」速度で AI 画像を生成できますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

モデルコンテキストプロトコル(MCP)とは何ですか? モデルコンテキストプロトコル(MCP)とは何ですか? Mar 03, 2025 pm 07:09 PM

モデルコンテキストプロトコル(MCP):AIとデータのユニバーサルコネクタ 私たちは皆、毎日のコーディングにおけるAIの役割に精通しています。 Replit、Github Copilot、Black Box AI、およびCursor IDEは、AIがワークフローを合理化する方法のほんの一部です。 しかし、想像してみてください

Omniparser V2とOmnitoolを使用して地元のビジョンエージェントを構築する Omniparser V2とOmnitoolを使用して地元のビジョンエージェントを構築する Mar 03, 2025 pm 07:08 PM

MicrosoftのOmniparser V2とOmnitool:AIでGUIオートメーションに革命をもたらす 味付けされた専門家のように、Windows 11インターフェースと相互作用するだけでなく、熟練したプロのように相互作用するAIを想像してください。 MicrosoftのOmniparser V2とOmnitoolはこれを再生します

レプリットエージェント:実用的な例を備えたガイド レプリットエージェント:実用的な例を備えたガイド Mar 04, 2025 am 10:52 AM

アプリ開発の革新:レプリットエージェントに深く潜ります 複雑な開発環境と不明瞭な構成ファイルとの格闘にうんざりしていませんか? Replit Agentは、アイデアを機能的なアプリに変換するプロセスを簡素化することを目的としています。 このai-p

カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! Mar 20, 2025 pm 03:34 PM

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Runway Act-One Guide:私はそれをテストするために自分自身を撮影しました Runway Act-One Guide:私はそれをテストするために自分自身を撮影しました Mar 03, 2025 am 09:42 AM

このブログ投稿では、Runway MLの新しいAct-One Animationツールの経験をテストし、WebインターフェイスとPython APIの両方をカバーしています。約束しますが、私の結果は予想よりも印象的ではありませんでした。 生成AIを探索したいですか? PでLLMSを使用することを学びます

オブジェクト検出にYolo V12を使用する方法は? オブジェクト検出にYolo V12を使用する方法は? Mar 22, 2025 am 11:07 AM

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! 2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! Mar 22, 2025 am 10:58 AM

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Elon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突します Elon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突します Mar 08, 2025 am 11:15 AM

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します

See all articles