Stable Diffusion XL Turbo は「リアルタイム」速度で AI 画像を生成できます
Stable Diffusion XL Turbo (SDXL Turbo) は、自宅でも驚くほどのスピードで詳細な画像を作成します。
火曜日、Stability AI は「Stable Diffusion XL Turbo」と呼ばれる人工知能画像合成モデルをリリースしました。モデルは、書かれたプロンプトに基づいて画像を迅速に生成できます。実際、このモデルは非常に高速なので、Web カメラなどのソースからの画像を迅速に変換することもできるため、同社はこのモデルを「リアルタイム」画像ジェネレーターとして宣伝しています。
火曜日に公開された ADD テクノロジーに焦点を当てた研究論文では、Stability AI がモデルの内部動作について詳しく説明しています。 SDXL Turbo の利点の 1 つは、特にシングルステップ画像出力の生成における敵対的生成ネットワーク (GAN) との類似性です。
SDXL Turbo の画像は、SDXL で高解像度で生成された画像ほど詳細ではないため、以前のモデルを完全に置き換えるものではありません。ただし、驚くべきスピードで時間を節約できます
それを試すために、Automatic111 (SDXL の重みと同じ重みの低下) を使用して Nvidia RTX 3060 で SDXL Turbo をネイティブに実行しました。20 ステップと比較して約 4 秒で 3 ステップの 1024×1024 画像が生成されました。同様の詳細の SDXL 画像には 26.4 秒かかります。小さい画像の生成ははるかに速くなります (512×768 の場合は 1 秒未満)。もちろん、RTX 3090 や 4090 などのより強力なグラフィックス カードを使用すると、生成時間も短縮されます。 Stability のマーケティングとは対照的に、SDXL Turbo 画像は画像あたり約 3 ~ 5 ステップで最も詳細な画像が得られることがわかりました。
SDXL Turboの生成速度はいわゆる「リアルタイム」です。 Stability AI によると、AI によって調整された強力なグラフィックス プロセッサである NVIDIA A100 では、このモデルはエンコード、1 回のノイズ除去ステップ、デコードを含めて 512×512 の画像を 207 ミリ秒で生成できるそうです。一貫性の問題が解決できれば、このような速度により、AI ビデオ フィルターのリアルタイム生成や実験的なビデオ ゲーム画像の生成につながる可能性があります。この場合、一貫性とは、複数のフレームまたは世代にわたって同じテーマを維持することを意味します。
一方、Stability AIは内部経営上の問題に直面しており、最近ある投資家がCEOのエマド・モスタク氏に辞任を勧告した。伝えられるところによると、Stability AI の経営陣は会社をより大きな企業に売却する可能性を模索しているとのことですが、これは Stability AI が新製品をリリースするペースに影響を与えていません。つい先週、同社は静止画像を短いビデオクリップに変換する Stable Video Diffusion というソフトウェアを発売しました
Stability AI は、画像編集プラットフォーム Clipdrop で SDXL Turbo 機能のベータ デモを提供しました。 Hugging Face では非公式のライブデモを無料で試すこともできます。明らかに、トレーニング データの出所の欠如や悪用の可能性など、通常の注意事項がすべて適用されます。こうした未解決の疑問があるにもかかわらず、AI 画像合成における技術進歩は確かに減速していません。
お友達が気に入ったら、「Zhixin」に注目してください!
以上がStable Diffusion XL Turbo は「リアルタイム」速度で AI 画像を生成できますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











モデルコンテキストプロトコル(MCP):AIとデータのユニバーサルコネクタ 私たちは皆、毎日のコーディングにおけるAIの役割に精通しています。 Replit、Github Copilot、Black Box AI、およびCursor IDEは、AIがワークフローを合理化する方法のほんの一部です。 しかし、想像してみてください

MicrosoftのOmniparser V2とOmnitool:AIでGUIオートメーションに革命をもたらす 味付けされた専門家のように、Windows 11インターフェースと相互作用するだけでなく、熟練したプロのように相互作用するAIを想像してください。 MicrosoftのOmniparser V2とOmnitoolはこれを再生します

アプリ開発の革新:レプリットエージェントに深く潜ります 複雑な開発環境と不明瞭な構成ファイルとの格闘にうんざりしていませんか? Replit Agentは、アイデアを機能的なアプリに変換するプロセスを簡素化することを目的としています。 このai-p

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

このブログ投稿では、Runway MLの新しいAct-One Animationツールの経験をテストし、WebインターフェイスとPython APIの両方をカバーしています。約束しますが、私の結果は予想よりも印象的ではありませんでした。 生成AIを探索したいですか? PでLLMSを使用することを学びます

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します
