ホームページ テクノロジー周辺機器 AI MIT と Google が共同研究する新技術 StableRep: 合成画像を使用した AI 画像モデルのトレーニング

MIT と Google が共同研究する新技術 StableRep: 合成画像を使用した AI 画像モデルのトレーニング

Nov 29, 2023 am 11:17 AM
合成画像 stablerep AI画像モデル

主要な強調点:

研究者らは、人工知能によって生成された画像を使用して、非常に詳細な人工知能画像モデルをトレーニングする StableRep と呼ばれる新しいテクノロジーを提案しました。

StableRep は、何百万ものラベル付き合成画像を使用してトレーニングされ、学習プロセスを改善するために「複数のポジティブ コントラスト学習方法」を採用し、それをオープンソースのテキストから画像へのモデル Stable Diffusion に適用します

- ⚙️ StableRep は ImageNet 分類で顕著な結果を達成しましたが、画像の生成が遅く、テキスト プロンプトと生成された画像の間の意味的な不一致に悩まされています。

ウェブマスター ホーム (ChinaZ.com) 11 月 28 日のニュース: MIT と Google の研究者は最近、AI によって生成された画像を利用して、より詳細かつ効率的な AI 画像をトレーニングすることを目的とした、StableRep と呼ばれる新技術を開発しました。モデル。このテクノロジーは、オープンソースのテキストから画像へのモデルである Stable Diffusion に適用され、一連の注目すべき成果を達成しました。

StableRepでは「多重ポジティブコントラスト学習法」という独自の手法を採用しています。このアプローチでは、同じテキスト プロンプトに由来する複数の画像が互いにポジティブなコントラストとして見なされ、学習プロセスが強化されます。たとえば、風景のテキスト プロンプトの場合、モデルは生成された複数の風景画像と関連するすべての説明を比較して、これらの画像に基づいて小さな違いを見つけ、最終出力に適用して、非常に詳細な画像を作成します

MIT と Google が共同研究する新技術 StableRep: 合成画像を使用した AI 画像モデルのトレーニング

研究者らは、自分たちの手法が、複数の画像を単なるピクセルの集合としてではなく、根底にある同じものの表現として扱うことに優れていると指摘しています。実験により、StableRep が Vision Transformer モデルを使用した ImageNet 分類タスクで 76.7% の線形精度を達成したことが証明されました。さらに、言語監視の導入により、2,000 万枚の合成画像でトレーニングされた StableRep モデルは、5,000 万枚の実際の画像でトレーニングされた CLIP モデルのパフォーマンスを上回りました。

ただし、安定した発電機にも欠陥がないわけではありません。画像の生成が遅く、テキスト プロンプトと生成された画像の間で意味的な不一致が発生します。さらに、安定したジェネレーターの基礎となるモデルの安定した拡散には、実際のデータでの初期トレーニングが必要となるため、安定したジェネレーターを使用して画像を生成すると時間がかかり、コストが高くなる可能性があります

StableRep は GitHub でオープンソース化されており、商用利用が可能です。 Apache 2.0ライセンスを採用しており、ユーザーはそれを使用して派生作品を生成することができますが、再配布作品または派生作品にはApacheライセンスのコピーを提供し、変更の通知を含める必要があります。ライセンスには、ライセンスされた作品の使用から生じる損害に対する投稿者の責任の制限も含まれています。 Stable Replica (StableRep) は GitHub でオープンソースとしてリリースされており、商用目的で使用できます。 Apache2.0ライセンスを採用しており、利用・二次創作が可能です。ただし、再配布または派生作品の場合、ユーザーは Apache ライセンスのコピーを提供し、変更が加えられたことを通知する必要があります。このライセンスは、ライセンスされた作品の使用によって生じるあらゆる損害からも寄稿者を補償します。

MIT と Google によるこの研究結果は、人工知能画像生成の分野における革新を表しています。いくつかの欠陥はありますが、高品質の画像を生成するための新しい方法とアイデアを提供します

以上がMIT と Google が共同研究する新技術 StableRep: 合成画像を使用した AI 画像モデルのトレーニングの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! Mar 20, 2025 pm 03:34 PM

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Dall-E 3の使用方法:ヒント、例、および機能 Dall-E 3の使用方法:ヒント、例、および機能 Mar 09, 2025 pm 01:00 PM

Dall-E 3:生成AI画像作成ツール 生成AIはコンテンツの作成に革命をもたらし、Openaiの最新の画像生成モデルであるDall-E 3が最前線にあります。 2023年10月にリリースされ、前任者のDall-EとDall-E 2に基づいています

2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! 2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! Mar 22, 2025 am 10:58 AM

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

オブジェクト検出にYolo V12を使用する方法は? オブジェクト検出にYolo V12を使用する方法は? Mar 22, 2025 am 11:07 AM

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

Elon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突します Elon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突します Mar 08, 2025 am 11:15 AM

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します

SORA vs VEO 2:よりリアルなビデオを作成するのはどれですか? SORA vs VEO 2:よりリアルなビデオを作成するのはどれですか? Mar 10, 2025 pm 12:22 PM

GoogleのVEO 2とOpenaiのSORA:どのAIビデオジェネレーターが最高でしたか? どちらのプラットフォームも印象的なAIビデオを生成しますが、その強みはさまざまな領域にあります。 この比較は、さまざまなプロンプトを使用して、どのツールがニーズに最適かを明らかにします。 t

Google' s Gencast:Gencast Mini Demoを使用した天気予報 Google' s Gencast:Gencast Mini Demoを使用した天気予報 Mar 16, 2025 pm 01:46 PM

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク

chatgptよりも優れたAIはどれですか? chatgptよりも優れたAIはどれですか? Mar 18, 2025 pm 06:05 PM

この記事では、Lamda、Llama、GrokのようなChatGptを超えるAIモデルについて説明し、正確性、理解、業界への影響における利点を強調しています(159文字)

See all articles