ホームページ テクノロジー周辺機器 AI Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

Apr 12, 2023 pm 08:10 PM
ビデオ 画像

生成モデルとマルチモーダル視覚言語モデルの進歩により、前例のない生成リアリズムと多様性を備えた大規模なテキストから画像へのモデルへの道が開かれたことを私たちは知っています。これらのモデルは新しい創造的なプロセスを提供しますが、既存の画像を編集するのではなく、新しい画像を合成することに限定されます。このギャップを埋めるために、直感的なテキストベースの編集方法により、生成された画像と実際の画像のテキストベースの編集が可能になり、これらの画像の元のプロパティの一部が保持されます。画像と同様に、最近多くのテキストからビデオへのモデルが提案されていますが、これらのモデルをビデオ編集に使用する方法はほとんどありません。

テキストガイド付きビデオ編集では、ユーザーは、以下の図 1 に示すように、生成されたビデオの予期されるプロパティを説明するテキスト プロンプトとともに入力ビデオを提供します。目標には次の 3 つの側面があります、1) 整列、編集されたビデオは入力テキスト プロンプトに準拠する必要があります、2) 忠実度、編集されたビデオは元のビデオの内容を保持する必要があります、3) 品質、編集されたビデオは高品質である必要があります。 。

#ご覧のとおり、 ビデオ編集は画像編集よりも難しく、単に見た目を変更するだけではなく、新しいアクションを合成する必要があります# 。時間的な一貫性を維持する必要もあります。したがって、SDEdit や Prompt-to-Prompt などの画像レベルの編集方法をビデオ フレームに適用するだけでは、良好な結果を得るには十分ではありません。

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

##Google Research などが arXiv で最近公開した論文では、

研究者らは、UniTune からインスピレーションを受け、テキスト条件付きビデオ拡散モデル (VDM) をビデオ編集に適用した新しい手法、Dreamix を提案しました。

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

論文アドレス: https://arxiv.org/pdf /2302.01329.pdf
  • プロジェクトのホームページ: https://dreamix-video-editing.github.io/
  • #この記事の方法の核心は次のとおりです。
  • テキスト条件付き VDM は、次の 2 つの方法によって入力ビデオに対する高い忠実度を維持します。主なアイデア

。 1 つはモデルの初期化として純粋なノイズを使用せず、元のビデオのダウングレード バージョンを使用して、サイズを削減しノイズを追加することで低い時空間情報のみを保持します。もう 1 つは、モデルの初期化を微調整することで元のビデオの忠実度をさらに向上させます。元のビデオに生成モデルを費やします。 微調整により、モデルが元のビデオの高解像度特性を確実に理解できるようになります。入力ビデオを簡単に微調整することで、モデルがテキスト プロンプトに従うよりも生のモーションを優先するように学習するため、モーションの編集可能性が比較的低くなります。研究者らは、VDM も入力ビデオの個々のフレームのセットに対して微調整され、そのタイミングを破棄する、新しいハイブリッド微調整方法を提案しています。ブレンドの微調整により、モーション編集の品質が大幅に向上します。

研究者らは、ビデオ編集モデルをさらに使用して、新しい画像アニメーション フレームワーク

を提案しました (以下の図 2 を参照)。このフレームワークは、画像内のオブジェクトや背景のアニメーション化、動的なカメラの動きの作成など、いくつかのステップで構成されています。これは、フレームのコピーや幾何学的画像変換などの単純な画像処理操作を通じて行われ、粗雑なビデオが作成されます。次に、Dreamix ビデオ エディターを使用してビデオを編集します。さらに、研究者らは、Dreambooth のビデオ版である目標主導型ビデオ生成の微調整手法も使用しました。

#実験表示部分では、研究者は広範な定性調査と手動評価を実施しました。彼らのメソッドの強力な機能については、次のアニメーションを参照してください。 Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

この Google の調査では、3D モーションと編集ツールは次のように述べられています。次の論文の人気のトピックになるかもしれません。

# 他の人はこう言いました: 予算内ですぐに自分の映画を作ることができます。必要なのはグリーン スクリーンとこのテクノロジーだけです:

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

#方法の概要

この記事では、ビデオ編集の新しい方法、特に:

## を提案します。

#破壊されたビデオのリバース エンジニアリングによるテキストガイド付きビデオ編集

彼らはカスケード VDM (ビデオ拡散モデル) を使用し、まず入力ビデオを特定のレベルまで破壊します。ダウンサンプリングを通じて拡張し、ノイズを追加します。次に、カスケード拡散モデルがサンプリング プロセスと条件付き時間 t に使用され、ビデオを最終的な時間空間解像度にアップスケールします。

入力ビデオを破棄するプロセスでは、まずダウンサンプリング操作を実行して基本モデル (16 フレーム 24 × 40) を取得し、次に分散は

ガウス ノイズであり、入力ビデオがさらに破損します。 Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

上記の処理されたビデオの場合、次のステップは、カスケード VDM を使用して、破損した低解像度ビデオをテキストに合わせた高解像度ビデオにマッピングすることです。ここでの中心的な考え方は、ノイズが多く、時間的および空間的解像度が非常に低いビデオがある場合、それに対応する完全に実行可能な高解像度のビデオが多数存在するということです。この論文の基本モデルは、時間 s での拡散プロセスと同じノイズを持つ破損したビデオから始まります。次に研究では、VDM を使用して時間 0 まで拡散プロセスを逆転させました。最後に、ビデオは超解像モデルによってアップグレードされます。

ハイブリッド ビデオ画像の微調整

入力ビデオのみを使用してビデオ拡散モデルを微調整すると、オブジェクトの動きの変化を制限します。代わりに、この研究ではハイブリッド ターゲットを使用します。つまり、元のターゲット (左下隅) に加えて、この論文では、順序付けされていないフレームのセットに対しても微調整を実行します。これは、「」を通じて行われます。一時的な注意を防ぐために「マスクされた一時的な注意」。力と畳み込みが微調整されます (右下)。この操作により、静止ビデオに動きを追加できます。

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

#推論

アプリケーション内この研究は、前処理 (アプリケーション依存の前処理、下図の左側) に基づいて、複数のアプリケーションをサポートし、入力コンテンツを統一されたビデオ形式に変換できます。画像からビデオへの変換の場合、入力画像がコピーおよび変換され、カメラの動きを含む大まかなビデオが合成されます。オブジェクト駆動型のビデオ生成の場合、忠実度を維持するために入力が省略され、個別に微調整されます。この大まかなビデオは、Dreamix Video Editor (右) を使用して編集されました。前述したように、ビデオは最初にダウンサンプリングによって破壊され、ノイズが追加されました。次に、微調整されたテキストガイド付きビデオ拡散モデルが適用され、ビデオが最終的な時間的および空間的解像度にアップスケールされます。

実験結果

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできるビデオ編集: 下の図では、Dreamix がアクションをダンスに変更し、見た目がダンスから変わります。サルとクマ、しかしビデオの被写体の基本的な属性は変わっていません:

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる


Dreamix は、入力ビデオ時間情報と一致するスムーズな視覚的変更を生成することもできます。たとえば、図のようにスケートボードできる鹿などです。以下:

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

画像からビデオへ: 入力が画像の場合、Dreamix はビデオを使用して新しい移動オブジェクトを追加できます。 、以下の通り 霧の森の中にユニコーンが現れ、ズームインされています。

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

ペンギンが小屋の隣に現れました:

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

目標主導型ビデオ生成: Dreamix は、同じ被写体を示す画像のコレクションを取得し、その被写体を移動オブジェクトとして含む新しいビデオを生成することもできます。下の写真は、葉の上でうごめく毛虫を示しています。

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

定性分析に加えて、この研究では主に Dreamix Compare with を使用してベースライン比較も実施しました。 2 つの基本的な方法: Imagen-Video とプラグ アンド プレイ (PnP)。次の表はスコアリング結果を示しています。

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

# 図 8 は、Dreamix によって編集されたビデオと 2 つのベースライン例を示しています。ビデオ モデルは、元のビデオに依存しないため、低忠実度の編集が可能になります。 PnP はシーンを保持しますが、フレームごとの一貫性に欠けます。Dreamix は 3 つの目標すべてで優れたパフォーマンスを発揮します。

Google がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできる

#技術的な詳細については、元の論文を参照してください。

以上がGoogle がビデオ生成 AIGC を初めてリリース、ネチズン: 映画をカスタマイズできるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

動画ファイルはブラウザのキャッシュのどこに保存されますか? 動画ファイルはブラウザのキャッシュのどこに保存されますか? Feb 19, 2024 pm 05:09 PM

ブラウザはビデオをどのフォルダにキャッシュしますか? 私たちは毎日インターネット ブラウザを使用するときに、YouTube でミュージック ビデオを視聴したり、Netflix で映画を視聴したりするなど、さまざまなオンライン ビデオを視聴することがよくあります。これらのビデオは読み込みプロセス中にブラウザによってキャッシュされるため、将来再び再生するときにすぐに読み込むことができます。そこで問題は、これらのキャッシュされたビデオが実際にどのフォルダーに保存されるのかということです。ブラウザーが異なれば、キャッシュされたビデオ フォルダーは異なる場所に保存されます。以下に、いくつかの一般的なブラウザとそのブラウザを紹介します。

他人の動画をDouyinに投稿することは侵害になりますか?侵害せずにビデオを編集するにはどうすればよいですか? 他人の動画をDouyinに投稿することは侵害になりますか?侵害せずにビデオを編集するにはどうすればよいですか? Mar 21, 2024 pm 05:57 PM

ショートビデオプラットフォームの台頭により、Douyinはみんなの日常生活に欠かせないものになりました。 TikTokでは世界中の面白い動画を見ることができます。他人のビデオを投稿することを好む人もいますが、「Douyin は他人のビデオを投稿することを侵害しているのでしょうか?」という疑問が生じます。この記事では、この問題について説明し、著作権を侵害せずに動画を編集する方法と、著作権侵害の問題を回避する方法について説明します。 1.Douyin による他人の動画の投稿は侵害ですか?私の国の著作権法の規定によれば、著作権者の著作物を著作権者の許可なく無断で使用することは侵害となります。したがって、オリジナルの作者または著作権所有者の許可なしに他人のビデオをDouyinに投稿することは侵害となります。 2. 著作権を侵害せずにビデオを編集するにはどうすればよいですか? 1. パブリックドメインまたはライセンスされたコンテンツの使用: パブリック

Wink でビデオの透かしを削除する方法 Wink でビデオの透かしを削除する方法 Feb 23, 2024 pm 07:22 PM

Wink でビデオからウォーターマークを削除するにはどうすればよいですか? winkAPP にはビデオからウォーターマークを削除するツールがありますが、ほとんどの友達は wink でビデオからウォーターマークを削除する方法を知りません。次は Wink でビデオからウォーターマークを削除する方法の画像です。編集者が持参したテキストチュートリアルですので、興味のある方はぜひ見に来てください! Wink でビデオ透かしを削除する方法 1. まず、Wink APP を開き、ホームページ領域で [透かしを削除] 機能を選択します; 2. 次に、アルバムで透かしを削除したいビデオを選択します; 3. 次に、ビデオを選択してクリックしますビデオ編集後、右上隅にある [√]; 4. 最後に、下図のように [ワンクリック印刷] をクリックし、[処理] をクリックします。

Douyin に動画を投稿して収益を得るにはどうすればよいですか?初心者はどうやってDouyinでお金を稼ぐことができますか? Douyin に動画を投稿して収益を得るにはどうすればよいですか?初心者はどうやってDouyinでお金を稼ぐことができますか? Mar 21, 2024 pm 08:17 PM

全国的なショートビデオプラットフォームであるDouyinは、自由な時間にさまざまな興味深く斬新なショートビデオを楽しむことができるだけでなく、自分自身を示し、自分の価値観を実現するステージも提供します。では、Douyin に動画を投稿してお金を稼ぐにはどうすればよいでしょうか?この記事ではこの質問に詳しく答え、TikTokでより多くのお金を稼ぐのに役立ちます。 1.Douyin に動画を投稿してお金を稼ぐにはどうすればよいですか?動画を投稿し、Douyin で一定の​​再生回数を獲得すると、広告共有プランに参加できるようになります。この収入方法はDouyinユーザーにとって最も馴染みのある方法の1つであり、多くのクリエイターにとって主な収入源でもあります。 Douyin は、アカウントの重み、動画コンテンツ、視聴者のフィードバックなどのさまざまな要素に基づいて、広告共有の機会を提供するかどうかを決定します。 TikTok プラットフォームでは、視聴者がギフトを送ったり、

iPhoneのビデオからスローモーションを削除する2つの方法 iPhoneのビデオからスローモーションを削除する2つの方法 Mar 04, 2024 am 10:46 AM

iOS デバイスでは、カメラ アプリを使用してスローモーション ビデオを撮影できます。最新の iPhone を使用している場合は、1 秒あたり 240 フレームのビデオを撮影することもできます。この機能により、高速アクションを詳細にキャプチャできます。ただし、ビデオの詳細やアクションをよりよく理解するために、スローモーション ビデオを通常の速度で再生したい場合もあります。この記事では、iPhone上の既存のビデオからスローモーションを削除するすべての方法を説明します。 iPhoneでビデオからスローモーションを削除する方法[2つの方法] 写真アプリまたはiMovieアプリを使用して、デバイス上のビデオからスローモーションを削除できます。方法 1: 写真アプリを使用して iPhone で開く

画質を圧縮せずにWeiboに動画を投稿する方法_画質を圧縮せずにWeiboに動画を投稿する方法 画質を圧縮せずにWeiboに動画を投稿する方法_画質を圧縮せずにWeiboに動画を投稿する方法 Mar 30, 2024 pm 12:26 PM

1. まず携帯電話で Weibo を開き、右下隅の [Me] をクリックします (図を参照)。 2. 次に、右上隅の [歯車] をクリックして設定を開きます (図を参照)。 3. 次に、[一般設定] を見つけて開きます (図を参照)。 4. 次に、[Video Follow] オプションを入力します (図を参照)。 5. 次に、[ビデオアップロード解像度]設定を開きます(図を参照)。 6. 最後に、圧縮を避けるために [オリジナルの画質] を選択します (図を参照)。

小紅書ビデオ作品を公開するにはどうすればよいですか?動画を投稿する際に注意すべきことは何ですか? 小紅書ビデオ作品を公開するにはどうすればよいですか?動画を投稿する際に注意すべきことは何ですか? Mar 23, 2024 pm 08:50 PM

短編ビデオ プラットフォームの台頭により、Xiaohongshu は多くの人々が自分の生活を共有し、自分自身を表現し、トラフィックを獲得するためのプラットフォームになりました。このプラットフォームでは、ビデオ作品の公開が非常に人気のある交流方法です。では、小紅書ビデオ作品を公開するにはどうすればよいでしょうか? 1.小紅書ビデオ作品を公開するにはどうすればよいですか?まず、共有できるビデオ コンテンツがあることを確認します。携帯電話やその他のカメラ機器を使用して撮影することもできますが、画質と音声の明瞭さには注意する必要があります。 2.ビデオを編集する:作品をより魅力的にするために、ビデオを編集できます。 Douyin、Kuaishou などのプロ仕様のビデオ編集ソフトウェアを使用して、フィルター、音楽、字幕、その他の要素を追加できます。 3. 表紙を選択する: 表紙はユーザーのクリックを誘致するための鍵です。ユーザーのクリックを誘致するために、表紙には鮮明で興味深い写真を選択してください。

UC ブラウザでダウンロードしたビデオをローカルビデオに変換する方法 UC ブラウザでダウンロードしたビデオをローカルビデオに変換する方法 Feb 29, 2024 pm 10:19 PM

UC ブラウザでダウンロードしたビデオをローカルビデオに変換するにはどうすればよいですか?多くの携帯電話ユーザーは UC Browser を好んで使用しており、Web を閲覧するだけでなく、オンラインでさまざまなビデオやテレビ番組を視聴したり、お気に入りのビデオを携帯電話にダウンロードしたりすることもできます。実は、ダウンロードした動画をローカル動画に変換することもできますが、その方法がわからない人も多いでしょう。したがって、エディターは、UC ブラウザーによってキャッシュされたビデオをローカルビデオに変換する方法を特別に提供します。 uc ブラウザーのキャッシュされたビデオをローカルビデオに変換する方法 1. uc ブラウザーを開き、「メニュー」オプションをクリックします。 2.「ダウンロード/ビデオ」をクリックします。 3. 「キャッシュされたビデオ」をクリックします。 4. 任意のビデオを長押しし、オプションがポップアップ表示されたら、「ディレクトリを開く」をクリックします。 5. ダウンロードしたいものにチェックを入れます

See all articles