Douyinで900万人以上が使用している「漫画の顔」特殊効果技術が明らかに
特殊効果のゲームプレイに関して言えば、Douyin の「すべての仕事をこなす」能力は誰の目にも明らかです。最近、「漫画の顔」の特殊効果が脚光を浴びています。男性、女性、子供を問わず、この特殊効果を使用すると、ディズニーアニメのキャラクターのように賢くてかわいく見えます。 「Cartoon Face」はリリースされるとすぐにDouyinで発酵し、「ワンクリックで背が高くて甘い漫画の顔に変身」、「Douyinのすべての逃亡中の王女がここにいます」、「あなたの赤ちゃんを見せびらかしてください」など、ユーザーに深く愛されました。漫画の顔スタイル」、「「砂糖をまぶすお姫さまのジェスチャー ダンス」や「おとぎ話の魔法が失敗した瞬間を捉える」など、王子関連のホットスポットは常に成長しています。その中には、「Douyin から逃亡した王女が全員ここにいます」と「おとぎ話の魔法が失敗した瞬間を捉える」は、Douyin の全国ホット リストにも掲載されています。現在、この特殊効果のユーザー数は900万人を超えています。
「カートゥーンフェイス」は 3D スタイルの特殊効果ですが、このタイプの特殊効果の開発の難しさは主に、多様な CG トレーニング データの取得の難しさ、生き生きとした表情の復元、リアルなフィット感の難しさ、3次元的な肌の光と影の表現が難しく、誇張された強いスタイルの顔の特徴の変形GANを習得するのが難しい。この点で、ByteDance のインテリジェント作成チームは 3D スタイライゼーションの方向での画期的な最適化に焦点を当てており、これにより上記の問題がすべて解決されただけでなく、一連の普遍的な技術ソリューションも生み出されました。
「Cartoon Face」を支える研究開発プロセスの革新
以前は、完全な 3Dスタイライゼーション 研究開発プロセスは次のモジュールに分割されます:
オリジナルのスタイル画像を多数収集 -> StyleGan ラージ モデルをトレーニング -> ペア データを生成 -> 利用可能なペアを手動で選択データ デザイナー P ピクチャー 最適化 -> p2p 小規模モデルのトレーニング、を繰り返します。
従来の研究開発プロセスの問題は非常に明白です。反復サイクルが長く、設計者の参加が弱く、そして、沈殿させて再利用するのは簡単ではありません。
「漫画の顔」特殊効果の研究開発において、ByteDance インテリジェント作成チームは 革新的な研究開発プロセスを採用しました。 :
デザイナーがターゲットのスタイル効果を作成するところから開始します。デザイナーは、アルゴリズムによって合意された要件に従って、いくつかの 3D アート素材を提供します。その後、ByteDance インテリジェント作成チームが DCC ソフトウェアを使用してバッチ処理します。レンダリングプロセスでは、技術チームは最も人気のある AIGC テクノロジーを初めて導入してデータを強化し、次に GAN を使用してトレーニングに必要なペアデータを合成し、最後に自社開発のデータを使用しました。最終的な効果を得るためにトレーニングするための変形 pix2pix モデル。
ByteDance Intelligent Creation Team による「Cartoon Face」の研究開発フローチャート
# プロセスのリンクから、この方法により反復サイクルが大幅に短縮され、自動化の度合いが向上し、設計者の参加度が高まることがわかります。実践により、革新的なエンジニアリングが反復をリンクしていることがわかります。サイクルが 6 か月から 1 か月に短縮され、ソリューションの蓄積と再利用が容易になります。
「漫画の顔」特殊効果のデザイン方法
現在、ソーシャル メディア上で変身特殊効果がますます増えており、人々の注目が高まっています。特殊効果 美的感覚と正確性。ユーザーが様式化された変換効果をより良く実現できるようにするために、Douyin 特殊効果のデザイナーは慎重に研究し、人気のあるアニメーション スタイルと組み合わせて、漫画の顔の特殊効果のセットを革新的に設計しました。アニメのような柔軟なキャラクタースタイルを体験できると同時に、より美しく、よりハンサムになりたいというユーザーのニーズにも応えます。
Douyin 特殊効果デザイナーは、市場にある既存の変身特殊効果を徹底的に調査した結果、既存の特殊効果にはスタイルが不十分、表現が誇張されていない、照明効果がリアルではないなどの問題があることがわかりました。そこで、Douyinの特殊効果デザイナーは、国内の美学に基づいて漫画の顔のスタイルを再設計し、男性と女性の顔のプロポーションを誇張し、かわいい丸い顔とスマートな顔の特徴を持つ「女の子」と、タフで長い顔の「男の子」に再構築しました。顔とハンサムな顔立ち。このプロセスでは、デザイナーがユーザー自身の髪を残し、髪のふわふわ感と光沢を高め、漫画の顔に溶け込むように自然に仕上げ、漫画の質感の肌もユーザー自身の肌のディテールを取り込み、特殊効果がより自然になり、ユーザーの特性がよりパーソナライズされました。
さらに、Douyin 特殊効果のデザイナーは、複雑なシーンでの照明復元のニーズを満たすために、さまざまな照明の下での光と影のテクスチャも定義し、漫画の顔をさらに 3 つにしました。立体的で自然な、日常生活に溶け込むセルフィーを撮るのは悪いことではありません。最後に、デザイナーは誇張された象徴的な表情を作成し、フェイシャル キャプチャ テクノロジーを使用してデジタル人財の表情 CG データを生成し、トレーニング データとアルゴリズムを継続的に改善して、ユーザーの個性をより鮮明に表示できる表情効果を生成しました。
自社構築の CG 合成データ ストリーム、高品質のトレーニング データを再利用可能
3D スタイルの特殊効果のトレーニング データのソースは高品質の CG に依存データ配布要件の多様性は比較的高いですが、同時に、3D アセットの手動モデリングも非常に労力を要するプロセスであり、再利用性も不十分です。多くの場合、プロジェクトは、 3D アセットのバッチを作成しましたが、プロジェクトの終了時に完全に放棄されました。
今回、ByteDance のインテリジェント作成チームは、汎用的で拡張しやすい CG 合成データ ワークフローのセットを構築しました。
#Bytedance Intelligent Creation Team の CG 合成データ フローのフローチャート
この合成データ フローのワークフローは次のとおりです:
1. Houdini を通じてプログラムでデジタル アセットを生成し、プログラムで顔をピンチし、ボーンをバインドし、ウェイトを調整します。 、など、現実的なデジタル ヒューマン モデル アセット ライブラリを確立します。
2. Houdini の Solaris を使用して USD テンプレートを構築し、髪、毛皮、頭部モデル、衣服、表現係数などのアセットを組み合わせます。米ドル参照輸入。
3. Houdini の PDG を使用してアセット、カメラ アングル、照明環境などを変更します。 . ランダムな組み合わせ。 PDG を使用してワークアイテムを制御し、データ分散を正確に制御します。
以来研究開発プロセスでは、エフェクトの反復のために大量のレンダリング データを頻繁に提供する必要があり、これには多大な計算能力コストとレンダリング待ち時間が必要になります。以前、チームはDouyinの「Magic Transformation」特殊効果のデータレンダリングのために外部ファームに数百万ドルを費やしていました。 「漫画の顔」の特殊効果に関しては、チームは ByteDance のクラウド プラットフォーム Volcano Engine の強固なインフラストラクチャを利用して、コンピューティング電力コストを大幅に削減しました。
ByteDance のインテリジェント作成チームは、映画およびテレビ業界のプロセスを参考にして、自社開発のレンダリング ファーム プラットフォームを構築しました。オフライン タスクを複数のレンダリング マシンに分割して並列処理できます。イメージ ホスティング用の Volcano Engine ミラーリング プラットフォーム、リソースのアプリケーションとリリース用のリソース プーリング プラットフォーム、コンテナーの動的な拡張と縮小用の CPU/GPU クラスター、資産管理用の NAS の使用により、レンダリング ファームはワンクリックで拡張できます。数千ものレンダリング ノードを効率的に計算する機能。
これに基づいて、ByteDance インテリジェント作成チームは、前処理、エンジン レンダリング、後処理、その他のステップを含むシングルタスク処理ロジックをカスタマイズしました。また、必要に応じていつでもクラスター サイズを動的に拡張/縮小して、コンピューティング リソースの使用を最大化します。
効率をさらに向上させ、デザイナーが効果の最適化に参加しやすくするために、技術チームはデザイナーが使用できる Feishu アプレットも作成しました。これにより、自動プロセスをトリガーできます。 Feishu を介したクラウド アート効果を反復するために、クラウド タスクが完了した後、デザイナーが確認できるメッセージが Feishu に返送され、デザイナーの作業効率が大幅に向上します。
同時に、ByteDance インテリジェント作成チームは、イベント ドライバー (EventTrigger) と API をカスタマイズして、ファーム、Feishu プラットフォーム、クラウド デスクトップ プラットフォームを接続し、オールインワンのコンセプトを最大限に高めました。これにより、デザイナーとエンジニアは、Feishu と Cloud Desktop に基づいて共同研究開発をより便利に完了できるようになります。
#自社開発のレンダリング ファーム プラットフォーム
AIGC Newテクノロジーの応用DALL・E の出現により、ByteDance インテリジェント作成チームは、2021 年初頭に関連テクノロジーのフォローアップと計画を開始しました。ByteDance インテリジェント作成チームは、Stable Diffusion オープンソースを開発しました。モデル をもとにデータ量10億のデータセットを構築し、油絵や水墨画風の絵を生成できる汎用モデル「拡散モデル」と、「拡散モデル」の2つのモデルを学習させた。もう1つはアニメーションスタイルの拡散モデルです。
つい最近、ByteDance のインテリジェント作成チームがサポートする「AI ペイント」特殊効果が、この新しいテクノロジーを使用して Douyin で人気になりました。今回は Douyin の "Cartoon Face" について、技術チームは 3D 漫画スタイルを生成する拡散モデルの機能をさらに調査し、画像生成戦略を採用しました。最初に画像にノイズを追加し、次にトレーニング済みのヴィンセント グラフ モデルを使用しました。テキストの。事前にトレーニングされた安定拡散モデルに基づいて、実際の人物画像と一致する GAN によって生成されたターゲット 3D スタイル結果画像を入力し、一連の微調整されたテキスト キーワードを通じてターゲット スタイルを目的の方向に近づけます。結果は最終データとして使用され、学習のために後続の GAN モデルに渡されます。
自社開発の変形 GAN モデルDouyin の「漫画の顔」のターゲット スタイルは、元のポートレートに比べて変形が大きいため、そのまま使用するのは困難です従来の p2p フレームワーク 高品質のトレーニング結果を達成するために、ByteDance のインテリジェント作成チームは一連の p2p 変形 GAN トレーニング フレームワークを自社開発しました。これは、大きく変形した強いスタイルの漫画ターゲットのトレーニングに優れた効果をもたらします。 ByteDance のインテリジェント作成チームが自社開発した変形 GAN トレーニング フレームワークは 2 つの部分で構成されています:
#1. 漫画の顔の様式化された情報を抽出するための様式化された事前トレーニング。技術チームは、様式化された情報をインタラクティブに融合するための非ペアトレーニングフレームワークを構築し、現実の人物と漫画の顔のデータセットをフレームワークに入力することで、漫画の顔の様式化された情報を抽出できます。このフレームワークは、定型化された特徴のエンコーディング、特徴の融合、再構成トレーニング、定型化された予備トレーニングを含むエンドツーエンドのトレーニング フレームワークであり、トレーニングが完了すると、漫画の顔の定型化された情報が次の洗練されたトレーニングのステップのために取得されます。
#2. 漫画の顔の様式化された情報を統合し、正確なトレーニングを実施します。最初のステップで取得された漫画の顔の様式化された情報には、スタイルや変形などの情報が含まれています。情報のこの部分は、洗練されたトレーニングのために現実の人物の画像に統合されます。ペアリングのトレーニングには、p2p 関連の強力な監視損失が使用されます。トレーニングが収束すると、漫画の顔モデルが取得されます。
上記の革新的な技術ソリューションに基づいて、Douyin の「Cartoon Face」はエンジニアリング リンクを簡素化し、反復効率を大幅に向上させるだけでなく、大きな角度、豊かな表現、効果スタイルの復元、光と影の一貫性、および複数の機能を改善します。肌の色、マッチングなどの面で明らかな最適化効果が得られています。 「Cartoon Face」プロジェクトを担当する ByteDance インテリジェント作成チームは、2021 年から 3D スタイライゼーションの方向で画期的な最適化に注力していることがわかりました。この技術ソリューションは、さまざまな 3D スタイルの特殊効果をサポートし、ゲーム上で人気の高い結果を達成しました。プラットホーム。
#Bytedance インテリジェント作成チームについて:
#インテリジェント作成チームは、Bytedance AI およびマルチメディア テクノロジをサポートするミドル プラットフォームです。コンピューター ビジョン、オーディオおよびビデオ編集、特殊効果処理などの最先端のテクノロジーを構築することで、Douyin、Jianying、Toutiao などの同社の製品ラインの多くをサポートすると同時に、外部の ToB パートナーに業界をリードするインテリジェントな作成機能を提供します。 Volcano Engine と業界ソリューションを通じて。
以上がDouyinで900万人以上が使用している「漫画の顔」特殊効果技術が明らかにの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











クロスチェーントランザクションをサポートする交換:1。Binance、2。Uniswap、3。Sushiswap、4。CurveFinance、5。Thorchain、6。1inchExchange、7。DLNTrade、これらのプラットフォームはさまざまな技術を通じてマルチチェーン資産トランザクションをサポートします。

WorldCoin(WLD)は、独自の生体認証とプライバシー保護メカニズムを備えた暗号通貨市場で際立っており、多くの投資家の注目を集めています。 WLDは、特にOpenai人工知能技術と組み合わせて、革新的なテクノロジーを備えたAltcoinsの間で驚くほど演奏しています。しかし、デジタル資産は今後数年間でどのように振る舞いますか? WLDの将来の価格を一緒に予測しましょう。 2025年のWLD価格予測は、2025年にWLDで大幅に増加すると予想されています。市場分析は、平均WLD価格が1.31ドルに達する可能性があり、最大1.36ドルであることを示しています。ただし、クマ市場では、価格は約0.55ドルに低下する可能性があります。この成長の期待は、主にWorldCoin2によるものです。

Binanceは、グローバルデジタルアセット取引エコシステムの大君主であり、その特性には次のものが含まれます。1。1日の平均取引量は1,500億ドルを超え、500の取引ペアをサポートし、主流の通貨の98%をカバーしています。 2。イノベーションマトリックスは、デリバティブ市場、Web3レイアウト、教育システムをカバーしています。 3.技術的な利点は、1秒あたり140万のトランザクションのピーク処理量を伴うミリ秒のマッチングエンジンです。 4.コンプライアンスの進捗状況は、15か国のライセンスを保持し、ヨーロッパと米国で準拠した事業体を確立します。

仮想通貨価格の上昇の要因には、次のものが含まれます。1。市場需要の増加、2。供給の減少、3。刺激された肯定的なニュース、4。楽観的な市場感情、5。マクロ経済環境。衰退要因は次のとおりです。1。市場需要の減少、2。供給の増加、3。ネガティブニュースのストライキ、4。悲観的市場感情、5。マクロ経済環境。

暗号通貨の賑やかな世界では、新しい機会が常に現れます。現在、Kerneldao(Kernel)Airdropアクティビティは多くの注目を集め、多くの投資家の注目を集めています。それで、このプロジェクトの起源は何ですか? BNBホルダーはそれからどのような利点を得ることができますか?心配しないでください、以下はあなたのためにそれを一つ一つ明らかにします。

2025年のレバレッジド取引、セキュリティ、ユーザーエクスペリエンスで優れたパフォーマンスを持つプラットフォームは次のとおりです。1。OKX、高周波トレーダーに適しており、最大100倍のレバレッジを提供します。 2。世界中の多通貨トレーダーに適したバイナンス、125倍の高いレバレッジを提供します。 3。Gate.io、プロのデリバティブプレーヤーに適し、100倍のレバレッジを提供します。 4。ビットゲットは、初心者やソーシャルトレーダーに適しており、最大100倍のレバレッジを提供します。 5。Kraken、安定した投資家に適しており、5倍のレバレッジを提供します。 6。Altcoinエクスプローラーに適したBybit。20倍のレバレッジを提供します。 7。低コストのトレーダーに適したKucoinは、10倍のレバレッジを提供します。 8。ビットフィネックス、シニアプレイに適しています

Aavenomicsは、Aaveプロトコルトークンを変更し、Aavedaoの定足数を実装したToken Reposを導入する提案です。 Aave Project Chain(ACI)の創設者であるMarc Zellerは、これをXで発表し、契約の新しい時代をマークしていることに注目しました。 Aave Chain Initiative(ACI)の創設者であるMarc Zellerは、Aavenomicsの提案にAave Protocolトークンの変更とトークンリポジトリの導入が含まれていると発表しました。 Zellerによると、これは契約の新しい時代を告げています。 Aavedaoのメンバーは、水曜日の週に100でした。

暗号通貨市場での突入は投資家の間でパニックを引き起こし、Dogecoin(Doge)は最も困難なヒット分野の1つになりました。その価格は急激に下落し、分散財務財務(DEFI)(TVL)の総価値が激しく減少しました。 「ブラックマンデー」の販売波が暗号通貨市場を席巻し、ドゲコインが最初にヒットしました。そのdefitVLは2023レベルに低下し、通貨価格は過去1か月で23.78%下落しました。 DogecoinのDefitVLは、主にSOSO値指数が26.37%減少したため、272万ドルの安値に低下しました。退屈なDAOやThorchainなどの他の主要なDefiプラットフォームも、それぞれ24.04%と20減少しました。
