アニメーション制作効率80%アップ!ワンクリックで高精度なビデオモーションキャプチャを実現するAIソフトウェア
AIGC には新しい魔法があります。
アニメーターの手Kや習慣キャプチャ、ライトキャプチャなどは必要なく、動画を提供するだけで自動的にアクションを出力できるAIモーションキャプチャソフトです。わずか数分でバーチャルヒューマンのアニメーションが完成します。
# 手足の大きな動きだけでなく、手の細部まで正確に捉えることができます。
シングルビューのビデオに加えて、マルチビューのビデオにも対応しており、単眼認識のみをサポートする他のモーション キャプチャ ソフトウェアと比較して、このソフトウェアはより高いモーション キャプチャ品質を提供できます。
最近、NetEase Interactive Entertainment AI Lab は、このソフトウェアの開発経験とモーション キャプチャ分野での関連研究作業に基づいて、「分析事後確率の学習」という論文をまとめました。 Recovery」は、コンピューター ビジョンのトップ カンファレンスである CVPR 2023 に採択されました。
- #ホームページのアドレス: https://netease-gameai.github.io/ProPose/
- 論文アドレス: https://netease-gameai.github.io/ProPose/static/assets/CVPR2023_ProPose.pdf
- ##この論文は、事後確率に基づくビデオ モーション キャプチャ テクノロジーである ProPose を革新的に提案します。これにより、単一画像やマルチセンサー フュージョンなどのさまざまな設定下で正確な 3 次元の人間の姿勢推定を実現できます。技術的精度は、事前分布を使用したベースラインの確率的手法より 19% 高く、公開データセット 3DPW、Human3.6M、および AGORA での過去の手法を上回っています。さらに、マルチセンサー フュージョン タスクの場合、このテクノロジーは、新しいセンサーの導入によりニューラル ネットワークのバックボーンを変更することなく、ベースライン モデルよりも高い精度を達成することもできます。
技術的背景
この研究のタスクは、RGB 画像からヒューマン メッシュ回復 (hmr) を予測することです。既存の手法は 2 つのカテゴリに要約できます: 直接手法そして間接的な方法。直接法では、ニューラル ネットワークを使用して人間の関節の回転表現 (軸の角度、回転行列、6D ベクトルなど) をエンドツーエンドで回帰しますが、間接法では最初にいくつかの中間表現 (3 次元ベクトルなど) を予測します。次元のキー ポイント、セグメンテーションなど)、これらの中間を通過することにより、関節の回転が取得されることを示します。ただし、どちらのタイプの方法にもいくつかの問題があります。直接法では、回転などの抽象表現をネットワークに直接学習させる必要があるため、キーポイントやセグメンテーションの学習に比べて回転の学習が比較的難しく、ネットワークが出力する結果が画像と一致しにくい場合があります。下の図 (a) の最初の列の右足など、一部の大きな動きは完全に後方に伸ばすことができません。対照的に、間接的な方法は一般に高い精度を生成しますが、そのような方法のパフォーマンスは中間表現の精度に大きく依存します。中間表現がノイズによるエラーを生成すると、最終的な回転が非常に明白に見えることが容易になります。エラー、以下の (b) の 2 行目の左側に示すように。
#前述の決定論的手法に加えて、特定の確率分布を学習することで人間の姿勢の不確実性をモデル化する手法もいくつかあります。システムの堅牢性を向上させるために考慮されます。現在、主な確率モデリング手法には、多変量ガウス分布、正規化フロー、ニューラル ネットワーク陰的モデリングなどが含まれますが、非 SO (3) 上のこれらの確率分布は、関節回転の不確実性を真に反映することはできません。たとえば、不確実性が大きい場合、SO (3) のガウス分布の局所線形性の仮定は成立しません。最近の研究では、ネットワークを直接使用して行列フィッシャー分布のパラメータを学習しています。これは SO (3) 上の分布ではありますが、この方法の学習方法は直接法に似ており、収束性能は比較できません。既存の間接法です。
高精度と堅牢性の両方を考慮し、確率的手法のパフォーマンスを向上させるために、ProPose は関節回転の解析事後確率を導き出します。これは、もたらされる変化から恩恵を受けるだけではありません。さまざまな観測変数による高精度で不確実性を測定し、アルゴリズムに対するノイズの影響を可能な限り低減することもできます。下図に示すように、ProPose は入力画像に対して、腕の軸に沿った右手の回転、腕の回転の方向など、出力確率分布を通じてさまざまな方向の関節回転の不確実性をある程度測定できます。左腕の上下振りや左ふくらはぎの距離感など。 #技術的実装
人体モデリング ##この研究では、人間の姿勢モジュールの確率構築を行います。 、目標は、いくつかの観測変数 (骨の方向 d など) の下で関節回転 R の事後確率 p (R|d,⋯) を見つけることです。
具体的には、人体の関節回転は SO (3) に位置し、親関節に対する子関節の単位ボーン方向は S^2 に位置するため、 、これら 2 つに基づいて、多様体上の確率分布を解析します。
まず、SO (3) 上の行列フィッシャー分布 MF (⋅) は、次の式 F に示すように、関節回転 R の事前分布として使用できます。 ∈R^(3×3 ) は分布のパラメータ、c (F) は正規化定数、tr は行列のトレースを表します。
#次の式に示すように、F は平均 M と、平均値を表す集計項について直接解くことができます。 SVD 分解による分布集約度 K.このうち、Δ=diag (1,1,|UV|) は対角直交行列で、M の行列式が 1 になるようにするために使用され、特殊直交群に分類されます。
第二に、骨の方向が関節の回転によって計算できることを考慮すると、関節の回転 R は次のようにみなできます。暗黙の変数、骨の向き d が観測変数として使用されます。R の指定された条件下で、S^2 上のユニットの向き d は、フォン ミーゼス-フィッシャー分布に従います:
このうち、κ∈R と d∈S^2 はそれぞれ集計項と分布の平均値、l は基準姿勢での単位骨の向き (たとえば、 T ポーズとして)、理論的には Rl= d を満たします。つまり、基準骨の方向が関節の回転を通じて現在の骨の方向に転送されます。
ベイズ理論を使用すると、事前分布 p (R) と尤度関数 p (d|R) が与えられると、骨の向きを条件とした関節回転の事後分布を計算できます。事後確率 p (R|d) の分析形式:
これから、次の結論が得られます。事後確率 p ( R|d) も行列フィッシャー分布に従い、そのパラメーターは F から F^'=F κdl^T に更新されます。
上記の事後確率は、観測量として人間の骨格の向きのみを考慮していますが、同様に他の方向の観測量 d_i や回転の観測量 D_j にも拡張できます。他のセンサー (IMU など) によって生成される場合、分析事後確率は次の一般的な形式で取得されます:
ここで、κ_i と K_j は集計項です。 g (⋅) は、方向観測値を回転推定値に変換できる IK 形式のマッピングで、g (d_i)=dl^T などの最も単純な形式を採用できます。 Z_1 と Z_3 は、それぞれ方向観測値と回転観測値のセットを表します。
特性
このセクションでは、事後確率分布が事前確率分布よりも高い確率を持つことについてさらに説明します。集約の程度。
前述のセクションでは、新しいパラメータ F' によって特徴付けられる、人間の関節回転の事後確率の解析形式を紹介しました。事後パラメータ F^' は別の観点から理解できます。つまり、F^' は、F と同じ平均項 M と新しい集計項 K^' の積です。
ここで、M^T dl^T=ll^T はランク 1 の実対称行列であり、K も実対称行列、つまり事後集約項 K' です。も実対称行列です。行列解析における実対称行列に関するスタッガード定理によれば、K' の固有値 λ_i' と K の固有値 λ_i には次の不等式の関係があることがわかります。
集計項の固有値が分布パラメータの特異値に相当し、分布パラメータの特異値が分布の信頼度を反映できることを考慮すると、次のようになります。尤度項が非ゼロの場合、事後推定比はより集中しており、尤度関数が優先するモードにすぐに収束するため、学習が容易になると結論付けています。
事前確率法に加えて、もう 1 つの主要なベンチマーク法は、インバース キネマティクス (IK) を使用して、ボーンの向きを通じて回転を直接計算することです。次の図は、事後確率を直感的に示すことができます。確率的 IK 手法と決定的 IK 手法の比較。
#上の図は、人間の肘関節を例にしています。実三次元座標軸は真値を表し、透明三次元座標軸は推定値を表す。最初の行は決定論的 IK 法を表します。このタイプの方法の背後にあるモデリング手法は、骨の方向を表すベクトルです。骨の方向が正確に推定されると、残りの 1 自由度 (ねじれ) は円に縮小できます (図 (ボール上の点線の円); 骨の向きが不正確に推定されると、考えられるすべての推定値が真の値から外れてしまいます。 2行目は複数の異なるタイプのモデルを融合した本研究の事後確率モデルを表しており、球上の赤い部分はある回転の確率を表している 骨の向きの推定に誤差があっても骨の方向のノイズは先験的または他の観察によって可能な限り軽減できるため、このメソッドはそれを真の状態の値に戻すことができます。
#ネットワーク フレームワーク図と損失関数
前述の理論と導出に基づいて、次の図を直接表すことができます。構築されたフレーム図。マルチブランチ ネットワークを使用して、単一の画像から事前分布パラメータ F、3 次元キーポイント J (骨の向き d の計算元)、および形状パラメータ β を推定します。事後確率はベイズ則によって計算され、最終的に事後分布から姿勢推定値を取得して人間メッシュを出力します。
#損失関数の選択は比較的簡単で、次の 4 つの制約の加重和になります。ここで、L_J はキー ポイント制約を表し、L_β はキー ポイント制約を表します。は形状パラメータ制約を表し、L_θは行列形式の姿勢パラメータ制約を表し、L_sは分布をサンプリングした後の姿勢パラメータ制約を表します。分布の制約に関しては、正規化パラメータの数値安定性を考慮するため、ここでは MAP を直接使用しません。サンプリング戦略に関しては、以前の研究と同様に、行列フィッシャー分布が四元数形式の等価ビンガム分布に変換され、その後、拒否サンプリングを通じて取得されます。拒否サンプリングに推奨される分布は、角中心ガウス分布を採用します。
実験結果
実験部分では、この研究は公開データセットHuman3.6M、3DPW、AGORA、そしてトータルキャプチャ。この研究の方法は、これまでの多くの方法を上回っていることがわかります。右下の表の最後の 2 つの灰色の行は、同じ時期の作品であり、リストを完全にするためにここにリストされています。
#次の図は、既存の SOTA の定性的比較を示しています。 HybrIK、PARE、および CLIFF メソッドは、一部のオクルージョン状況では ProPose がより良い結果を達成できることを示しています。
次の表は、主に ProPose の精度と堅牢性を実証する一連のアブレーション実験を示しています。ベンチマーク方法には、3 次元のキー ポイントを使用しない、事前分布を使用しない、テスト中に事前分布を使用しない、バックボーン ネットワーク内の異なる場所にある特徴を選択するなどが含まれます。下の左側の表は、提案された事後確率分布がより高いことを完全に検証しています。正確さ。下右の表は事後法と決定論的 IK 法のノイズに対する耐性を比較したもので、事後法の方がノイズの干渉に強いことがわかります。
上記の hmr タスクに加えて、この研究ではマルチタスクにも焦点を当てています。 -センサーフュージョンタスク 上記について評価を実施し、シングルビューとIMUフュージョンの効果を以下に示します。
以上がアニメーション制作効率80%アップ!ワンクリックで高精度なビデオモーションキャプチャを実現するAIソフトウェアの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

MySQLはJSONデータを返すことができます。 json_extract関数はフィールド値を抽出します。複雑なクエリについては、Where句を使用してJSONデータをフィルタリングすることを検討できますが、そのパフォーマンスへの影響に注意してください。 JSONに対するMySQLのサポートは絶えず増加しており、最新バージョンと機能に注意を払うことをお勧めします。

データベース酸属性の詳細な説明酸属性は、データベーストランザクションの信頼性と一貫性を確保するための一連のルールです。データベースシステムがトランザクションを処理する方法を定義し、システムのクラッシュ、停電、または複数のユーザーの同時アクセスの場合でも、データの整合性と精度を確保します。酸属性の概要原子性:トランザクションは不可分な単位と見なされます。どの部分も失敗し、トランザクション全体がロールバックされ、データベースは変更を保持しません。たとえば、銀行の譲渡が1つのアカウントから控除されているが別のアカウントに増加しない場合、操作全体が取り消されます。 TRANSACTION; updateaccountssetbalance = balance-100wh

MySQLのインストール障害の主な理由は次のとおりです。1。許可の問題、管理者として実行するか、SUDOコマンドを使用する必要があります。 2。依存関係が欠落しており、関連する開発パッケージをインストールする必要があります。 3.ポート競合では、ポート3306を占めるプログラムを閉じるか、構成ファイルを変更する必要があります。 4.インストールパッケージが破損しているため、整合性をダウンロードして検証する必要があります。 5.環境変数は誤って構成されており、環境変数はオペレーティングシステムに従って正しく構成する必要があります。これらの問題を解決し、各ステップを慎重に確認して、MySQLを正常にインストールします。

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。
