SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマン モーション キャプチャ モデルを提示します。
現在、人間の全身の姿勢と形状の推定 (EHPS、表情豊かな人間の姿勢と形状の推定) では研究が大きく進歩していますが、最も先進的な方法はトレーニング データ セットの制限によって依然として制限されています。
最近、南洋理工大学 S-Lab、SenseTime、東京大学上海人工知能研究所、IDEA 研究所の研究者らは、人体の姿勢と姿勢の推定を初めて提案しました。ボディ形状SMPLer-X、ミッションの大型モーションキャプチャーモデル。この調査では、さまざまなデータ ソースからの最大 450 万のインスタンスを使用してモデルをトレーニングし、7 つの主要なリストで最高のパフォーマンスを達成しました。
SMPLer-X は体の動きをキャプチャするだけでなく、出力もできます顔と手の動き、体型の推定
論文リンク: https://arxiv.org/ abs/2309.17448
プロジェクトのホームページ: https://caizhongang.github.io/projects/SMPLer-X/
豊富なデータと巨大なモデルにより、SMPLer-X は強力なパフォーマンスを示しますさまざまなテストやランキングで高い評価を獲得し、未知の環境でも優れた汎用性を備えています
データの拡張に関しては、研究者らは 32 の 3D 人体データセットの包括的な評価と分析を実施して、モデル トレーニングのリファレンス
2. モデルのスケーリングに関しては、視覚的な大きなモデルを使用して、モデル パラメーターの増加を検討します。パフォーマンスに対する量の改善効果
3. 微調整戦略により、SMPLer-X の一般的な大型モデルを専用の大型モデルに変換し、さらなるパフォーマンスの向上を実現できます。
要約すると、SMPLer-X はデータ スケーリングとモデル スケーリングを調査し (図 1 を参照)、32 の学術データに対して実行しました。 450 万のインスタンスで同時に設定およびトレーニングした結果、AGORA、UBody、EgoBody、EHF を含む 7 つの主要なリストで最高のパフォーマンスを達成しました
図 1データとモデル パラメーターの量を増やすことは、キー リスト (AGORA、UBody、EgoBody、3DPW、および EHF) の平均主誤差 (MPE) を減らすのに効果的です
既存の 3D 人体データセットに関する一般化研究
研究者らは 32 の学術データセットについて一般化研究を実施しました。ランキングが実行されました。各データセットのパフォーマンスを測定するために、モデルは以下を使用してトレーニングされました。そのデータセットとモデルは、AGORA、UBody、EgoBody、3DPW、および EHF の 5 つの評価データセットで評価されました。
平均一次誤差 (MPE) も表で計算され、さまざまなデータセット間の簡単な比較が容易になります。
データセットの一般化の研究からのインスピレーション
多数のデータ セットを分析すると (図 3 を参照)、次の 4 つの結論が導き出されます:
1. 単一のデータ セットのデータ量に関しては、 100,000 インスタンスのオーダー モデルのトレーニングに使用して、より高いコストパフォーマンスを実現できます;
2. データセットの収集シナリオに関しては、In-the-wild データセットは最高の効果。データが屋内でしか収集できない場合、トレーニング効果を高めるためには、単一のシーンからのデータの使用を避ける必要があります。
データセットの収集に関して、上位 3 つのうち 2 つは、データセットは生成されたデータセットです。近年、生成されたデータセットは優れたパフォーマンスを示しています
# データセットのアノテーションに関しては、擬似ラベルもトレーニングにおいて非常に重要な役割を果たしています#大規模なモーション キャプチャ モデルのトレーニングと微調整
今日の最先端の手法では、通常、トレーニングに少数のデータ セット (MSCOCO、MPII、Human3.6M など) のみが使用されます。この論文では、その他のデータセットの使用について研究します
#
よりランクの高いデータ セットが優先されることを考慮して、トレーニング セットとして 5、10、20、および 32 データ セットの 4 つの異なるデータ サイズを使用し、合計サイズは 750,000、150 万、300 万、4.5 です。
#さらに、研究者らは、一般的な大規模モデルを特定のシーンに適応させるための低コストの微調整戦略も実証しました。
さらに、研究者らは、ARCTIC と DNA レンダリングの 2 つのテスト セットで大規模モーション キャプチャ モデルの一般化も評価しました。
研究者SMPLer-X がアルゴリズム設計を超えたインスピレーションをもたらし、強力な全身ヒューマン モーション キャプチャの大型モデルを学術コミュニティに提供できることを期待しています。
コードと事前トレーニングされたモデルは、プロジェクトのホームページでオープンソース化されています。詳細については、https://caizhongang.github.io/projects/SMPLer-X/ をご覧ください。
結果表示
以上がSMPLer-X: 7 つの主要なリストを覆し、最初のヒューマン モーション キャプチャ モデルを提示します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











クロスチェーントランザクションをサポートする交換:1。Binance、2。Uniswap、3。Sushiswap、4。CurveFinance、5。Thorchain、6。1inchExchange、7。DLNTrade、これらのプラットフォームはさまざまな技術を通じてマルチチェーン資産トランザクションをサポートします。

WorldCoin(WLD)は、独自の生体認証とプライバシー保護メカニズムを備えた暗号通貨市場で際立っており、多くの投資家の注目を集めています。 WLDは、特にOpenai人工知能技術と組み合わせて、革新的なテクノロジーを備えたAltcoinsの間で驚くほど演奏しています。しかし、デジタル資産は今後数年間でどのように振る舞いますか? WLDの将来の価格を一緒に予測しましょう。 2025年のWLD価格予測は、2025年にWLDで大幅に増加すると予想されています。市場分析は、平均WLD価格が1.31ドルに達する可能性があり、最大1.36ドルであることを示しています。ただし、クマ市場では、価格は約0.55ドルに低下する可能性があります。この成長の期待は、主にWorldCoin2によるものです。

暗号通貨市場での突入は投資家の間でパニックを引き起こし、Dogecoin(Doge)は最も困難なヒット分野の1つになりました。その価格は急激に下落し、分散財務財務(DEFI)(TVL)の総価値が激しく減少しました。 「ブラックマンデー」の販売波が暗号通貨市場を席巻し、ドゲコインが最初にヒットしました。そのdefitVLは2023レベルに低下し、通貨価格は過去1か月で23.78%下落しました。 DogecoinのDefitVLは、主にSOSO値指数が26.37%減少したため、272万ドルの安値に低下しました。退屈なDAOやThorchainなどの他の主要なDefiプラットフォームも、それぞれ24.04%と20減少しました。

仮想通貨価格の上昇の要因には、次のものが含まれます。1。市場需要の増加、2。供給の減少、3。刺激された肯定的なニュース、4。楽観的な市場感情、5。マクロ経済環境。衰退要因は次のとおりです。1。市場需要の減少、2。供給の増加、3。ネガティブニュースのストライキ、4。悲観的市場感情、5。マクロ経済環境。

暗号通貨の賑やかな世界では、新しい機会が常に現れます。現在、Kerneldao(Kernel)Airdropアクティビティは多くの注目を集め、多くの投資家の注目を集めています。それで、このプロジェクトの起源は何ですか? BNBホルダーはそれからどのような利点を得ることができますか?心配しないでください、以下はあなたのためにそれを一つ一つ明らかにします。

2025年のレバレッジド取引、セキュリティ、ユーザーエクスペリエンスで優れたパフォーマンスを持つプラットフォームは次のとおりです。1。OKX、高周波トレーダーに適しており、最大100倍のレバレッジを提供します。 2。世界中の多通貨トレーダーに適したバイナンス、125倍の高いレバレッジを提供します。 3。Gate.io、プロのデリバティブプレーヤーに適し、100倍のレバレッジを提供します。 4。ビットゲットは、初心者やソーシャルトレーダーに適しており、最大100倍のレバレッジを提供します。 5。Kraken、安定した投資家に適しており、5倍のレバレッジを提供します。 6。Altcoinエクスプローラーに適したBybit。20倍のレバレッジを提供します。 7。低コストのトレーダーに適したKucoinは、10倍のレバレッジを提供します。 8。ビットフィネックス、シニアプレイに適しています

Binanceは、グローバルデジタルアセット取引エコシステムの大君主であり、その特性には次のものが含まれます。1。1日の平均取引量は1,500億ドルを超え、500の取引ペアをサポートし、主流の通貨の98%をカバーしています。 2。イノベーションマトリックスは、デリバティブ市場、Web3レイアウト、教育システムをカバーしています。 3.技術的な利点は、1秒あたり140万のトランザクションのピーク処理量を伴うミリ秒のマッチングエンジンです。 4.コンプライアンスの進捗状況は、15か国のライセンスを保持し、ヨーロッパと米国で準拠した事業体を確立します。

Aavenomicsは、Aaveプロトコルトークンを変更し、Aavedaoの定足数を実装したToken Reposを導入する提案です。 Aave Project Chain(ACI)の創設者であるMarc Zellerは、これをXで発表し、契約の新しい時代をマークしていることに注目しました。 Aave Chain Initiative(ACI)の創設者であるMarc Zellerは、Aavenomicsの提案にAave Protocolトークンの変更とトークンリポジトリの導入が含まれていると発表しました。 Zellerによると、これは契約の新しい時代を告げています。 Aavedaoのメンバーは、水曜日の週に100でした。
