目錄
#動捕大模型的訓練與微調
結果展示
首頁 科技週邊 人工智慧 SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

Oct 30, 2023 pm 04:01 PM
ai 模型

目前,雖然在人體全身姿態與體型估計(EHPS, Expressive Human Pose and Shape estimation)方面已經取得了很大的研究進展,但是最先進的方法仍然受限於訓練資料集的限制

最近,南洋理工大學S-Lab、商湯科技、上海人工智慧實驗室、東京大學和IDEA研究院的研究人員首次提出了針對人體全身姿態與體型估計任務的動捕大模型SMPLer-X。該研究使用了來自不同資料來源的多達450萬個實例對模型進行訓練,在7個關鍵榜單上都取得了最佳性能

SMPLer-X不僅可以捕捉身體動作,還可以輸出臉部和手部動作,並對體型進行估計

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

論文連結:https://arxiv.org/ abs/2309.17448

專案首頁:https://caizhongang.github.io/projects/SMPLer-X/

#憑藉豐富的數據和龐大的模型,SMPLer-X在各種測試和排行榜上展現出強大的性能,甚至在未知環境中也具備出色的通用性

在數據擴展方面,研究人員對32個3D人體資料集進行了全面的評估和分析,以為模型訓練提供參考

2. 在模型縮放方面,使用視覺大模型來研究增加模型參數量對效能的提升效果

3. 透過微調策略可以將SMPLer-X通用大模型轉變為專用大模型,使其能夠實現進一步的效能提升。

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

綜上所述,SMPLer-X進行了資料縮放與模型縮放的探索(見圖1),並在32個學術數據集上進行排名,同時在其450萬個實例上進行訓練,在包括AGORA、UBody、EgoBody和EHF在內的7個關鍵榜單上均實現了最佳性能

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

Figure 1 增大資料量和模型參數量在降低關鍵榜單(AGORA、UBody、EgoBody、3DPW 和EHF)的平均主要誤差(MPE)方面都是有效的

對現有的3D人體資料集進行泛化性研究

研究人員對32個學術資料集進行了排名:為了衡量每個資料集的效能,需要使用該資料集訓練一個模型,並在五個評估資料集上評估模型:AGORA、UBody、EgoBody、3DPW和EHF。

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

表格中也計算了平均主要誤差(Mean Primary Error, MPE),以便於在各個資料集之間進行簡單比較。

從研究資料集泛化性得到的啟示

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

透過大量資料集的分析(見圖3),可以得出以下四個結論:

#1. 關於單一資料集的資料量,10萬個實例數量級的資料集用於模型訓練可以得到較高的性價比;

2. 關於資料集的採集場景,In-the-wild資料集的效果最佳。如果只能在室內採集數據,為了提升訓練效果,需要避免使用單一場景的數據

關於數據集的採集,前三名的數據集中有兩個是生成的數據集。近年來,生成資料集展現了強大的效能

關於資料集的標註,偽標籤在訓練中也扮演了非常重要的角色

#動捕大模型的訓練與微調

現今最先進的方法通常只使用少數幾個資料集(例如,MSCOCO、MPII和Human3.6M)進行訓練,而本文研究了使用更多的資料集

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

在考慮到排名較高的資料集為首選的前提下,我們使用了四種不同的資料量:分別是作為訓練集的5、10、20和32個資料集,總大小分別為75萬、150萬、300萬和450萬個實例

除此之外,研究人員也展示了低成本的微調策略來將通用大模型適應到特定場景。

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

#上表中展示了部分主要測試,如AGORA測試集(表3)、AGORA驗證集(表4)、EHF(表5)、UBody(表6)、EgoBody-EgoSet(表7)。

此外,研究人員也對動捕大模型的泛化性進行了在ARCTIC和DNA-Rendering兩個測試集上的評估

研究人員希望SMPLer-X能帶來超越演算法設計的啟發,並為學術社群提供強大的全身人體動捕大模型。

程式碼和預訓練模型已經在專案首頁開源,歡迎造訪https://caizhongang.github.io/projects/SMPLer-X/ ,了解更多詳情

結果展示

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!

##

以上是SMPLer-X:顛覆七大榜單,呈現首個人體動捕基模型!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1317
25
PHP教程
1268
29
C# 教程
1243
24
如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

怎樣在C  中處理高DPI顯示? 怎樣在C 中處理高DPI顯示? Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

C  中的字符串流如何使用? C 中的字符串流如何使用? Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

MySQL批量插入數據的高效方法 MySQL批量插入數據的高效方法 Apr 29, 2025 pm 04:18 PM

MySQL批量插入数据的高效方法包括:1.使用INSERTINTO...VALUES语法,2.利用LOADDATAINFILE命令,3.使用事务处理,4.调整批量大小,5.禁用索引,6.使用INSERTIGNORE或INSERT...ONDUPLICATEKEYUPDATE,这些方法能显著提升数据库操作效率。

See all articles