觸覺從未如此真實!兩位南加州大學華人博士革新「觸覺感知」演算法
電子科技的發展,讓我們隨時隨地享受一場「視聽盛宴」,人類的聽覺和視覺從此徹底解放。
近幾年,為裝置裝上「觸覺」逐漸成了新的研究熱點,尤其是在「元宇宙」概念的加持下,加上觸感無疑能讓虛擬世界的真實感大大提升。
當下觸覺感知技術主要是透過「資料驅動」的模式來模擬和渲染觸感,模型首先記錄使用者與真實紋理互動的訊號,然後將訊號輸入到紋理生成部分,並用振動的方式將觸感「回放」給使用者。
最近一些方法大多基於使用者互動運動和高頻振動訊號來對紋理的特徵進行建模,例如摩擦和微觀表面特徵。
雖然說資料驅動極大提升了類比的真實感,但仍存在諸多限制。
例如世界上的紋理可以說是有「無數種」,如果每種紋理都記錄一遍,所需的人力、物力都不可想像,也無法滿足一些小眾用戶的需求。
人類對於觸覺的感知相當敏感,不同的人對於相同物體的感覺也不同,數據驅動的方式無法從根本上消除從紋理記錄到紋理渲染的感知不符問題。
最近,南加州大學維特比工程學院的三個博士生提出了一個全新的「偏好驅動」模型框架,利用人類分辨紋理細節的能力對生成的虛擬感知進行調整,最終可以達到相當逼真的觸覺感知,論文發表在IEEE Transactions on Haptics.
##論文鏈接:https://ieeexplore.ieee.org/document/9772285
偏好驅動的模型首先會給使用者一個真實的觸控紋理,然後模型會使用數十個變數隨機產生三個虛擬紋理,然後使用者可以從中選擇摸起來與真實物體最相似的一個紋理。
隨著不斷地試錯和回饋,模型會透過搜尋不斷優化變數的分佈,使得生成的紋理更接近使用者的偏好。這種方法比直接記錄、回放紋理具有明顯優勢,因為電腦讀取的內容和人類的真實感受之間總是存在差距。
這個流程其實跟「甲方乙方」差不多,我們身為感知者(甲方),如果覺得觸摸感不對勁,就打回去,讓演算法(乙方)修改重新生成,直到生成的效果滿意為止。
這樣做其實很合理,因為不同的人摸相同的物體都會有不同的感覺,但電腦釋放的訊號是相同的,所以根據每個人進行觸感定制,很有必要!
整個系統由兩個模組組成,首先是一個深度卷積生成對抗網路(DCGAN),用於將潛空間的向量映射到紋理模型,在UPenn Haptic Texture Toolkit (HaTT)上進行訓練。
#
第二個模組是一個基於比較的演化演算法:在一組產生的紋理模型中,協方差矩陣適應演化策略(CMA-ES)會根據使用者的偏好回饋創建一個新的紋理模型以進化。
為了模擬真實紋理,研究人員首先會要求使用者使用自訂工具來觸摸真實紋理,然後使用觸覺裝置觸摸一組虛擬紋理候選,其中觸覺回饋透過連接到裝置觸控筆的Haptuator來傳輸。
使用者唯一需要做的就是選擇最接近真實紋理的虛擬紋理,並使用簡單的滑桿介面來調整摩擦量(amount of friction),因為摩擦對於紋理觸感至關重要,也可能因人而異。
然後所有的虛擬紋理將根據使用者的選擇按照演化策略進行更新,然後使用者再次進行選擇和調整。
重複上述過程,直到使用者找到他們認為的接近真實紋理的虛擬紋理並保存,或找不到更接近的虛擬紋理為止。
研究者將評估過程分為兩個階段,每個階段分別有一組參與者。
在第一階段,五位參與者分別為5個真實紋理產生和搜尋虛擬紋理。
第二階段則是評估最終保存的偏好驅動紋理(VTp)及其對應的真實紋理(RT)之間的差距。
評估的方式主要採用形容詞評估(adjective rating)的方式,對包括粗糙度、硬度和光滑度等感知維度進行評估。
並且在VTp、RT和資料驅動的紋理(VTd)之間的相似性進行比較。
實驗結果也顯示遵循演化的過程,使用者能夠有效地找到一個虛擬紋理模型,真實程度超過資料驅動模型。
此外,超過80%的參與者認為偏好驅動模型產生的虛擬紋理評分優於資料驅動模型。
觸覺設備在電玩遊戲、時裝設計和手術模擬中越來越受歡迎,即使在家裡,我們也開始看到用戶使用與筆記型電腦一樣流行的那些觸覺設備。
例如第一人稱電玩加入觸覺以後,會大大提升玩家的真實感。
論文作者表示,當我們透過工具與環境互動時,觸覺回饋只是一種形式,一種感官回饋,音訊是另一種感官回饋,兩者都非常重要。
除了遊戲外,這項工作成果對於用於牙科或手術訓練的虛擬紋理尤其有用,這些虛擬紋理需要非常準確。
「外科訓練絕對是一個巨大的領域,需要非常逼真的紋理和觸覺回饋;裝潢設計還需要在開發過程中對質地進行高度精確地模擬,然後再進行製造。」
#從電子遊戲到時裝設計,一切都在整合觸覺技術,而現有的虛擬紋理資料庫可以透過這種使用者偏好方法來改進。
紋理搜尋模型還可以讓使用者從資料庫中提取虛擬紋理,例如賓州大學的觸覺紋理工具包,可以對其進行改進,直到獲得他們想要的結果。
這項技術與紋理搜尋模型一結合,那你就可以使用之前別人已經記錄完成的虛擬紋理,然後根據策略來優化紋理。
作者暢想,在未來,模型甚至可能不需要真實的紋理。
我們生活中的一些常見事物的感覺是非常直觀的,我們天生就可以透過查看照片來微調自己的感官,而無需參考真實的紋理。
例如當我們看到一張桌子時,我們可以想像一旦觸摸到這張桌子會有什麼感覺,利用我們對錶面的這種先驗知識,就可以向使用者提供視覺回饋,並允許他們選擇匹配的內容。
文章的第一作者Shihan Lu目前是南加州大學電腦科學學院的博士研究生,之前在沉浸式技術方面做過聲音方面的相關工作,即透過在工具與其互動時引入匹配的聲音,使虛擬紋理更加身臨其境。
文章的的第二作者Mianlun Zheng(鄭棉崙)是南加州大學電腦科學學院的博士研究生,大學部和碩士畢業於武漢大學。
以上是觸覺從未如此真實!兩位南加州大學華人博士革新「觸覺感知」演算法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

寫在前面&筆者的個人理解目前,在整個自動駕駛系統當中,感知模組扮演了其中至關重要的角色,行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結果後,才能讓自動駕駛系統中的下游規控模組做出及時、正確的判斷和行為決策。目前,具備自動駕駛功能的汽車中通常會配備包括環視相機感測器、光達感測器以及毫米波雷達感測器在內的多種數據資訊感測器來收集不同模態的信息,用於實現準確的感知任務。基於純視覺的BEV感知演算法因其較低的硬體成本和易於部署的特點,以及其輸出結果能便捷地應用於各種下游任務,因此受到工業

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

C++sort函數底層採用歸併排序,其複雜度為O(nlogn),並提供不同的排序演算法選擇,包括快速排序、堆排序和穩定排序。

人工智慧(AI)與執法領域的融合為犯罪預防和偵查開啟了新的可能性。人工智慧的預測能力被廣泛應用於CrimeGPT(犯罪預測技術)等系統,用於預測犯罪活動。本文探討了人工智慧在犯罪預測領域的潛力、目前的應用情況、所面臨的挑戰以及相關技術可能帶來的道德影響。人工智慧和犯罪預測:基礎知識CrimeGPT利用機器學習演算法來分析大量資料集,識別可以預測犯罪可能發生的地點和時間的模式。這些資料集包括歷史犯罪統計資料、人口統計資料、經濟指標、天氣模式等。透過識別人類分析師可能忽視的趨勢,人工智慧可以為執法機構

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

一、多模態大模型的歷史發展上圖這張照片是1956年在美國達特茅斯學院舉行的第一屆人工智慧workshop,這次會議也被認為拉開了人工智慧的序幕,與會者主要是符號邏輯學屆的前驅(除了前排中間的神經生物學家PeterMilner)。然而這套符號邏輯學理論在隨後的很長一段時間內都無法實現,甚至到80年代90年代還迎來了第一次AI寒冬期。直到最近大語言模型的落地,我們才發現真正承載這個邏輯思維的是神經網絡,神經生物學家PeterMilner的工作激發了後來人工神經網絡的發展,也正因為此他被邀請參加了這個

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

寫在前面&筆者的個人理解在自動駕駛系統當中,感知任務是整個自駕系統中至關重要的組成部分。感知任務的主要目標是使自動駕駛車輛能夠理解和感知周圍的環境元素,如行駛在路上的車輛、路旁的行人、行駛過程中遇到的障礙物、路上的交通標誌等,從而幫助下游模組做出正確合理的決策和行為。在一輛具備自動駕駛功能的車輛中,通常會配備不同類型的信息採集感測器,如環視相機感測器、雷射雷達感測器以及毫米波雷達感測器等等,從而確保自動駕駛車輛能夠準確感知和理解周圍環境要素,使自動駕駛車輛在自主行駛的過程中能夠做出正確的決斷。目
