目錄
效果展示
模型組成
SAM-Track模型架構
首頁 科技週邊 人工智慧 視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

May 23, 2023 pm 02:07 PM
影片 分裂

近期,浙江大學ReLER實驗室將SAM與分割視訊進行深度結合,發布Segment-and-Track Anything (SAM-Track)。

SAM-Track賦予了SAM對視訊目標的追蹤能力,並支援多種方式(點、畫筆、文字)進行互動。

在此基礎上,SAM-Track統一了多個傳統視訊分割任務,達成了一鍵分割追蹤任意視訊中的任意目標,將傳統視訊分割外推至通用視訊分割。

SAM-Track具有卓越的效能,在複雜場景下僅需單卡就能高品質地穩定追蹤數百個目標。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

計畫網址:https://github.com/z-x-yang/Segment-and-Track -Anything

論文網址:https://arxiv.org/abs/2305.06558

效果展示

SAM-Track支援語言輸入作為Prompt。例如,給定類別文字「熊貓」,便可一鍵實例級分割追蹤所有屬於「熊貓」這一類別的目標。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

也可進一步給出更詳細的描述,例如輸入文字「最左邊的熊貓」,SAM-Track可定位至特定目標進行分割追蹤。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

相較於傳統視訊追蹤演算法,SAM-Track的另一個強大之處在於可對大量目標同時進行追蹤分割,並自動偵測新出現的物體。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

SAM-Track也支援多種互動方式組合使用,使用者可依實際需求搭配。例如使用畫筆框定與人體緊密連接的滑板,防止分割多餘物體,而後使用點擊選擇人體。

全自動視訊目標分割與追蹤自然也不在話下,各種應用場景包括街景、空拍、AR、動畫、醫學影像等,均可一鍵分割追蹤並自動偵測新出現的物體。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

如果對自動分割結果不滿意,使用者可在此基礎上進行編輯修正,例如使用點擊來修正過分割的電車。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

同時最新版本的SAM-Track支援將追蹤結果線上瀏覽,可選擇中間任一幀的分割結果進行修改和新增目標,並再次追蹤。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

為了方便使用者線上體驗,專案提供了WebUI,可透過Colab一鍵部署:

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

模型組成

SAM-Track模型是基於ECCV'22 VOT Workshop四個賽道的冠軍方案DeAOT。

DeAOT是一個高效能的多目標VOS模型,在給定首幀物件標註的情況下,可以追蹤視訊其餘影格中的物件分割。

DeAOT採用一種識別機制,將一個影片中的多個目標嵌入到同一高維空間中,從而實現了同時對多個物體進行追蹤。

DeAOT在多物體追蹤方面的速度表現能夠與其他針對單一物體追蹤的VOS方法相媲美。

此外,透過基於分層的Transformer的傳播機制,DeAOT更好地聚合了長時序和短時序訊息,表現出了優異的追蹤效能。

由於DeAOT需要參考影格的標註來初始化,為了提高便捷性,SAM-Track使用了最近在影像分割領域大放異彩的Segment Anything Model(SAM)模型來獲取標註資訊。

利用SAM優異的零樣本遷移能力,以及多種互動方式,SAM-Track能有效率地為DeAOT取得高品質的參考影格標註資訊。

雖然SAM模型在影像分割領域表現出色,但它無法輸出語意標籤,且文字提示也無法很好地支援Referring Object Segmentation及其他依賴深層語意理解的任務。

因此,SAM-Track模型進一步整合了Grounding-DINO,實現了高精度的語言引導的視訊分割。 Grounding DINO是一個開放集合目標偵測模型,具有良好的語言理解能力。

根據輸入的類別或目標物件的詳細描述,Grounding-DINO可以偵測到目標並傳回位置方塊。

SAM-Track模型架構

如下圖所示,SAM-Track模型支援了三種物件追蹤模式,分別為互動追蹤模式、自動追蹤模式以及融合模式。

視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達

對於互動追蹤模式,SAM-Track模型首先會套用SAM,在參考影格中利用點擊或畫框的方式選取目標,直到得到使用者滿意的交互分割結果。

如果想要實現語言引導的視訊物件分割,SAM-Track則會呼叫Grounding-DINO根據輸入的文本,先得到目標物件的位置框,並在此基礎上透過SAM得到感興趣物體的分割結果。

最後DeAOT將交互分割結果作為參考幀,並對選取的目標進行追蹤。在追蹤的過程中,DeAOT會將過去幀中的視覺嵌入和高維ID嵌入分層傳播到當前幀中,實現逐幀追蹤分割多個目標物件。因此,SAM-Track能過支援多模態的互動方式來追蹤分割影片中的興趣物體。

然而,互動追蹤模式無法處理影片中出現的新出現的物件。限制了SAM-Track在特定領域的應用,例如,自動駕駛,智慧城市等。

為了進一步拓展SAM-Track的應用範圍和效能,SAM-Track實現了自動追蹤模式,對影片中出現的新物件進行追蹤。

自動追蹤模式透過Segment Everything和Object of Interest Segmentation兩種方式來獲得每n幀中新出現的物體的註解。對於新出現的物體的ID分配問題,SAM-Track採用了比較遮罩模組(CMR)來決定新的物件的ID。

融合模式則是把互動追蹤模式和自動追蹤模式結合在一起。透過互動式追蹤模式使用者可以很方便地取得影片中第一幀的註釋,而自動追蹤模式則可以處理影片後續影格中出現的未被選取的新物件。追蹤方法的組合擴大了SAM-Track的應用範圍,增加了SAM-Track的實用性。

以上是視訊分割大結局!浙大最新發布SAM-Track:通用智慧視訊分割一鍵直達的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

視訊檔案儲存在瀏覽器快取中的位置在哪裡? 視訊檔案儲存在瀏覽器快取中的位置在哪裡? Feb 19, 2024 pm 05:09 PM

瀏覽器快取影片在哪個資料夾在日常使用網路瀏覽器時,我們經常會觀看各種線上視頻,例如在YouTube上看音樂影片或在Netflix上觀看電影等。而這些影片在載入過程中會被瀏覽器快取下來,以便日後再次播放時能夠快速載入。那麼問題來了,這些快取的影片實際上儲存在哪個資料夾中呢?不同瀏覽器的快取視訊資料夾保存位置是不同的。以下我們將分別介紹幾種常見的瀏覽器以及它們

抖音發布他人影片侵權嗎?它怎麼剪輯影片不算侵權? 抖音發布他人影片侵權嗎?它怎麼剪輯影片不算侵權? Mar 21, 2024 pm 05:57 PM

隨著短影片平台的興起,抖音成為了大家日常生活中不可或缺的一部分。在抖音上,我們可以看到來自世界各地的有趣影片。有些人喜歡發布他人的視頻,這就引發了一個問題:抖音發布他人視頻侵權嗎?本文將圍繞這個問題展開討論,告訴大家怎樣剪輯影片不算侵權,以及如何避免侵權問題。一、抖音發布他人影片侵權嗎?根據我國《著作權法》的規定,未經著作權人許可,擅自使用其作品,屬於侵權行為。因此,在抖音上發布他人視頻,如果未經原作者或著作權人許可,就屬於侵權行為。二、怎樣剪輯影片不算侵權? 1.使用公共領域或授權的內容:公共

Wink如何去影片浮水印 Wink如何去影片浮水印 Feb 23, 2024 pm 07:22 PM

Wink如何去視訊浮水印?winkAPP中是有去除掉視訊浮水印的工具,但是多數的小伙伴不知道wink中如何去除掉視頻中的水印,接下來就是小編為玩家帶來的Wink視頻去水印方法圖文教程,有興趣的用戶快來一起看看吧! Wink如何去視訊浮水印1、先開啟winkAPP,在首頁面專區中選擇【去浮水印】功能;2、然後在相簿中選擇你需要去除水印的影片;3、接著選擇影片之後,剪輯影片之後點擊右上角【√】;4、最後點選如下圖的【一鍵去印】之後點選【處理】即可。

抖音發布影片如何賺收益?新手小白怎麼在抖音上賺錢啊? 抖音發布影片如何賺收益?新手小白怎麼在抖音上賺錢啊? Mar 21, 2024 pm 08:17 PM

抖音,這個全民短視頻平台,不僅讓我們在閒暇時間享受到各種有趣、新奇的短視頻,同時也給了我們一個展示自我、實現價值的舞台。那麼,如何在抖音發布影片中賺取收益呢?本文將詳細解答這個問題,幫助你在抖音上賺取更多的收益。一、抖音發布影片如何賺收益?發布影片在抖音上獲得一定的播放量後,可以有機會參與廣告分成計畫。這項收益方式是抖音用戶最熟悉的之一,也是許多創作者主要的收入來源。抖音根據帳號權重、影片內容以及觀眾回饋等多種因素來決定是否提供廣告分成的機會。抖音平台允許觀眾透過發送禮物來支持自己喜歡的創作者,

MobileSAM:為行動裝置提供高效能的輕量級影像分割模型 MobileSAM:為行動裝置提供高效能的輕量級影像分割模型 Jan 05, 2024 pm 02:50 PM

一、引言隨著行動裝置的普及和運算能力的提升,影像分割技術成為了研究的熱點。 MobileSAM(MobileSegmentAnythingModel)是一種針對行動裝置最佳化的影像分割模型,旨在保持高品質分割結果的同時,降低計算複雜度和記憶體佔用,以便在資源有限的行動裝置上高效運行。本文將詳細介紹MobileSAM的原理、優點和應用場景。二、MobileSAM模式的設計想法MobileSAM模式的設計想法主要包括以下幾個面向:輕量級模式:為了適應行動裝置的資源限制,MobileSAM模式採用了輕量級

從 iPhone 上的影片中刪除慢動作的 2 種方法 從 iPhone 上的影片中刪除慢動作的 2 種方法 Mar 04, 2024 am 10:46 AM

在iOS設備上,「相機」應用程式可讓您拍攝慢動作視頻,如果您使用的是最新的iPhone,甚至可以以每秒240幀的速度錄製視頻。此功能讓您能夠捕捉到豐富細節的高速動作。但有時候,您可能希望將慢動作影片以正常速度播放,這樣可以更好地欣賞影片中的細節和動作。在這篇文章中,我們將解釋從iPhone上的現有影片中刪除慢動作的所有方法。如何從iPhone上的影片中刪除慢動作[2種方法]您可以使用「照片」App或iMovie剪輯App從裝置上的影片中刪除慢動作。方法1:使用「照片」應用程式在iPhone上開啟

如何發布小紅書影片作品?發影片要注意什麼? 如何發布小紅書影片作品?發影片要注意什麼? Mar 23, 2024 pm 08:50 PM

隨著短影片平台的興起,小紅書成為了許多人分享生活、表達自我、獲取流量的平台。在這個平台上,發布影片作品是一種非常受歡迎的互動方式。那麼,如何發布小紅書影片作品呢?一、如何發布小紅書影片作品?首先,確保準備好一段適合分享的影片內容。你可以利用手機或其他攝影設備拍攝,需要注意畫質和聲音的清晰度。 2.剪輯影片:為了讓作品更具吸引力,可以剪輯影片。可使用專業的影片剪輯軟體,如抖音、快手等,加入濾鏡、音樂、字幕等元素。 3.選擇封面:封面是吸引用戶點擊的關鍵,選擇一張清晰、有趣的圖片作為封面,讓

微博發影片怎麼不壓縮畫質_微博發影片不壓縮畫質方法 微博發影片怎麼不壓縮畫質_微博發影片不壓縮畫質方法 Mar 30, 2024 pm 12:26 PM

1.先打開手機微博,點選右下角【我】(如圖所示)。 2、接著點選右上角【齒輪】打開設定(如圖所示)。 3.然後找到並開啟【通用設定】(如圖所示)。 4.隨後進入【影片隨著】選項(如圖所示)。 5.再開啟【影片上傳清晰度】設定(如圖)。 6.最後選擇【原畫質】就能不壓縮了(如圖)。

See all articles