清華接手,YOLOv10問世:效能大幅提升,登上GitHub熱門榜
目標偵測系統的標竿 YOLO 系列,再次獲得了重磅升級。
自今年 2 月 YOLOv9 發布之後, YOLO(You Only Look Once)系列的接力棒傳到了清華大學研究人員的手上。
上週末,YOLOv10推出的消息引發了AI界的關注。它被認為是電腦視覺領域的突破性框架,以其即時的端到端目標檢測能力而聞名,透過提供結合效率和準確性的強大解決方案,延續了YOLO系列的傳統。
論文網址:https://arxiv.org/pdf/2405.14458
計畫網址: https://github.com/THU-MIG/yolov10
新版本發布之後,很多人已經進行了部署測試,效果不錯:
#YOLO 因為效能強大、消耗算力較少,一直以來都是即時目標偵測領域的主要範式。該框架被廣泛用於各種實際應用,包括自動駕駛、監控和物流。其高效、準確的物體檢測能力使其成為即時識別行人和車輛等任務的理想選擇;在物流方面,它有助於庫存管理和包裹跟踪,透過 AI 能力幫助人們在許多工作上提高了效率。
幾年來,研究人員對 YOLO 的架構設計、最佳化目標、資料增強策略等進行了探索,取得了顯著進展。然而,後處理對非極大值抑制(NMS)的依賴阻礙了 YOLO 的端對端部署,並對推理延遲產生不利影響。此外,YOLO 中各個組件的設計缺乏全面徹底的檢查,導致明顯的計算冗餘並限制了模型的能力。
YOLOv10 的突破就在於從後處理和模型架構方面進一步提升了 YOLO 的效能 - 效率邊界。
為此,研究團隊首次提出了YOLO 無NMS 訓練的一致雙重分配(consistent dual assignment),這使得YOLO 在性能和推理延遲方面有所改進。
研究團隊為YOLO 提出了整體效率- 準確率驅動的模型設計策略,從效率和準確率兩個角度全面優化YOLO 的各個組件,大大降低了計算開銷並增強了模型能力。
大量實驗表明,YOLOv10 在各種模型規模上都實現了 SOTA 性能和效率。例如,YOLOv10-S 在 COCO 上的類似 AP 下比 RT-DETR-R18 快 1.8 倍,同時參數數量和 FLOP 大幅減少。與 YOLOv9-C 相比,在效能相同的情況下,YOLOv10-B 的延遲減少了 46%,參數減少了 25%。
方法介紹
#為了實現整體效率- 準確率驅動的模型設計,研究團隊從效率、準確率兩方面分別提出改進方法。
為了提高效率,研究提出了輕量級分類head、空間通道(spatial-channel)解耦下採樣和排序指導的區塊設計,以減少明顯的計算冗餘餘並實現更有效率的架構。
為了提高準確率,研究團隊探索了大核卷積並提出了有效的部分自註意力(partial self-attention,PSA)模組來增強模型能力,在低成本下挖掘性能改進的潛力。基於這些方法,團隊成功實現了一系列不同規模的即時端對端偵測器,即 YOLOv10-N / S / M / B / L / X。
用於無NMS 訓練的一致雙重分配
#在訓練期間,YOLO 通常利用TAL 為每個實例分配多個正樣本。一對多的分配方式產生了豐富的監督訊號,促進了最佳化並使模型實現了卓越的性能。
然而,這需要 YOLO 依賴 NMS 後處理,這導致了部署時次優的推理效率。雖然先前的研究工作探索了一對一匹配來抑制冗餘預測,但它們通常引入了額外的推理開銷。
與一對多分配不同,一對一配對對每個 ground truth 僅分配一個預測,避免 NMS 後處理。然而,這會導致弱監督,以至於準確率和收斂速度不理想。幸運的是,這種缺陷可以透過一對多分配來彌補。
本研究提出的「雙標籤分配」結合了上述兩種策略的優點。如下圖所示,該研究為 YOLO 引入了另一個一對一 head。它保留了與原始一對多分支相同的結構並採用相同的最佳化目標,但利用一對一匹配來獲取標籤分配。在訓練過程中,兩個 head 聯合優化,以提供豐富的監督;在推理過程中,YOLOv10 會丟棄一對多 head 並利用一對一 head 做出預測。這使得 YOLO 能夠進行端對端部署,而不會產生任何額外的推理成本。
整體效率- 準確率驅動的模式設計
除了後處理之外,YOLO 的模型架構也對效率- 準確率權衡提出了巨大挑戰。儘管先前的研究工作探索了各種設計策略,但仍缺乏對 YOLO 中各種組件的全面檢查。因此,模型架構表現出不可忽視的運算冗餘和能力受限。
YOLO 中的元件包括 stem、下採樣層、帶有基本構建塊的階段和 head。作者主要對以下三個部分執行效率驅動的模型設計。
- 輕量級分類head
- #空間通道解耦下取樣
- 排序指導的模組設計
為了實現準確率驅動的模型設計,研究團隊進一步探索了大核卷積和自註意力機制,旨在以最小的成本提升模型性能。
實驗
如表1 所示,清華團隊所發展的YOLOv10 在各種模型規模上實現了SOTA 的效能和端對端延遲。
該研究也針對YOLOv10-S 和YOLOv10-M 進行了消融實驗,實驗結果如下表所示:
#如下表所示,雙標籤分配實現了最佳的AP - 延遲權衡,採用一致匹配度量可以達到最優性能。
如下表所示,每個設計元件,包括輕量級分類head、空間通道解耦下採樣和排序指導的模組設計,都有助於減少參數數量、FLOPs 和延遲。重要的是,這些改進是在保持卓越性能的同時所實現的。
#針對準確度驅動的模型設計的分析。研究人員展示了基於 YOLOv10-S/M 逐步整合準確性驅動設計元素的結果。
如表 10 所示,采用大核卷积和 PSA 模块分别在延迟最小增加 0.03ms 和 0.15ms 的情况下,使 YOLOv10-S 的性能有了 0.4% AP 和 1.4% AP 的显著提升。
以上是清華接手,YOLOv10問世:效能大幅提升,登上GitHub熱門榜的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

目錄如何選擇加密貨幣進行短期交易?短期交易最佳加密貨幣列表比特幣雪崩索拉納狗狗幣多邊形世界幣Chainlink新興企業如何選擇加密貨幣進行短期交易?短期交易是指購買加密貨幣並持有一段時間,從幾分鐘到幾天不等。這種方法前景光明,但也存在風險,耗時較長,因為你需要持續關注市場行情。但這還不是全部;在選擇合適的加密貨幣資產時,你還應該注意以下幾點:波動性:短期交易成功的主要指標之一是高揮發性加密貨幣的價值;價值越高,價格波動越大,從而創造更

介紹去中心化金融(DeFi)正在改變用戶與區塊鏈技術的交互方式,為交易、借貸和收益創造創造無縫靈活的途徑。 Solayer(LAYER)正是這一變革的核心,它構建了一個跨多條區塊鏈連接流動性和實用性的協議。隨著DeFi的普及以及對高效跨鏈基礎設施需求的增長,Solayer正吸引著交易員、開發者和投資者的關注,他們正在尋找下一個重大機遇。本文將解釋Solayer的概念,詳細介紹其創新功能和代幣經濟學,並展望其2030年

區塊鏈技術持續改變著人們在線上交換價值、驗證信息和建立信任的方式。隨著去中心化應用在各行各業的蓬勃發展,跨多個區塊鏈確認聲明和身份的能力變得越來越重要,也越來越複雜。傳統的、依賴於中心化權威的信任模型往往不足以支撐去中心化的生態系統,因此對區塊鏈原生驗證解決方案的需求也日益增長。 SignProtocol(SIGN)通過提供一個用於跨多個區塊鍊網絡創建、驗證和管理證明的框架來應對這一挑戰。 SignProtocol旨在打造一個全鏈

Solana鏈上兩大Meme幣——MooDeng(MOODENG)、GoatseusMaximus(GOAT)昨(11)日登陸幣安「Alpha」平台後迅速翻紅,重燃投資人熱情,其中MOODENG幣價單日狂飆逾123%,一舉刷新今年以來新高。幣安Alpha主要聚焦於早期潛力幣種,通常會上架社群熱度高、有成長潛力的幣種,如今正式上線MOODENG、GOAT,不僅為這兩款Meme幣注入資金活水,更讓Solana生態再

加密貨幣市場項目隨著區塊鏈發展而不斷湧現,目的就是改變傳統金融實踐,SwissCheese就是其中一個項目。據了解,SwissCheese是一個讓用戶能夠交易通證化股票的去中心化平台,旨在增強市場的可及性並降低交易成本,為更具包容性的金融環境鋪平道路。平台的原生代幣為SWCH,主要作用就是交易、治理等。該項目上線後立即引起了投資者的關注,但僅僅了解SWCH是什麼幣種?還不能分析出SWCH值得投資嗎?結合當前數據來看,SWCH具有一定的

目錄ALPACA幣最新新聞和價格動態AlpacaFinance(ALPACA)是什麼? AlpacaFinance是如何運作的? ALPACA幣是什麼? ALPACA代幣經濟學ALPACA價格走勢分析2025年ALPACA價格預測AlpacaFinance(ALPACA)未來展望ALPACA幣怎麼買?總結AlpacaFinance(ALPACA)是幣安智能鏈上的借貸協議,具有槓桿收益農業的特徵。自幣安宣布將於5月2日下架AL

TrendResearch自2025年4月24日研報全網發出至今,ETH自1800美元漲至2400美元附近,一個月內漲幅約30%,研報撰寫前的預判更是在1450美金開始,作為千億規模的資產標的,是大資金短期實現高回報的難得機會。彼時堅定看多的主要原因包括:ETH依然擁有穩健的金融數據,是加密重要基礎設施的地位沒有改變;短期高點巨大的調整幅度(4個月跌幅超60%);衍生品市場空頭規模龐大,底部現貨放量後攀升至重要支阻互換區域,傳統金融的

AltCoin季節指數在90天內衡量了對比特幣的頂級山寨幣的表現情況。 CryptoRover在X上分享了兩個不同的圖表,揭示了一些引人注目的趨勢轉變。第一個圖表是近期熱議的焦點-Altcoin季節。它展示了Altcoin季節指數,該指數衡量了90天內頂級山寨幣相對於比特幣的表現。這項具體數據來自blockchaincenter.net,測量了前50個表現最佳的山寨幣,不包括任何穩定幣或資產支持的代幣。關於AltCoin季節指數,如果在過去的90天內,前50個Altcoin的表現超過比特幣,則會進
