ICLR 2024 Spotlight | 負標籤挖掘輔助基於CLIP的分佈外偵測任務
在機器學習模式日益應用於開放世界場景中,如何有效識別和處理分佈外(Out-of-Distribution,OOD)資料成為一個重要研究領域。分佈外資料的存在可能導致模型過度自信和錯誤預測,這在安全關鍵應用(如自動駕駛和醫療診斷)中尤其危險。因此,發展一種有效的OOD檢測機制,對於提高模型在實際應用中的安全性和可靠性至關重要。
傳統的OOD偵測方法主要集中在單一模式,特別是影像資料上,而忽略了其它潛在有用的資訊來源,例如文字資料。隨著視覺-語言模型(VLMs)的興起,它們在多模式學習場景中展示了強大的性能,特別是在處理需要同時理解圖像和相關文字描述的任務中表現出色。現有的基於VLMs的OOD檢測方法[3,4,5]僅使用了ID標籤的語意訊息,忽略了VLMs模型強大的零樣本能力,以及VLMs可解釋非常廣闊的語意空間。基於此,我們認為VLMs在OOD檢測中有巨大的未開發潛力,尤其是它們可以綜合利用圖像和文字資訊來改善檢測效果。
這篇文章圍繞著三個問題:
1.非ID標籤的資訊是否對零樣本OOD偵測有幫助?
2.如何挖掘出對零樣本OOD偵測有利的資訊?
3.如何利用挖掘出的資訊進行零樣本OOD偵測?
在這個專案中,我們提出了一種名為NegLabel的創新方法,該方法利用VLMs進行OOD檢測。 NegLabel方法特別引入了「負標籤」機制,這些負標籤與已知ID類別標籤具有顯著的語義差異,透過分析比較影像和ID標籤和負標籤的親和力和性質,NegLabel能夠有效地區分屬於分佈外的樣本,從而顯著增強模型對OOD樣本的辨識能力。
在多個零樣本OOD偵測基準測試中,NegLabel取得了優越的效能表現。在大規模資料集如ImageNet-1k上能夠達到94.21%的AUROC和25.40%的FPR95。相較於基於VLMs的OOD偵測方法,NegLabel不僅不需要額外的訓練過程,而且展現出更優越的表現。此外,NegLabel在不同的VLM架構上都展現了優異的通用性和穩健性。
Ø論文連結:https://arxiv.org/pdf/2403.20078.pdf
Ø程式碼連結:https://github.com/ tmlr-group/NegLabel
接下來將簡單地向大家分享我們近期發表在ICLR 2024 上的分佈外偵測方向的研究結果。
預備知識
方法介紹
NegLabel的核心就是引入了「負標籤」機制,這些負標籤與已知ID類別標籤有顯著的語意差異,透過分析比較影像與ID標籤和負標籤的親和力,NegLabel能夠有效地區分出屬於分佈外的樣本,從而顯著增強模型對OOD樣本的辨識能力。
圖1. NegLabel的總覽圖
#1. 如何選取負標籤?
2. 如何利用負標籤來進行OOD偵測?
3.如何理解負樣本可以促進零樣本OOD偵測?
實驗結果
我們的研究工作提供了多維度的實驗結果以理解我們提出的方法性能及底層機制。
如下表所示,與諸多性能優良的基準方法和先進方法相比,本文提出的方法可以大規模資料集(如ImageNet)上在其基礎上達到更優的分佈外檢測效果。
此外,如下表所示,本文的方法在ID資料發生域遷移時有著更好的穩健性。
在下列兩個表格中,我們對NegLabel的各個模組還有VLMs的結構進行了消融實驗。左表可以看出,NegMining演算法和Grouping策略都可以有效提升OOD偵測的效能。右表展示了我們提出的NegLabel演算法在不同結構的VLMs有著良好的適應性。
我們也對不同輸入影像對於ID標籤和負標籤的親和力進行了視覺化分析,更多詳細的實驗和結果請參考原文。
#參考文獻
[1] Hendrycks, D. and Gimpel, K. A baseline for detecting misclassified and out-of-distribution examples in neural networks. In ICLR, 2017.
[2] Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal,Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, et al. Learning transferable visual models from natural language supervision. In ICML, 2021.
[3] Sepideh Esmaeilpour, Bing Liu, Eric Robertson, and Lei Shu. Zero-shot out-of -distribution detection based on the pre-trained model clip. In AAAI, 2022.
[4] Yifei Ming, Ziyang Cai, Jiuxiang Gu, Yiyou Sun, Wei Li, and Yixuan Li. Delving into out-ofdisdbution detection with vision-language representations. In NeurIPS, 2022a.
[5] Hualiang Wang, Yi Li, Huifeng Yao, and Xiaomeng Li. Clipn for zero-shot ood detection: Teaching clip to iaomeng Li. Clipn for zero-shot ood detection: Teaching clip to say no.CV, 2023.
[6] Christiane Fellbaum. WordNet: An Electronic Lexical Database. Bradford Books, 1998.
#以上是ICLR 2024 Spotlight | 負標籤挖掘輔助基於CLIP的分佈外偵測任務的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

要通過 Git 下載項目到本地,請按以下步驟操作:安裝 Git。導航到項目目錄。使用以下命令克隆遠程存儲庫:git clone https://github.com/username/repository-name.git

更新 git 代碼的步驟:檢出代碼:git clone https://github.com/username/repo.git獲取最新更改:git fetch合併更改:git merge origin/master推送更改(可選):git push origin master

解決 Git 下載速度慢時可採取以下步驟:檢查網絡連接,嘗試切換連接方式。優化 Git 配置:增加 POST 緩衝區大小(git config --global http.postBuffer 524288000)、降低低速限制(git config --global http.lowSpeedLimit 1000)。使用 Git 代理(如 git-proxy 或 git-lfs-proxy)。嘗試使用不同的 Git 客戶端(如 Sourcetree 或 Github Desktop)。檢查防火

要刪除 Git 倉庫,請執行以下步驟:確認要刪除的倉庫。本地刪除倉庫:使用 rm -rf 命令刪除其文件夾。遠程刪除倉庫:導航到倉庫設置,找到“刪除倉庫”選項,確認操作。

Git 代碼合併過程:拉取最新更改以避免衝突。切換到要合併的分支。發起合併,指定要合併的分支。解決合併衝突(如有)。暫存和提交合併,提供提交消息。

在開發一個電商網站時,我遇到了一個棘手的問題:如何在大量商品數據中實現高效的搜索功能?傳統的數據庫搜索效率低下,用戶體驗不佳。經過一番研究,我發現了Typesense這個搜索引擎,並通過其官方PHP客戶端typesense/typesense-php解決了這個問題,大大提升了搜索性能。

Git Commit 是一種命令,將文件變更記錄到 Git 存儲庫中,以保存項目當前狀態的快照。使用方法如下:添加變更到暫存區域編寫簡潔且信息豐富的提交消息保存並退出提交消息以完成提交可選:為提交添加簽名使用 git log 查看提交內容

如何更新本地 Git 代碼?用 git fetch 從遠程倉庫拉取最新更改。用 git merge origin/<遠程分支名稱> 將遠程變更合併到本地分支。解決因合併產生的衝突。用 git commit -m "Merge branch <遠程分支名稱>" 提交合併更改,應用更新。
