從個體對抗到流形對抗:CVPR 2023探討可泛化的流形對抗攻擊
聲稱準確率 99% 的人臉辨識系統真的牢不可破嗎?事實上,在人臉照片上做一些不影響視覺判斷的改變就可以輕鬆攻破人臉辨識系統,例如讓鄰家女孩和男明星被判斷成同一個人,這便是對抗攻擊。對抗攻擊的目標是尋找自然的且能夠讓神經網路混淆的對抗樣本,從本質上講,找到對抗樣本也就是找到了神經網路的脆弱之處。
近日,來自東方理工的研究團隊提出了一種廣義流形對抗攻擊的範式(Generalized Manifold Adversarial Attack, GMAA),將傳統的「點」 攻擊模式推廣為「面」 攻擊模式,大大提高了對抗攻擊模型的泛化能力,為對抗攻擊的工作展開了一個新的思維。
研究從目標域和對抗域兩個面向對先前的工作做了改進。在目標域上,該研究透過攻擊目標身分的狀態集合找到高泛化的更強大的對抗樣本。對於對抗域,先前的工作都是在尋找離散的對抗樣本,即找到了系統的幾個「漏洞」(點),而該研究則在尋找連續的對抗流形,即要找到神經網路脆弱的整片“區域”(面)。此外,研究引入表情編輯的領域知識,提出了基於表情狀態空間實例化的新範式。透過對生成的對抗流形連續採樣可以獲得表情連續變化的高泛化性對抗樣本,相比於化妝、光照、添加擾動等手段,表情狀態空間更加普適自然,不受性別、光照的影響。 研究論文已被 CVPR 2023 接收。
論文連結:請點擊此處查看論文
需要重寫的內容是:程式碼連結https://github.com/tokaka22/GMAA
介紹方法
在目標領域部分,先前的工作都是針對目標身分A 的某一張特定的照片去設計對抗樣本。但如圖 2 所示,當用這種攻擊方式產生的對抗樣本去攻擊 A 的另一張照片時,攻擊效果會大幅下降。面對此類攻擊,定期更換人臉辨識庫中的照片自然是一種有效的防禦措施。但是,該研究提出的GMAA 不僅針對目標身分的單一樣本進行訓練,而且尋找能攻擊目標身分狀態集合的對抗樣本,這樣的高泛化性的對抗樣本面對更新後的人臉辨識庫具備更好的攻擊性能。 這些更強大的對抗樣本也對應著神經網路更為薄弱之處,值得深入探索。
在對抗領域的先前研究中,人們通常尋找離散的一個或幾個對抗樣本,這相當於在高維空間中找到了神經網路脆弱的一個或幾個「點」。然而,這項研究認為神經網路可能在整個「面」上都是脆弱的,因此應該找到這個「面」上的所有對抗樣本。因此,研究的目標是尋找高維空間中的對抗流形
綜上,GMAA 是一種用對抗流形去攻擊目標身份的狀態集合的新攻擊範式。
請參考圖1,這是文章的核心思想
#具體來說,研究引入了臉部行為編碼系統(Facial Action Coding System,FACS)作為領域知識,用於實例化所提出的新的攻擊範式。 FACS是一種用於臉部表情編碼的系統,它將臉部分為不同的肌肉單元,AU向量中的每個元素對應一個肌肉單元,向量元素的大小表示對應單元的肌肉活躍程度,從而編碼表情狀態。例如,在下圖中,AU向量的第一個元素AU1表示提起內側眉毛的程度

來自《面部表情解剖學》
對於目標領域,這項研究旨在攻擊包含多種表情狀態的目標集合,以實現對未知目標照片的較好攻擊性能;對於對抗領域,該研究透過建立與AU空間一一對應的對抗流形,可以透過改變AU值的方式在對抗流形上取樣對抗樣本,透過連續改變AU值,生成連續變化表情的對抗樣本
值得注意的是,該研究採用表情狀態空間來實例化 GMAA 攻擊範式。這是因為表情是人面部活動中最常見的一種狀態,而且表情狀態空間相對穩定,不會受到人種、性別的影響(光照可改變膚色、化妝則會影響性別) 。事實上,只要能找到其他合適的狀態空間,該攻擊範式就完全可以被推廣應用於自然界的其他對抗攻擊任務。
需要重新寫作的內容是:模型結果
該研究的視覺化結果在下面的動圖中顯示。每一幀動圖都是透過對抗流形上的採樣得到的對抗樣本。連續採樣可以獲得一系列表情連續改變的對抗樣本(左側)。動圖中的紅色數值表示目前影格的對抗樣本與目標樣本(右)在Face 人臉辨識系統下的相似度
在表1中,列出了4個人臉辨識模型在兩個資料集上的黑盒子攻擊成功率。其中,MAA是GMAA的縮減版,MAA僅在對抗域上將點攻擊的模式推廣到了流形攻擊,目標域上仍然是對單一目標照片進行攻擊。攻擊目標的狀態集合是一種通用的實驗設置,文章在表2中為包括MAA在內的三種方法加上了這種設置(表中加粗的部分是加上這種設置的結果,在方法的名稱前加上了「G」以示區分),驗證了目標域的擴充可以提升對抗樣本的泛化性





#需要進行改寫的內容是:原理方法
重寫後的內容:模型的核心部分包括基於WGAN-GP的生成模組、表情監督模組、可轉移性增強模組和廣義攻擊模組。其中,廣義攻擊模組能夠實現攻擊目標狀態的集合功能,可轉移性增強模組是基於先前的研究工作而來,為了公平比較,所有基準模型都加入了這個模組。表情監督模組由四個經過訓練的表情編輯器組成,透過全局結構監督和局部細節監督實現對抗樣本的表情轉換連續對抗流形和語義連續對抗流形的概念,並詳細證明了生成的對抗流形與AU 向量空間同胚。
#
總結是對已有資訊或經驗的歸納與概括。它是一種整理和總結思考的過程,旨在提煉出最重要的觀點和結論。總結可以幫助我們更好地理解和記憶所學的知識,同時也能夠幫助我們更好地傳達和分享我們的想法。透過總結,我們可以將複雜的資訊簡化並提煉出核心要點,使其更易於理解和應用。總結是學習和溝通過程中的重要工具,它能夠幫助我們更有效率地處理和利用大量的資訊。無論是在學習、工作或生活中,總結都是一項必不可少的技能
綜上所述,該研究提出了一種新的名為GMAA 的攻擊範式,同時擴展了目標域和對抗域,提高了攻擊的效能。對於目標域,GMAA 透過攻擊狀態集合而不是單張影像來提升對目標身分的泛化能力。此外,GMAA 將對抗域從離散點擴展到語意連續的對抗流形(「由點到面」)。該研究透過引入表情編輯的領域知識實例化了 GMAA 攻擊範式。大量的比較實驗證明,GMAA 具有比其他競爭模型更好的攻擊性能和更自然的視覺品質。
以上是從個體對抗到流形對抗:CVPR 2023探討可泛化的流形對抗攻擊的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

在現代製造業中,精準的缺陷檢測不僅是確保產品品質的關鍵,更是提升生產效率的核心。然而,現有的缺陷檢測資料集常常缺乏實際應用所需的精確度和語意豐富性,導致模型無法辨識特定的缺陷類別或位置。為了解決這個難題,由香港科技大學廣州和思謀科技組成的頂尖研究團隊,創新地開發了「DefectSpectrum」資料集,為工業缺陷提供了詳盡、語義豐富的大規模標註。如表一所示,相較於其他工業資料集,「DefectSpectrum」資料集提供了最多的缺陷標註(5438張缺陷樣本),最細緻的缺陷分類(125個缺陷類別

開放LLM社群正是百花齊放、競相爭鳴的時代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等許多表現優良的模型。但是,相較於以GPT-4-Turbo為代表的專有大模型,開放模型在許多領域仍有明顯差距。在通用模型之外,也有一些專精關鍵領域的開放模型已被開發出來,例如用於程式設計和數學的DeepSeek-Coder-V2、用於視覺-語言任務的InternVL

編輯|ScienceAI基於有限的臨床數據,數百種醫療演算法已被批准。科學家們正在討論由誰來測試這些工具,以及如何最好地進行測試。 DevinSingh在急診室目睹了一名兒科患者因長時間等待救治而心臟驟停,這促使他探索AI在縮短等待時間中的應用。 Singh利用了SickKids急診室的分診數據,與同事們建立了一系列AI模型,用於提供潛在診斷和推薦測試。一項研究表明,這些模型可以加快22.3%的就診速度,將每位需要進行醫學檢查的患者的結果處理速度加快近3小時。然而,人工智慧演算法在研究中的成功只是驗證此

對AI來說,奧數不再是問題了。本週四,GoogleDeepMind的人工智慧完成了一項壯舉:用AI做出了今年國際數學奧林匹克競賽IMO的真題,並且距拿金牌僅一步之遙。上週剛結束的IMO競賽共有六道賽題,涉及代數、組合學、幾何和數論。谷歌提出的混合AI系統做對了四道,獲得28分,達到了銀牌水準。本月初,UCLA終身教授陶哲軒剛剛宣傳了百萬美元獎金的AI數學奧林匹克競賽(AIMO進步獎),沒想到7月還沒過,AI的做題水平就進步到了這種水平。 IMO上同步做題,做對了最難題IMO是歷史最悠久、規模最大、最負

編輯|KX時至今日,晶體學所測定的結構細節和精度,從簡單的金屬到大型膜蛋白,是任何其他方法都無法比擬的。然而,最大的挑戰——所謂的相位問題,仍然是從實驗確定的振幅中檢索相位資訊。丹麥哥本哈根大學研究人員,開發了一種解決晶體相問題的深度學習方法PhAI,利用數百萬人工晶體結構及其相應的合成衍射數據訓練的深度學習神經網絡,可以產生準確的電子密度圖。研究表明,這種基於深度學習的從頭算結構解決方案方法,可以以僅2埃的分辨率解決相位問題,該分辨率僅相當於原子分辨率可用數據的10%到20%,而傳統的從頭算方

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

2023年,幾乎AI的每個領域都在以前所未有的速度進化,同時,AI也不斷地推動著具身智慧、自動駕駛等關鍵賽道的技術邊界。在多模態趨勢下,Transformer作為AI大模型主流架構的局面是否會撼動?為何探索基於MoE(專家混合)架構的大模型成為業界新趨勢?大型視覺模型(LVM)能否成為通用視覺的新突破? ……我們從過去的半年發布的2023年本站PRO會員通訊中,挑選了10份針對以上領域技術趨勢、產業變革進行深入剖析的專題解讀,助您在新的一年裡為大展宏圖做好準備。本篇解讀來自2023年Week50

編輯|紫羅蘭AI在簡化藥物發現方面的應用正在爆炸式增長。從數十億種候選分子中篩選出可能具有開發新藥所需特性的分子。需要考慮的變數太多了,從材料價格到出錯的風險,即使科學家使用AI,權衡合成最佳候選分子的成本也不是一件容易的事。在此,MIT研究人員開發了一個定量決策演算法架構SPARROW,來自動識別最佳分子候選物,從而最大限度地降低合成成本,同時最大限度地提高候選物具有所需特性的可能性。該演算法還確定了合成這些分子所需的材料和實驗步驟。 SPARROW考慮了一次合成一批分子的成本,因為多個候選分子通常可
