使用紋理對比度檢測檢測AI生成的影像
在本篇文章中我們將介紹如何開發一個深度學習模型來偵測人工智慧產生的圖像。
許多用於檢測人工智慧生成圖像的深度學習方法都根據圖像生成的方式或圖像的特性/語義來確定,通常這些模型只能辨識人工智慧產生的特定對象,例如人、臉、汽車等。
然而,這項名為「Rich and Poor Texture Contrast: A Simple yet Effective Approach for AI-generated Image Detection」的研究提出的方法克服了這些挑戰,具有更廣泛的適用性。我們將深入探討這篇研究論文,闡明它是如何有效解決了其他檢測人工智慧生成圖像方法所面臨的問題。
泛化性問題
當我們使用一個模型(例如ResNet-50)來識別人工智慧產生的圖像時,模型會根據圖像的語意進行學習。如果我們訓練一個模型來識別人工智慧生成的汽車圖像,使用真實圖像和人工智慧生成的不同汽車圖像進行訓練,那麼該模型將只能從這些數據中獲取有關汽車的信息,而對於其他物體則無法進行準確辨識。
雖然可以對各種物件的資料進行訓練,但這種方式耗時較長,而且僅能在未知資料上達到大約72%的準確率。儘管可以透過增加訓練次數和資料量來提高準確性,但我們無法無限地取得訓練資料。
也就是說目前偵測模型的泛化性有很大的問題,為了解決這個問題,論文提出了以下的方法
Smash&Reconstruction
這篇論文介紹了一種獨特的方法,用於防止模型在訓練過程中從圖像的形狀中學習到人工智慧生成的特徵。作者提出了一種名為Smash&Reconstruction的方法來實現這一目標。
在這個方法中,圖像被分成預定大小的小塊,然後對它們進行重新排列,以產生新的圖像。這只是一個簡單的概述,因為在形成生成模型的最終輸入影像之前,還需要進行額外的步驟。
將影像分割成小塊後,我們將小塊分成兩組,一組是紋理豐富的小塊,另一組是紋理較差的小塊。
影像中細節豐富的區域,如物體或兩個對比色區域之間的邊界,就成為一個豐富的紋理區塊。與主要為背景的紋理區域(如天空或靜止的水)相比,豐富的紋理區域在像素上有很大的變化。
計算紋理豐富的指標
首先將影像分成預先決定大小的小塊,如上圖所示。然後找到這些圖像塊的像素梯度(即找出水平方向、對角線方向和反對角線方向上的像素值之差並將它們相加),並將它們分離成豐富紋理塊和紋理較差塊。
與紋理較差的區塊相比,紋理豐富的區塊具有更高的像素梯度值,計算影像梯度值得公式如下:
在像素對比度的基礎上將影像分離,得到兩個合成影像。這個過程是本文稱為「Smash&Reconstruction」的完整過程。
這樣就讓模型學習到得是紋理的細節,而不是物體的內容表徵
fingerprint
大多數基於指紋的方法受到圖像生成技術的限制,這些模型/演算法只能檢測由特定方法/類似方法(如擴散、GAN或其他基於CNN的影像生成方法)產生的影像。
為了精確地解決這個問題,論文已經將這些圖像塊劃分為豐富或貧乏的紋理。然後作者提出了一種識別人工智慧生成圖像指紋的新方法,這也就是論文的標題。他們提出在應用30個高通濾波器後,找到影像中豐富和貧乏紋理斑塊之間的對比。
豐富與貧乏的紋理塊之間的對比度有什麼幫助呢?
為了更好理解,我們將圖像並排比較,真實圖像和人工智慧生成的圖像。
これら 2 つの画像を肉眼で見るのは難しいですよね?
この論文では、最初に Smash&Reconstruction プロセスが使用されています。
30 個のハイパス フィルターを適用した後の各画像間のコントラスト:
これらの結果から、AI が生成した画像と実際の画像のコントラストは同等であることがわかります。豊かなテクスチャパッチと貧弱なテクスチャパッチははるかに高くなります。
このようにして、肉眼で違いを確認できるため、コントラスト結果をトレーニング可能なモデルに入力し、結果データを分類器に入力できます。これが目的です。モデル アーキテクチャ:
#分類子の構造は次のとおりです:
この論文では、もともとステガナリシスのために導入された 30 個のハイパス フィルターについて言及しています。
注: ステガノグラフィー的にイメージ化する方法は多数あります。広義には、画像の中に何らかの方法で情報が隠されており、通常の手段では発見することが困難な情報を画像ステガノグラフィーと呼ぶことができます。
ここでのフィルターは、畳み込み法を使用して画像の行列値に適用されます。使用されるフィルターは、高周波の特徴のみを許可するハイパス フィルターです。そこを通過するイメージ。高周波の特徴には通常、エッジ、細かいディテール、強度や色の急速な変化が含まれます。
(f) と (g) を除くすべてのフィルターは、画像に再適用される前にある角度で回転され、合計 30 個のフィルターが形成されます。 。これらの行列の回転は、SciPy を使用して行われるアフィン変換を使用して行われます。
まとめ
論文の結果は検証精度92%に達しており、さらにトレーニングを行えば、より良い結果が得られるでしょう 結果として、これは非常に興味深い研究です。トレーニング コードも見つけました。興味があれば、詳しく調べることができます:
論文: https:// arxiv.org/abs/2311.12397コード: https://github.com/hridayK/Detection-of-AI-generated-images
以上是使用紋理對比度檢測檢測AI生成的影像的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

隨著加密貨幣的普及,虛擬幣交易平台應運而生。全球十大虛擬幣交易平台根據交易量和市場份額排名如下:幣安、Coinbase、FTX、KuCoin、Crypto.com、Kraken、Huobi、Gate.io、Bitfinex、Gemini。這些平台提供各種服務,從廣泛的加密貨幣選擇到衍生品交易,適合不同水平的交易者。

芝麻開門交易所怎麼調成中文?本教程涵蓋電腦、安卓手機端詳細步驟,從前期準備到操作流程,再到常見問題解決,幫你輕鬆將芝麻開門交易所界面切換為中文,快速上手交易平台。

十大虛擬幣交易平台2025:1. OKX,2. Binance,3. Gate.io,4. Kraken,5. Huobi,6. Coinbase,7. KuCoin,8. Crypto.com,9. Bitfinex,10. Gemini。選擇平台時應考慮安全性、流動性、手續費、幣種選擇、用戶界面和客戶支持。

十大加密貨幣交易平台包括:1. OKX,2. Binance,3. Gate.io,4. Kraken,5. Huobi,6. Coinbase,7. KuCoin,8. Crypto.com,9. Bitfinex,10. Gemini。選擇平台時應考慮安全性、流動性、手續費、幣種選擇、用戶界面和客戶支持。

安全靠譜的數字貨幣平台:1. OKX,2. Binance,3. Gate.io,4. Kraken,5. Huobi,6. Coinbase,7. KuCoin,8. Crypto.com,9. Bitfinex,10. Gemini。選擇平台時應考慮安全性、流動性、手續費、幣種選擇、用戶界面和客戶支持。

C35 的計算本質上是組合數學,代表從 5 個元素中選擇 3 個的組合數,其計算公式為 C53 = 5! / (3! * 2!),可通過循環避免直接計算階乘以提高效率和避免溢出。另外,理解組合的本質和掌握高效的計算方法對於解決概率統計、密碼學、算法設計等領域的許多問題至關重要。

Bootstrap 圖片居中方法多樣,不一定要用 Flexbox。如果僅需水平居中,text-center 類即可;若需垂直或多元素居中,Flexbox 或 Grid 更合適。 Flexbox 兼容性較差且可能增加複雜度,Grid 則更強大且學習成本較高。選擇方法時應權衡利弊,並根據需求和偏好選擇最適合的方法。

十大虛擬幣交易app排名:1. OKX,2. Binance,3. Gate.io,4. Kraken,5. Huobi,6. Coinbase,7. KuCoin,8. Crypto.com,9. Bitfinex,10. Gemini。選擇平台時應考慮安全性、流動性、手續費、幣種選擇、用戶界面和客戶支持。
