首頁 科技週邊 人工智慧 CMU朱俊彥團隊研發出一款自動匹配排名系統,用於評估各種AI生成模型的優劣

CMU朱俊彥團隊研發出一款自動匹配排名系統,用於評估各種AI生成模型的優劣

May 09, 2023 pm 09:09 PM
ai 模型

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

最近的生成式 AI 可謂十分火爆,新出的預訓練影像生成模型多到讓人目不暇給。無論是肖像、風景,還是卡通漫畫、特定藝術家風格元素等等,每個模型都有它擅長生成的內容。

這麼多模型裡面,要如何快速找到一個能滿足自己創作欲的最佳模型呢?

近日,卡內基美隆大學的助理教授朱俊彥等人首次提出了基於內容的模型搜尋演算法,讓你能夠一鍵搜尋出最匹配的深度影像生成模型。

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

#論文網址:https://arxiv.org/pdf/2210.03116.pdf

在團隊基於這套模型搜尋算開發的線上模型共享和搜尋平台Modelverse 上,你可以輸入文字、圖像、草圖和給定模型,來搜尋出最匹配或相似的相關模型。

Modelverse 平台位址:https://modelverse.cs.cmu.edu/

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:輸入文字(如「非洲動物」)、圖像(如風景圖)、草圖(如一隻站立的貓的草圖)或一個給定模型,輸出排名靠前的相關模型(第二行、第三行)

例如,輸入文字“face”,得到結果如下:

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

輸入一隻貓咪影像:

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

#輸入一匹馬的草圖:

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

#1 基於內容的模型搜尋

和傳統的多媒體搜尋一樣,模型搜尋能夠幫助用戶找到最適合其特定需求的模型。但基於內容的模型搜尋任務有其特殊困難:

判斷模型是否可以產生特定圖像,這是一個比較難計算的問題,而且很多深度生成模型並沒有提供有效方法來估計密度,其本身也不支持評估跨模態相似性。而蒙特卡羅這種基於抽樣的方法又會讓模型搜尋過程變得非常緩慢。

為此,朱俊彥團隊提出了一個新的模型搜尋系統。

每個生成模型都會產生一個圖像分佈,所以作者將搜尋問題處理為最佳化,以最大化在給定模型的情況下產生與查詢匹配的機率。如下圖所示,系統由預緩存階段(a,b)和推理階段(c)組成。

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:模型搜尋方法概覽

給定一組模型,(a)首先為每個模型產生50K 樣本;(b) 然後將圖像編碼為圖像特徵併計算每個模型的一階和二階特徵統計。統計資料快取在系統中以提高效率;(c) 在推理階段,支援不同模態的查詢,包括圖像、草圖、文字描述、另一個生成模型或這些查詢類型的組合。作者在這裡引入近似值,查詢被編碼為特徵向量,透過評估查詢特徵與每個模型統計資料之間的相似性,來檢索具有最佳相似性度量的模型。

模型搜尋效果

作者對演算法進行評估,對133 個深度生成模型(包括GAN、擴散模型和自回歸模型)進行了消融實驗分析。與蒙特卡羅基線相比,此方法可實現更有效率的搜索,速度在 0.08 毫秒內,提升 5 倍,同時還能保持高精度

透過對比模型檢索結果,我們也可以大致了解針對不同查詢輸入,哪些模型能產生更高品質的影像。例如下圖展示了模型檢索的結果比較。

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:模型檢索結果範例

##最上面一行是圖像查詢,輸入靜物畫,檢索相關藝術風格的模型,得到排名第一的StyleGAN2 模型和排名最後的Vision-aided GAN 模型。中間行是草圖查詢,輸入馬和教堂的草圖,得到 ADM、ProGAN 等模型。最下面一行是文字查詢,輸入“戴眼鏡的人”和“說話的鳥”,分別檢索得出排名第一的 GANSketch 模型和 Self-Distilled GAN 模型。

作者也發現,不同網路特徵空間的模型效能有差異。 如下圖所示,在輸入影像查詢時,結果顯示三個網路CLIP、DINO 和Inception 都具有相似的效能;而在輸入草圖查詢時,CLIP 效果明顯較好,而DINO 和Inception 則較不適合給定查詢,它們在藝術風格的模型上表現更好。

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:不同網路特徵空間中基於影像和草圖的模型檢索比較

另外,這項工作所提出的模型搜尋演算法還能支援多種應用,包括多模態使用者查詢、相似模型查詢、真實影像重構和編輯等。

例如多模態查詢可以幫助細化模型搜索,在只有“Nicolas Cage”的圖像時,只能檢索到人臉模型;但當同時使用“Nicolas Cage”和「dog」作為輸入時,就可以檢索到能產生「Nicolas Cage dog」影像的 StyleGAN-NADA 模型。 (如下圖)

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:多模態使用者查詢

當輸入是一個人臉模型時,可以檢索到更多的人臉生成模型,並且類別保持相似。 (如下圖)

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:相似模型查詢

給定真實人臉的查詢影像,使用排名較高的模型能獲得更精確的影像重建。下圖是使用不同排名模型的 CelebA-HQ 和 LSUN Church 影像的影像逆映射範例。

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:將真實影像投射到檢索到的 StyleGAN2 模型。

在對真實影像進行編輯的任務中,不同模型的表現也有高低之分。在下圖中,使用基於圖像的模型檢索演算法排名第一的模型來對真實圖像進行逆映射,然後使用 GANspace 進行編輯,從而將浮世繪圖圖像中的皺眉人臉變成笑臉。

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统#

圖註:編輯真實圖像

##這項研究已經證明了模型搜尋的可行性,而文字、音訊或其他內容生成的模型搜尋還有很大的研究空間。

但目前來看,這項工作所提出的方法還有一定的限制。例如,在查詢特定的草圖時,有時會匹配出抽象形狀的模型;而有時進行多模態查詢時,只能檢索到單一的模型,系統可能會很難處理像一隻狗的圖像「大象」這樣的多模態查詢。 (如下圖)

AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出自动匹配排名系统

圖註:失敗案例

另外,在其模型搜尋平台上,對檢索出的模型清單並未根據其效果進行自動排序,如在生成影像的解析度、逼真度、匹配度等方面對不同模型進行評估並給出排名,這樣可更便於使用者檢索,也能幫助使用者更了解目前生成模型的優劣情況,並期待這方面的後續工作。

以上是CMU朱俊彥團隊研發出一款自動匹配排名系統,用於評估各種AI生成模型的優劣的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

mysql 無法啟動怎麼解決 mysql 無法啟動怎麼解決 Apr 08, 2025 pm 02:21 PM

MySQL啟動失敗的原因有多種,可以通過檢查錯誤日誌進行診斷。常見原因包括端口衝突(檢查端口占用情況並修改配置)、權限問題(檢查服務運行用戶權限)、配置文件錯誤(檢查參數設置)、數據目錄損壞(恢復數據或重建表空間)、InnoDB表空間問題(檢查ibdata1文件)、插件加載失敗(檢查錯誤日誌)。解決問題時應根據錯誤日誌進行分析,找到問題的根源,並養成定期備份數據的習慣,以預防和解決問題。

mysql 能返回 json 嗎 mysql 能返回 json 嗎 Apr 08, 2025 pm 03:09 PM

MySQL 可返回 JSON 數據。 JSON_EXTRACT 函數可提取字段值。對於復雜查詢,可考慮使用 WHERE 子句過濾 JSON 數據,但需注意其性能影響。 MySQL 對 JSON 的支持在不斷增強,建議關注最新版本及功能。

了解 ACID 屬性:可靠數據庫的支柱 了解 ACID 屬性:可靠數據庫的支柱 Apr 08, 2025 pm 06:33 PM

數據庫ACID屬性詳解ACID屬性是確保數據庫事務可靠性和一致性的一組規則。它們規定了數據庫系統處理事務的方式,即使在系統崩潰、電源中斷或多用戶並發訪問的情況下,也能保證數據的完整性和準確性。 ACID屬性概述原子性(Atomicity):事務被視為一個不可分割的單元。任何部分失敗,整個事務回滾,數據庫不保留任何更改。例如,銀行轉賬,如果從一個賬戶扣款但未向另一個賬戶加款,則整個操作撤銷。 begintransaction;updateaccountssetbalance=balance-100wh

掌握SQL LIMIT子句:控制查詢中的行數 掌握SQL LIMIT子句:控制查詢中的行數 Apr 08, 2025 pm 07:00 PM

SQLLIMIT子句:控制查詢結果行數SQL中的LIMIT子句用於限制查詢返回的行數,這在處理大型數據集、分頁顯示和測試數據時非常有用,能有效提升查詢效率。語法基本語法:SELECTcolumn1,column2,...FROMtable_nameLIMITnumber_of_rows;number_of_rows:指定返回的行數。帶偏移量的語法:SELECTcolumn1,column2,...FROMtable_nameLIMIToffset,number_of_rows;offset:跳過

如何針對高負載應用程序優化 MySQL 性能? 如何針對高負載應用程序優化 MySQL 性能? Apr 08, 2025 pm 06:03 PM

MySQL數據庫性能優化指南在資源密集型應用中,MySQL數據庫扮演著至關重要的角色,負責管理海量事務。然而,隨著應用規模的擴大,數據庫性能瓶頸往往成為製約因素。本文將探討一系列行之有效的MySQL性能優化策略,確保您的應用在高負載下依然保持高效響應。我們將結合實際案例,深入講解索引、查詢優化、數據庫設計以及緩存等關鍵技術。 1.數據庫架構設計優化合理的數據庫架構是MySQL性能優化的基石。以下是一些核心原則:選擇合適的數據類型選擇最小的、符合需求的數據類型,既能節省存儲空間,又能提升數據處理速度

mysql 主鍵可以為 null mysql 主鍵可以為 null Apr 08, 2025 pm 03:03 PM

MySQL 主鍵不可以為空,因為主鍵是唯一標識數據庫中每一行的關鍵屬性,如果主鍵可以為空,則無法唯一標識記錄,將會導致數據混亂。使用自增整型列或 UUID 作為主鍵時,應考慮效率和空間佔用等因素,選擇合適的方案。

Navicat查看MongoDB數據庫密碼的方法 Navicat查看MongoDB數據庫密碼的方法 Apr 08, 2025 pm 09:39 PM

直接通過 Navicat 查看 MongoDB 密碼是不可能的,因為它以哈希值形式存儲。取回丟失密碼的方法:1. 重置密碼;2. 檢查配置文件(可能包含哈希值);3. 檢查代碼(可能硬編碼密碼)。

使用 Prometheus MySQL Exporter 監控 MySQL 和 MariaDB Droplet 使用 Prometheus MySQL Exporter 監控 MySQL 和 MariaDB Droplet Apr 08, 2025 pm 02:42 PM

有效監控 MySQL 和 MariaDB 數據庫對於保持最佳性能、識別潛在瓶頸以及確保整體系統可靠性至關重要。 Prometheus MySQL Exporter 是一款強大的工具,可提供對數據庫指標的詳細洞察,這對於主動管理和故障排除至關重要。

See all articles