解決VAE表示學習問題,北海道大學提出新型生成模式GWAE
學習高維度資料的低維表示是無監督學習中的基本任務,因為這種表示簡潔地捕捉了資料的本質,並且使得執行以低維輸入為基礎的下游任務成為可能。變分自編碼器(VAE)是一種重要的表示學習方法,然而由於其目標控製表示學習仍然是一個具有挑戰性的任務。雖然 VAE 的證據下界(ELBO)目標進行了生成建模,但學習表示並不是直接針對該目標的,這需要對錶示學習任務進行特定的修改,如解糾纏。這些修改有時會導致模型的隱式和不可取的變化,使得控製表示學習成為一個具有挑戰性的任務。
為了解決變分自編碼器中的表示學習問題,本文提出了一種稱為 Gromov-Wasserstein Autoencoders(GWAE)的新型生成模型。 GWAE 提供了一個基於變分自編碼器(VAE)模型架構的表示學習新框架。與傳統基於 VAE 的表示學習方法針對資料變數的生成建模不同,GWAE 透過資料和潛在變數之間的最優傳輸獲得有益的表示。 Gromov-Wasserstein(GW)度量使得在不可比較變數之間(例如具有不同維度的變數)進行這種最優傳輸成為可能,其側重於所考慮的變數的距離結構。透過以 GW 度量取代 ELBO 目標,GWAE 在資料和潛在空間之間執行比較,直接針對變分自編碼器中的表示學習(如圖 1)。這種表示學習的表述允許學習到的表示具有特定的被認為有益的屬性(例如分解性),這些屬性被稱為元先驗。
圖1 VAE 與GWAE 的差異
##本研究目前已被ICLR 2023 接受。
- 論文連結:https://arxiv.org/abs/2209.07007
- #程式碼連結:https://github.com/ganmodokix/gwae
資料分佈與潛在先驗分佈之間的GW目標定義如下:
這種最優傳輸代價的公式可以衡量不可比空間中分佈的不一致性;然而對於連續分佈,由於需要對所有耦合進行下確界,計算精確的GW 值是不切實際的。為了解決這個問題,GWAE 解決了一個鬆弛的最佳化問題,以此來估計和最小化 GW 估計量,其梯度可以透過自動微分進行計算。鬆弛目標是估計的 GW 度量和三個正則化損失的總和,可以在可微編程框架(如 PyTorch)中全部實現。此鬆弛目標由一個主要損失和三個正則化損失組成,即主要估計的 GW 損失,基於 WAE 的重構損失,合併的充分條件損失以及熵正則化損失。
這個方案還可以靈活地自訂先驗分佈,以將有益的特徵引入低維表示中。具體而言,該論文引入了三個先驗族群,分別是:
#神經先驗(NP) 在具有NP 的GWAEs 中,使用全連接的神經網路建構先驗採樣器。此先驗分佈族群在潛在變數方面做出了較少的假設,適用於一般情況。
因子化神經先驗(FNP)#在具有FNP 的GWAEs 中,使用本地連接的神經網路建構採樣器,其中每個潛在變數的條目獨立產生。這種採樣器產生一個因子化的先驗和一個逐項獨立的表示,這是代表性元先驗、解糾纏的一種突出方法。
高斯混合先驗(GMP) #在GMP 中,定義為幾個高斯分佈的混合物,其取樣器可以使用重參數化技巧和Gumbel-Max 技巧來實現。 GMP 允許在表示中假設簇,其中先驗的每個高斯組件都預期捕捉一個簇。
實驗及結果
本研究對GWAE 進行了兩個主要元先驗的經驗評估:解糾纏和聚類。
解糾纏 研究使用了 3D Shapes 資料集和 DCI 指標來測量 GWAE 的解糾纏能力。結果表明,使用 FNP 的 GWAE 能夠在單一軸上學習物件色調因素,這表明了 GWAE 的解糾纏能力。定量評估也展示了 GWAE 的解糾纏表現。
聚類 為了評估基於聚類元先驗獲得的表徵,該研究進行了一項Out-of-Distribution(OoD)偵測。 MNIST 資料集被用作 In-Distribution(ID)數據,Omniglot 資料集被用作 OoD 資料。雖然 MNIST 包含手寫數字,但 Omniglot 包含不同字母的手寫字母。在這個實驗中,ID 和 OoD 資料集共享手寫影像領域,但它們包含不同的字元。模型在 ID 資料上進行訓練,然後使用它們學到的特性來偵測 ID 或 OoD 資料。在 VAE 和 DAGMM 中,用於 OoD 檢測的變數是先驗的對數似然,而在 GWAE 中,它是 Kantorovich potential。 GWAE 的先驗是用 GMP 建構的,以捕捉 MNIST 的簇。 ROC 曲線顯示了模型的 OoD 檢測性能,其中所有三個模型都實現了近乎完美的性能;然而,使用 GMP 構建的 GWAE 在曲線下面積(AUC)方面表現最佳。
此外研究對 GWAE 進行了生成能力的評估。
作為基於自動編碼器的生成模型的性能 為了評估GWAE 在沒有特定元先驗的情況下對一般情況的處理能力,使用CelebA 數據集進行了生成性能的評估。實驗使用 FID 評估模型的生成性能,使用 PSNR 評估自編碼性能。 GWAE 使用 NP 獲得了第二好的生成性能和最佳的自編碼性能,這表明其能夠在其模型中捕捉資料分佈並在其表示中捕捉資料資訊的能力。
總結
- #GWAE 是基於Gromov-Wasserstein 度量所建構的變分自編碼器產生模型,旨在直接進行表示學習。
- 由於先驗只需要可微分樣本,因此可以建立各種先驗分佈設定來假設元先驗(表示的理想特性)。
- 在主要元先驗上的實驗以及作為變分自編碼器的性能評估表明了 GWAE 公式的靈活性和 GWAE 的表示學習能力。
- 第一作者Nao Nakagawa 個人首頁:https://ganmodokix.com/note/cv
- 日本北海道大學多媒體實驗室首頁:https://www-lmd.ist.hokudai.ac.jp/
以上是解決VAE表示學習問題,北海道大學提出新型生成模式GWAE的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

上週,在內部的離職潮和外部的口誅筆伐之下,OpenAI可謂是內憂外患:-侵權寡姐引發全球熱議-員工簽署“霸王條款”被接連曝出-網友細數奧特曼“七宗罪」闢謠:根據Vox獲取的洩漏資訊和文件,OpenAI的高級領導層,包括Altman在內,非常了解這些股權回收條款,並且簽署了它們。除此之外,還有一個嚴峻而迫切的問題擺在OpenAI面前——AI安全。最近,五名與安全相關的員工離職,其中包括兩名最著名的員工,「超級對齊」團隊的解散讓OpenAI的安全問題再次被置於聚光燈下。 《財星》雜誌報道稱,OpenA

評估Java框架商業支援的性價比涉及以下步驟:確定所需的保障等級和服務等級協定(SLA)保證。研究支持團隊的經驗和專業知識。考慮附加服務,如昇級、故障排除和效能最佳化。權衡商業支援成本與風險緩解和提高效率。

70B模型,秒出1000token,换算成字符接近4000!研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍!不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。这项成果,来自爆火的AI编程神器Cursor背后团队anysphere,OpenAI也参与过投资。要知道在以快著称的推理加速框架Groq上,70BLlama3的推理速度也不过每秒300多token。Cursor这样的速度,可以说是实现了近乎即时的完整代码文件编辑。有人直呼好家伙,如果把Curs

PHP框架的學習曲線取決於語言熟練度、框架複雜性、文件品質和社群支援。與Python框架相比,PHP框架的學習曲線較高,而與Ruby框架相比,則較低。與Java框架相比,PHP框架的學習曲線中等,但入門時間較短。

6月26日消息,在2024年世界行動通訊大會上海(MWC上海)開幕典禮上,中國移動董事長楊傑發表演說。他表示,當前,人類社會正邁入以資訊為主導、資訊和能量深度融合的第四次工業革命,即“數智化革命”,新質生產力加速形成。楊傑認為,從蒸汽機驅動的“機械化革命”,到電力、內燃機等驅動的“電氣化革命”,再到計算機和互聯網等驅動的“信息化革命”,每一輪工業革命都是以“信息和能量」為主線,帶來生產力發

輕量級PHP框架透過小體積和低資源消耗提升應用程式效能。其特點包括:體積小,啟動快,記憶體佔用低提升響應速度和吞吐量,降低資源消耗實戰案例:SlimFramework創建RESTAPI,僅500KB,高響應性、高吞吐量

根據應用場景選擇最佳Go框架:考慮應用類型、語言特性、效能需求、生態系統。常見Go框架:Gin(Web應用)、Echo(Web服務)、Fiber(高吞吐量)、gorm(ORM)、fasthttp(速度)。實戰案例:建構RESTAPI(Fiber),與資料庫互動(gorm)。選擇框架:效能關鍵選fasthttp,靈活Web應用選Gin/Echo,資料庫互動選gorm。

日前,Google2500頁的內部文件被洩露,揭示了搜尋——「網路最強大的仲裁者」的運作方式。 SparkToro的聯合創始人兼CEO是一位匿名人士,他在個人網站上發表博客文章,宣稱“一位匿名人士與我分享了數千頁洩露的谷歌搜索API文檔,SEO中的每個人都應該看到它們!既然在這個領域德高望重,RandFishkin
