基於資訊理論的校準技術，CML讓多模態機器學習更可靠-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

基於資訊理論的校準技術，CML讓多模態機器學習更可靠

PHPz

Jun 27, 2023 pm 04:26 PM

機器學習模型

多模態機器學習在各種場景下都取得了令人矚目的進展。然而，多模態學習模型的可靠性尚缺乏深入研究。「資訊是消除的不確定性」，多模態機器學習的初衷與這是一致的——增加的模態可以使得預測更為準確和可靠。然而，最近發表於 ICML2023 的論文《Calibrating Multimodal Learning》發現當前多模態學習方法違法了這一可靠性假設，並做出了詳細分析和矯正。

基於資訊理論的校準技術，CML讓多模態機器學習更可靠圖片

#論文Arxiv：https:// arxiv.org/abs/2306.01265
#程式碼GitHub：https://github.com/QingyangZhang/CML

#目前的多模態分類方法存在不可靠的置信度，即當部分模態被移除時，模型可能產生更高的置信度，違反了資訊理論中「資訊是消除的不確定性」這一基本原理。針對此問題，本文提出校準多模態學習（Calibrating Multimodal Learning）方法。此方法可以部署到不同的多模態學習範式中，提升多模態學習模型的合理性和可信賴性。

基於資訊理論的校準技術，CML讓多模態機器學習更可靠圖片

該工作指出，目前多模態學習方法存在不可靠的預測置信度問題，現有多模態機器學習模型傾向於依賴部分模態來估計置信度。特別地，研究發現，目前模型估計的置信度在某些模態被損壞時反而會增加。為了解決這個不合理問題，作者提出了一個直觀的多模態學習原則：當移除模態時，模型預測置信度不應增加。但是，目前的模型傾向於相信部分模態，容易受到這個模態的影響，而不是公平地考慮所有模態。這進一步影響了模型的穩健性，即當某些模態被損壞時，模型很容易受到影響。

基於資訊理論的校準技術，CML讓多模態機器學習更可靠

為了解決上述問題，目前一些方法採用了現有的不確定性校準方法，例如 Temperature Scaling 或貝葉斯學習方法。這些方法可以建立比傳統訓練 / 推理方式更準確的置信度估計。但是，這些方法只是使最終融合結果的信心估計與正確率匹配，並沒有明確考慮模態資訊量與信心之間的關係，因此，無法本質上提升多模態學習模型的可信度。

作者提出了一個新的正則化技術，稱為 “Calibrating Multimodal Learning (CML)”。該技術透過添加一項懲罰項來強制模型預測信心與資訊量的匹配關係，以實現預測置信度和資訊量之間的一致性。該技術基於一種自然的直覺，即當移除一個模態時，預測置信度應該會降低（至少不應該增加），這可以內在地提高置信度校準。具體來說，提出了一種簡單的正則化項，透過對那些當移除一個模態時預測置信度會增加的樣本添加懲罰，來強制模型學習直觀的次序關係：

基於資訊理論的校準技術，CML讓多模態機器學習更可靠

上面的限制為正規損失，當模態訊息移除信心上升時作為懲罰出現。

實驗結果表明，CML 正則化可以顯著提高現有多模態學習方法的預測置信度的可靠性。此外，CML 還可以提高分類精度，並提高模型的穩健性。

基於資訊理論的校準技術，CML讓多模態機器學習更可靠

多模态机器学习在各种情境中取得了显著的进展，但是多模态机器学习模型的可靠性仍然是一个需要解决的问题。本文通过广泛的实证研究发现，当前多模态分类方法存在预测置信度不可靠的问题，违反了信息论原则。针对这一问题，研究人员提出了 CML 正则化技术，该技术可以灵活地部署到现有的模型，并在置信度校准、分类精度和模型鲁棒性方面提高性能。相信这个新技术将在未来的多模态学习中发挥重要作用，提高机器学习的可靠性和实用性。

以上是基於資訊理論的校準技術，CML讓多模態機器學習更可靠的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1664

CakePHP 教程

1423

Laravel 教程

1321

PHP教程

1269

C# 教程

1249

Related knowledge

一文帶您了解SHAP：機器學習的模型解釋 Jun 01, 2024 am 10:58 AM

在機器學習和資料科學領域，模型的可解釋性一直是研究者和實踐者關注的焦點。隨著深度學習和整合方法等複雜模型的廣泛應用，理解模型的決策過程變得尤為重要。可解釋人工智慧（ExplainableAI|XAI）透過提高模型的透明度，幫助建立對機器學習模型的信任和信心。提高模型的透明度可以透過多種複雜模型的廣泛應用等方法來實現，以及用於解釋模型的決策過程。這些方法包括特徵重要性分析、模型預測區間估計、局部可解釋性演算法等。特徵重要性分析可以透過評估模型對輸入特徵的影響程度來解釋模型的決策過程。模型預測區間估計

替代MLP的KAN，被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

本月初，來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如，作者表示，他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說，DeepMind的MLP有大約300,000個參數，而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎，MLP基於通用逼近定理，而KAN基於Kolmogorov-Arnold表示定理。如下圖所示，KAN在邊上具

使用C++實現機器學習演算法：常見挑戰及解決方案 Jun 03, 2024 pm 01:25 PM

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫，並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法，有效地管理記憶體和使用高效能矩陣操作。

全面超越DPO：陳丹琦團隊提出簡單偏好優化SimPO，也煉出最強8B開源模型 Jun 01, 2024 pm 04:41 PM

為了將大型語言模型（LLM）與人類的價值和意圖對齊，學習人類回饋至關重要，這能確保它們是有用的、誠實的和無害的。在對齊LLM方面，一種有效的方法是根據人類回饋的強化學習（RLHF）。儘管RLHF方法的結果很出色，但其中涉及了一些優化難題。其中涉及訓練一個獎勵模型，然後優化一個策略模型來最大化該獎勵。近段時間已有一些研究者探索了更簡單的離線演算法，其中之一就是直接偏好優化（DPO）。 DPO是透過參數化RLHF中的獎勵函數來直接根據偏好資料學習策略模型，這樣就無需顯示式的獎勵模型了。此方法簡單穩定

你所不知道的機器學習五大學派 Jun 05, 2024 pm 08:51 PM

機器學習是人工智慧的重要分支，它賦予電腦從數據中學習的能力，並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用，從影像辨識和自然語言處理到推薦系統和詐欺偵測，它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論，其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學（Symbolism），又稱符號主義，強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程，透過現有的

無需OpenAI數據，躋身程式碼大模型榜單！ UIUC發表StarCoder-15B-Instruct Jun 13, 2024 pm 01:59 PM

在软件技术的前沿，UIUC张令明组携手BigCode组织的研究者，近日公布了StarCoder2-15B-Instruct代码大模型。这一创新成果在代码生成任务取得了显著突破，成功超越CodeLlama-70B-Instruct，登上代码生成性能榜单之巅。StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略，整个训练流程公开透明，且完全自主可控。该模型通过StarCoder2-15B生成了数千个指令，响应对StarCoder-15B基座模型进行微调，无需依赖昂贵的人工标注数

Flash Attention穩定嗎？ Meta、哈佛發現其模型權重偏差呈現數量級波動 May 30, 2024 pm 01:24 PM

MetaFAIR聯合哈佛優化大規模機器學習時所產生的資料偏差，提供了新的研究架構。據所周知，大語言模型的訓練常常需要數月的時間，使用數百甚至上千個GPU。以LLaMA270B模型為例，其訓練總共需要1,720,320個GPU小時。由於這些工作負載的規模和複雜性，導致訓練大模型存在著獨特的系統性挑戰。最近，許多機構在訓練SOTA生成式AI模型時報告了訓練過程中的不穩定情況，它們通常以損失尖峰的形式出現，例如Google的PaLM模型訓練過程中出現了多達20次的損失尖峰。數值偏差是造成這種訓練不準確性的根因，

LLM全搞定！ OmniDrive：集3D感知、推理規劃於一體（英偉達最新） May 09, 2024 pm 04:55 PM

寫在前面&筆者的個人理解這篇論文致力於解決當前多模態大語言模型（MLLMs）在自動駕駛應用中存在的關鍵挑戰，即將MLLMs從2D理解擴展到3D空間的問題。由於自動駕駛車輛（AVs）需要針對3D環境做出準確的決策，這項擴展顯得格外重要。 3D空間理解對於AV來說至關重要，因為它直接影響車輛做出明智決策、預測未來狀態以及與環境安全互動的能力。目前的多模態大語言模型（如LLaVA-1.5）通常只能處理較低解析度的影像輸入（例如），這是由於視覺編碼器的分辨率限制，LLM序列長度的限制。然而，自動駕駛應用需

See all articles

基於資訊理論的校準技術，CML讓多模態機器學習更可靠

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題