目錄
少樣本學習方法
元學習
資料級方法
元學習演算法
基於度量的元學習
基於梯度元的學習
基於少樣本學習的圖像分類演算法
與模型無關的元學習
匹配網路
原型網路
關係網路
少樣本學習的應用
總結
首頁 科技週邊 人工智慧 少樣本學習綜述:技術、演算法與模型

少樣本學習綜述:技術、演算法與模型

Apr 12, 2023 pm 02:52 PM
機器學習 演算法

機器學習最近取得了很大的進展,但仍然有一個主要的挑戰:需要大量的標記資料來訓練模型。

有時這種數據在現實世界中是無法取得的。以醫療保健為例,我們可能沒有足夠的x光掃描來檢查一種新的疾病。但是透過少樣本學習可以讓模型只從幾個例子中學習到知識!

所以少樣本學習(FSL)是機器學習的一個子領域,它解決了只用少量標記示例學習新任務的問題。 FSL的全部意義在於讓機器學習模型能夠用一點點數據學習新東西,這在收集一堆標記數據太昂貴、花費太長時間或不實用的情況下非常有用。

少樣本學習方法

少樣本學習綜述:技術、演算法與模型

支援樣本/查詢集:使用少量圖片對查詢集進行分類。

少樣本學習中有三種主要方法需要了解:元學習、資料級和參數級。

  • 元學習:元學習包括訓練一個模型,學習如何有效地學習新任務;
  • 資料級:資料級方法著重於增加可用數據,以提高模型的泛化性能;
  • 參數級:參數級方法旨在學習更健壯的特徵表示,以便更好地泛化到新任務中

元學習

#元學習(學習如何學習)。這種方法訓練一個模型學習如何有效地學習新任務。這個模型是關於識別不同任務之間的共同點,並使用這些知識透過幾個例子快速學習新事物。

元學習演算法通常在一組相關任務上訓練模型,並學習從可用資料中提取與任務無關的特徵和特定於任務的特徵。任務無關的特徵捕獲關於資料的一般知識,而任務特定的特徵捕獲當前任務的細節。在訓練過程中,演算法透過僅使用每個新任務的幾個標記範例更新模型參數來學習適應新任務。這使得模型可以用很少的範例推廣到新的任務。

資料級方法

資料級方法著重於擴充現有數據,這樣可以幫助模型更好地理解資料的底層結構,從而提高模型的泛化效能。

主要想法是透過對現有範例應用各種轉換來創建新的範例,這可以幫助模型更好地理解資料的底層結構。

有兩種類型的資料級方法:

  • 資料增強:資料增強功能包括透過對現有資料應用不同的轉換來建立新的範例;
  • #資料生成:資料生成涉及使用生成對抗網路(GANs)從頭產生新的範例。

資料級的方法:

參數層級方法目標是學習更健壯的特徵表示,可以更好地泛化到新的任務。

有兩種參數級方法:

  • 特徵提取:特徵提取涉及從資料中學習一組特徵,可以用於新任務;
  • 微調:微調包括透過學習最優參數使預先訓練的模型適應新任務。

例如,假設你有一個預先訓練好的模型,它可以辨識影像中的不同形狀和顏色。透過在新資料集上微調模型,只需幾個範例,它就可以快速學會識別新的類別。

元學習演算法

元學習是FSL的一種流行方法,它涉及在各種相關任務上訓練模型,以便它能夠學習如何有效地學習新任務。此演算法學習從可用資料中提取任務無關和任務特定的特徵,快速適應新的任務。

元學習演算法可以大致分為兩種類型:基於度量的和基於梯度的。

基於度量的元學習

基於度量的元學習演算法學習一種特殊的方法來比較每個新任務的不同範例。他們透過將輸入範例映射到一個特殊的特徵空間來實現這一點,在這個空間中,相似的範例放在一起,而不同的範例則分開很遠。模型可以使用這個距離測量將新的範例分類到正確的類別中。

一種流行的基於度量的演算法是Siamese Network,它學習如何透過使用兩個相同的子網路來測量兩個輸入範例之間的距離。這些子網路為每個輸入範例產生特徵表示,然後使用距離度量(如歐幾里德距離或餘弦相似度)來比較它們的輸出。

基於梯度元的學習

基於梯度的元學習學習如何更新他們的參數,以便他們能夠快速適應新的挑戰。

這些演算法訓練模型學習一組初始參數,只需幾個例子就能快速適應新任務。 MAML (model - agnostic元學習)是一種流行的基於梯度的元學習演算法,它學習如何優化模型的參數以快速適應新任務。它透過一系列相關任務來訓練模型,並使用每個任務中的一些範例來更新模型的參數。一旦模型學習到這些參數,它就可以使用當前任務中的其他範例對它們進行微調,提高其效能。

基於少樣本學習的圖像分類演算法

FSL有幾種演算法,包括:

  • 與模型無關的元學習(Model-Agnostic Meta-Learning ):MAML是一種元學習演算法,它為模型學習了一個良好的初始化,然後可以用少量的例子來適應新的任務。
  • 匹配網路 (Matching Networks):匹配網路透過計算相似度來學習將新範例與標記的範例配對。
  • 原型網路(Prototypical Networks):原型網路學習每個類別的原型表示,根據它們與原型的相似性對新範例進行分類。
  • 關係網絡(Relation Networks):關係網絡學會比較成對的例子,對新的例子做出預測。

與模型無關的元學習

MAML的關鍵思想是學習模型參數的初始化,這些參數可以透過一些範例適應新任務。在訓練過程中,MAML接受一組相關任務,並學習僅使用每個任務的幾個標記範例來更新模型參數。這個過程使模型能夠透過學習模型參數的良好初始化來泛化到新的任務,這些參數可以快速適應新的任務。

匹配網路

匹配網路是另一個常用的少樣本影像分類演算法。它不是學習固定的度量或參數,而是基於當前支援集學習動態度量。這意味著用於比較查詢圖像和支援集的度量因每個查詢圖像而異。

匹配網路演算法使用一種注意力機制來計算每個查詢圖像的支援集特徵的加權和。權重是根據查詢圖像和每個支援集圖像之間的相似性來學習的。然後將支援集特徵的加權和與查詢影像特徵連接起來,得到的向量透過幾個全連接的層來產生最終的分類。

原型網路

原型網路是一種簡單有效的少樣本影像分類演算法。它學習圖像的表示,並使用支援範例的嵌入特徵的平均值計算每個類別的原型。在測試過程中,計算查詢影像與每個類別原型之間的距離,並將原型最近的類別分配給查詢。

關係網路

關係網路學習比較支援集中的範例對,並使用此資訊對查詢範例進行分類。關係網絡包括兩個子網絡:特徵嵌入網絡和關係網絡。特徵嵌入網路將支援集中的每個範例和查詢範例對應到一個特徵空間。然後關係網絡計算查詢範例和每個支援集範例之間的關係分數。最後使用這些關係分數對查詢範例進行分類。

少樣本學習的應用

少樣本學習在不同的領域有許多應用,包括:

在各種電腦視覺任務中,包括影像分類、目標偵測和分割。少樣本學習可以辨識影像中不存在於訓練資料中的新物件。

在自然語言處理任務中,如文字分類、情緒分析和語言建模,少樣本學習有助於提高語言模型在低資源語言上的表現。

在機器人技術中使用少數學習,使機器人能夠快速學習新任務,適應新環境。例如,機器人只需要幾個例子就可以學會撿起新物體。

少樣本在醫療診斷領域可以在數據有限的情況下識別罕見疾病和異常,可以幫助個人化治療和預測病人的結果。

總結

少樣本學習是一種強大的技術,它使模型能夠從少數例子中學習。它在各個領域都有大量的應用,並有可能徹底改變機器學習。隨著不斷的研究和開發,少樣本學習可以為更有效率和有效的機器學習系統鋪平道路。

以上是少樣本學習綜述:技術、演算法與模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1665
14
CakePHP 教程
1423
52
Laravel 教程
1321
25
PHP教程
1269
29
C# 教程
1249
24
一文帶您了解SHAP:機器學習的模型解釋 一文帶您了解SHAP:機器學習的模型解釋 Jun 01, 2024 am 10:58 AM

在機器學習和資料科學領域,模型的可解釋性一直是研究者和實踐者關注的焦點。隨著深度學習和整合方法等複雜模型的廣泛應用,理解模型的決策過程變得尤為重要。可解釋人工智慧(ExplainableAI|XAI)透過提高模型的透明度,幫助建立對機器學習模型的信任和信心。提高模型的透明度可以透過多種複雜模型的廣泛應用等方法來實現,以及用於解釋模型的決策過程。這些方法包括特徵重要性分析、模型預測區間估計、局部可解釋性演算法等。特徵重要性分析可以透過評估模型對輸入特徵的影響程度來解釋模型的決策過程。模型預測區間估計

使用C++實現機器學習演算法:常見挑戰及解決方案 使用C++實現機器學習演算法:常見挑戰及解決方案 Jun 03, 2024 pm 01:25 PM

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

你所不知道的機器學習五大學派 你所不知道的機器學習五大學派 Jun 05, 2024 pm 08:51 PM

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

Flash Attention穩定嗎? Meta、哈佛發現其模型權重偏差呈現數量級波動 Flash Attention穩定嗎? Meta、哈佛發現其模型權重偏差呈現數量級波動 May 30, 2024 pm 01:24 PM

MetaFAIR聯合哈佛優化大規模機器學習時所產生的資料偏差,提供了新的研究架構。據所周知,大語言模型的訓練常常需要數月的時間,使用數百甚至上千個GPU。以LLaMA270B模型為例,其訓練總共需要1,720,320個GPU小時。由於這些工作負載的規模和複雜性,導致訓練大模型存在著獨特的系統性挑戰。最近,許多機構在訓練SOTA生成式AI模型時報告了訓練過程中的不穩定情況,它們通常以損失尖峰的形式出現,例如Google的PaLM模型訓練過程中出現了多達20次的損失尖峰。數值偏差是造成這種訓練不準確性的根因,

可解釋性人工智慧:解釋複雜的AI/ML模型 可解釋性人工智慧:解釋複雜的AI/ML模型 Jun 03, 2024 pm 10:08 PM

譯者|李睿審校|重樓人工智慧(AI)和機器學習(ML)模型如今變得越來越複雜,這些模型產生的產出是黑盒子-無法向利害關係人解釋。可解釋性人工智慧(XAI)致力於透過讓利害關係人理解這些模型的工作方式來解決這個問題,確保他們理解這些模型實際上是如何做出決策的,並確保人工智慧系統中的透明度、信任度和問責制來解決這個問題。本文探討了各種可解釋性人工智慧(XAI)技術,以闡明它們的基本原理。可解釋性人工智慧至關重要的幾個原因信任度和透明度:為了讓人工智慧系統被廣泛接受和信任,使用者需要了解決策是如何做出的

改進的檢測演算法:用於高解析度光學遙感影像目標檢測 改進的檢測演算法:用於高解析度光學遙感影像目標檢測 Jun 06, 2024 pm 12:33 PM

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

C++技術中的機器學習:使用C++實作常見機器學習演算法的指南 C++技術中的機器學習:使用C++實作常見機器學習演算法的指南 Jun 03, 2024 pm 07:33 PM

在C++中,機器學習演算法的實作方式包括:線性迴歸:用於預測連續變量,步驟包括載入資料、計算權重和偏差、更新參數和預測。邏輯迴歸:用於預測離散變量,流程與線性迴歸類似,但使用sigmoid函數進行預測。支援向量機:一種強大的分類和回歸演算法,涉及計算支援向量和預測標籤。

演算法在 58 畫像平台建置中的應用 演算法在 58 畫像平台建置中的應用 May 09, 2024 am 09:01 AM

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

See all articles