全面的機器學習術語指南

WBOY
發布: 2024-07-26 12:58:51
原創
362 人瀏覽過

Comprehensive Machine Learning Terminology Guide

介紹

歡迎來到綜合機器學習術語指南!無論您是機器學習領域的新手,還是希望溫習詞彙的經驗豐富的從業者,本指南都旨在成為您了解構成 ML 基礎的關鍵術語和概念的首選資源。


基本概念

機器學習 (ML):人工智慧的一個子集,專注於建立可以從資料中學習並根據資料做出決策的系統。

人工智慧 (AI):創造可以模擬人類思考能力和行為的智慧機器的更廣泛領域。

深度學習:基於多層人工神經網路的機器學習子集。

資料集:用於訓練和測試機器學習模型的資料集合。

特徵:所觀察到的現象的單一可測量屬性或特徵。

標籤:我們在監督學習中嘗試預測的目標變數。

模型:從資料中學習的現實世界過程的數學表示。

演算法:解決問題的逐步過程或公式。

訓練:教導模型根據資料做出預測或決策的過程。

推理:使用經過訓練的模型對新的、未見過的資料進行預測。


機器學習的類型

監督學習:從標記資料中學習以預測不可預見資料的結果。

無監督學習:在沒有標記回應的情況下尋找輸入資料中隱藏的模式或內在結構。

半監督學習:從標記和未標記資料的組合中學習。

強化學習:學習透過與環境互動來做出決策。

遷移學習:將從一項任務中獲得的知識應用於相關任務。


模型評估和指標

準確率:正確預測佔所檢查個案總數的比例。

精確度:真陽性預測佔所有陽性預測的比例。

回想率:真陽性預測佔所有實際陽性案例的比例。

F1 分數:精確率和回想率的調和平均值。

ROC 曲線:說明二元分類器系統的診斷能力的圖形。

AUC(曲線下面積):衡量分類器區分類別的能力。

混淆矩陣:用來描述分類模型表現的表格。

交叉驗證:用於在有限資料樣本上評估機器學習模型的重採樣過程。

過度擬合:當模型對訓練資料學習良好時,包括雜訊和波動。

欠擬合:當模型太簡單而無法捕捉資料的底層結構。


神經網路和深度學習

神經元:神經網路的基本單位,大致模仿生物神經元。

激活函數:在給定輸入或一組輸入的情況下確定神經元輸出的函數。

權重:神經網路中決定神經元之間連結強度的參數。

偏差:神經網路中的附加參數,用於調整輸出以及神經元輸入的加權和。

反向傳播:一種透過根據預測誤差迭代調整網路權重來訓練神經網路的演算法。

梯度下降:一種最佳化演算法,用於透過沿著最陡下降的方向迭代移動來最小化損失函數。

Epoch:一次完整地遍歷整個訓練資料集。

批次:模型訓練的一次迭代中使用的訓練資料的子集。

學習率:一個超參數,用於控制每次更新模型權重時響應估計誤差而改變模型的程度。

卷積神經網路(CNN):一種常用於影像辨識和處理的神經網路。

循環神經網路 (RNN):一種旨在識別資料序列中的模式的神經網路。

長短期記憶 (LSTM):一種能夠學習長期依賴關係的 RNN。

Transformer:完全依賴注意力機制來繪製輸入和輸出之間的全域依賴關係的模型架構。


特徵工程和選擇

特徵工程:利用領域知識從原始資料中提取特徵的過程。

特徵選擇:選擇相關特徵子集用於模型建構的過程。

降維:減少資料集中輸入變數數量的技術。

主成分分析 (PCA):一種統計過程,使用正交變換將一組可能相關變數的觀測值轉換為一組線性不相關變數的值。


整合方法

整合學習:組合多個模型來解決計算智能問題的過程。

Bagging:一種使用訓練資料的多個子集來訓練不同模型的整合方法。

Boosting:一種將弱學習器組合起來創建強學習器的整合方法。

隨機森林:一種建構大量決策樹的整合學習方法。


自然語言處理(NLP)

標記化:將文字分解為單字或子字的過程。

字幹擷取:將變形字還原為其字幹或字根形式的過程。

詞形還原:將單字的不同變形形式分組在一起的過程。

詞嵌入:一種學習的文本表示,其中具有相似含義的單字具有相似的表示。

命名實體辨識 (NER):辨識和分類文字中的命名實體的任務。

情緒分析:使用自然語言處理從文本中辨識和提取主觀資訊。


強化學習

代理:強化學習場景中的學習者或決策者。

環境:智能體運作與學習的世界。

狀態:環境中代理的當前情況或狀況。

行動:代理人所做的舉動或決定。

獎勵:來自環境的回饋,用於評估代理所採取的操作。

策略:代理根據目前狀態決定下一步操作的策略。


先進理念

生成對抗網路(GAN):一類機器學習框架,其中兩個神經網路相互競爭。

注意力機制:一種模仿認知注意力的技術,增強輸入資料的重要部分並減少不相關部分。

遷移學習:機器學習中的一個研究問題,重點是儲存在解決一個問題時獲得的知識並將其應用於另一個不同但相關的問題。

少樣本學習:一種機器學習,模型經過訓練僅從幾個範例中識別新類別。

可解釋的人工智慧 (XAI):結果可以被人類理解的人工智慧系統。

聯邦學習:一種機器學習技術,可跨多個分散的設備或保存本地資料樣本的伺服器訓練演算法。

AutoML:將機器學習應用於現實世界問題的端到端流程自動化的過程。


結論

如果您正在閱讀本文,非常感謝您!我非常感激❤️。

在 Twitter appyzdl5 上關注我,獲取有關 ML 的定期更新、見解和引人入勝的對話。

我的 Github,其中包含從頭開始的 miniGit 和 ML 演算法等項目:@appyzdl

以上是全面的機器學習術語指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!