首頁 > 常見問題 > 資料探勘六大步驟是什麼?

資料探勘六大步驟是什麼?

Guanhui
發布: 2020-07-27 13:49:58
原創
15050 人瀏覽過

資料探勘六大步驟是什麼?

資料探勘六大步驟是什麼?

資料探勘就是從大量資料中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,步驟為:

  • 1、定義問題;

  • 2、準備資料;

  • 3、瀏覽資料;

  • 4、生成模型;

  • 5、瀏覽和驗證模型;

  • 6、部署和更新模型。

資料探勘通常需要資料收集,資料集成,資料規約,資料清理,資料變換,資料探勘實施過程,模式評估和知識表示

1.數據收集:根據所得的數據,抽像出數據的特徵信息,將收集到的信息存入數據庫。選擇一個適當的資料儲存和管理的資料倉儲類型

2.資料整合:把不同來源,格式的資料進行分類

3.資料規約:當資料量和資料的值比較大的時候,我們可以用規約技術來得到資料集的規約表示,例如(資料值-資料平均值)/資料方差,這是資料就變小了很多但接近原資料的完整性,在規約後資料探勘的結果和規約前的結果基本上一致。

4.資料清理:有些資料是不完整的如:有些有缺失值(值不存在),有些含雜訊(錯誤,孤立點),有些是不一致的(如單位不同等),我們可以使用工具進行資料清理,得到完整,正確,一致的資料。

5.資料變換:透過平滑聚集,資料概化,標準化等方式將資料轉換成適用於資料探勘的資料集。

6.特徵提取或特徵選擇:特徵提取多應用於電腦視覺和影像處理中,特徵選擇是提出不相關和冗餘的特徵,防止過擬合,提高模型精確度,常用方法有PCA等。

7.資料探勘過程:分析資料倉儲中的資料訊息,選擇合適的資料探勘工具,應用統計方法,使用對應的資料探勘演算法。 。

8.從業務上,驗證資料分析和資料探勘的結果正確性。

9.知識表示,將資料探勘所得結果以視覺化的方式呈現給使用者。

推薦教學:《PHP

以上是資料探勘六大步驟是什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板