資料探勘就是從大量的、不完全的、有雜訊的、模糊的、隨機的資料中,提取隱含在其中的、人們事先不知道的但又是潛在有用的資訊和知識的過程。資料探勘的任務是從資料集中發現模式,可以發現的模式有很多種,依功能可以分為兩大類:預測性(Predictive)模式和描述性(Descriptive)模式。
資料探勘軟體(推薦學習:PHP影片教學)
Orange
Orange是一個基於組件的資料探勘和機器學習軟體套裝,它的功能即友好,又很強大,快速而又多功能的可視化程式設計前端,以便瀏覽資料分析和視覺化,基底綁定了Python以進行腳本開發。它包含了完整的一系列的組件以進行資料預處理,並提供了資料帳目,過渡,建模,模式評估和勘探的功能。其由C 和 Python開發,它的圖形庫是由跨平台的Qt框架開發。
RapidMiner
RapidMiner, 以前叫YALE (Yet Another Learning Environment), 其是一個給機器學習和資料探勘和分析的試驗環境,同時用於研究了真實世界資料探勘。它提供的實驗由大量的算子組成,而這些算子由詳細的XML 檔案記錄,並被RapidMiner圖形化的使用者介面表現出來。 RapidMiner為主要的機器學習過程提供了超過500算子,並且,其結合了學習方案和Weka學習環境的屬性評估器。它是一個獨立的工具可以用來做資料分析,同樣也是一個資料探勘引擎可以用來整合到你的產品中。
Weka
由Java開發的 Weka (Waikato Environment for Knowledge Analysis) 是知名機器學機軟體,其支援幾種經典的資料探勘任務,顯著的資料預處理,集群,分類,回歸,虛擬化,以及功能選擇。其技術基於假設資料是以單一檔案或關聯的,在那裡,每個資料點都被許多屬性標註。 Weka 使用Java的資料庫連結能力可以存取SQL資料庫,並且可以處理一個資料庫的查詢結果。它主要的用戶接品是Explorer,也同樣支援相同功能的命令列,或是一種基於元件的知識流介面。
JHepWork
為科學家,工程師和學生設計的 jHepWork 是一個免費的開源資料分析框架,其主要是用開源程式庫來建立資料分析環境,並提供了豐富的用戶接口,以此來和那些收費的的軟體競爭。它主要是為了科學計算用的二維和三維的製圖,並包含了用Java實現的數學科學庫,隨機數,和其它的資料探勘演算法。 jHepWork 是基於一個高階的程式語言 Jython,當然,Java程式碼同樣可以用來呼叫 jHepWork 的數學和圖形函式庫。
KNIME
KNIME (Konstanz Information Miner) 是一個用戶友好,智能的,並有豐演的開源的數據集成,數據處理,數據分析和數據勘探平台。它給了用戶有能力以可視化的方式創建數據流或數據通道,可選擇性地運行一些或全部的分析步驟,並以後面研究結果,模型 以及 可交互的視圖。 KNIME 由Java寫成,其基於 Eclipse 並透過插件的方式來提供更多的功能。透過以插件的文件,使用者可以為文件,圖片,和時間序列加入處理模組,並可以整合到其它各種各樣的開源專案中,例如:R語言,Weka, Chemistry Development Kit, 和LibSVM.
更多PHP相關技術文章,請造訪PHP圖文教學欄位進行學習!
以上是資料探勘用什麼軟體的詳細內容。更多資訊請關注PHP中文網其他相關文章!