データマイニングの 6 つのステップとは何ですか?

Guanhui
リリース: 2020-07-27 13:49:58
オリジナル
15009 人が閲覧しました

データマイニングの 6 つのステップとは何ですか?

データマイニングの 6 つのステップとは何ですか?

データ マイニングは、大量のデータから、効果的で新規性があり、潜在的に役立つ、そして最終的には理解可能なパターンを取得する重要なプロセスです。手順は次のとおりです:

  • 1. 問題を定義する;

  • 2. データを準備する;

  • 3. データを参照する;

  • 4. モデルを生成します;

  • 5. モデルを参照して確認します;

  • 6. モデルをデプロイして更新します。

データ マイニングには通常、データ収集、データ統合、データ仕様、データ クリーニング、データ変換、データ マイニング実装プロセス、パターン評価、知識表現が必要です

1. データ収集:取得したデータを基に、データの特徴情報を抽出し、収集した情報をデータベースに格納します。データ ストレージと管理に適したデータ ウェアハウス タイプを選択します。

2. データ統合: さまざまなソースおよび形式からのデータを分類します。

#3. データ仕様: データの量とサイズがいつになるかデータの値が比較的大きい場合は、リダクション技術を使用して、(データ値 - データ平均) / データ分散などのデータセットのリダクション表現を取得できます。これは、データがはるかに小さくなりますが、完全性に近づくことを意味します。元のデータ リダクション後 データマイニングの結果は、仕様化前の結果と基本的に一致しています。

4. データ クリーニング: データの一部は不完全です。たとえば、値が欠落しているもの (値が存在しない)、ノイズが含まれているもの (エラー、孤立点)、一貫性のないもの (など)さまざまな単位など)、ツールを使用してデータをクリーンアップし、完全で正確で一貫性のあるデータを取得できます。

5. データ変換: スムーズな集計、データの一般化、標準化などを通じて、データをデータマイニングに適したデータセットに変換します。

6. 特徴抽出または特徴選択: 特徴抽出は主にコンピューター ビジョンや画像処理で使用されます。特徴選択は、過剰適合を防止し、モデルの精度を向上させるために、無関係で冗長な特徴を提案することです。一般的な方法として PCA があります。等々。

7. データ マイニング プロセス: データ ウェアハウス内のデータ情報を分析し、適切なデータ マイニング ツールを選択し、統計的手法を適用し、対応するデータ マイニング アルゴリズムを使用します。 。

8. ビジネスの観点から、データ分析とデータマイニングの結果が正しいことを検証します。

9. 知識表現。データ マイニングの結果を視覚的な方法でユーザーに提示します。

推奨チュートリアル:「

PHP

以上がデータマイニングの 6 つのステップとは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート