アソシエーションルールマイニング

(*-*)浩
リリース: 2019-07-27 14:42:19
オリジナル
6335 人が閲覧しました

アソシエーション ルールは、) の形式での含意です。中でも相関ルールXYは支持と信頼を集めています。

アソシエーションルールマイニング

相関ルール マイニング プロセスは、主に 2 つの段階で構成されます。第 1 段階では、すべての高頻度アイテム セット (Frequent Itemsset) をデータから見つける必要があります。第 2 段階では、これらの高頻度プロジェクト グループから関連付けルール (Association Rules) が生成されます。 (推奨学習: PHP ビデオ チュートリアル )

相関ルール マイニングの最初の段階では、元のデータ コレクションから高頻度の項目セット (大きな項目セット) をすべて見つける必要があります。

高頻度とは、特定の項目グループの頻度がすべてのレコードに対して一定のレベルに達する必要があることを意味します。アイテム群の出現頻度をサポートといい、2つのアイテムAとBを含む2アイテムセットを例にとると、{A, B}を含むアイテム群のサポートは、次の式(1)で求めることができます。サポートが設定された最小サポートしきい値以上である場合、{A, B} を高頻度アイテム グループと呼びます。

最小サポートを満たす k 項目セットは高頻度 k 項目セット (Frequent k 項目セット) と呼ばれ、一般に Large k または Frequent k と表されます。次に、アルゴリズムは、高頻度のアイテム グループが見つからなくなるまで、Large k のアイテム グループから Large k 1 を生成します。

相関ルール マイニングの第 2 段階は、相関ルール (相関ルール) を生成することです。高頻度項目グループからの相関ルールの生成は、前の手順で高頻度の k 項目グループを使用してルールを生成します。最小信頼度 (Minimum Confidence) の条件付きしきい値の下で、ルールによって取得された信頼度が最小値を満たす場合、信頼度 この規則は相関規則と呼ばれます。

例: 高頻度の k 項目グループ {A, B} を通じて生成されたルール AB の信頼度は、式 (2) で求めることができます。信頼性、相関ルールの AB と呼ばれます。

ルールで処理される変数のカテゴリに基づく

相関ルールによって処理される変数は、ブール型と数値型に分類できます。ブール相関ルールによって処理される値は離散的かつカテゴリカルであり、これらの変数間の関係を示しますが、数値相関ルールは多次元相関ルールまたは多層相関ルールと組み合わせて数値フィールドを処理することができ、それを動的に分割し、もちろん、数値関連ルールにはカテゴリ変数を含めることもできます。例: 性別 = "女性" => 職業 = "秘書"、これはブール相関ルールです; 性別 = "女性" => 平均 (収入) = 2300、関連する収入は数値タイプであるため、数値になります。関連付けルール。

ルール内のデータの抽象化レベルに基づく

ルール内のデータの抽象化レベルに基づいて、単一層の関連付けルールと複数層の関連付けルールに分類できます。レイヤー関連付けルール。単一レベルの相関ルールでは、すべての変数で実際のデータに複数の異なるレベルがあることが考慮されませんが、マルチレベルの相関ルールでは、データのマルチレベルの性質が十分に考慮されます。例: IBM デスクトップ =>Sony プリンタは、詳細データに関する単一層の関連付けルールです。デスクトップ =>Sony プリンタは、上位レベルと詳細レベルの間の多層関連付けルールです。

ルールに含まれるデータの次元に基づく

相関ルール内のデータは、単次元と多次元に分類できます。単次元相関ルールでは、ユーザーが購入した商品など、データの 1 つの次元のみが関与しますが、多次元相関ルールでは、処理されるデータに複数の次元が関与します。言い換えれば、一次元の関連ルールは単一の属性内の一部の関係を扱い、多次元の関連ルールはさまざまな属性間の一部の関係を扱います。例: ビール => おむつ、このルールにはユーザーが購入した商品のみが含まれます; 性別 = "女性" => 職業 = "秘書"、このルールには 2 つのフィールド (2 つの次元) の情報が含まれます。

PHP 関連の技術記事をさらに詳しく知りたい場合は、PHP グラフィック チュートリアル 列にアクセスして学習してください。

以上がアソシエーションルールマイニングの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート