PHPのK-meansアルゴリズムの詳細な説明-PHPチュートリアル-php.cn

PHPのK-meansアルゴリズムの詳細な説明

王林

リリース： 2023-07-08 16:44:02

オリジナル

1531 人が閲覧しました

PHP における K-means アルゴリズムの詳細な説明

K-means アルゴリズムは、一般的に使用されるクラスタリング分析アルゴリズムであり、データマイニングと機械学習の分野で広く使用されています。この記事では、PHP を使用して K 平均法アルゴリズムを実装するプロセスを詳細に紹介し、コード例を示します。

アルゴリズム原理

K 平均法アルゴリズムは、データセット内のサンプルポイントを複数のクラスターに分割し、クラスター内のサンプルポイント間の距離を可能な限り小さくします。、およびクラスター間のサンプル点間の距離は、できるだけ大きくする必要があります。具体的な実装プロセスは次のとおりです。

1.1 初期化

まず、クラスターの数 K を決定する必要があります。次に、K 個のサンプル点が初期中心点としてデータセットからランダムに選択されます。

1.2 割り当て

データセット内の各サンプル点について、そのサンプル点とすべての中心点の間の距離を計算し、それを最も近いクラスターに割り当てます。

1.3 更新

各クラスターについて、クラスター内のサンプル点の平均を新しい中心点として計算します。

1.4 反復の繰り返し

クラスター内のサンプルポイントが変化しなくなるまで、または所定の反復回数に達するまで、割り当てと更新のプロセスを繰り返します。

PHP コード例

以下は、PHP を使用して K-means アルゴリズムを実装するコード例です。

<?php

function kMeans($data, $k, $iterations) {
  // 初始化簇中心点
  $centers = [];
  for ($i = 0; $i < $k; $i++) {
    $centers[] = $data[array_rand($data)];
  }

  // 迭代分配和更新过程
  for ($iteration = 0; $iteration < $iterations; $iteration++) {
    $clusters = array_fill(0, count($centers), []);

    foreach ($data as $point) {
      // 计算样本点与各个中心点的距离
      $distances = [];
      foreach ($centers as $center) {
        $distance = calculateDistance($point, $center);
        $distances[] = $distance;
      }

      // 将样本点分配到最近的簇
      $clusterIndex = array_search(min($distances), $distances);
      $clusters[$clusterIndex][] = $point;
    }

    // 更新中心点
    $newCenters = [];
    foreach ($clusters as $cluster) {
      $newCenter = calculateMean($cluster);
      $newCenters[] = $newCenter;
    }

    // 判断是否达到终止条件
    if ($centers == $newCenters) {
      break;
    }

    $centers = $newCenters;
  }

  return $clusters;
}

// 计算两个样本点之间的欧氏距离
function calculateDistance($point1, $point2) {
  $distance = 0;
  for ($i = 0; $i < count($point1); $i++) {
    $distance += pow($point1[$i] - $point2[$i], 2);
  }
  return sqrt($distance);
}

// 计算簇内样本点的均值
function calculateMean($cluster) {
  $mean = [];
  $dimension = count($cluster[0]);
  for ($i = 0; $i < $dimension; $i++) {
    $sum = 0;
    foreach ($cluster as $point) {
      $sum += $point[$i];
    }
    $mean[] = $sum / count($cluster);
  }
  return $mean;
}

// 测试代码
$data = [
  [2, 10],
  [2, 5],
  [8, 4],
  [5, 8],
  [7, 5],
  [6, 4],
  [1, 2],
  [4, 9],
];

$k = 2;
$iterations = 100;

$clusters = kMeans($data, $k, $iterations);

print_r($clusters);

?>

ログイン後にコピー

上記のコードでは、まず、K-means アルゴリズムを実行するために使用される kMeans 関数を定義します。次に、calculateDistance 関数を実装して、2 つのサンプルポイント間のユークリッド距離を計算します。最後に、calculateMean 関数が実装されます。この関数は、クラスター内のサンプルポイントの平均を計算するために使用されます。

結果表示

上記のコードに従って、単純な 2 次元データセットに対してクラスター分析を実行し、結果を出力します。出力にはクラスターの割り当てが表示されます。

Array
(
    [0] => Array
        (
            [0] => Array
                (
                    [0] => 2
                    [1] => 10
                )

            [1] => Array
                (
                    [0] => 2
                    [1] => 5
                )

            [2] => Array
                (
                    [0] => 1
                    [1] => 2
                )

        )

    [1] => Array
        (
            [0] => Array
                (
                    [0] => 8
                    [1] => 4
                )

            [1] => Array
                (
                    [0] => 5
                    [1] => 8
                )

            [2] => Array
                (
                    [0] => 7
                    [1] => 5
                )

            [3] => Array
                (
                    [0] => 6
                    [1] => 4
                )

            [4] => Array
                (
                    [0] => 4
                    [1] => 9
                )

        )
)

ログイン後にコピー

上記の結果は、K 平均法アルゴリズムがサンプルポイントを 2 つのクラスターに分割することを示しています。最初のクラスターには 3 つのサンプルポイント [2, 10]、[2, 5]、および [1, 2] が含まれています。 2 番目のクラスターには、他の 5 つのサンプルポイントが含まれます。

上記のコードとサンプルデータから、PHP を使用して K 平均法アルゴリズムを実装するプロセスが非常に簡単であると同時に、効果的なクラスタリング結果が得られることがわかります。

概要

K 平均法アルゴリズムは、一般的に使用されるクラスター分析アルゴリズムです。データセット内のサンプルポイントを複数のクラスターに分割することで、クラスター内の距離とクラスター間の距離を最小化できます。クラスターの最大化目標。この記事では、PHP を使用して K 平均法アルゴリズムを実装するための詳細な手順とコード例を示し、単純な 2 次元データセットを使用してそれを示します。読者は、実際のニーズに応じて関連パラメータを調整し、独自のデータ分析タスクに適用できます。

以上がPHPのK-meansアルゴリズムの詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。