現代の産業環境にはセンサーやスマート コンポーネントが数多く搭載されており、これらすべてのデバイスが連携して大量のデータを生成します。このデータは、今日ほとんどの工場で活用されておらず、さまざまなエキサイティングな新しいアプリケーションを強化します。実際、IBM によると、平均的な工場では毎日 1TB の生産データが生成されます。ただし、実用的な洞察に変換されるのはデータの約 1% のみです。
機械学習 (ML) は、このデータを活用して大量の価値を引き出すために設計された基本的なテクノロジーです。機械学習システムは、トレーニング データを使用して、明示的な指示なしで特定のタスクを実行するようにシステムに教える数学的モデルを構築できます。
ML は、データに基づいて動作するアルゴリズムを使用して、人間の介入をほとんど必要とせずに意思決定を行います。産業オートメーションにおける機械学習の最も一般的な形式は教師あり機械学習です。これは、人間によってラベル付けされた大量の履歴データを使用してモデルをトレーニングします (つまり、人間が教師付きアルゴリズムをトレーニングします)。
これは、ベアリングの欠陥、潤滑不良、製品の欠陥などのよく知られた問題に役立ちます。教師あり機械学習が不十分となるのは、十分な履歴データが利用できない場合、ラベル付けに時間がかかりすぎるか費用がかかりすぎる場合、またはユーザーがデータの中で何を探しているのか正確にわかっていない場合です。ここで教師なし機械学習が登場します。
教師なし機械学習は、パターンの認識とデータ内の異常の特定に優れたアルゴリズムを使用して、ラベルのないデータを操作することを目的としています。教師なし機械学習を適切に適用すると、状態監視やパフォーマンス テストからサイバーセキュリティや資産管理に至るまで、さまざまな産業オートメーションのユースケースに役立ちます。
教師あり機械学習は、教師なし機械学習よりも実行が簡単です。適切にトレーニングされたモデルを使用すると、非常に一貫性のある信頼性の高い結果が得られます。教師あり機械学習には、関連するすべてのケースを含める必要があるため、大量の履歴データが必要になる場合があります。つまり、製品の欠陥を検出するには、データに十分な数の欠陥製品のケースが含まれている必要があります。これらの大量のデータセットにラベルを付けるには、時間と費用がかかる場合があります。さらに、モデルのトレーニングは芸術です。良い結果を生み出すには、適切に編成された大量のデータが必要です。
現在、さまざまな ML アルゴリズムのベンチマークを行うプロセスは、AutoML などのツールを使用して大幅に簡素化されています。同時に、トレーニング プロセスを過度に制約すると、モデルがトレーニング セットでは良好にパフォーマンスするものの、実際のデータではパフォーマンスが低下する可能性があります。もう 1 つの重要な欠点は、教師あり機械学習が、データの予期せぬ傾向を特定したり、新しい現象を発見したりするのにあまり効果的ではないことです。このような種類のアプリケーションでは、教師なし機械学習の方がより良い結果が得られます。
教師あり機械学習と比較して、教師なし機械学習はラベルのない入力に対してのみ動作します。これは、人間の助けを借りずに未知のパターンや相関関係を発見するためのデータ探索用の強力なツールを提供します。ラベルのないデータを操作できるため、時間と費用が節約され、入力が生成されるとすぐに教師なし機械学習がデータを操作できるようになります。
欠点は、教師なし機械学習は教師あり機械学習よりも複雑であることです。より高価で、より高度な専門知識が必要であり、多くの場合、より多くのデータが必要になります。その出力は教師あり ML よりも信頼性が低くなる傾向があり、最適な結果を得るには最終的に人間の監督が必要になります。
教師なし機械学習技術の 3 つの重要な形式は、クラスタリング、異常検出、データの次元削減です。
名前が示すように、クラスタリングには、データセットを分析してデータ間の共有特性を特定し、類似したインスタンスをグループ化することが含まれます。クラスタリングは教師なし ML 手法であるため、(人間ではなく) アルゴリズムがランキング基準を決定します。したがって、クラスタリングは驚くべき発見につながる可能性があり、優れたデータ探索ツールです。
簡単な例を挙げると、生産部門で 3 人の人が果物の仕分けを依頼されていると想像してください。柑橘類、核果、トロピカル フルーツなどの果物の種類で並べ替える場合もあれば、色で並べ替える場合もあり、形状で並べ替える場合も考えられます。各方法では、異なる一連の特性が強調表示されます。
#クラスタリングはさまざまなタイプに分類できます。最も一般的なものは次のとおりです。相互排他的クラスタリング (排他的クラスタリング): データ インスタンスは、クラスタに排他的に割り当てられます。
ファジー クラスタリングまたはオーバーラップ クラスタリング (ファジー クラスタリング): データ インスタンスを複数のクラスターに割り当てることができます。たとえば、オレンジは柑橘類であると同時にトロピカル フルーツでもあります。ラベルなしデータを操作する教師なし ML アルゴリズムの場合、データ ブロックがグループ A とグループ B に正しく属する確率を割り当てることができます。
階層クラスタリング: この手法には、クラスターのセットではなく、クラスター化されたデータの階層構造の構築が含まれます。オレンジは柑橘類ですが、より大きな球形の果物グループにも含まれており、すべての果物グループでさらに吸収されます。
最も一般的なクラスタリング アルゴリズムのセットを見てみましょう:
K-平均 (K 平均) アルゴリズムはデータを K 個のクラスターに分類します。K の値はユーザーによって事前に設定されます。プロセスの開始時に、アルゴリズムは K 個のデータ ポイントを K 個のクラスターの重心としてランダムに割り当てます。次に、各データ ポイントとそのクラスターの重心の間の平均を計算します。これにより、データがクラスターに再割り当てされます。この時点で、アルゴリズムは重心を再計算し、平均の計算を繰り返します。重心を計算し、クラスターを並べ替えるプロセスを、一定の解に到達するまで繰り返します (図 1 を参照)。
図 1: K 平均法アルゴリズムはデータセットを K 個のクラスターに分割し、最初に K 個のデータポイントを重心としてランダムに選択します。を実行し、残りのインスタンスをクラスター全体にランダムに分散します。
K 平均法アルゴリズムはシンプルで効率的です。パターン認識やデータマイニングに非常に役立ちます。欠点は、セットアップを最適化するためにデータセットに関する高度な知識が必要なことです。また、異常値の影響も不均衡に受けます。
K-median アルゴリズムは K-means に近いものです。基本的に同じプロセスを使用しますが、各データ ポイントの平均を計算する代わりに中央値を計算する点が異なります。したがって、アルゴリズムは外れ値の影響を受けにくくなります。
クラスター分析の一般的な使用例をいくつか示します。
異常検出は、欠陥検出から状態監視、サイバーセキュリティまで、さまざまなユースケースにとって重要です。これは教師なし機械学習における重要なタスクです。教師なし機械学習で使用される異常検出アルゴリズムはいくつかあります。最も一般的な 2 つのアルゴリズムを見てみましょう:
異常検出の標準的な方法は、一連の正常値を確立し、各データを分析して正常値から逸脱しているかどうか、またどの程度逸脱しているかを確認することです。 ML で使用される種類の大量のデータ セットを操作する場合、これは非常に時間のかかるプロセスです。分離フォレスト アルゴリズムは逆のアプローチを採用します。外れ値は、一般的でもなく、データセット内の他のインスタンスと大きく異なるものでもないと定義されます。したがって、それらは他のインスタンス上のデータセットの残りの部分からより簡単に分離されます。
分離フォレスト アルゴリズムのメモリ要件は最小限であり、必要な時間はデータ セットのサイズに直線的に関係します。無関係な属性が含まれる場合でも、高次元データを処理できます。
重心からの距離だけで外れ値を特定するという課題の 1 つはい、小さなクラスターから近い距離にあるデータ ポイントは外れ値である可能性がありますが、大きなクラスターから遠く離れているように見えるデータ ポイントは外れ値ではない可能性があります。 LOF アルゴリズムは、この区別を行うように設計されています。
LOF は、近隣のデータ ポイントよりもはるかに大きい局所的な密度偏差を持つデータ ポイントとして外れ値を定義します (図 2 を参照)。 K-means と同様に、事前にユーザーによるセットアップが必要ですが、非常に効果的です。半教師ありアルゴリズムとして使用し、通常のデータのみでトレーニングした場合は、新規性の検出にも適用できます。
図 2: 局所外れ値係数 (LOF) は、各データ ポイントの局所密度偏差を使用して異常スコアを計算します。 、それによって正常なデータポイントを外れ値から区別します。
次に、異常検出の使用例をいくつか示します:
産業環境で収集されたデータは貴重なリソースになりますが、それは適切に活用された場合に限られます。教師なし機械学習は、データセットを分析して実用的な洞察を抽出するための強力なツールとなり得ます。このテクノロジーの導入は困難を伴う場合がありますが、困難な世界では大きな競争上の優位性をもたらす可能性があります。
以上が教師なし機械学習は産業オートメーションにどのようなメリットをもたらしますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。