Python による時系列分類の完全な入門
時系列データは多くの業界にわたって遍在していますが、時系列予測はかなりの注目を集めていますが、時系列分類は見落とされがちです。この記事では、時系列分類の包括的な概要を提供し、その実際のアプリケーションを調査し、さまざまな方法を確認し、Python ベースの分類プロジェクトでこれらの手法のいくつかを実証します。始めましょう!
時系列分類を理解する
時系列分類は、時間の経過とともに測定された 1 つ以上の特徴を使用してカテゴリを割り当てる教師あり機械学習手法です。 目的は、将来の値を予測するのではなく、時系列にラベルを付けることです。
時系列分類の現実世界への応用
時系列分類は、特にセンサー データで広く使用されています。 主なアプリケーションには以下が含まれます:
- 予知保全: 潜在的な障害を予測するための機器の監視。
- ヘルスケア: 心電図 (ECG) データを分析して患者の健康状態を評価します。
- 音声認識: 音波パターンから話し言葉と話者を識別します。
- 食品分光法: 分光法データからアルコール含有量を測定したり、食品成分を特定したりします。
- サイバーセキュリティ: 詐欺や侵害を示す異常なアクティビティを検出します。
これらの多様なアプリケーションは、さまざまな分野における時系列分類の重要性を強調しています。
時系列分類モデルの概要
時系列分類には多数のアプローチが存在します。 このセクションでは、それぞれの概要を簡単に説明します。さらに詳細な説明は、この専用ガイド [利用可能な場合はガイドへのリンク] で参照できます。
1.距離ベースのモデル: これらのモデルは、距離メトリック (ユークリッド距離など) を利用してサンプルを分類します。ダイナミック タイム ワーピング (DTW) は、より堅牢なアプローチを提供し、一連のさまざまな長さに対応し、わずかに位相がずれたパターンを処理します。 例には、K 最近傍 (KNN) や ShapeDTW などがあります。
2.辞書ベースのモデル: これらのモデルは、シンボルを使用して系列パターンをエンコードし、分類にシンボルの頻度を活用します。 例としては、BOSS、WEASEL、TDE、MUSE などがあります。
3.アンサンブル メソッド: これらはモデル自体ではなく、予測を改善するために複数の基本推定量を組み合わせたフレームワークです。 主な利点は、単変量モデル (バギングなど) を使用して多変量データを処理できることです。 例には、バギング、加重アンサンブル、時系列フォレストなどがあります。
4.特徴ベースのメソッド: これらのメソッドは、時系列 (要約統計量、Catch22、マトリックス プロファイル、TSFresh など) から特徴を抽出し、分類器のトレーニングに使用されます。
5.区間ベースのモデル: これらは、時系列から複数の区間を抽出し、上記の方法を使用して特徴を計算し、分類器をトレーニングします。例には、RISE、CIF、DrCIF などがあります。
6.カーネルベースのモデル: これらのモデルは、カーネル関数を使用して時系列を高次元空間にマッピングし、分類を容易にします。例には、サポート ベクター分類子 (SVC)、Rocket、Arsenal (Rocket のアンサンブル) などがあります。
7.シェイプレット分類子: この分類子は、距離比較に基づく分類にシェイプレット (識別サブシーケンス) を識別して利用します。
8.メタ分類子: これらは、堅牢な分類パフォーマンスを実現するためにさまざまな方法を組み合わせています。 TDE、Shapelet、DrCIF、Arsenal を組み合わせた HIVE-COTE は一例ですが、計算コストが高くなります。
方法の選択は、データの特性、計算リソース、必要な精度などの要因によって異なります。
実践的な時系列分類プロジェクト (Python)
このセクションでは、前述のテクニックの一部を BasicMotions データセット [データセットへのリンク] に適用します。このデータセットは、さまざまなアクティビティ (立位、歩行、ランニング、バドミントン) を実行する個人からの加速度計とジャイロスコープのデータで構成されます。
セットアップ:
import pandas as pd import numpy as np import matplotlib.pyplot as plt from sktime.datasets import load_basic_motions from sklearn.model_selection import GridSearchCV, KFold
データの読み込み:
X_train, y_train = load_basic_motions(split='train', return_type='numpy3D') X_test, y_test = load_basic_motions(split='test', return_type='numpy3D')
データの視覚化 (ウォーキングとバドミントンの比較例):
# ... (Visualization code as provided in the original article) ...
KNN 分類:
# ... (KNN code as provided in the original article) ...
WEASEL で袋詰め:
# ... (Bagging with WEASEL code as provided in the original article) ...
評価:
# ... (Evaluation code as provided in the original article) ...
結論
この記事では、時系列分類の概要を説明し、その応用とさまざまな方法について説明しました。 実践的なプロジェクトでは、KNN の適用と WEASEL による袋詰めを実証しました。 この分野のさらなる探究が奨励されています。
次のステップ
学習を続けるには、時系列分類方法に関するガイドやこの主題に関するコースなど、元の記事で言及されているリソースを探索することを検討してください。
参考文献
- BasicMotions データセット — [データセットへのリンク]
- SKTIME — [SKTIME へのリンク]
以上がPython による時系列分類の完全な入門の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











LinuxターミナルでPythonバージョンを表示する際の許可の問題の解決策PythonターミナルでPythonバージョンを表示しようとするとき、Pythonを入力してください...

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

PythonのPandasライブラリを使用する場合、異なる構造を持つ2つのデータフレーム間で列全体をコピーする方法は一般的な問題です。 2つのデータがあるとします...

UvicornはどのようにしてHTTPリクエストを継続的に聞きますか? Uvicornは、ASGIに基づく軽量のWebサーバーです。そのコア機能の1つは、HTTPリクエストを聞いて続行することです...

10時間以内にコンピューター初心者プログラミングの基本を教える方法は?コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

Investing.comの反クラウリング戦略を理解する多くの人々は、Investing.com(https://cn.investing.com/news/latest-news)からのニュースデータをクロールしようとします。
