時系列に基づく異常検出問題
時系列に基づく異常検出の問題には、特定のコード例が必要です
時系列データとは、株価、気温の変化、時間の経過とともに特定の順序で記録されるデータです。交通の流れなど実際のアプリケーションでは、時系列データの異常検出は非常に重要です。外れ値は、通常のデータ、ノイズ、誤ったデータ、または特定の状況における予期せぬイベントと一致しない極端な値である可能性があります。異常検出は、これらの異常を発見し、適切な措置を講じるのに役立ちます。
時系列での異常検出には、統計的手法、機械学習手法、深層学習手法など、一般的に使用される手法が多数あります。この記事では、統計的手法と機械学習手法に基づく 2 つの時系列異常検出アルゴリズムを紹介し、対応するコード例を示します。
1. 統計的手法に基づく異常検出アルゴリズム
1.1 平均分散法
平均分散法は、最も単純な異常検出手法の 1 つです。基本的な考え方は、時系列データの平均と分散に基づいて異常の有無を判断することです。平均からのデータ ポイントの偏差が特定のしきい値 (たとえば、標準偏差の 3 倍) より大きい場合、異常であると判断されます。
次は、Python を使用して時系列異常検出の平均分散法を実装するコード例です:
import numpy as np def detect_outliers_mean_std(data, threshold=3): mean = np.mean(data) std = np.std(data) outliers = [] for i in range(len(data)): if abs(data[i] - mean) > threshold * std: outliers.append(i) return outliers # 示例数据 data = [1, 2, 3, 4, 5, 20, 6, 7, 8, 9] # 检测异常值 outliers = detect_outliers_mean_std(data) print("异常数据索引:", outliers)
実行結果:
異常データ インデックス: [5 ]
1.2 箱ひげ図法
箱ひげ図法は、よく使用されるもう 1 つの異常検出方法です。データの四分位数 (上位四分位数と下位四分位数、中央値) に基づいて外れ値を決定します。中央値 (Q2) と上下四分位数 (Q1、Q3) に基づいて上限と下限を計算し、データ ポイントがこの境界を超えた場合に異常と判断します。
次は、Python を使用して時系列異常検出のための箱ひげ図メソッドを実装するコード例です:
import numpy as np import seaborn as sns def detect_outliers_boxplot(data): q1 = np.percentile(data, 25) q3 = np.percentile(data, 75) iqr = q3 - q1 outliers = [] for i in range(len(data)): if data[i] < q1 - 1.5 * iqr or data[i] > q3 + 1.5 * iqr: outliers.append(i) return outliers # 示例数据 data = [1, 2, 3, 4, 5, 20, 6, 7, 8, 9] # 绘制箱型图 sns.boxplot(data=data) # 检测异常值 outliers = detect_outliers_boxplot(data) print("异常数据索引:", outliers)
実行結果:
異常データ インデックス: [5]
2. 機械学習手法に基づく異常検出アルゴリズム
2.1 孤立フォレスト アルゴリズム
孤立フォレスト アルゴリズムは、教師なし学習に基づく異常検出手法です。決定木のセグメント化手法を使用して、データ ポイントの異常を判断します。分離フォレスト アルゴリズムでは、外れ値の特徴空間上の密度が低いと想定しているため、デシジョン ツリーを構築する際、外れ値のパス長は短くなります。
以下は、Python を使用して時系列異常検出のための分離フォレスト アルゴリズムを実装するコード例です:
from sklearn.ensemble import IsolationForest def detect_outliers_isolation_forest(data): model = IsolationForest(contamination=0.1, random_state=0) model.fit(data.reshape(-1, 1)) outliers = model.predict(data.reshape(-1, 1)) return np.where(outliers == -1)[0] # 示例数据 data = [1, 2, 3, 4, 5, 20, 6, 7, 8, 9] # 检测异常值 outliers = detect_outliers_isolation_forest(data) print("异常数据索引:", outliers)
実行結果:
異常なデータ インデックス: [5]
2.2 時系列分解法
時系列分解法は、時系列データを傾向、季節性、残差の 3 つの部分に分解し、分析することで、従来の統計手法に基づいた異常検出手法です。残差を測定して異常点を特定します。
次は、Python を使用して時系列異常検出のための時系列分解メソッドを実装するコード例です:
import statsmodels.api as sm def detect_outliers_time_series(data): decomposition = sm.tsa.seasonal_decompose(data, model='additive') residuals = decomposition.resid outliers = [] for i in range(len(residuals)): if abs(residuals[i]) > 2 * np.std(residuals): outliers.append(i) return outliers # 示例数据 data = [1, 7, 3, 4, 5, 20, 6, 7, 8, 9] # 检测异常值 outliers = detect_outliers_time_series(data) print("异常数据索引:", outliers)
実行結果:
異常なデータ インデックス: [1, 5]
結論
時系列に基づく異常検出の問題は、非常に重要かつ現実的な問題です。この記事では、統計的手法に基づく平均分散法と箱ひげ図法、および機械学習手法に基づく分離フォレスト アルゴリズムと時系列分解法という、一般的に使用される 2 つの異常検出手法を紹介します。上記のコード例を通じて、読者は Python を使用してこれらのアルゴリズムを実装し、異常検出のために実際の時系列データに適用する方法を理解できます。この記事が時系列異常検出に関して読者の役に立てば幸いです。
以上が時系列に基づく異常検出問題の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









C# を使用した時系列予測アルゴリズムの作成方法 時系列予測とは、過去のデータを分析することで将来のデータの傾向を予測する手法です。金融、販売、天気予報など、さまざまな分野で幅広く応用されています。この記事では、C#を使用した時系列予測アルゴリズムの書き方を具体的なコード例とともに紹介します。データの準備 時系列予測を実行する前に、まずデータを準備する必要があります。一般に、時系列データは十分な長さがあり、時系列に並べられている必要があります。データベースから取得するか、

XGBoost は、さまざまな予測問題を解決するために使用できる、人気のあるオープンソースの機械学習ライブラリです。時系列予測のために InfluxDB と組み合わせて使用する方法を理解する必要があります。翻訳者 | Li Rui によるレビュー | Sun Shujuan XGBoost は、最適化された分散勾配ブースティング アルゴリズムを実装するオープンソースの機械学習ライブラリです。 XGBoost は並列処理を使用して高速なパフォーマンスを実現し、欠損値を適切に処理し、小さなデータセットでも適切にパフォーマンスを発揮し、過剰適合を防ぎます。これらすべての利点により、XGBoost は予測などの回帰問題に対する一般的なソリューションになっています。予測は、予測分析、予知保全、製品計画、予算編成などのさまざまなビジネス目標にとってミッションクリティカルです。多くの予測または予想問題には時系列が含まれます

元のコンテンツの意味を変更したり、コンテンツを微調整したり、コンテンツを書き直したり、継続したりしないでください。 「分位回帰はこのニーズを満たし、定量化された確率で予測間隔を提供します。これは、特に応答変数の条件付き分布が重要な場合に、予測変数と応答変数の間の関係をモデル化するために使用される統計手法です。従来の回帰とは異なります」図 (A): 分位回帰 分位回帰の概念は推定です。一連の回帰子 X と変数の間の線形関係をモデル化する方法です。被説明変数 Y の分位数。既存の回帰モデルは、実際には被説明変数と説明変数の関係を調べる手法です。説明変数と被説明変数の関係に焦点を当てます。

今日は、時系列予測のパフォーマンスを向上させるために、時系列データを潜在空間上の大規模な自然言語処理 (NLP) モデルと整合させる方法を提案するコネチカット大学の最近の研究成果を紹介したいと思います。この方法の鍵は、潜在的な空間ヒント (プロンプト) を使用して時系列予測の精度を高めることです。論文タイトル: S2IP-LLM: SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting ダウンロードアドレス: https://arxiv.org/pdf/2403.05798v1.pdf 1. 大きな問題の背景モデル

マクリダキス M コンペティション シリーズ (それぞれ M4 と M5 として知られる) は、それぞれ 2018 年と 2020 年に開催されました (今年は M6 も開催されました)。知らない人のために説明すると、m シリーズは時系列エコシステムの現在の状態を要約したものであり、現在の理論と予測の実践に経験的かつ客観的な証拠を提供すると考えることができます。 2018 M4 の結果は、純粋な「ML」手法が従来の統計手法を当時予想外だった大幅なパフォーマンスで上回ることを示しました。 2 年後の M5[1] では、最高スコアは「ML」メソッドのみを使用したものでした。そして、上位 50 はすべて基本的に ML ベース (ほとんどがツリー モデル) です。このゲームはLightGを見た

PHP を使用して異常検出と不正分析を実装する方法 要約: 電子商取引の発展に伴い、不正行為は無視できない問題になっています。この記事では、PHP を使用して異常検出と不正分析を実装する方法を紹介します。ユーザーのトランザクション データと行動データを収集し、機械学習アルゴリズムと組み合わせることで、ユーザーの行動がシステム内でリアルタイムに監視および分析され、潜在的な不正行為が特定され、それに対応する措置が講じられます。キーワード: PHP、異常検出、不正分析、機械学習 1. はじめに 電子商取引の急速な発展に伴い、人々がインターネット上で行う取引の数は増加しています。

時系列は一連のデータ ポイントであり、通常は一定期間にわたって取得された連続した測定値で構成されます。時系列分析は、時系列データから意味のある情報を抽出して予測を行うために、統計手法を使用して時系列データをモデル化および分析するプロセスです。時系列分析は、データから貴重な情報を抽出し、将来の出来事を予測するために使用できる強力なツールです。これを使用して、傾向、季節パターン、変数間のその他の関係を特定できます。時系列分析は、販売、需要、価格の変化などの将来のイベントを予測するためにも使用できます。 Python で時系列データを操作している場合は、さまざまなライブラリから選択できます。そこでこの記事では、Python で時系列を扱うための最も人気のあるライブラリを整理します。 S

Python での ARMA モデルの詳細な説明 ARMA モデルは統計における重要なタイプの時系列モデルであり、時系列データの予測と分析に使用できます。 Python は、ARMA モデルを時系列モデリングに簡単に使用できる豊富なライブラリとツールボックスを提供します。この記事では、Python の ARMA モデルについて詳しく紹介します。 1. ARMA モデルとは ARMA モデルは、自己回帰モデル (AR モデル) と移動平均モデル (MA モデル) から構成される時系列モデルです。その中でもARモデルは
