時系列分析とは、過去の期間のイベントの特徴を使用して、将来の期間のイベントの特徴を予測することです。これは、回帰分析モデルの予測とは異なる、比較的複雑な予測モデリングの問題です。時系列モデルはイベントが発生する順序に依存します。順序が変更されると、同じサイズの値でも異なる結果が生成されます。 # タイミングの問題をすべて見る これは回帰問題ですが、回帰手法 (線形回帰、ツリー モデル、深層学習など) には特定の違いがあります。
タイミング解析には、静的タイミング解析 (STA) と動的タイミング解析が含まれます。
次に、いくつかの一般的なタイミング解析アルゴリズムを示します。
1 深層学習タイミング解析
RNN (リカレント ニューラル ネットワーク)この方法は時間を記憶できるため、時系列の間隔が短い問題を解くのに適しています
欠点:長期ステップ データは、勾配消失や勾配爆発の問題を起こしやすいです。
LSTM (Long Short-Term Memory Network)LSTM (Long Short-Term Memory Network) メモリ ネットワーク (Long Short-Term Memory) は、従来のリカレント ニューラル ネットワーク (RNN) に存在する長期依存問題を解決するために設計された時間的リカレント ニューラル ネットワークです。すべての RNN は、一連の繰り返されるニューラル ネットワーク モジュールで構成されています。
強み:非常に長い間隔と時系列の遅延を持つ重要なイベントの処理と予測に適しています。
欠点:モデル パラメーターが多すぎると過学習の問題が発生します
2 従来の時系列分析モデル
自動回帰 (AR)
移動平均 (MA)シンプルさ: AR モデルは、理解と実装が簡単な線形モデルです。過去の観測値のみを独立変数として使用し、他の複雑な要素を考慮する必要はありません。
モデリング機能: AR モデルは、時系列データの自己相関構造、つまり現在の観測と過去の観測の関係をキャプチャできます。将来の観測結果を予測し、データの傾向とパターンを明らかにします。移動平均法 (MA): この方法はデータの平均に基づいており、将来の値を仮定します。過去の値の間には一定の安定性があります。
強み:
時系列データの移動平均関係を捉えることができます。 MA モデルは、過去のタイム ステップからのホワイト ノイズ誤差項の線形結合を利用して現在の観測を予測するため、データの移動平均の性質を捉えます。
比較的シンプルで直感的です。 MA モデルのパラメーターは、過去のタイム ステップでのホワイト ノイズ誤差項の重みを表し、これらの重みを推定することでモデルをフィッティングできます。
欠点:
自己回帰移動平均モデル (ARMA モデル、自動回帰および移動平均モデル) は、時系列を研究するための重要な方法です。自己回帰モデル(ARモデル)と移動平均モデル(MAモデル)を「混合」したもので、適用範囲が広く、予測誤差が小さいという特徴があります。
ARIMA モデルは、自己回帰差分移動平均モデルの略称で、正式名称は自己回帰統合移動平均モデルです。このモデルは主に、自己回帰モデル (AR)、差分プロセス (I)、移動平均モデル (MA) の 3 つの部分で構成されます。
ARIMA の基本的な考え方モデルはデータを使用することです。独自の履歴情報を使用して将来を予測します。ある時点のタグ値は、過去の期間のタグ値と過去の期間の偶発的イベントの両方の影響を受けます。つまり、ARIMA モデルでは、タグ値が時間の一般的な傾向に沿って変動すると仮定しています。トレンドは過去のラベルに影響され、変動は期間内の偶然の出来事に影響され、全体的なトレンド自体は必ずしも安定しているわけではありません
ARIMA モデルは、時系列分析手法の抜粋です。データの自己相関と差異をモデル化することでデータに隠された時系列パターンを解析し、将来のデータを予測します
これら 3 つの部分を組み合わせることで、ARIMA モデルはデータのトレンド変化を捉えるだけでなく、一時的な突然の変化や大きなノイズを含むデータを処理することもできます。したがって、ARIMA モデルは、多くの時系列予測問題で良好なパフォーマンスを発揮します。
強み:
モデルの構築は非常にシンプルで、他の外生変数に頼ることなく内生変数のみを使用します。いわゆる内生変数は、他の変数のサポートを必要とする回帰モデルとは異なり、データ自体にのみ依存する変数を指します。
欠点:
時系列データは安定している、または差分処理後に安定する
本質的には、線形関係のみを捕捉できますが、非線形関係は捕捉できません。
SARIMA は、季節データに関する ARIMA モデルを拡張した、一般的に使用される時系列分析手法です。 SARIMA モデルを使用すると、年間売上高や週ごとの Web サイト訪問数などの季節時系列データを予測できます。 SARIMA モデルの長所と短所は次のとおりです。
長所:
欠点:
季節的自己回帰統合移動平均モデル (SARIMAX) は、差分モデルに基づくモデルです。移動自己回帰モデル (ARIMA) と外因性回帰変数。これは、明らかな周期的および季節的特性を持つ時系列データに適しています
このタイプの方法は、lightgbm および xgboost で表されます。系列の問題は教師あり学習に変換され、特徴量エンジニアリングと機械学習の手法によって予測されます。このモデルは、複雑な時系列予測モデルの大部分を解決できます。複雑なデータ モデリング、多変数協調回帰、非線形問題をサポートします。
特徴量エンジニアリングの重要性は自明のことであり、機械学習の成功において重要な役割を果たします。ただし、特徴量エンジニアリングは単純な作業ではなく、複雑な手動処理と独自の専門知識が必要です。多くの場合、特徴量エンジニアリングのレベルによって機械学習の上限が決まり、機械学習アルゴリズムは可能な限りこの上限に近づきます。 特徴エンジニアリングが完了すると、ツリー モデル アルゴリズム (lightgbm および xgboost) を直接適用できます。これら 2 つのモデルは非常に一般的で効率的なモデリング方法です。さらに、次のような特徴もあります:
#具体的な方法は、データの性質、問題の特性、ご自身の経験や能力などを考慮して総合的に検討する必要があります。
特定のデータ特性、問題要件、およびユーザー自身の能力に基づいて、適切な時系列予測方法を選択する必要があります。場合によっては、複数の方法を組み合わせることで、予測の精度と安定性が向上することがあります。同時に、より適切にモデルを選択し、予測結果を評価するには、データの視覚的な分析とモデルの診断を実行することも重要です。
以上がタイミング解析で一般的に使用されるアルゴリズムはすべてここにありますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。