Python ist eine beliebte Programmiersprache, die aufgrund ihrer leistungsstarken Datenverarbeitungs- und Visualisierungsfunktionen im Bereich der Datenwissenschaft weit verbreitet ist. Im Hinblick auf die Zeitreihenanalyse bietet Python eine Fülle von Tools und Bibliotheken, die uns bei der Verarbeitung und Analyse von Zeitreihendaten unterstützen. In diesem Artikel werden einige Beispiele für die Zeitreihenanalyse in Python vorgestellt.
1. Datenerfassung
In der Zeitreihenanalyse sind Zeitstempel- und Datumsobjekte die am häufigsten verwendeten Datentypen. Das integrierte Datetime-Modul von Python kann diese Art von Daten problemlos verarbeiten. Beim Abrufen von Zeitreihendaten können wir die von der Python-Pandas-Bibliothek bereitgestellten Datenlesefunktionen wie read_csv(), read_excel() und read_sql() verwenden.
Hier ist ein Beispielcode zum Lesen von Zeitreihendaten aus einer CSV-Datei:
pandas als pd importieren
matplotlib.pyplot als plt importieren
df = pd.read_csv('data.csv', parse_dates=['Datum ' ], index_col='Date')
print(df.head())
In diesem Beispiel verwenden wir die Funktion read_csv(), um die CSV-Datei zu lesen und setzen den Parameter parse_dates auf die Liste ['Date'] Konvertieren Sie Zeitstempel in Daten in Python-Datumsobjekte. Darüber hinaus haben wir auch den Parameter index_col als „Datum“ angegeben, um die Datumsspalte als Index der Daten zu verwenden.
2. Zeitreihenvisualisierung
Python bietet eine Vielzahl von Datenvisualisierungstools, von denen das am häufigsten verwendete die Matplotlib-Bibliothek ist. Wir können die Funktion plot() von matplotlib verwenden, um Zeitreihendaten zu zeichnen und die x-Achse auf die Zeitreihe festzulegen. Hier ist ein Beispielcode:
plt.plot(df.index, df['Value'])
plt.xlabel('Date')
plt.ylabel('Value')
plt.title('Time Series' )
plt.show()
Dieser Code verwendet die Zeitreihe in den Zeitreihendaten df als x-Achse, die Datenspalte als y-Achse und legt die horizontalen und vertikalen Achsenbeschriftungen und Titel des Diagramms vorher fest Zeichnung.
3. Stationaritätstest von Zeitreihen
Bei der Zeitreihenanalyse ist es normalerweise notwendig, die Stationarität der Daten zu testen. Der Mittelwert und die Varianz einer stationären Zeitreihe ändern sich im Laufe der Zeit nicht, was uns die Verwendung einiger robuster Analysemethoden wie autoregressive Modelle (AR) und Modelle mit gleitendem Durchschnitt (MA) ermöglicht.
Wir können die Statistikmodelle der Python-Statistikbibliothek verwenden, um den Stationaritätstest durchzuführen. Die Bibliothek stellt die Funktion adfuller() bereit, mit der die Dickey-Fuller-Testmethode zum Testen der Stationarität von Zeitreihendaten verwendet werden kann. Hier ist ein Beispielcode:
from statsmodels.tsa.stattools import adfuller
result = adfuller(df['Value'])
print('ADF Statistic: %f' % result[0])
print('p -value: %f' % result[1])
print('Critical Values:')
for key, value in result[4].items():
print(' %s: %.3f' % (key , value))
In diesem Beispiel verwenden wir den Wert von df['Value'] als Zeitreihendaten, die getestet werden müssen. Die Funktion adfuller() gibt die Testergebnisse und Schlüsselstatistiken zurück, die wir zur Analyse ausdrucken.
4. Saisonale Zerlegung von Zeitreihen
In der Zeitreihenanalyse ist die saisonale Zerlegung eine wichtige Analysemethode. Wir können eine saisonale Zerlegung von Zeitreihendaten mithilfe der Funktion „seasonal_decompose()“ durchführen, die von der Python-Bibliothek statsmodels bereitgestellt wird. Hier ist ein Beispielcode:
aus statsmodels.tsa.seasonal import saisonal_decompose
result = saisonal_decompose(df['Value'], model='multiplicative', period=12)
result.plot()
plt.show( )
In diesem Beispiel verwenden wir den Wert von df['Value'] als Zeitreihendaten, die zerlegt werden müssen, und legen die Parameter model='multiplicative' und period=12 fest, die jeweils die Verwendung des multiplikativen Modells angeben zur Zersetzung und jährlich. Tritt periodisch alle 12 Monate auf. Abschließend werden die Zerlegungsergebnisse grafisch dargestellt und angezeigt.
Fazit
In diesem Artikel werden einige klassische Beispiele für Python vorgestellt, die für die Zeitreihenanalyse verwendet werden, einschließlich Datenerfassung, Zeitreihenvisualisierung, Stationaritätstests und saisonale Zerlegung. Die oben genannten Methoden sind nur die Spitze des Eisbergs der Zeitreihenanalyse in Python. Durch kontinuierliches Lernen und Üben können wir verschiedene Methoden der Zeitreihenanalyse weiter beherrschen und bessere Ergebnisse erzielen.
Das obige ist der detaillierte Inhalt vonBeispiele für Zeitreihenanalysen in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!