


Wie kann ich Ausreißer in einem Pandas-DataFrame mithilfe von Standardabweichungen erkennen und ausschließen?
Ausreißer in einem Pandas-Datenrahmen mithilfe von Standardabweichungen erkennen und ausschließen
Ausreißer sind Datenpunkte, die erheblich vom Rest der Daten in einem abweichen Verteilung. Das Identifizieren und Ausschließen von Ausreißern kann die Datenanalyse verbessern, indem verzerrte oder verrauschte Beobachtungen entfernt werden. Pandas bietet mehrere Methoden zum Umgang mit Ausreißern, einschließlich der Verwendung von Standardabweichungen.
Um Zeilen mit Werten auszuschließen, die eine bestimmte Anzahl von Standardabweichungen vom Mittelwert überschreiten, können wir die Funktion scipy.stats.zscore verwenden. Diese Funktion berechnet den Z-Score für jeden Datenpunkt und stellt die Anzahl der Standardabweichungen dar, um die er vom Mittelwert abweicht.
import pandas as pd import numpy as np from scipy import stats # Create a sample dataframe df = pd.DataFrame({'Vol': [1200, 1230, 1250, 1210, 4000]}) # Calculate Z-score for the 'Vol' column zscores = stats.zscore(df['Vol']) # Exclude rows with Z-score greater than 3 filtered_df = df[np.abs(zscores) < 3]
Dieser Ansatz erkennt und schließt Ausreißer speziell in der Spalte „Vol“ aus. Für mehr Flexibilität können wir diesen Filter auf mehrere Spalten gleichzeitig anwenden:
# Calculate Z-scores for all columns zscores = stats.zscore(df) # Exclude rows with any column Z-score greater than 3 filtered_df = df[(np.abs(zscores) < 3).all(axis=1)]
Durch Anpassen des Schwellenwerts (in diesem Fall 3) können wir den Grad des Ausschlusses von Ausreißern steuern. Ein kleinerer Schwellenwert führt zu einer konservativeren Ausreißererkennung, während ein größerer Schwellenwert mehr potenzielle Ausreißer ausschließt.
Mit diesem Ansatz können wir Ausreißer effektiv identifizieren und entfernen, die die Analyse unseres Pandas DataFrame verzerren könnten.
Das obige ist der detaillierte Inhalt vonWie kann ich Ausreißer in einem Pandas-DataFrame mithilfe von Standardabweichungen erkennen und ausschließen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wie kann man nicht erkannt werden, wenn Sie Fiddlereverywhere für Man-in-the-Middle-Lesungen verwenden, wenn Sie FiddLereverywhere verwenden ...

Fastapi ...

Verwenden Sie Python im Linux -Terminal ...

Wie lehre ich innerhalb von 10 Stunden die Grundlagen für Computer -Anfänger für Programmierungen? Wenn Sie nur 10 Stunden Zeit haben, um Computer -Anfänger zu unterrichten, was Sie mit Programmierkenntnissen unterrichten möchten, was würden Sie dann beibringen ...

Über Pythonasyncio ...

Verständnis der Anti-Crawling-Strategie von Investing.com Viele Menschen versuchen oft, Nachrichten von Investing.com (https://cn.investing.com/news/latest-news) zu kriechen ...

Laden Sie die Gurkendatei in Python 3.6 Umgebungsfehler: ModulenotFoundError: Nomodulenamed ...

Diskussion über die Gründe, warum Pipeline -Dateien beim Lernen und Verwendung von Scapy -Crawlern für anhaltende Datenspeicher nicht geschrieben werden können, können Sie auf Pipeline -Dateien begegnen ...
