NumPy steht für Numerical Python. Die leistungsstärkste Funktion von NumPy ist das n-dimensionale Array. Diese Bibliothek enthält außerdem grundlegende lineare Algebrafunktionen, Fourier-Transformationen, erweiterte Zufallszahlenfunktionen und Tools für die Integration mit anderen Low-Level-Sprachen wie Fortran, C und C
SciPy steht für Scientific Python. SciPy basiert auf NumPy. Es handelt sich um eine der nützlichsten Bibliotheken für eine Vielzahl hochwertiger wissenschaftlicher und technischer Module wie diskrete Fourier-Transformation, lineare Algebra, Optimierung und Sparse-Matrizen.
Matplotlib zum Zeichnen einer Vielzahl von Diagrammen, angefangen von Histogrammen über Liniendiagramme bis hin zu Wärmediagrammen. Sie können die Pylab-Funktion im ipython-Notebook (ipython notebook –pylab = inline) verwenden, um diese Plotfunktionen inline zu verwenden. Wenn Sie die Inline-Option ignorieren, konvertiert Pylab die Ipython-Umgebung in eine Umgebung, die Matlab sehr ähnlich ist. Sie können auch Latex-Befehle verwenden, um Mathematik zu Ihrem Plot hinzuzufügen.
Pandas für strukturierte Datenoperationen und -manipulationen. Es wird häufig zur Datenerfassung und -aufbereitung verwendet. Pandas wurden Python erst vor relativ kurzer Zeit hinzugefügt und haben maßgeblich dazu beigetragen, die Nutzung von Python in der Datenwissenschaftler-Community zu steigern.
Scikit Learn für maschinelles Lernen. Diese Bibliothek basiert auf NumPy, SciPy und Matplotlib und enthält viele effiziente Tools für maschinelles Lernen und statistische Modellierung, einschließlich Klassifizierung, Regression, Clustering und Dimensionsreduktion.
Statsmodels für statistische Modellierung. Statsmodels ist ein Python-Modul, mit dem Benutzer Daten untersuchen, statistische Modelle schätzen und statistische Tests durchführen können. Für verschiedene Datentypen und jeden Schätzer steht eine umfangreiche Liste deskriptiver Statistiken, statistischer Tests, Darstellungsfunktionen und Ergebnisstatistiken zur Verfügung.
Seaborn zur statistischen Datenvisualisierung. Seaborn ist eine Bibliothek zur Erstellung attraktiver und informativer statistischer Grafiken in Python. Es basiert auf Matplotlib. Seaborn möchte die Visualisierung zu einem zentralen Bestandteil der Erforschung und des Verständnisses von Daten machen.
Bokeh zum Erstellen interaktiver Diagramme, Dashboards und Datenanwendungen in modernen Webbrowsern. Es ermöglicht dem Benutzer, elegante und prägnante Grafiken im Stil von D3.js zu erstellen. Darüber hinaus verfügt es über die Fähigkeit einer leistungsstarken Interaktivität über sehr große oder Streaming-Datensätze.
Blaze für die Erweiterung der Funktionalität von Numpy und Pandas auf verteilte und Streaming-Datensätze. Es kann für den Zugriff auf Daten aus einer Vielzahl von Quellen verwendet werden, darunter Bcolz, MongoDB, SQLAlchemy, Apache Spark, PyTables usw. Zusammen mit Bokeh kann Blaze als sehr leistungsstarkes Tool zum Erstellen effektiver Visualisierungen und Dashboards für große Datenmengen fungieren.
Scrapy für das Web-Crawling. Es ist ein sehr nützliches Framework zum Abrufen spezifischer Datenmuster. Es bietet die Möglichkeit, mit der Home-URL einer Website zu beginnen und dann die Webseiten innerhalb der Website zu durchsuchen, um Informationen zu sammeln.
SymPy für symbolische Berechnungen. Es verfügt über weitreichende Fähigkeiten, von grundlegender symbolischer Arithmetik bis hin zu Analysis, Algebra, diskreter Mathematik und Quantenphysik. Eine weitere nützliche Funktion ist die Möglichkeit, das Ergebnis der Berechnungen als LaTeX-Code zu formatieren.
Anfragen für den Zugriff auf das Internet. Es funktioniert ähnlich wie die Standard-Python-Bibliothek urllib2, ist aber viel einfacher zu programmieren. Sie werden subtile Unterschiede zu urllib2 feststellen, aber für Anfänger ist „Requests“ möglicherweise bequemer.
Zusätzliche Bibliotheken, die Sie möglicherweise benötigen:
Betriebssystem für Betriebssystem- und Dateivorgänge
networkx und igraph für diagrammbasierte Datenmanipulationen
reguläre Ausdrücke zum Finden von Mustern in Textdaten
BeautifulSoup zum Scrapping-Web. Es ist Scrapy unterlegen, da es in einem Durchlauf Informationen von nur einer einzelnen Webseite extrahiert.
Datenwissenschaftliche Ressourcen: https://t.me/DataScienceResourcesTP
Das obige ist der detaillierte Inhalt vonNützliche PYTHON-Bibliotheken für Data Science. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!