$ pip install ipyvolume



Neun äußerst nützliche Python-Bibliotheken für die Datenwissenschaft
In diesem Artikel werden wir uns einige andere Python-Bibliotheken für datenwissenschaftliche Aufgaben ansehen als die gängigeren Bibliotheken wie Panda, Scikit-Learn und Matplotlib. Obwohl Bibliotheken wie Panda und Scikit-Learn häufig für maschinelle Lernaufgaben verwendet werden, ist es immer von Vorteil, andere Python-Produkte in diesem Bereich zu verstehen.
1. Wget
Das Extrahieren von Daten aus dem Internet ist eine der wichtigen Aufgaben eines Datenwissenschaftlers. Wget ist ein kostenloses Dienstprogramm, mit dem nicht interaktive Dateien aus dem Internet heruntergeladen werden können. Es unterstützt die Protokolle HTTP, HTTPS und FTP sowie den Dateiabruf über den HTTP-Proxy. Da es nicht interaktiv ist, kann es im Hintergrund arbeiten, auch wenn der Benutzer nicht angemeldet ist. Wenn Sie also das nächste Mal alle Bilder einer Website oder Seite herunterladen möchten, kann Ihnen wget helfen.
Installation:
$ pip install wget
Beispiel:
import wget url = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3' filename = wget.download(url) 100% [................................................] 3841532 / 3841532 filename 'razorback.mp3'
2. Pendulum
Für diejenigen, die beim Umgang mit Datum und Uhrzeit in Python frustriert sind, ist Pendulum genau das Richtige. Es handelt sich um ein Python-Paket, das Datum/Uhrzeit-Operationen vereinfacht. Es ist ein einfacher Ersatz für die nativen Klassen von Python. Weitere Informationen finden Sie in der Dokumentation.
Installation:
$ pip install pendulum
Beispiel:
import pendulum dt_toronto = pendulum.datetime(2012, 1, 1, tz='America/Toronto') dt_vancouver = pendulum.datetime(2012, 1, 1, tz='America/Vancouver') print(dt_vancouver.diff(dt_toronto).in_hours()) 3
3. imbalanced-learn
Es ist ersichtlich, dass die meisten Klassifizierungsalgorithmen am besten funktionieren, wenn die Anzahl der Stichproben in jeder Klasse grundsätzlich gleich ist, das heißt, das Datengleichgewicht muss sein gepflegt. Bei den meisten realen Fällen handelt es sich jedoch um unausgeglichene Datensätze, die einen großen Einfluss auf die Lernphase und die nachfolgenden Vorhersagen des Algorithmus für maschinelles Lernen haben. Glücklicherweise ist diese Bibliothek darauf ausgelegt, dieses Problem zu lösen. Es ist mit scikit-learn kompatibel und Teil des scikit-lear-contrib-Projekts. Versuchen Sie es, wenn Sie das nächste Mal auf einen unausgeglichenen Datensatz stoßen.
Installation:
$ pip install -U imbalanced-learn # 或者 $ conda install -c conda-forge imbalanced-learn
Beispiel:
Nutzung und Beispiele finden Sie in der Dokumentation.
4. FlashText
Bei NLP-Aufgaben erfordert das Bereinigen von Textdaten häufig das Ersetzen von Schlüsselwörtern in Sätzen oder das Extrahieren von Schlüsselwörtern aus Sätzen. In der Regel kann dies mithilfe regulärer Ausdrücke erfolgen. Dies kann jedoch umständlich werden, wenn die Anzahl der gesuchten Begriffe in die Tausende geht. Das FlashText-Modul von Python basiert auf dem FlashText-Algorithmus und bietet für diese Situation eine geeignete Alternative. Das Tolle an FlashText ist, dass die Laufzeit unabhängig von der Anzahl der Suchbegriffe gleich ist. Mehr erfahren Sie hier.
Installation:
$ pip install flashtext
Beispiel:
Schlüsselwörter extrahieren
from flashtext import KeywordProcessor keyword_processor = KeywordProcessor() # keyword_processor.add_keyword(<unclean name>, <standardised name>) keyword_processor.add_keyword('Big Apple', 'New York') keyword_processor.add_keyword('Bay Area') keywords_found = keyword_processor.extract_keywords('I love Big Apple and Bay Area.') keywords_found ['New York', 'Bay Area']
Schlüsselwörter ersetzen
keyword_processor.add_keyword('New Delhi', 'NCR region') new_sentence = keyword_processor.replace_keywords('I love Big Apple and new delhi.') new_sentence 'I love New York and NCR region.' Fuzzywuzzy
5. Fuzzywuzzy klingt seltsam, aber wenn es um den String-Abgleich geht, ist Fuzzywuzzy eine sehr nützliche Bibliothek. Vorgänge wie die Berechnung des String-Matching-Grades und des Token-Matching-Grades können problemlos implementiert werden, und in verschiedenen Datenbanken gespeicherte Datensätze können ebenfalls problemlos abgeglichen werden.
Installation:
$ pip install fuzzywuzzy
Beispiele:
from fuzzywuzzy import fuzz from fuzzywuzzy import process # 简单匹配度 fuzz.ratio("this is a test", "this is a test!") 97 # 模糊匹配度 fuzz.partial_ratio("this is a test", "this is a test!") 100
Weitere interessante Beispiele finden Sie im GitHub-Repository.
6. PyFlux
Die Zeitreihenanalyse ist eines der häufigsten Probleme im Bereich des maschinellen Lernens. PyFlux ist eine Open-Source-Bibliothek in Python, die für die Arbeit mit Zeitreihenproblemen entwickelt wurde. Die Bibliothek verfügt über eine hervorragende Sammlung moderner Zeitreihenmodelle, darunter unter anderem ARIMA-, GARCH- und VAR-Modelle. Kurz gesagt bietet PyFlux einen probabilistischen Ansatz zur Zeitreihenmodellierung. Einen Versuch wert.
Installation
pip install pyflux
Beispiele
Detaillierte Informationen zur Verwendung und Beispiele finden Sie in der offiziellen Dokumentation.
7. Ipyvolume
Die Ergebnisanzeige ist auch ein wichtiger Aspekt in der Datenwissenschaft. Die Möglichkeit, die Ergebnisse visualisieren zu können, wird ein großer Vorteil sein. IPyvolume ist eine Python-Bibliothek, die 3D-Volumina und Grafiken (z. B. 3D-Streudiagramme usw.) in Jupyter-Notebooks visualisieren kann und nur einen geringen Konfigurationsaufwand erfordert. Es befindet sich jedoch noch in der Version vor 1.0. Eine passendere Metapher zur Erklärung ist: „Volshow“ von IPyvolume ist für dreidimensionale Arrays genauso nützlich wie „imshow“ von matplotlib für zweidimensionale Arrays. Mehr gibt es hier. R Verwenden Sie PIPre$ pip install ipyvolume
Nach dem Login kopierenE
, um Conda/Anaconda zu verwenden. Es basiert auf Flask, Plotly.js und React.js und ist an viele moderne UI-Elemente wie Dropdown-Felder, Schieberegler und Diagramme gebunden. Sie können Python-Code direkt verwenden, um relevante Analysen zu schreiben, ohne Javascript verwenden zu müssen. Dash eignet sich hervorragend zum Erstellen von Datenvisualisierungsanwendungen. Diese Anwendungen können dann in einem Webbrowser gerendert werden. Die Bedienungsanleitung finden Sie hier. Installation$ pip install ipyvolume
$ conda install -c conda-forge ipyvolume
九、Gym
OpenAI 的 Gym 是一款用于增强学习算法的开发和比较工具包。它兼容任何数值计算库,如 TensorFlow 或 Theano。Gym 库是测试问题集合的必备工具,这个集合也称为环境 —— 你可以用它来开发你的强化学习算法。这些环境有一个共享接口,允许你进行通用算法的编写。
安装
pip install gym
例子这个例子会运行CartPole-v0环境中的一个实例,它的时间步数为 1000,每一步都会渲染整个场景。
总结
以上这些有用的数据科学 Python 库都是我精心挑选出来的,不是常见的如 numpy 和 pandas 等库。如果你知道其它库,可以添加到列表中来,请在下面的评论中提一下。另外别忘了先尝试运行一下它们。
Das obige ist der detaillierte Inhalt vonNeun äußerst nützliche Python-Bibliotheken für die Datenwissenschaft. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

PHP ist hauptsächlich prozedurale Programmierung, unterstützt aber auch die objektorientierte Programmierung (OOP). Python unterstützt eine Vielzahl von Paradigmen, einschließlich OOP, funktionaler und prozeduraler Programmierung. PHP ist für die Webentwicklung geeignet, und Python eignet sich für eine Vielzahl von Anwendungen wie Datenanalyse und maschinelles Lernen.

Zu den Kernvorteilen von PHP gehören einfacher Lernen, starke Unterstützung für Webentwicklung, reiche Bibliotheken und Rahmenbedingungen, hohe Leistung und Skalierbarkeit, plattformübergreifende Kompatibilität und Kosteneffizienz. 1) leicht zu erlernen und zu bedienen, geeignet für Anfänger; 2) gute Integration in Webserver und unterstützt mehrere Datenbanken. 3) leistungsstarke Frameworks wie Laravel; 4) hohe Leistung kann durch Optimierung erzielt werden; 5) mehrere Betriebssysteme unterstützen; 6) Open Source, um die Entwicklungskosten zu senken.

PHP eignet sich für Webentwicklung und schnelles Prototyping, und Python eignet sich für Datenwissenschaft und maschinelles Lernen. 1.PHP wird für die dynamische Webentwicklung verwendet, mit einfacher Syntax und für schnelle Entwicklung geeignet. 2. Python hat eine kurze Syntax, ist für mehrere Felder geeignet und ein starkes Bibliotheksökosystem.

Python eignet sich besser für Anfänger mit einer reibungslosen Lernkurve und einer kurzen Syntax. JavaScript ist für die Front-End-Entwicklung mit einer steilen Lernkurve und einer flexiblen Syntax geeignet. 1. Python-Syntax ist intuitiv und für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet. 2. JavaScript ist flexibel und in Front-End- und serverseitiger Programmierung weit verbreitet.

PHP ist eine serverseitige Skriptsprache, die für dynamische Webentwicklung und serverseitige Anwendungen verwendet wird. 1.PHP ist eine interpretierte Sprache, die keine Zusammenstellung erfordert und für die schnelle Entwicklung geeignet ist. 2. PHP -Code ist in HTML eingebettet, wodurch es einfach ist, Webseiten zu entwickeln. 3. PHP verarbeitet die serverseitige Logik, generiert die HTML-Ausgabe und unterstützt Benutzerinteraktion und Datenverarbeitung. 4. PHP kann mit der Datenbank interagieren, die Einreichung von Prozessformularen und serverseitige Aufgaben ausführen.

VS -Code kann zum Schreiben von Python verwendet werden und bietet viele Funktionen, die es zu einem idealen Werkzeug für die Entwicklung von Python -Anwendungen machen. Sie ermöglichen es Benutzern: Installation von Python -Erweiterungen, um Funktionen wie Code -Abschluss, Syntax -Hervorhebung und Debugging zu erhalten. Verwenden Sie den Debugger, um Code Schritt für Schritt zu verfolgen, Fehler zu finden und zu beheben. Integrieren Sie Git für die Versionskontrolle. Verwenden Sie Tools für die Codeformatierung, um die Codekonsistenz aufrechtzuerhalten. Verwenden Sie das Lining -Tool, um potenzielle Probleme im Voraus zu erkennen.

PHP entstand 1994 und wurde von Rasmuslerdorf entwickelt. Es wurde ursprünglich verwendet, um Website-Besucher zu verfolgen und sich nach und nach zu einer serverseitigen Skriptsprache entwickelt und in der Webentwicklung häufig verwendet. Python wurde Ende der 1980er Jahre von Guidovan Rossum entwickelt und erstmals 1991 veröffentlicht. Es betont die Lesbarkeit und Einfachheit der Code und ist für wissenschaftliche Computer, Datenanalysen und andere Bereiche geeignet.

VS -Code -Erweiterungen stellen böswillige Risiken dar, wie das Verstecken von böswilligem Code, das Ausbeutetieren von Schwachstellen und das Masturbieren als legitime Erweiterungen. Zu den Methoden zur Identifizierung böswilliger Erweiterungen gehören: Überprüfung von Verlegern, Lesen von Kommentaren, Überprüfung von Code und Installation mit Vorsicht. Zu den Sicherheitsmaßnahmen gehören auch: Sicherheitsbewusstsein, gute Gewohnheiten, regelmäßige Updates und Antivirensoftware.
