


Erklärung des Python-äquivalenten Codes für automatisches maschinelles Lernen
Einführung
Maschinelles Lernen ist ein sich schnell entwickelndes Feld und es entstehen ständig neue Technologien und Algorithmen. Allerdings kann die Erstellung und Verbesserung von Modellen für maschinelles Lernen eine zeitaufwändige und herausfordernde Aufgabe sein, die ein hohes Maß an Fachwissen erfordert. Automatisiertes maschinelles Lernen, oft auch als AutoML bezeichnet, zielt darauf ab, den Prozess der Erstellung und Optimierung von Modellen für maschinelles Lernen zu vereinfachen, indem einige der mühsamen Aufgaben wie Feature-Engineering, Hyperparameter-Tuning und Modellauswahl automatisiert werden.
auto-sklearn ist ein leistungsstarkes Open-Source-Framework für automatisiertes maschinelles Lernen, das auf scikit-learn basiert, einer der bekanntesten Bibliotheken für maschinelles Lernen in Python. Es sucht automatisch nach potenziellen Machine-Learning-Pipelines in einem bestimmten Datensatz durch Bayes'sche Optimierung und Meta-Learning und identifiziert automatisch die besten Modelle und Hyperparameter. In diesem Tutorial wird die Verwendung von Auto-sklearn in Python vorgestellt, einschließlich Anleitungen zur Installation, zum Importieren von Daten, zur Datenvorbereitung, zum Erstellen und Trainieren von Modellen sowie zum Bewerten von Modelleffekten. Selbst Anfänger können mit Auto-sklearn schnell und einfach leistungsstarke Modelle für maschinelles Lernen erstellen.
So gehen Sie mit Fehlern in Node-Red um
Auto-sklearn
Automatisieren Sie die Erstellung und kontinuierliche Verbesserung von Modellen für maschinelles Lernen mit dem effizienten Open-Source-Softwareprogramm Auto-sklearn. Finden Sie automatisch das ideale Modell und die idealen Hyperparameter für einen bestimmten Datensatz mithilfe von Bayes'scher Optimierung und Meta-Learning, die wiederum auf dem bekannten Programm für maschinelles Lernen scikit-learn basieren.
Nur einige der von autosklearn für Klassifizierungs- und Regressionsprobleme erstellten Anwendungen umfassen die Verarbeitung natürlicher Sprache, Bildklassifizierung und Zeitreihenvorhersage.
Die Bibliothek durchsucht eine Sammlung potenzieller maschineller Lernprozesse, einschließlich Feature-Engineering, Modellauswahl und Datenvorbereitungsprozesse. Es nutzt die Bayes'sche Optimierung, um diesen Bereich effizient zu durchsuchen, und verbessert die Sucheffizienz gegenüber früheren Tests kontinuierlich durch Meta-Learning.
Darüber hinaus bietet Auto-sklearn eine Reihe leistungsstarker Funktionen, darunter dynamische Ensembleauswahl, automatische Modellintegration und aktives Lernen. Darüber hinaus bietet es eine benutzerfreundliche API zum Entwickeln, Testen und Trainieren von Modellen.
AutoML-Code
Lassen Sie uns nun den AutoML-Code mithilfe von Auto-sklearn genauer untersuchen. Wir werden den Digits-Datensatz von scikit-learn verwenden, bei dem es sich um einen Datensatz handgeschriebener Ziffern handelt. Das Ziel besteht darin, Zahlen anhand von Zahlenbildern vorherzusagen. Hier ist der Code -
Die chinesische Übersetzung vonProgramm
lautet:Programm
import autosklearn.classification from sklearn.datasets import load_digits from sklearn.model_selection import train_test_split # Load the dataset X, y = load_digits(return_X_y=True) X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1) # Create and fit the AutoML model automl = autosklearn.classification.AutoSklearnClassifier(time_left_for_this_task=180, per_run_time_limit=30) automl.fit(X_train, y_train) # Evaluate the model on the test set print("Accuracy:", automl.score(X_test, y_test))
Ausgabe
Accuracy: 0.9866666666666667
Code-Erklärung
Dieses Programm nutzt automatisiertes maschinelles Lernen (AutoML), um handgeschriebene Ziffern aus dem MNIST-Datensatz zu klassifizieren, einschließlich der Verwendung des Auto-sklearn-Moduls. Hier ist eine kurze Übersicht über den Code −
Importieren Sie die AutoSklearnClassifier-Klasse aus dem autosklearn.classification-Modul. Diese Klasse enthält das AutoML-Klassifizierungsmodell, das verwendet wird.
Ladefunktion „load_digits“ aus sklearn.datasets importieren: Dadurch wird die Funktion „load_digits“ des MNIST-Datensatzes aus dem Paket „sklearn.datasets“ importiert.
Wählen Sie ein Modell von sklearn. Der MNIST-Datensatz wird mithilfe der Train-Test-Split-Funktion im hier importierten Auswahlmodul sklearn.model in einen Trainingssatz und einen Testsatz unterteilt.
Der MNIST-Datensatz wird geladen, die Eingabemerkmale werden in X und die entsprechenden Beschriftungen in Y gespeichert. X, y = load_digits(return_X_y=True): Dadurch wird der MNIST-Datensatz geladen.
X-Trainingssatz, Seed-Satz auf 1, um die Reproduzierbarkeit sicherzustellen
Automl entspricht autosklearn.classification. AutoSklearnClassifier (Zeitlimit pro Lauf = 30, verbleibende Zeit für diese Aufgabe = 180): Bilden Sie ein auf dem MNIST-Datensatz trainiertes AutoML-Modell in eine Instanz der AutoSklearnClassifier-Klasse. Das Zeitlimit pro Ausführung stellt die maximale Zeit (in Sekunden) dar, die jedes einzelne Modell ausführen kann, während die verbleibende Zeit für diese Aufgabe die maximale Zeit (in Sekunden) darstellt, die der AutoML-Prozess ausführen kann. -
.
Der obige Code implementiert die AutoML-Methode, eine maschinelle Lerntechnologie, die jeden Schritt des Modellerstellungsprozesses automatisiert, einschließlich Funktionsauswahl, Hyperparameter-Tuning und Datenvorbereitung. Auch Nicht-Experten können mit Hilfe von AutoML leistungsstarke Modelle erstellen, was den manuellen Aufwand für die Erstellung von Machine-Learning-Modellen reduziert.
Importieren Sie zunächst die erforderlichen Bibliotheken wie Pandas, Numpy, Sklearn und Tpot in den Code. Sklearn wird für maschinelle Lernaufgaben wie Datenvorverarbeitung, Modellauswahl und -bewertung verwendet, Pandas wird für die Datenmanipulation verwendet und NumPy wird für numerische Berechnungen verwendet. Die Hauptbibliothek, die AutoML-Algorithmen implementiert, ist TPOT.
Laden Sie dann den Datensatz mit der Funktion read_csv von Pandas und speichern Sie die Eingabemerkmale und Ausgabebeschriftungen separat in verschiedenen Variablen. Die Variable „y“ enthält die Beschriftungen der Ausgabe, während die Variable „X“ die Merkmale der Eingabe speichert.
Um die Daten anzupassen und das Modell für maschinelles Lernen zu generieren, lädt der Code zunächst den Datensatz und erstellt dann eine Instanz der TPOTRegressor-Klasse. Die TPOTSRegressor-Klasse ist eine Unterklasse der TPOTBase-Klasse und verwendet einen genetischen Algorithmus, um Features auszuwählen und Hyperparameter anzupassen. Die TPOTRegressor-Klasse behandelt Regressionsprobleme, während die TPOTClassifier-Klasse Klassifizierungsprobleme behandelt.
Verwenden Sie die Train-Test-Split-Methode von Sklearn, um den Datensatz in einen Trainingssatz und einen Testsatz aufzuteilen. Beim maschinellen Lernen ist es üblich, die Daten in zwei Sätze aufzuteilen: einen Trainingssatz zur Anpassung des Modells und einen Testsatz zur Bewertung der Modellleistung.
Sobald die Daten aufgeteilt sind, wird die Fit-Methode der TPOTRegressor-Instanz aufgerufen, die das Modell basierend auf den Trainingsdaten anpasst. Bei der Fit-Technologie wird ein genetischer Algorithmus verwendet, um die optimale Teilmenge von Merkmalen und Hyperparametern für die gegebenen Daten zu finden. Das beste Modell wird dann zurückgegeben.
Der Code bewertet dann die Leistung des Modells im Testsatz, um mithilfe einer Bewertungsmethode die Genauigkeit des Modells zu bestimmen. Der Genauigkeitswert gibt an, wie gut das Modell zu den Daten passt, wobei Werte näher bei 1 auf eine bessere Anpassung hinweisen.
Das beste Modell wird dann mithilfe der Exportfunktion zusammen mit seiner Genauigkeitsbewertung für den Testsatz in eine Python-Datei exportiert.
Fazit
Zusammenfassend ist Auto-sklearn eine leistungsstarke Bibliothek, die den Prozess der Erstellung und Verbesserung von Modellen für maschinelles Lernen vereinfacht. Es spart Zeit und Aufwand, indem automatisch das beste Modell und die besten Hyperparameter für einen bestimmten Datensatz gefunden werden. In diesem Tutorial wird die Verwendung von Auto-sklearn in Python erläutert, einschließlich Anleitungen zur Installation, zum Importieren von Daten, zum Vorbereiten von Daten, zum Erstellen und Trainieren von Modellen sowie zum Bewerten der Modellleistung. Selbst Anfänger können mit Auto-sklearn schnell und einfach leistungsstarke Modelle für maschinelles Lernen erstellen.
Das obige ist der detaillierte Inhalt vonErklärung des Python-äquivalenten Codes für automatisches maschinelles Lernen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



PHP und Python haben ihre eigenen Vor- und Nachteile, und die Wahl hängt von den Projektbedürfnissen und persönlichen Vorlieben ab. 1.PHP eignet sich für eine schnelle Entwicklung und Wartung großer Webanwendungen. 2. Python dominiert das Gebiet der Datenwissenschaft und des maschinellen Lernens.

Aktivieren Sie die Pytorch -GPU -Beschleunigung am CentOS -System erfordert die Installation von CUDA-, CUDNN- und GPU -Versionen von Pytorch. Die folgenden Schritte führen Sie durch den Prozess: Cuda und Cudnn Installation Bestimmen Sie die CUDA-Version Kompatibilität: Verwenden Sie den Befehl nvidia-smi, um die von Ihrer NVIDIA-Grafikkarte unterstützte CUDA-Version anzuzeigen. Beispielsweise kann Ihre MX450 -Grafikkarte CUDA11.1 oder höher unterstützen. Download und installieren Sie Cudatoolkit: Besuchen Sie die offizielle Website von Nvidiacudatoolkit und laden Sie die entsprechende Version gemäß der höchsten CUDA -Version herunter und installieren Sie sie, die von Ihrer Grafikkarte unterstützt wird. Installieren Sie die Cudnn -Bibliothek:

Python und JavaScript haben ihre eigenen Vor- und Nachteile in Bezug auf Gemeinschaft, Bibliotheken und Ressourcen. 1) Die Python-Community ist freundlich und für Anfänger geeignet, aber die Front-End-Entwicklungsressourcen sind nicht so reich wie JavaScript. 2) Python ist leistungsstark in Bibliotheken für Datenwissenschaft und maschinelles Lernen, während JavaScript in Bibliotheken und Front-End-Entwicklungsbibliotheken und Frameworks besser ist. 3) Beide haben reichhaltige Lernressourcen, aber Python eignet sich zum Beginn der offiziellen Dokumente, während JavaScript mit Mdnwebdocs besser ist. Die Wahl sollte auf Projektbedürfnissen und persönlichen Interessen beruhen.

Docker verwendet Linux -Kernel -Funktionen, um eine effiziente und isolierte Anwendungsumgebung zu bieten. Sein Arbeitsprinzip lautet wie folgt: 1. Der Spiegel wird als schreibgeschützte Vorlage verwendet, die alles enthält, was Sie für die Ausführung der Anwendung benötigen. 2. Das Union File System (UnionFS) stapelt mehrere Dateisysteme, speichert nur die Unterschiede, speichert Platz und beschleunigt. 3. Der Daemon verwaltet die Spiegel und Container, und der Kunde verwendet sie für die Interaktion. 4. Namespaces und CGroups implementieren Container -Isolation und Ressourcenbeschränkungen; 5. Mehrere Netzwerkmodi unterstützen die Containerverbindung. Nur wenn Sie diese Kernkonzepte verstehen, können Sie Docker besser nutzen.

Minio-Objektspeicherung: Hochleistungs-Bereitstellung im Rahmen von CentOS System Minio ist ein hochleistungsfähiges, verteiltes Objektspeichersystem, das auf der GO-Sprache entwickelt wurde und mit Amazons3 kompatibel ist. Es unterstützt eine Vielzahl von Kundensprachen, darunter Java, Python, JavaScript und Go. In diesem Artikel wird kurz die Installation und Kompatibilität von Minio zu CentOS -Systemen vorgestellt. CentOS -Versionskompatibilitätsminio wurde in mehreren CentOS -Versionen verifiziert, einschließlich, aber nicht beschränkt auf: CentOS7.9: Bietet einen vollständigen Installationshandbuch für die Clusterkonfiguration, die Umgebungsvorbereitung, die Einstellungen von Konfigurationsdateien, eine Festplattenpartitionierung und Mini

Pytorch Distributed Training on CentOS -System erfordert die folgenden Schritte: Pytorch -Installation: Die Prämisse ist, dass Python und PIP im CentOS -System installiert sind. Nehmen Sie abhängig von Ihrer CUDA -Version den entsprechenden Installationsbefehl von der offiziellen Pytorch -Website ab. Für CPU-Schulungen können Sie den folgenden Befehl verwenden: PipinstallTorChTorChVisionTorChaudio Wenn Sie GPU-Unterstützung benötigen, stellen Sie sicher, dass die entsprechende Version von CUDA und CUDNN installiert ist und die entsprechende Pytorch-Version für die Installation verwenden. Konfiguration der verteilten Umgebung: Verteiltes Training erfordert in der Regel mehrere Maschinen oder mehrere Maschinen-Mehrfach-GPUs. Ort

Bei der Installation von PyTorch am CentOS -System müssen Sie die entsprechende Version sorgfältig auswählen und die folgenden Schlüsselfaktoren berücksichtigen: 1. Kompatibilität der Systemumgebung: Betriebssystem: Es wird empfohlen, CentOS7 oder höher zu verwenden. CUDA und CUDNN: Pytorch -Version und CUDA -Version sind eng miteinander verbunden. Beispielsweise erfordert Pytorch1.9.0 CUDA11.1, während Pytorch2.0.1 CUDA11.3 erfordert. Die Cudnn -Version muss auch mit der CUDA -Version übereinstimmen. Bestimmen Sie vor der Auswahl der Pytorch -Version unbedingt, dass kompatible CUDA- und CUDNN -Versionen installiert wurden. Python -Version: Pytorch Official Branch

Python zeichnet sich in Automatisierung, Skript und Aufgabenverwaltung aus. 1) Automatisierung: Die Sicherungssicherung wird durch Standardbibliotheken wie OS und Shutil realisiert. 2) Skriptschreiben: Verwenden Sie die PSUTIL -Bibliothek, um die Systemressourcen zu überwachen. 3) Aufgabenverwaltung: Verwenden Sie die Zeitplanbibliothek, um Aufgaben zu planen. Die Benutzerfreundlichkeit von Python und die Unterstützung der reichhaltigen Bibliothek machen es zum bevorzugten Werkzeug in diesen Bereichen.
