


So verwenden Sie die Scikit-Learn-Bibliothek für maschinelles Lernen in Python.
Vorwort
scikit-learn ist eine der beliebtesten Bibliotheken für maschinelles Lernen in Python. Sie bietet eine Vielzahl von Algorithmen und Werkzeugen für maschinelles Lernen, einschließlich Klassifizierung, Regression, Clustering, Dimensionsreduktion usw.
Die Vorteile von scikit-learn sind:
Einfach zu bedienen: Die Benutzeroberfläche von scikit-learn ist einfach und leicht zu verstehen, sodass Benutzer problemlos mit maschinellem Lernen beginnen können. Einheitliche API: Die API von scikit-learn ist sehr einheitlich und die Methoden zur Verwendung verschiedener Algorithmen sind grundsätzlich gleich, was das Lernen und die Verwendung komfortabler macht.
Implementiert eine große Anzahl von Algorithmen für maschinelles Lernen: scikit-learn implementiert verschiedene klassische Algorithmen für maschinelles Lernen und bietet eine Fülle von Tools und Funktionen, um das Debuggen und Optimieren von Algorithmen zu vereinfachen.
Open Source und kostenlos: scikit-learn ist vollständig Open Source und kostenlos, jeder kann seinen Code verwenden und ändern.
Effizient und stabil: scikit-learn implementiert verschiedene effiziente Algorithmen für maschinelles Lernen, kann große Datensätze verarbeiten und bietet eine gute Leistung in Bezug auf Stabilität und Zuverlässigkeit. scikit-learn eignet sich sehr gut für maschinelles Lernen auf Einstiegsniveau, da die API sehr einheitlich und das Modell relativ einfach ist. Meine Empfehlung hier ist, in Verbindung mit der offiziellen Dokumentation zu studieren, die nicht nur den Anwendungsbereich jedes Modells vorstellt, sondern auch Codebeispiele bereitstellt.
Lineares Regressionsmodell-LinearRegression
Das lineare Regressionsmodell ist ein Modell, das auf linearer Regression basiert und sich zur Lösung von Vorhersageproblemen kontinuierlicher Variablen eignet. Die Grundidee dieses Modells besteht darin, eine lineare Gleichung aufzustellen, die Beziehung zwischen unabhängigen Variablen und abhängigen Variablen als gerade Linie zu modellieren und die Trainingsdaten zum Anpassen der geraden Linie zu verwenden, um die Koeffizienten der linearen Gleichung zu ermitteln. und verwenden Sie dann diese Gleichung, um die Daten auf Vorhersage zu testen.
Das lineare Regressionsmodell eignet sich für Probleme, bei denen eine lineare Beziehung zwischen unabhängigen und abhängigen Variablen besteht, z. B. Immobilienpreisvorhersage, Verkaufsvorhersage, Benutzerverhaltensvorhersage usw. Wenn die Beziehung zwischen der unabhängigen Variablen und der abhängigen Variablen nichtlinear ist, ist die Leistung des LinearRegression-Modells natürlich schlecht. Zu diesem Zeitpunkt können Polynomregression, Ridge-Regression, Lasso-Regression und andere Methoden zur Lösung des Problems verwendet werden.
Bereiten Sie den Datensatz vor
Nach Abzug des Einflusses anderer Faktoren besteht ein gewisser linearer Zusammenhang zwischen Lernzeit und Lernleistung. Natürlich bezieht sich die Lernzeit hier auf die effektive Lernzeit, die als Leistung ausgedrückt wird nimmt mit der Lernzeit zu. Deshalb erstellen wir einen Datensatz über Studienzeit und Noten. Einige Daten im Datensatz sind wie folgt:
Lernzeit, Punkte
0,5, 15
0,75, 23
1,0, 14
1,25, 42
1,5, 21
1,75, 28
1,75, 35
2,0, 51
2,25, 61
2,5,49
Verwenden Sie die lineare Regression
, um Merkmale und Ziele zu bestimmen
Zwischen Lernzeit und Noten ist die Lernzeit das Merkmal, das die unabhängige Variable ist; die Note ist die Bezeichnung, die die abhängige Variable ist. Daher müssen wir uns auf das Erlernen des Extrahierens von Merkmalen und Beschriftungen aus Zeit- und Notendatensätzen vorbereiten.
import pandas as pd import numpy as np from sklearn.metrics import r2_score, mean_squared_error from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression # 读取学习时间和成绩CSV数据文件 data = pd.read_csv('data/study_time_score.csv') # 提取数据特征学习时间 X = data['学习时间'] # 提取数据目标(标签)分数 Y = data['分数']
Teilen Sie den Trainingssatz und den Testsatz auf.
Nachdem die Feature- und Label-Daten vorbereitet wurden, verwenden Sie die LinearRegression von scikit-learn für das Training und teilen Sie den Datensatz in einen Trainingssatz und einen Testsatz auf.
""" 将特征数据和目标数据划分为测试集和训练集 通过test_size=0.25将百分之二十五的数据划分为测试集 """ X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.25, random_state=0) x_train = X_train.values.reshape(-1, 1) model.fit(x_train, Y_train)
Wählen Sie ein Modell und passen Sie die Daten an
Nach der Vorbereitung des Testsatzes und des Trainingssatzes können wir ein geeignetes Modell auswählen, das zum Trainingssatz passt, damit wir die Ziele vorhersagen können, die anderen Funktionen entsprechen
# 选择模型,选择模型为LinearRegression model = LinearRegression() # Scikit-learn中,机器学习模型的输入必须是一个二维数组。我们需要将一维数组转换为二维数组,才能在模型中使用。 x_train = X_train.values.reshape(-1, 1) # 进行拟合 model.fit(x_train, Y_train)
Modellparameter erhalten
Da der Datensatz nur zwei Lernzeiten und Noten enthält, handelt es sich um ein sehr einfaches lineares Modell. Die mathematische Formel dahinter lautet y=ax+b, wobei die y-abhängige Variable die Noten und die x-unabhängige Variable die Lernzeit ist .
""" 输出模型关键参数 Intercept: 截距 即b Coefficients: 变量权重 即a """ print('Intercept:', model.intercept_) print('Coefficients:', model.coef_)
Backtest
Das obige Anpassungsmodell verwendet nur die Testsatzdaten, um einen Backtest für die Anpassung des Modells durchzuführen. Anschließend können wir es anpassen Machen Sie Vorhersagen mit dem Feature-Testsatz und vergleichen Sie die erhaltenen Zielvorhersageergebnisse mit den tatsächlichen Zielwerten. Wir können den Anpassungsgrad des Modells ermitteln.
# 转换为n行1列的二维数组 x_test = X_test.values.reshape(-1, 1) # 在测试集上进行预测并计算评分 Y_pred = model.predict(x_test) # 打印测试特征数据 print(x_test) # 打印特征数据对应的预测结果 print(Y_pred) # 将预测结果与原特征数据对应的实际目标值进行比较,从而获得模型拟合度 # R2 (R-squared):模型拟合优度,取值范围在0~1之间,越接近1表示模型越好的拟合了数据。 print("R2:", r2_score(Y_test, Y_pred))
Programmlaufergebnisse
Gemäß dem obigen Code müssen wir den Anpassungsgrad des LinearRegression-Modells bestimmen, das heißt, ob die Daten für die Anpassung an ein lineares Modell geeignet sind as follows:
Prediction results:
[47.43726068 33.05457106 49.83437561 63.41802692 41.84399249 37.84880093
23.46611131 37.84880093 26.662 26456 71.40841004 18.67188144 88.9872529 63.41802692 42.6430308 21.86803469 69.81033341 66.61418017 33.05457106 58. 62379705 50.63341392 18.67188144 41.04495418 20.26995807 77.80071653
28.26034119 13.87765157 61.81995029 90.58532953 77. 80071653 36.25072431
84,19302303]
R2: 0,8935675710322939
Das obige ist der detaillierte Inhalt vonSo verwenden Sie die Scikit-Learn-Bibliothek für maschinelles Lernen in Python.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



PHP und Python haben ihre eigenen Vor- und Nachteile, und die Wahl hängt von den Projektbedürfnissen und persönlichen Vorlieben ab. 1.PHP eignet sich für eine schnelle Entwicklung und Wartung großer Webanwendungen. 2. Python dominiert das Gebiet der Datenwissenschaft und des maschinellen Lernens.

Python und JavaScript haben ihre eigenen Vor- und Nachteile in Bezug auf Gemeinschaft, Bibliotheken und Ressourcen. 1) Die Python-Community ist freundlich und für Anfänger geeignet, aber die Front-End-Entwicklungsressourcen sind nicht so reich wie JavaScript. 2) Python ist leistungsstark in Bibliotheken für Datenwissenschaft und maschinelles Lernen, während JavaScript in Bibliotheken und Front-End-Entwicklungsbibliotheken und Frameworks besser ist. 3) Beide haben reichhaltige Lernressourcen, aber Python eignet sich zum Beginn der offiziellen Dokumente, während JavaScript mit Mdnwebdocs besser ist. Die Wahl sollte auf Projektbedürfnissen und persönlichen Interessen beruhen.

Docker verwendet Linux -Kernel -Funktionen, um eine effiziente und isolierte Anwendungsumgebung zu bieten. Sein Arbeitsprinzip lautet wie folgt: 1. Der Spiegel wird als schreibgeschützte Vorlage verwendet, die alles enthält, was Sie für die Ausführung der Anwendung benötigen. 2. Das Union File System (UnionFS) stapelt mehrere Dateisysteme, speichert nur die Unterschiede, speichert Platz und beschleunigt. 3. Der Daemon verwaltet die Spiegel und Container, und der Kunde verwendet sie für die Interaktion. 4. Namespaces und CGroups implementieren Container -Isolation und Ressourcenbeschränkungen; 5. Mehrere Netzwerkmodi unterstützen die Containerverbindung. Nur wenn Sie diese Kernkonzepte verstehen, können Sie Docker besser nutzen.

VS -Code kann zum Schreiben von Python verwendet werden und bietet viele Funktionen, die es zu einem idealen Werkzeug für die Entwicklung von Python -Anwendungen machen. Sie ermöglichen es Benutzern: Installation von Python -Erweiterungen, um Funktionen wie Code -Abschluss, Syntax -Hervorhebung und Debugging zu erhalten. Verwenden Sie den Debugger, um Code Schritt für Schritt zu verfolgen, Fehler zu finden und zu beheben. Integrieren Sie Git für die Versionskontrolle. Verwenden Sie Tools für die Codeformatierung, um die Codekonsistenz aufrechtzuerhalten. Verwenden Sie das Lining -Tool, um potenzielle Probleme im Voraus zu erkennen.

Im VS -Code können Sie das Programm im Terminal in den folgenden Schritten ausführen: Erstellen Sie den Code und öffnen Sie das integrierte Terminal, um sicherzustellen, dass das Codeverzeichnis mit dem Terminal Working -Verzeichnis übereinstimmt. Wählen Sie den Befehl aus, den Befehl ausführen, gemäß der Programmiersprache (z. B. Pythons Python your_file_name.py), um zu überprüfen, ob er erfolgreich ausgeführt wird, und Fehler auflösen. Verwenden Sie den Debugger, um die Debugging -Effizienz zu verbessern.

VS -Code kann unter Windows 8 ausgeführt werden, aber die Erfahrung ist möglicherweise nicht großartig. Stellen Sie zunächst sicher, dass das System auf den neuesten Patch aktualisiert wurde, und laden Sie dann das VS -Code -Installationspaket herunter, das der Systemarchitektur entspricht und sie wie aufgefordert installiert. Beachten Sie nach der Installation, dass einige Erweiterungen möglicherweise mit Windows 8 nicht kompatibel sind und nach alternativen Erweiterungen suchen oder neuere Windows -Systeme in einer virtuellen Maschine verwenden müssen. Installieren Sie die erforderlichen Erweiterungen, um zu überprüfen, ob sie ordnungsgemäß funktionieren. Obwohl VS -Code unter Windows 8 möglich ist, wird empfohlen, auf ein neueres Windows -System zu upgraden, um eine bessere Entwicklungserfahrung und Sicherheit zu erzielen.

VS -Code -Erweiterungen stellen böswillige Risiken dar, wie das Verstecken von böswilligem Code, das Ausbeutetieren von Schwachstellen und das Masturbieren als legitime Erweiterungen. Zu den Methoden zur Identifizierung böswilliger Erweiterungen gehören: Überprüfung von Verlegern, Lesen von Kommentaren, Überprüfung von Code und Installation mit Vorsicht. Zu den Sicherheitsmaßnahmen gehören auch: Sicherheitsbewusstsein, gute Gewohnheiten, regelmäßige Updates und Antivirensoftware.

Python zeichnet sich in Automatisierung, Skript und Aufgabenverwaltung aus. 1) Automatisierung: Die Sicherungssicherung wird durch Standardbibliotheken wie OS und Shutil realisiert. 2) Skriptschreiben: Verwenden Sie die PSUTIL -Bibliothek, um die Systemressourcen zu überwachen. 3) Aufgabenverwaltung: Verwenden Sie die Zeitplanbibliothek, um Aufgaben zu planen. Die Benutzerfreundlichkeit von Python und die Unterstützung der reichhaltigen Bibliothek machen es zum bevorzugten Werkzeug in diesen Bereichen.
