Eingehende Analyse der Konzepte und Anwendungen mehrerer linearer Regressionsmodelle

王林
Freigeben: 2024-01-22 18:30:21
nach vorne
1369 Leute haben es durchsucht

Multiple lineare Regression ist die häufigste Form der linearen Regression und wird verwendet, um zu beschreiben, wie eine einzelne Antwortvariable Y eine lineare Beziehung zu mehreren Prädiktorvariablen aufweist.

Beispiele für Anwendungen, bei denen die multiple Regression verwendet werden kann:

Der Verkaufspreis eines Hauses kann durch Faktoren wie Lage, Anzahl der Schlafzimmer und Badezimmer, Baujahr, Grundstücksgröße usw. beeinflusst werden.

2. Die Größe eines Kindes hängt von der Größe der Mutter, der Größe des Vaters, der Ernährung und Umweltfaktoren ab.

Parameter des multiplen linearen Regressionsmodells

Betrachten Sie ein multiples lineares Regressionsmodell mit k unabhängigen Prädiktorvariablen x1, x2..., xk und einer Antwortvariablen y.

多元线性回归概念分析 多元线性回归模型

Angenommen, wir haben n Beobachtungen für k+1 Variablen und n Variablen sollten größer als k sein.

多元线性回归概念分析 多元线性回归模型

Das grundlegende Ziel der Regression der kleinsten Quadrate besteht darin, die Hyperebene in den (k+1)-dimensionalen Raum einzupassen, um die Summe der quadrierten Residuen zu minimieren.

多元线性回归概念分析 多元线性回归模型

Bevor Sie die Modellparameter differenzieren, setzen Sie sie auf Null und leiten Sie die Normalgleichung der kleinsten Quadrate ab, die die Parameter erfüllen müssen.

Diese Gleichungen werden mit Hilfe von Vektoren und Matrizen formuliert.

多元线性回归概念分析 多元线性回归模型

Ein lineares Regressionsmodell wird wie folgt geschrieben:

多元线性回归概念分析 多元线性回归模型

Bei der linearen Regression schätzt der Parameter der kleinsten Quadrate b

多元线性回归概念分析 多元线性回归模型

Stellen Sie sich vor, dass die Daten der Problem , und sagen wir, b ist variabel. Wir möchten das „beste“ b finden, das die Summe der quadrierten Residuen minimiert.

Die kleinstmögliche Quadratsumme ist Null.

多元线性回归概念分析 多元线性回归模型

Hier ist y der geschätzte Antwortvektor.

Der Code implementiert eine mehrfache lineare Regression für den Datensatz data2

data2-Datensatz

多元线性回归概念分析 多元线性回归模型

dataset=read.csv('data2.csv')
dataset$State=factor(dataset$State,
levels=c('New York','California','Florida'),
labels=c(1,2,3))
dataset$State
Nach dem Login kopieren
多元线性回归概念分析 多元线性回归模型

library(caTools)
set.seed(123)
split=sample.split(dataset$Profit,SplitRatio=0.8)
training_set=subset(dataset,split==TRUE)
test_set=subset(dataset,split==FALSE)
regressor=lm(formula=Profit~.,
data=training_set)
y_pred=predict(regressor,newdata=test_set)
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonEingehende Analyse der Konzepte und Anwendungen mehrerer linearer Regressionsmodelle. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:163.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage