다중 선형 회귀는 선형 회귀의 가장 일반적인 형태이며 단일 응답 변수 Y가 여러 예측 변수와 선형 관계를 나타내는 방법을 설명하는 데 사용됩니다.
다중 회귀를 사용할 수 있는 응용 프로그램의 예:
집의 판매 가격은 위치, 침실 및 욕실 수, 건축 연도, 부지 규모 등과 같은 요인에 의해 영향을 받을 수 있습니다.
2. 아이의 키는 엄마의 키, 아빠의 키, 영양, 환경적 요인에 따라 달라집니다.
k개의 독립 예측 변수 x1, x2..., xk와 응답 변수 y가 있는 다중 선형 회귀 모델을 생각해 보세요.
k+1 변수에 대한 n개의 관측치가 있고 n개의 변수가 k보다 커야 한다고 가정합니다.
최소 제곱 회귀의 기본 목표는 초평면을 (k+1) 차원 공간에 맞춰 잔차 제곱의 합을 최소화하는 것입니다.
모델 매개변수를 도출하기 전에 이를 0으로 설정하고 매개변수가 만족해야 하는 최소 제곱 정규 방정식을 도출합니다.
이 방정식은 벡터와 행렬의 도움으로 공식화됩니다.
선형 회귀 모델은 다음과 같이 작성됩니다.
선형 회귀에서 최소 제곱 모수 추정치는 b
X의 열이 고정되어 있다고 상상해 보세요. 특정 문제의 데이터이고 b는 가변적입니다. 우리는 잔차 제곱합을 최소화하는 "최적" b를 찾고 싶습니다.
가능한 가장 작은 제곱합은 0입니다.
여기 y는 추정된 응답 벡터입니다.
data2 데이터 세트
dataset=read.csv('data2.csv') dataset$State=factor(dataset$State, levels=c('New York','California','Florida'), labels=c(1,2,3)) dataset$State
library(caTools) set.seed(123) split=sample.split(dataset$Profit,SplitRatio=0.8) training_set=subset(dataset,split==TRUE) test_set=subset(dataset,split==FALSE) regressor=lm(formula=Profit~., data=training_set) y_pred=predict(regressor,newdata=test_set)
위 내용은 다중선형회귀모델의 개념과 응용에 대한 심층분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!