Tikhonov 정규화

Jan 23, 2024 am 09:33 AM
선형 회귀

Tikhonov 정규화

능선 회귀 또는 L2 정규화라고도 하는 Tikhonov 정규화는 선형 회귀에 사용되는 정규화 방법입니다. 모델의 목적 함수에 L2 규범 페널티 항을 추가하여 모델의 복잡성과 일반화 능력을 제어합니다. 이 패널티 항은 과도한 가중치를 피하기 위해 제곱합으로 모델의 가중치에 패널티를 부여하여 과적합 문제를 완화합니다. 이 방법은 손실 함수에 정규화 항을 도입하고 정규화 계수를 조정하여 모델의 피팅 능력과 일반화 능력의 균형을 맞춥니다. Tikhonov 정규화는 실제 적용 범위가 넓으며 모델의 성능과 안정성을 효과적으로 향상시킬 수 있습니다.

정규화 전 선형 회귀의 목적 함수는 다음과 같이 표현할 수 있습니다.

J(w)=frac{1}{2m}sum_{i=1}^{m}(h_w(x^{ (i)})-y^{(i)})^2

이 목적 함수에서 w는 모델의 가중치 벡터이고 h_w(x^{(i)})는 i번째 샘플 x^{(i)}의 예측 결과에 대한 모델의 가중치 벡터, y^{(i)}는 실제 레이블, m은 샘플 수입니다. 이러한 목적함수를 최적화하기 위해 경사하강법(Gradient Descent)과 같은 방법이 자주 사용됩니다. 이러한 방법은 목적함수의 기울기를 계산하고 가중치 벡터 w를 업데이트함으로써 목적함수의 값을 점진적으로 줄여 모델의 예측 결과를 실제 레이블에 가깝게 만듭니다. 이러한 방식으로 목적함수를 최적화하여 모델의 성능을 향상시킬 수 있습니다.

그리고 Tikhonov 정규화에서 목적 함수는 다음과 같습니다.

J(w)=frac{1}{2m}sum_{i=1}^{m}(h_w(x^ {(i)} )-y^{(i)})^2+frac{lambda}{2}||w||_2^2

여기서 람다는 정규화 매개변수이며 페널티 항 강도를 제어하는 ​​데 사용됩니다. ||w||_2^2는 모든 가중치의 제곱의 합인 가중치 벡터의 L2 놈을 나타냅니다. 이 페널티 항은 가중치 값이 너무 커지지 않도록 제한하여 모델이 과적합되는 것을 방지합니다.

실제 응용 분야에서 정규화 매개변수 람다의 값은 일반적으로 교차 검증 및 기타 방법을 통해 결정되어야 합니다. 람다가 너무 작으면 정규화 효과가 약해지고 모델이 여전히 과적합되기 쉽습니다. 람다가 너무 크면 페널티 항이 원래 목적 함수를 압도하여 모델 과소적합이 발생합니다.

Tikhonov 정규화에는 몇 가지 다른 기능과 응용 프로그램이 있습니다. 예를 들어, 관련 특성 가중치를 서로 상쇄할 수 있으므로 특성 간의 상관관계를 더 잘 처리할 수 있습니다. 또한 중요하지 않은 특성에 불이익을 주어 특성 수를 줄일 수 있으므로 고차원 데이터를 처리하는 데에도 사용할 수 있습니다.

다음은 Tikhonov 정규화를 이용한 선형 회귀의 예입니다.

2개의 특성과 하나의 레이블이 포함된 데이터 세트가 있다고 가정해 보겠습니다. 이를 위해 Python의 Scikit-learn 라이브러리를 사용합니다.

from sklearn.linear_model import Ridge
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import make_regression

# 生成数据集
X, y = make_regression(n_samples=100, n_features=2, noise=0.5, random_state=42)

# 数据归一化
scaler = StandardScaler()
X = scaler.fit_transform(X)

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 构建模型
ridge = Ridge(alpha=1.0)  # alpha为正则化参数

# 模型训练
ridge.fit(X_train, y_train)

# 模型评估
print("Train score:", ridge.score(X_train, y_train))
print("Test score:", ridge.score(X_test, y_test))
로그인 후 복사

이 예에서는 Scikit-learn 라이브러리의 make_regression 함수를 사용하여 2개의 기능과 레이블이 있는 데이터 세트를 생성합니다. 먼저 데이터를 정규화한 다음 train_test_split 함수를 사용하여 데이터 세트를 훈련 세트와 테스트 세트로 나눴습니다. 다음으로 Ridge 함수를 사용하여 Tikhonov 정규화 선형 회귀 모델을 구축했습니다. 여기서 알파 매개변수는 정규화 매개변수입니다. 마지막으로 Fit 함수를 사용하여 모델을 훈련시켰고, Score 함수를 사용하여 훈련 세트와 테스트 세트에 대한 R2 점수를 각각 계산했습니다.

정규화 매개변수 알파의 값은 교차 검증 및 기타 방법을 통해 결정되어야 한다는 점에 유의해야 합니다. 이 예에서는 기본값인 alpha=1.0을 사용했습니다. 알파가 너무 작으면 모델이 만족스럽게 수행되지 않을 수 있습니다. 알파가 너무 크면 모델이 과소적합될 수 있습니다.

위 내용은 Tikhonov 정규화의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. 크로스 플레이가 있습니까?
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

다중선형회귀모델의 개념과 응용에 대한 심층분석 다중선형회귀모델의 개념과 응용에 대한 심층분석 Jan 22, 2024 pm 06:30 PM

다중 선형 회귀는 선형 회귀의 가장 일반적인 형태이며 단일 반응 변수 Y가 다중 예측 변수와 선형 관계를 나타내는 방법을 설명하는 데 사용됩니다. 다중 회귀를 사용할 수 있는 애플리케이션의 예: 주택 판매 가격은 위치, 침실 및 욕실 수, 건축 연도, 부지 규모 등과 같은 요인의 영향을 받을 수 있습니다. 2. 아이의 키는 어머니의 키, 아버지의 키, 영양, 환경적 요인에 따라 달라집니다. 다중 선형 회귀 모델 매개변수 k개의 독립 예측 변수 x1, x2..., xk와 응답 변수 y가 있는 다중 선형 회귀 모델을 고려하십시오. k+1개 변수에 대한 n개의 관측치가 있고 n개의 변수가 k보다 커야 한다고 가정합니다. 최소 제곱 회귀의 기본 목표는 초평면을 (k+1) 차원 공간에 맞춰 잔차 제곱의 합을 최소화하는 것입니다. 모델에

Python의 선형 회귀 모델에 대한 자세한 설명 Python의 선형 회귀 모델에 대한 자세한 설명 Jun 10, 2023 pm 12:28 PM

Python의 선형 회귀 모델에 대한 자세한 설명 선형 회귀는 고전적인 통계 모델이자 기계 학습 알고리즘입니다. 주식시장 예측, 날씨 예측, 주택 가격 예측 등 예측 및 모델링 분야에서 널리 사용됩니다. 효율적인 프로그래밍 언어인 Python은 선형 회귀 모델을 포함한 풍부한 기계 학습 라이브러리를 제공합니다. 이 기사에서는 모델 원리, 애플리케이션 시나리오 및 코드 구현을 포함하여 Python의 선형 회귀 모델을 자세히 소개합니다. 선형 회귀의 원리 선형 회귀 모델은 변수 간의 선형 관계를 기반으로 합니다.

Tikhonov 정규화 Tikhonov 정규화 Jan 23, 2024 am 09:33 AM

능선 회귀 또는 L2 정규화라고도 알려진 Tikhonov 정규화는 선형 회귀에 사용되는 정규화 방법입니다. 모델의 목적 함수에 L2 규범 페널티 항을 추가하여 모델의 복잡성과 일반화 능력을 제어합니다. 이 패널티 항은 과도한 가중치를 피하기 위해 제곱합으로 모델의 가중치에 패널티를 부여하여 과적합 문제를 완화합니다. 이 방법은 손실 함수에 정규화 항을 도입하고 정규화 계수를 조정하여 모델의 피팅 능력과 일반화 능력의 균형을 맞춥니다. Tikhonov 정규화는 실제 적용 범위가 넓으며 모델의 성능과 안정성을 효과적으로 향상시킬 수 있습니다. 정규화 전 선형 회귀의 목적 함수는 다음과 같이 표현될 수 있습니다. J(w)=\frac{1}{2m}\sum_{i=1}^{m}(h_

머신러닝에 대해 꼭 알아야 할, 꼭 알아야 할 알고리즘 10가지! 머신러닝에 대해 꼭 알아야 할, 꼭 알아야 할 알고리즘 10가지! Apr 12, 2023 am 09:34 AM

1. 선형 회귀 선형 회귀는 아마도 가장 널리 사용되는 기계 학습 알고리즘일 것입니다. 선형 회귀는 직선을 찾고 이 직선을 산점도의 데이터 점에 최대한 가깝게 맞추는 것입니다. 이 데이터에 직선 방정식을 맞춰 독립변수(x 값)와 수치 결과(y 값)를 표현하려고 합니다. 그러면 이 선을 사용하여 미래 가치를 예측할 수 있습니다! 이 알고리즘에 가장 일반적으로 사용되는 기술은 최소 제곱법입니다. 이 방법은 선의 각 데이터 점으로부터 수직 거리를 최소화하는 최적 맞춤 선을 계산합니다. 총 거리는 모든 데이터 포인트의 수직 거리(녹색 선)의 제곱의 합입니다. 아이디어는 이 제곱 오차 또는 거리를 최소화하여 모델을 맞추는 것입니다. 예를 들어

로지스틱 회귀 분석에서 OR 값의 정의, 의미 및 계산에 대한 자세한 설명 로지스틱 회귀 분석에서 OR 값의 정의, 의미 및 계산에 대한 자세한 설명 Jan 23, 2024 pm 12:48 PM

로지스틱 회귀는 분류 문제에 사용되는 선형 모델로, 주로 이진 분류 문제에서 확률 값을 예측하는 데 사용됩니다. 시그모이드 함수를 사용하여 선형 예측값을 확률값으로 변환하고 임계값을 기준으로 분류 결정을 내립니다. 로지스틱 회귀 분석에서 OR 값은 모델의 다양한 변수가 결과에 미치는 영향을 측정하는 데 사용되는 중요한 지표입니다. OR 값은 독립변수의 단위 변화에 대해 종속변수가 발생할 확률의 다중 변화를 나타냅니다. OR 값을 계산하면 모델에 대한 특정 변수의 기여도를 확인할 수 있습니다. OR값의 계산방법은 지수함수(exp)의 자연로그(ln)의 계수를 취하는 것, 즉 OR=exp(β)이며, 여기서 β는 로지스틱 회귀분석에서 독립변수의 계수이다. 모델. 도구

선형 및 비선형 분석의 다항식 회귀 속성 선형 및 비선형 분석의 다항식 회귀 속성 Jan 22, 2024 pm 03:03 PM

다항회귀는 비선형 데이터 관계에 적합한 회귀분석 방법입니다. 직선 관계만 맞출 수 있는 단순 선형 회귀 모델과 달리 다항 회귀 모델은 복잡한 곡선 관계를 더 정확하게 맞출 수 있습니다. 다항식 기능을 도입하고 모델에 고차 변수 항을 추가하여 데이터의 비선형 변화에 더 잘 적응합니다. 이 접근 방식은 모델 유연성과 적합성을 향상시켜 보다 정확한 데이터 예측과 해석을 가능하게 합니다. 다항식 회귀 모델의 기본 형태는 다음과 같습니다. y=β0+β1x+β2x^2+…+βn*x^n+ε 이 모델에서 y는 예측하려는 종속 변수이고 x는 독립 변수입니다. . β0~βn은 독립변수가 종속변수에 미치는 영향 정도를 결정하는 모형의 계수이다. ε은 모델의 오차항을 나타내며, 이는 다음을 수행할 수 없음으로 인해 결정됩니다.

일반화 선형 모델의 정의 이해 일반화 선형 모델의 정의 이해 Jan 23, 2024 pm 05:21 PM

일반화 선형 모델(GLM)은 종속변수와 독립변수 간의 관계를 설명하고 분석하는 데 사용되는 통계적 학습 방법입니다. 전통적인 선형 회귀 모델은 연속적인 숫자 변수만 처리할 수 있는 반면, GLM은 이진, 다변량, 개수 또는 범주형 변수를 포함하여 더 많은 유형의 변수를 처리하도록 확장될 수 있습니다. GLM의 핵심 아이디어는 종속변수의 변동성을 설명하기 위해 적절한 오류 분포를 사용하면서 종속변수의 기대값을 적절한 연결 함수를 통해 독립변수의 선형 결합과 연관시키는 것입니다. 이러한 방식으로 GLM은 다양한 유형의 데이터에 적응하여 모델의 유연성과 예측력을 더욱 향상시킬 수 있습니다. 적절한 링크 기능과 오류 분포를 선택함으로써 GLM을 다음과 같이 조정할 수 있습니다.

일반화 선형 모델과 일반 선형 모델의 차이점 일반화 선형 모델과 일반 선형 모델의 차이점 Jan 23, 2024 pm 01:45 PM

일반화선형모형과 일반선형모형은 통계학에서 흔히 사용되는 회귀분석 방법이다. 두 용어는 유사하지만 어떤 면에서는 다릅니다. 일반화 선형 모델을 사용하면 연결 함수를 통해 예측 변수를 종속 변수에 연결하여 종속 변수가 비정규 분포를 따를 수 있습니다. 일반 선형 모델은 종속 변수가 정규 분포를 따른다고 가정하고 모델링에 선형 관계를 사용합니다. 따라서 일반화 선형 모델은 더 유연하고 적용 범위가 더 넓습니다. 1. 정의 및 범위 일반선형모형은 종속변수와 독립변수 사이에 선형관계가 존재하는 상황에 적합한 회귀분석 방법이다. 종속변수가 정규분포를 따른다고 가정합니다. 일반화선형모형은 반드시 정규분포를 따르지 않는 종속변수에 적합한 회귀분석 방법이다. 연결함수와 분포군을 도입하여 종속변수를 기술할 수 있습니다.

See all articles