데이터 정규화의 목적은 무엇입니까?-일반적인 문제-php.cn

데이터 정규화의 목적은 무엇입니까?

青灯夜游

풀어 주다： 2023-01-13 00:36:05

원래의

27935명이 탐색했습니다.

데이터 정규화의 목적은 전처리된 데이터를 특정 범위로 제한하여 단일 샘플 데이터로 인한 부작용을 제거하는 것입니다. 데이터 정규화 후에는 최적의 해를 찾기 위한 경사 하강 속도가 빨라지고 정확도가 향상될 수 있습니다(예: KNN).

데이터 정규화의 목적은 무엇입니까?

이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.

머신러닝 분야에서는 서로 다른 평가 지표(즉, 특징 벡터의 서로 다른 특징이 서로 다른 평가 지표입니다) 종종 다른 차원과 차원 단위를 가지게 됩니다. 이러한 상황은 지표 간의 차원적 영향을 제거하기 위해 데이터 지표 간의 비교 가능성 문제를 해결하기 위해 데이터 표준화 처리가 필요합니다. . 원본 데이터를 데이터 표준화를 통해 처리한 후 각 지표의 크기가 동일한 순서로 되어 있어 종합적인 비교 평가에 적합합니다. 그 중 가장 대표적인 것이 데이터의 정규화 처리입니다. (연구 참고 가능: 데이터 표준화/정규화)

간단히 말하면 정규화의 목적은 전처리된 데이터를 특정 범위(예: [0,1)로 제한하는 것입니다. ] 또는 [-1,1])을 사용하여 단일 표본 데이터로 인한 역효과를 제거합니다.

1) 통계에서 정규화의 구체적인 역할은 통일된 표본의 통계적 분포를 요약하는 것입니다. 0과 1 사이의 정규화는 통계적 확률 분포이고, -1과 +1 사이의 정규화는 통계적 좌표 분포입니다.

2) 특이 표본 데이터는 다른 입력 표본에 비해 유난히 크거나 작은 표본 벡터(즉, 특징 벡터)를 말합니다. 예를 들어 다음은 두 가지 특징을 갖는 표본 데이터 x1과 x2입니다. , x3, x4, x5, x6(특징 벡터 -> 열 벡터) 중 x6 샘플의 두 가지 특징이 다른 샘플과 상대적으로 다르기 때문에 x6은 단일 샘플 데이터로 간주됩니다.