NumPy에서 인덱스 배열의 원-핫 인코딩
주어진 인덱스 배열을 원-핫 인코딩된 배열로 변환하는 것은 다음과 같습니다. 다양한 기계 학습 애플리케이션에 유용한 기술입니다. 원-핫 인코딩은 각 인덱스를 이진 벡터로 표현합니다. 여기서 인덱스의 해당 요소는 1이고 다른 모든 요소는 0입니다. 이 기술은 범주형 데이터를 처리할 때나 인덱스가 특성 값으로 사용되는 상황에서 특히 유용합니다.
NumPy에서 원-핫 인코딩을 달성하기 위해 우리는 간단한 프로세스를 따릅니다.
제공된 예를 고려하세요.
<code class="python">a = np.array([1, 0, 3]) b = np.zeros((a.size, a.max() + 1)) b[np.arange(a.size), a] = 1</code>
이 예에서 인덱스 배열 a는 0에서 3까지의 값을 가지므로 4개의 열이 있는 0으로 채워진 배열 b를 만듭니다. 그런 다음 np.arange() 함수를 사용하여 b에 대한 행 인덱스 배열을 생성하고 a의 값을 기반으로 적절한 열을 1로 설정합니다.
결과 배열 b는 이제 원-핫 인코딩됩니다. 원본 인덱스 배열 a의 표현:
array([[ 0., 1., 0., 0.], [ 1., 0., 0., 0.], [ 0., 0., 0., 1.]])
이 원-핫 인코딩 배열은 인덱스 값의 범주형 특성을 유지하고 기계 학습 알고리즘에서 효율적인 처리를 허용합니다.
위 내용은 NumPy에서 인덱스 배열을 원-핫 인코딩하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!