NumPy: 행당 특정 열 인덱스의 효율적인 선택
데이터 선택은 데이터 분석에서 중요한 작업입니다. NumPy 배열로 작업할 때 각 행에서 특정 열을 선택하는 것은 일반적인 작업이 될 수 있습니다. 이 선택은 다양한 방법으로 수행할 수 있지만 행당 인덱스 목록을 기반으로 열을 선택하는 것은 보다 효율적인 접근 방식이 필요합니다.
직접 선택을 위해 부울 배열 사용
선택할 열을 나타내는 부울 배열이 있는 경우 직접 선택을 사용하여 원하는 값을 효율적으로 추출할 수 있습니다. 부울 배열은 인덱스 목록과 열 범위를 비교하여 만들 수 있습니다. 예를 들어, 질문에 설명된 대로 행렬 X와 인덱스 목록 Y가 있으면 다음과 같이 부울 배열 b를 만들 수 있습니다.
<code class="python">import numpy as np X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) Y = np.array([1, 0, 2]) b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]</code>
부울 배열 b를 사용하면 직접 선택을 수행할 수 있습니다.
<code class="python">result = X[np.arange(X.shape[0]), b]</code>
이 방법은 부울 배열을 기반으로 특정 열을 선택하는 빠른 방법을 제공합니다.
대체 방법
또는 다음을 사용할 수 있습니다. np.arange 및 인덱스 목록 Y를 기반으로 한 직접 선택. 이 접근 방식에는 인덱스 배열을 생성하고 이에 따라 행렬 X에서 선택하는 작업이 포함됩니다.
<code class="python">result = X[np.arange(X.shape[0]), Y]</code>
결론
NumPy에서 행당 특정 열 인덱스를 선택하는 것은 부울 배열을 사용하여 효율적으로 수행할 수 있습니다. 이 방법을 사용하면 인덱스 목록을 기반으로 빠르고 간단하게 열을 선택할 수 있습니다. 대규모 데이터 배열의 경우 이 접근 방식은 반복 기반 방법에 비해 상당한 성능 이점을 제공합니다.
위 내용은 NumPy에서 행당 특정 열 인덱스를 효율적으로 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!