이중 정렬 없이 Python/NumPy에서 더 빠른 배열 항목 순위 지정
데이터 분석 및 기계 학습에서는 항목의 순위를 매기는 것이 종종 필요합니다. 값을 기준으로 배열합니다. 순위를 매기기 위해 배열을 이중 정렬하는 데는 시간이 많이 걸릴 수 있습니다.
초기 접근 방식
일반적인 방법은 다음과 같습니다.
<code class="python">import numpy as np # Sample array array = np.array([4, 2, 7, 1]) # Temporary array for sorting temp = array.argsort() # Rank computation ranks = np.arange(len(array))[temp.argsort()]</code>
이 접근 방식은 다음과 같습니다. 두 가지 정렬 작업이 포함되어 복잡성이 증가합니다.
최적화된 솔루션
이중 정렬을 피하기 위해 NumPy의 argsort() 함수를 두 번 활용할 수 있습니다.
<code class="python">array = np.array([4, 2, 7, 1]) # First argsort to obtain element order order = array.argsort() # Second argsort to obtain ranking ranks = order.argsort()</code>
설명
먼저 argsort()를 사용하여 배열 요소의 순서를 구합니다. 그런 다음 결과 순서에 다시 argsort()를 적용하여 순위를 결정합니다.
결론
이 최적화 기술은 다음과 같이 배열 항목 순위 지정 속도를 크게 향상시킵니다. 불필요한 정렬을 피합니다. 고차원 배열의 경우 argsort의 축 인수를 사용하여 정렬할 축을 지정하세요.
위 내용은 이중 정렬 없이 효율적으로 Python/NumPy에서 배열 항목의 순위를 매기는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!