> 백엔드 개발 > 파이썬 튜토리얼 > ## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?

## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?

Susan Sarandon
풀어 주다: 2024-10-27 10:55:30
원래의
364명이 탐색했습니다.

## How to Efficiently Calculate Frequency Counts for Distinct Values in NumPy Arrays?

NumPy 배열에서 고유한 값의 빈도 수 계산

NumPy 배열 내 개별 값의 발생 빈도를 찾는 것은 데이터 분석에서 일반적인 작업입니다. 이 문서에서는 이러한 빈도 수를 얻는 효율적인 접근 방식을 설명합니다.

방법:

NumPy에서 빈도 수를 얻는 기본 방법은 np.unique 함수를 사용하는 것입니다. return_counts=True로 설정합니다. 예를 들어 다음 배열을 고려해보세요.

<code class="python">x = np.array([1,1,1,2,2,2,5,25,1,1])</code>
로그인 후 복사

이러한 요소의 빈도 수를 계산하려면:

<code class="python">import numpy as np

unique, counts = np.unique(x, return_counts=True)

print(np.asarray((unique, counts)).T)</code>
로그인 후 복사

이 결과는 다음과 같습니다.

[[ 1  5]
 [ 2  3]
 [ 5  1]
 [25  1]]
로그인 후 복사

결과 배열에는 고유한 값(첫 번째 열)과 해당 빈도(두 번째 열)가 포함되어 있습니다.

비교 및 성능:

return_counts=True인 np.unique 메소드는 scipy.stats.itemfreq와 같은 다른 접근 방식에 비해 향상된 성능을 제공합니다. 대규모 배열의 경우 다음 벤치마크 비교에서 알 수 있듯이 np.unique에 걸리는 시간이 크게 줄어듭니다.

<code class="python">x = np.random.random_integers(0,100,1e6)

%timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms per loop

%timeit scipy.stats.itemfreq(x) # 170 ms per loop</code>
로그인 후 복사

결론:

np.unique NumPy의 함수는 배열에 있는 고유 값의 빈도 수를 얻기 위한 효율적인 솔루션을 제공합니다. 대체 방법에 비해 성능이 뛰어나 대규모 데이터 세트에 선호되는 선택입니다.

위 내용은 ## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿