주어진 스트라이드/단계 크기를 사용하여 Numpy 배열에서 효율적으로 하위 배열 가져오기
데이터 분석의 세계에서는 종종 특정 매개변수를 사용하여 하위 배열을 추출해야 합니다. 더 큰 배열의 보폭 또는 단계 크기. 수치 연산을 위한 인기 있는 Python 라이브러리인 Numpy는 이를 효율적으로 달성하기 위한 여러 가지 방법을 제공합니다.
문제 설명:
주어진 Numpy 배열에서 다음의 하위 배열 행렬을 추출하려고 합니다. 특정 보폭 또는 단계 크기를 갖는 고정 길이. 스트라이드는 연속된 하위 배열의 시작 사이의 거리입니다.
토론:
하위 배열을 생성하는 간단한 방법 중 하나는 for 루프를 사용하여 원래 배열을 반복하는 것입니다. . 이 접근 방식은 효과가 있지만 대규모 배열의 경우 속도가 느릴 수 있습니다.
접근 방식 1: 브로드캐스팅
NumPy의 브로드캐스팅 메커니즘을 사용하면 루프 없이 하위 배열을 생성할 수 있습니다. 배열, 하위 배열 길이(L) 및 스트라이드(S)를 취하는 다음 함수를 사용할 수 있습니다.
def broadcasting_app(a, L, S): nrows = ((a.size - L) // S) + 1 return a[S * np.arange(nrows)[:, None] + np.arange(L)]
설명:
np.arange(nrows)가 생성합니다. stride가 1인 인덱스 배열입니다. 이것을 S와 곱하면 각 하위 배열의 시작 인덱스를 얻습니다. 그런 다음 이 인덱스를 a 행에 브로드캐스트하여 하위 배열을 얻습니다.
접근 방법 2: NumPy Strides
또 다른 효율적인 방법은 NumPy의 strides 기능을 사용합니다. 스트라이드는 각 축을 따라 연속된 요소 사이의 바이트 수를 나타냅니다. 이 정보를 사용하여 하위 배열을 만들 수 있습니다.
def strided_app(a, L, S): nrows = ((a.size - L) // S) + 1 n = a.strides[0] return np.lib.stride_tricks.as_strided(a, shape=(nrows, L), strides=(S * n, n))
설명:
np.lib.stride_tricks.as_strided를 사용하여 보폭을 활용하여 모양을 변경합니다. 결과 배열은 S의 스트라이드를 유지하면서 원하는 행 수(nrows)와 하위 배열 길이(L)를 갖습니다.
샘플 코드:
접근 방식:
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]) print(broadcasting_app(a, L=5, S=3)) print(strided_app(a, L=5, S=3))
출력:
[[ 1 2 3 4 5] [ 4 5 6 7 8] [ 7 8 9 10 11]] [[ 1 2 3 4 5] [ 4 5 6 7 8] [ 7 8 9 10 11]]
두 접근 방식 모두 원하는 보폭으로 하위 배열 행렬을 효율적으로 생성합니다.
위 내용은 NumPy 배열에서 주어진 보폭으로 하위 배열을 효율적으로 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!