Pandas의 "축" 이해
Pandas로 작업할 때 "축" 개념은 다음을 포함한 다양한 작업에서 중요한 역할을 합니다. 평균과 같은 통계 계산. 이 맥락에서 axis 매개변수는 작업이 수행되는 방향을 지정합니다.
기본적으로 축 값은 0이며 이는 DataFrame의 행(인덱스)에 따른 작업을 나타냅니다. 그러나 축 값을 명시적으로 1로 설정하면 대신 열을 따라 작업을 수행할 수 있습니다.
다음 예를 고려하세요.
<code class="python">import pandas as pd import numpy as np # Generate a DataFrame with random values dff = pd.DataFrame(np.random.randn(1, 2), columns=list('AB')) # Calculate the mean along each column mean_columns = dff.mean(axis=1)</code>
이 경우 axis=1을 지정하면 평균 함수는 DataFrame의 각 열에 대한 평균값을 계산합니다. 예상되는 출력은 다음과 같습니다.
0 1.074821 dtype: float64
이는 각 행의 평균값을 계산한 axis=0을 사용하여 예상할 수 있는 결과와 다르며 결과는 다음과 같습니다.
A 0.626386 B 1.523255 dtype: float64
더 명확히 하자면, Pandas의 축 매개변수는 NumPy의 평균 함수의 축 사용과 일치합니다. NumPy의 평균에 축이 명시적으로 지정되지 않은 경우 기본값은 None으로 설정되어 평균을 계산하기 전에 배열을 평면화합니다. 따라서 Pandas에서 axis=0을 지정하는 것은 행을 따라 평균을 계산하는 것에 해당하고(Pandas의 인덱스는 행을 나타내기 때문에) axis=1을 지정하는 것은 열을 따라 평균을 계산하는 것에 해당합니다.
명확성을 높이기 위해 , axis=0 대신 axis='index', axis=1 대신 axis='columns'를 사용하여 작업이 수행되는 축을 명시적으로 명확하게 할 수도 있습니다.
위 내용은 Pandas: 행과 열에서 \'축\'은 어떻게 작동하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!