> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame에 숫자 데이터를 저장하고 각 저장소 내에서 값을 계산하려면 어떻게 해야 합니까?

Pandas DataFrame에 숫자 데이터를 저장하고 각 저장소 내에서 값을 계산하려면 어떻게 해야 합니까?

Barbara Streisand
풀어 주다: 2024-12-15 20:55:09
원래의
789명이 탐색했습니다.

How Can I Bin Numeric Data in a Pandas DataFrame and Count Values within Each Bin?

값 개수를 얻기 위해 pandas로 열 구간화

Pandas 데이터 프레임의 숫자 데이터를 처리할 때 구간화하는 것이 유용할 수 있습니다. 분석을 위해 데이터를 특정 범위로 분류합니다. 이 프로세스를 비닝이라고 합니다.

Pandas에서 열을 비닝하려면 다음 단계를 사용할 수 있습니다.

  1. bins 매개변수를 사용하여 bin 범위를 정의합니다.
  2. 잘라내기 기능을 사용하여 데이터 프레임에 새 열을 만듭니다.
  3. 값 개수 또는 그룹별을 사용하여 내부 값 개수를 가져옵니다.

예:

'백분율'이라는 숫자 열이 있는 다음 데이터 프레임을 고려해 보세요.

import pandas as pd
import numpy as np

df = pd.DataFrame({'percentage': [46.5, 44.2, 100.0, 42.12]})
로그인 후 복사

To '백분율' 열을 다음과 같이 분류합니다. bins:

bins = [0, 1, 5, 10, 25, 50, 100]
로그인 후 복사

다음과 같이 잘라내기 기능을 사용할 수 있습니다.

df['binned'] = pd.cut(df['percentage'], bins=bins)
로그인 후 복사

이렇게 하면 bin 레이블이 포함된 데이터 프레임에 'binned'라는 새 열이 생성됩니다.

각 bin 내의 값 개수를 얻으려면 value_counts를 사용할 수 있습니다. 방법:

print(df['binned'].value_counts())
로그인 후 복사

출력:

(25, 50]     3
(50, 100]    1
로그인 후 복사

또는 groupby를 사용하여 크기를 집계할 수 있습니다:

print(df.groupby(df['binned']).size())
로그인 후 복사

출력:

percentage
(0, 1]       0
(1, 5]       0
(5, 10]      0
(10, 25]     0
(25, 50]     3
(50, 100]    1
dtype: int64
로그인 후 복사

각 bin 내의 값 개수를 제공합니다.

위 내용은 Pandas DataFrame에 숫자 데이터를 저장하고 각 저장소 내에서 값을 계산하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿