> 백엔드 개발 > 파이썬 튜토리얼 > 참가자 ID를 기준으로 대규모 DataFrame을 개별 DataFrame으로 효율적으로 분할하려면 어떻게 해야 합니까?

참가자 ID를 기준으로 대규모 DataFrame을 개별 DataFrame으로 효율적으로 분할하려면 어떻게 해야 합니까?

Mary-Kate Olsen
풀어 주다: 2024-12-30 10:25:09
원래의
775명이 탐색했습니다.

How Can I Efficiently Split a Large DataFrame into Individual DataFrames by Participant ID?

참여자 ID를 기준으로 대규모 DataFrame을 개별 DataFrame으로 분할

60개 이상의 실험에서 얻은 데이터가 포함된 대규모 DataFrame을 소유하고 있는 시나리오를 생각해 보세요. 참가자들. 목표는 이 방대한 DataFrame을 각각 개별 참가자를 나타내는 60개의 개별 DataFrame으로 나누는 것입니다. 필수 변수인 'name'은 DataFrame 내의 각 참가자를 고유하게 식별합니다.

맞춤 기능인 'splitframe'을 사용하여 이 작업을 수행하려는 시도는 성공하지 못한 것으로 입증되어 보다 효율적인 솔루션에 대한 의문이 제기되었습니다.

우수한 접근 방식: 데이터 프레임 슬라이싱

슬라이싱을 사용하는 대체 전략 DataFrame을 분리하는 기술. 방법은 다음과 같습니다.

  1. DataFrame의 'Names' 열을 사용하여 고유한 참가자 이름 목록('UniqueNames')을 생성합니다.
  2. 다음을 활용하여 개별 DataFrame을 수용할 수 있는 사전을 설정합니다. 'UniqueNames' 목록을 키로 사용합니다.
  3. 각 참가자 이름을 반복하고 해당 데이터를 사전.

슬라이싱을 활용하는 이 접근 방식은 각 참가자에 대한 개별 DataFrame을 생성하는 보다 간단하고 효율적인 방법을 제공합니다.

# Create a DataFrame with a 'Names' column
data = pd.DataFrame({
    'Names': ['Joe', 'John', 'Jasper', 'Jez'] * 4,
    'Ob1': np.random.rand(16),
    'Ob2': np.random.rand(16)
})

# Extract unique participant names
UniqueNames = data['Names'].unique()

# Initialize a dictionary to store individual DataFrames
DataFrameDict = {elem: pd.DataFrame() for elem in UniqueNames}

# Populate the dictionary with individual DataFrames
for key in DataFrameDict.keys():
    DataFrameDict[key] = data[data['Names'] == key]
로그인 후 복사

개별 DataFrame에 액세스

특정 참가자의 특정 DataFrame에 액세스하려면 참가자 이름에 해당하는 사전 키를 사용하면 됩니다. 아래에 설명된 대로:

DataFrameDict['Joe']
로그인 후 복사

위 내용은 참가자 ID를 기준으로 대규모 DataFrame을 개별 DataFrame으로 효율적으로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿