GroupBy 및 DataFrame을 목록 사전으로 변환
구조화된 데이터가 포함된 Excel 파일이 있는 경우 목표는 데이터를 추출하고 그룹화하는 것입니다. 특정 열을 기준으로 목록을 값으로 사용하여 Python 사전에 저장합니다. Excel 시트의 데이터 형식은 다음과 같습니다.
Column1 | Column2 | Column3 |
---|---|---|
0 | 23 | 1 |
1 | 5 | 2 |
1 | 2 | 3 |
1 | 19 | 5 |
2 | 56 | 1 |
2 | 22 | 2 |
3 | 2 | 4 |
3 | 14 | 5 |
4 | 59 | 1 |
5 | 44 | 1 |
5 | 1 | 2 |
5 | 87 | 3 |
해결책 1: groupby.apply().to_dict()
데이터를 원하는 사전으로 변환하려면 형식을 지정하려면 다음 단계를 따르세요.
<code class="python">import pandas as pd excel = pd.read_excel(r"e:\test_data.xlsx", sheetname='mySheet', parse_cols='A,C') result = excel.groupby('Column1')['Column3'].apply(list).to_dict() print(result)</code>
해결책 2: 사전 이해
또는 사전 이해를 사용하여 동일한 결과를 얻을 수 있습니다.
<code class="python">result = {k: list(v) for k, v in excel.groupby('Column1')['Column3']} print(result)</code>
두 솔루션의 결과는 다음과 같습니다.
{0: [1], 1: [2, 3, 5], 2: [1, 2], 3: [4, 5], 4: [1], 5: [1, 2, 3]}
위 내용은 DataFrame을 열별로 그룹화하고 Python에서 목록 사전으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!