한 열의 텍스트를 여러 행으로 분할
대용량 CSV 파일로 작업할 때 특정 열의 텍스트를 분할해야 할 수 있습니다. 여러 행으로. Pandas와 Python은 이 작업을 수행하는 효율적인 방법을 제공합니다.
Pandas 사용
공백으로 분할:
df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
'Seatblocks' 열의 각 행을 공백으로 분할하고 각 결과 문자열에 대해 새 열을 생성합니다.
콜론으로 분할:
df['Seatblocks'].str.split(' ').apply(lambda x: Series(x.split(':')))
이는 새 열의 각 문자열을 콜론으로 추가로 분할하여 콜론으로 구분된 각 문자열에 대해 여러 열을 생성합니다.
예
다음 CSV 파일을 고려하세요.
CustNum | CustomerName | ItemQty | Item | Seatblocks | ItemExt |
---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2:218:10:4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1:13:36:1,12 1:13:37:1,13 | 300 |
위 방법을 사용하면 'Seatblocks' 열을 여러 행으로 분할할 수 있습니다.
CustNum | CustomerName | ItemQty | Item | Seatblocks1 | Seatblocks2 | Seatblocks3 | Seatblocks4 | ItemExt |
---|---|---|---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2 | 218 | 10 | 4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 36 | 1,12 | 300 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 37 | 1,13 | 300 |
결론
Pandas의 분할 및 쌓기 작업을 활용하면 한 열의 텍스트 데이터를 여러 행으로 효율적으로 재구성하여 추가 분석 및 조작이 가능합니다.
위 내용은 Pandas와 Python을 사용하여 한 열의 텍스트를 여러 행으로 분할하려면 어떻게 해야 하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!