Pandas DataFrames에서 셀을 여러 행으로 분할
Pandas 데이터 프레임에서 쉼표로 구분된 값을 처리할 때 이를 자체 행으로 변환하면 추가 분석을 위해 필요합니다. 이를 달성하는 방법은 다음과 같습니다.
Pandas의 경우 >= 0.25:
이 방법은 프로세스를 단순화합니다.
<code class="python">(df.set_index(['order_id', 'order_date']) .apply(lambda x: x.str.split(',').explode()) .reset_index()) order_id order_date package package_code 0 1 20/5/2018 p1 #111 1 1 20/5/2018 p2 #222 2 1 20/5/2018 p3 #333 3 3 22/5/2018 p4 #444 4 7 23/5/2018 p5 #555 5 7 23/5/2018 p6 #666</code>
의 경우 Pandas <= 0.24:
이전 Pandas 버전의 경우 다른 접근 방식이 필요합니다.
<code class="python">(df.set_index(['order_date', 'order_id']) .stack() .str.split(',', expand=True) .stack() .unstack(-2) .reset_index(-1, drop=True) .reset_index() ) order_date order_id package package_code 0 20/5/2018 1 p1 #111 1 20/5/2018 1 p2 #222 2 20/5/2018 1 p3 #333 3 22/5/2018 3 p4 #444 4 23/5/2018 7 p5 #555 5 23/5/2018 7 p6 #666</code>
세부 정보:
둘 다 방법에는 여러 단계가 포함됩니다.
위 내용은 Pandas DataFrames에서 쉼표로 구분된 값을 여러 행으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!