Pandas의 문자열에서 숫자 추출
Pandas 데이터 프레임 내의 문자열에서 숫자를 추출하려면 str.extract 메서드를 활용하는 것이 좋습니다. 이 방법을 사용하면 정규식을 사용하여 데이터 프레임의 문자열 값에서 특정 패턴을 추출할 수 있습니다.
제공된 예에서 df 데이터 프레임에는 숫자가 포함된 문자열을 포함하여 혼합 데이터 유형이 있는 열 'A'가 포함되어 있습니다. 숫자만 추출하려면 정규식 캡처 그룹을 사용할 수 있습니다.
<code class="python">df.A.str.extract('(\d+)')</code>
정규식 패턴(d )은 하나 이상의 숫자(d)와 일치하는 캡처 그룹을 지정합니다. 이렇게 하면 각 문자열 내의 숫자가 분리됩니다.
결과는 추출된 숫자를 포함하는 새 데이터 프레임 열입니다.
A 0 1 1 NaN 2 10 3 100 4 0
이 방법은 부동 소수점이 아닌 정수에 대해서만 작동합니다. . 더 복잡한 패턴이나 숫자가 숫자가 아닌 숫자로 구분되는 경우에는 추가 정규식 구문이 필요할 수 있습니다.
위 내용은 str.extract()를 사용하여 Pandas의 문자열에서 숫자를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!