Pandas: 문자열에서 숫자 추출
Pandas에서 데이터 프레임으로 작업할 때 숫자 정보가 포함되지 않은 셀에서 숫자 정보를 추출해야 하는 경우가 많습니다. -숫자 문자. 이는 어려울 수 있지만 Pandas는 이를 달성하는 데 도움이 되는 여러 가지 방법을 제공합니다.
숫자 추출에 str.extract() 사용
숫자 추출을 위한 효과적인 방법 중 하나 문자열은 str.extract()입니다. 이 방법을 사용하면 캡처하려는 숫자 데이터를 정의하는 정규식 패턴을 지정할 수 있습니다.
다음 데이터 프레임을 고려하세요.
<code class="python">import pandas as pd import numpy as np df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'], }) print(df)</code>
출력:
A 0 1a 1 NaN 2 10a 3 100b 4 0b
각 셀에서 숫자를 추출하려면 다음 정규식을 사용할 수 있습니다.
<code class="python">df.A.str.extract('(\d+)')</code>
정규식 패턴(d )은 하나 이상의 숫자 시퀀스를 캡처합니다. 패턴 주위의 괄호는 문자열의 일치하는 부분을 반환하는 데 사용되는 캡처링 그룹을 생성합니다.
출력:
0 1 1 NaN 2 10 3 100 4 0 Name: A, dtype: object
보시다시피 원하는 숫자가 성공적으로 반환되었습니다. 숫자가 아닌 문자가 포함된 셀도 포함하여 각 셀에서 추출됩니다. 이 방법은 정수에만 작동하며 부동 소수점 숫자에는 작동하지 않습니다.
위 내용은 Pandas에서 숫자가 아닌 문자열에서 숫자를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!