DataFrame 열의 문자열에서 원하지 않는 문자 제거
문자열 데이터가 포함된 데이터세트를 처리할 때 내부에서 의미 있는 정보를 추출해야 하는 경우가 많습니다. 문자열. 그러나 원하지 않는 문자나 형식으로 인해 원하는 데이터가 모호해질 수 있습니다. 이 시나리오의 목표는 원치 않는 부분을 효율적으로 제거하는 것입니다.
다음 데이터가 포함된 DataFrame 열이 있다고 가정합니다.
time | result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
우리의 목표는 데이터를 잘라서 ' ' 또는 '-' 접두사 및 'a' 또는 'b' 접미사. 원하는 출력은 다음과 같습니다.
time | result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
이를 달성하기 위해 맵 메소드 내에서 람다 함수를 사용합니다. 다음 코드 조각이 작업을 수행합니다.
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
lstrip 함수는 선행 ' ' 또는 '-' 문자를 제거하는 반면, rstrip 함수는 후행 'a', 'A', 'b'를 제거합니다. 'B' 또는 'c' 문자입니다. 출력은 원하는 잘린 데이터가 포함된 DataFrame입니다.
위 내용은 DataFrame의 문자열 열에서 원하지 않는 문자를 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!