텍스트와 숫자가 모두 포함된 텍스트 데이터를 처리할 때 다음이 될 수 있습니다. 문자열에서 숫자 값을 추출하는 데 필요합니다. Python에서 이 작업을 수행하는 두 가지 일반적인 방법은 정규식과 isdigit() 메서드입니다.
정규식(regex)은 문자열 내에서 패턴을 일치시키는 강력한 방법을 제공합니다. 숫자를 추출하려면 하나 이상의 숫자와 일치하는 d 패턴을 사용할 수 있습니다. 예를 들어보세요.
import re line = "hello 12 hi 89" numbers = re.findall(r'\d+', line) print(numbers) # Output: [12, 89]
이 정규식은 숫자 "12"와 "89"의 시퀀스를 일치시키고 이를 목록으로 반환합니다. 단어 경계(예: 공백, 마침표 또는 쉼표)로 구분된 숫자만 일치시키려면 b 패턴을 사용할 수 있습니다.
numbers = re.findall(r'\b\d+\b', line) print(numbers) # Output: [12, 89]
isdigit () 메서드는 문자열에서 숫자를 추출하는 대체 방법을 제공합니다. 이 메서드는 숫자인 문자에 대해 True를 반환하고 그렇지 않으면 False를 반환합니다. 이를 사용하려면 문자열을 반복하고 각 문자를 확인하면 됩니다.
line = "hello 12 hi 89" numbers = [] for char in line: if char.isdigit(): numbers.append(int(char)) print(numbers) # Output: [12, 89]
이 예에서 메서드는 문자열의 각 문자를 반복하고 isdigit()를 사용하여 숫자인지 확인합니다. 숫자 목록이 있으면 숫자 목록에 추가합니다.
일반적으로 정규 표현식을 사용하는 것이 추출에 더 효율적입니다. isdigit() 메서드를 사용하는 것보다 문자열에서 숫자를 가져옵니다. 정규식은 복잡한 패턴을 빠르게 일치시킬 수 있는 반면 isdigit()는 전체 문자열을 반복해야 합니다.
음수도 추출해야 하는 경우 정규식 접근 방식은 다음을 제공합니다. 더 쉬운 솔루션. 음수를 일치시키려면 r'-d '를 사용하면 됩니다. 그러나 isdigit()를 사용하려면 음수 기호를 처리하기 위해 더 복잡한 논리가 필요합니다.
위 내용은 Python 문자열 번호 추출: Regex 대 isdigit() - 어떤 방법이 가장 좋습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!