정규 표현식이 포함된 텍스트 찾기
텍스트 데이터를 처리할 때 미리 정의된 패턴을 기반으로 특정 정보를 추출해야 하는 경우가 많습니다. 이 작업을 위한 강력한 도구 중 하나는 정의된 규칙에 따라 텍스트 문자열을 일치시키는 데 사용되는 문자 시퀀스인 정규식입니다. 이 경우 정규식을 사용하여 서로 다른 두 문자열 사이의 텍스트를 일치시키는 것이 목표입니다.
문제:
다음 텍스트를 고려하세요.
Part 1. Part 2. Part 3 then more text
우리의 목표는 문자열 "Part 1"과 "Part 3"을 검색하고 그 사이에 있는 모든 항목, 즉 ".Part 2."를 검색하는 것입니다.
해결책:
Python 2x를 사용하면 re 모듈과 정규식을 활용할 수 있습니다. 한 가지 접근 방식은 re.search 기능을 사용하는 것입니다.
import re s = 'Part 1. Part 2. Part 3 then more text' match = re.search(r'Part 1\.(.*?)Part 3', s) if match: print(match.group(1))
이 코드는 "Part 1" 패턴과 그 뒤에 문자(".*?"로 표시됨)가 있고 "Part 3으로 끝나는 패턴을 검색합니다. ". 중간 텍스트를 포함하는 일치하는 부분은 match.group(1)에 저장되고 인쇄됩니다.
지정된 패턴이 여러 번 나타나는 경우 re.findall을 사용하는 대안도 있습니다.
matches = re.findall(r'Part 1(.*?)Part 3', s) for match in matches: print(match)
이 코드는 "Part 1"과 "Part 3" 사이에 일치하는 모든 세그먼트를 검색하고 각각을 인쇄합니다. 두 방법 모두 정규식을 효과적으로 활용하여 지정된 문자열 사이에서 원하는 텍스트를 추출합니다.
위 내용은 정규 표현식을 사용하여 중간 텍스트를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!