정규 표현식을 사용하여 문자열 사이의 텍스트 추출
Python에서는 정규 표현식을 활용하여 더 큰 문자열 내에서 지정된 두 문자열 사이에 있는 텍스트를 추출할 수 있습니다. 끈. 다음 예를 고려하십시오.
"Part 1. Part 2. Part 3 then more text"
귀하의 목표는 "Part 1"과 "Part 3" 사이의 텍스트를 분리하는 것입니다. 즉, ". Part 2. "입니다. 이를 달성하려면 re.search() 함수를 사용할 수 있습니다.
<code class="python">import re s = 'Part 1. Part 2. Part 3 then more text' match = re.search(r'Part 1\.(.*?)Part 3', s) if match: text_between = match.group(1) print(text_between)</code>
이 경우 정규식 r'Part 1.(.*?)Part 3'은 ".*?"를 할당합니다. 캡처 그룹으로. "?" 이 그룹이 탐욕스럽지 않은지 확인합니다. 즉, 정규식을 충족하는 가장 짧은 문자열을 캡처합니다. .*는 모든 문자와 일치하며 . 개행 문자를 제외한 모든 문자를 나타냅니다.
여러 항목이 있는 경우 대신 re.findall()을 사용할 수 있습니다.
<code class="python">matches = re.findall(r'Part 1(.*?)Part 3', s) for match in matches: print(match)</code>
위 내용은 Python에서 정규 표현식을 사용하여 문자열 사이의 텍스트를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!