re.sub가 re.MULTILINE 플래그와 함께 예기치 않게 동작하는 이유는 무엇입니까?

Patricia Arquette
풀어 주다: 2024-11-05 14:51:02
원래의
426명이 탐색했습니다.

Why is re.sub Behaving Unexpectedly with the re.MULTILINE Flag?

re.sub 및 플래그를 사용한 예기치 않은 대체

Python 문서에는 re.MULTILINE 플래그가 캐럿 문자(^)를 허용한다고 나와 있습니다. 각 줄의 시작 부분에서 일치합니다. 그러나 re.sub와 함께 이 플래그를 사용하면 예기치 않은 동작이 발생할 수 있습니다.

다음 예를 고려하세요.

<code class="python">import re
s = """// The quick brown fox.
// Jumped over the lazy dog."""
result = re.sub('^//', '', s, re.MULTILINE)
print(result)</code>
로그인 후 복사

예상되는 결과는 "//"로 시작하는 모든 줄이 다음과 같습니다. 빈 문자열로 대체되고 다음만 남깁니다.

The quick brown fox.
Jumped over the lazy dog.
로그인 후 복사

그러나 실제 결과는 다음과 같습니다.

 The quick brown fox.
// Jumped over the lazy dog.
로그인 후 복사

문제 이유

문제는 re.sub 함수가 최대 대체 횟수에 대한 네 번째 인수를 허용하기 때문에 발생합니다. 예제에서 re.MULTILINE은 플래그가 아닌 개수로 잘못 사용되었습니다.

해결 방법

이 동작을 수정하려면 명명된 인수를 사용하여 플래그:

<code class="python">result = re.sub('^//', '', s, flags=re.MULTILINE)</code>
로그인 후 복사

또는 re.sub와 함께 사용하기 전에 원하는 플래그로 정규식을 컴파일할 수 있습니다.

<code class="python">regex = re.compile('^//', re.MULTILINE)
result = re.sub(regex, '', s)</code>
로그인 후 복사

re.MULTILINE 플래그를 올바르게 지정하면 문자열 내의 위치에 관계없이 ^// 패턴이 나타나는 모든 항목이 대체되도록 할 수 있습니다.

위 내용은 re.sub가 re.MULTILINE 플래그와 함께 예기치 않게 동작하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿