Python에서 구분자를 유지하면서 문자열 분할
Python에서 re.split() 함수는 지정된 패턴을 기반으로 문자열을 효과적으로 분리합니다. . 그러나 기본 동작은 결과 토큰 목록에서 구분 기호를 제외합니다. 구분 기호를 유지하려면 캡처 그룹의 기능을 활용하는 간단한 기술이 필요합니다.
re.split()에 대한 공식 문서에는 "캡처 괄호가 패턴에 사용되는 경우 모든 그룹의 텍스트가 패턴은 결과 목록의 일부로도 반환됩니다." 이러한 통찰력은 우리의 솔루션을 위한 길을 열어줍니다.
구분 기호를 보존하려면 캡처 그룹 내에 구분 기호를 넣기만 하면 됩니다. 예를 들어 구분 기호를 유지하면서 문자열 "foo/bar spamneggs"를 분할하려면 다음 구문을 사용합니다.
re.split('(\W)', 'foo/bar spam\neggs')
출력은 다음과 같습니다.
['foo', '/', 'bar', ' ', 'spam', '\n', 'eggs']
이 접근 방식은 다음을 보장합니다. 원래 문자열은 원하는 구분 기호를 포함하여 원래 문자 순서를 유지하면서 원하는 토큰으로 분할됩니다.
위 내용은 `re.split()`을 사용하여 구분 기호를 유지하면서 Python에서 문자열을 어떻게 분할할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!