이 기사는 Python이 여러 구분 기호로 문자열을 분할하는 것에 관한 것입니다. 이는 특정 참조 값을 가지고 있으므로 도움이 필요할 수 있습니다.
1. 요구 사항
문자열을 여러 필드로 분할해야 하지만 구분 기호(및 구분 기호 사이의 공백)는 분할할 수 없습니다. 문자열 전체에서 일관됩니다.2. 솔루션
문자열 객체의 분할() 메서드는 매우 간단한 상황만 처리할 수 있으며 여러 구분 기호를 지원하지 않습니다. 캐릭터를 둘러싼 다양한 공간에 대해 알아보세요. 보다 유연한 기능이 필요한 경우 re.split() 메소드를 사용해야 합니다:
import re line='abc def ; ghi, jkl,mno, pkr' #分隔符:分号,都逗号,空格符,前后可以跟着任意数量的额外空格 result=re.split(r'\s*[;,\s]\s*',line) print(result)
결과:
['abc', 'def', 'ghi', 'jkl', 'mno', 'pkr']
3.
re.split()은 구분 기호에 여러 패턴을 지정할 수 있으므로 유용합니다. 예를 들어 위 솔루션에서 구분 기호는 세미콜론, 쉼표, 공백이며 그 뒤에는 원하는 만큼의 추가 공백이 올 수 있습니다. str.split()에서 얻은 결과와 마찬가지로 최종 결과는 필드 목록입니다. re.split()을 사용할 때 정규식 패턴의 캡처 그룹이 괄호 안에 포함되는지 주의해야 합니다. 캡처 그룹을 사용하는 경우 일치하는 텍스트도 최종 결과에 포함됩니다. 예를 들어, 다음 사례를 살펴보십시오.import re line='abc def ; ghi, jkl,mno, pkr' result=re.split(r'\s*(;|,|\s)\s*',line) print(result)
['abc', ' ', 'def', ';', 'ghi', ',', 'jkl', ',', 'mno', ',', 'pkr']
import re line='abc def ; ghi, jkl,mno, pkr' result=re.split(r'\s*(;|,|\s)\s*',line) values=result[::2] delimiters=result[1::2]+[''] print(values) print(delimiters) last=''.join(v+d for v,d in zip(values,delimiters)) print(last)
['abc', 'def', 'ghi', 'jkl', 'mno', 'pkr'] [' ', ';', ',', ',', ',', ''] abc def;ghi,jkl,mno,pkr
import re line='abc def ; ghi, jkl,mno, pkr' result=re.split(r'\s*(?:;|,|\s)\s*',line) print(result)
['abc', 'def', 'ghi', 'jkl', 'mno', 'pkr']
위 내용은 Python은 원하는 수의 구분 기호에 대해 문자열을 분할합니다(코드 첨부).의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!