Python에서 여러 구분 기호로 문자열 분할
프로그래밍의 많은 작업에는 문자열 조작이 포함됩니다. 세미콜론, 쉼표 등 여러 구분 기호가 포함된 문자열을 작업할 때는 효율적으로 구분하는 것이 중요합니다.
정규 표현식 사용
일반적인 접근 방식 중 하나는 정규 표현식을 사용하는 것입니다. 예제 문자열을 고려해보세요.
"b-staged divinylsiloxane-bis-benzocyclobutene [124221-30-3], mesitylene [000108-67-8]; polymerized 1,2-dihydro-2,2,4- trimethyl quinoline [026780-96-1]"
이 문자열을 세미콜론이나 쉼표와 공백으로 분할하려면 다음 정규식을 사용할 수 있습니다.
'; |, '
이 패턴은 다음과 일치합니다. 세미콜론이나 쉼표 뒤에 공백이 옵니다. re.split() 함수를 사용하면 다음과 같이 문자열을 분할할 수 있습니다.
import re re.split('; |, ', "b-staged divinylsiloxane-bis-benzocyclobutene [124221-30-3], mesitylene [000108-67-8]; polymerized 1,2-dihydro-2,2,4- trimethyl quinoline [026780-96-1]")
참고: 후행 공백이 없는 개별 쉼표는 분할되지 않습니다.
업데이트: 확장 구분 기호 패턴
주어진 솔루션은 추가 항목을 포함하도록 더욱 확장될 수 있습니다. 구분 기호. 예를 들어, 다음 문자열을 세미콜론, 쉼표, 별표 및 개행 문자로 분할하려면:
"Beautiful, is; better*than\nugly"
정규식은 다음과 같습니다.
'; |, |\*|\n'
re.split() 함수 사용 이전과 같습니다:
re.split('; |, |\*|\n', 'Beautiful, is; better*than\nugly')
이렇게 하면 다음과 같이 분할됩니다. 결과:
['Beautiful', 'is', 'better', 'than', 'ugly']
위 내용은 정규식을 사용하여 Python에서 여러 구분 기호로 문자열을 어떻게 분할할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!