구두점은 당연히 제거되었으므로 정규식을 사용합니다.
정규식, 정규식이라고도 합니다. (영어: 정규식, 코드에서 regex, regexp 또는 RE로 축약되는 경우가 많음)은 컴퓨터 과학의 개념입니다. 정규식은 특정 패턴(규칙)과 일치하는 텍스트를 검색하고 바꾸는 데 자주 사용됩니다. (권장 학습: Python 비디오 튜토리얼)
정규식은 사전 정의된 특정 문자와 이러한 특정 문자의 조합을 사용하는 문자열 연산의 논리식입니다. 문자는 "규칙 문자열"을 형성합니다. 이 "규칙 문자열"은 문자열에 대한 필터링 논리를 표현하는 데 사용됩니다.
정규 표현식과 다른 문자열이 주어지면 다음을 얻을 수 있습니다.
1 Give 특정 문자열이 일치하는지 여부. 정규식의 필터링 논리("일치"라고 함):
2 정규식을 통해 문자열에서 원하는 특정 부분을 얻을 수 있습니다.
문자열의 구두점을 필터링하여 구두점을 제거하거나 바꾸는 효과를 얻을 수 있습니다.
import re punctuation = '!,;:?"\'' def removePunctuation(text): text = re.sub(r'[{}]+'.format(punctuation),'',text) return text.strip().lower() text = " Hello, world! " print removePunctuation(text)
정규식의 특징은 다음과 같습니다.
1 매우 강력한 유연성, 논리 및 기능. 2. 매우 간단한 방법으로 복잡한 문자열 제어를 빠르게 달성할 수 있습니다.
3 처음 접하는 사람들에게는 상대적으로 모호합니다.
더 많은 Python 관련 기술 기사를 보려면
Python Tutorial위 내용은 파이썬에서 구두점을 제거하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!