Python의 정규식 및 일반적인 일치 함수 소개
/Introduction/
Python은 버전 1.5부터 Perl 스타일 정규식 패턴을 제공하는 re 모듈을 추가했습니다. re 모듈을 사용하면 Python 언어가 모든 정규식 기능을 가질 수 있습니다.
컴파일 함수는 패턴 문자열과 선택적 플래그 매개변수를 기반으로 정규식 개체를 생성합니다. 이 객체에는 정규식 일치 및 교체를 위한 일련의 메서드가 있습니다.
re 모듈은 이러한 메서드와 정확히 동일한 함수도 제공합니다. 이러한 함수는 패턴 문자열을 첫 번째 매개 변수로 사용합니다.
/re.match function/
re.match는 문자열의 시작 위치에서 패턴을 일치시키려고 시도합니다. 시작 위치가 성공적으로 일치하지 않으면 match()가 반환됩니다. 없음. 구문은 다음과 같습니다.
re.match(pattern, string, flags=0)
"pattern"은 정규식 "string" 및 문자열 "flags" 플래그와 일치합니다.
일치에 성공하면 re.match 메서드는 일치하는 개체를 반환하고, 그렇지 않으면 None을 반환합니다.
group(num) 또는 groups() 일치 개체 함수를 사용하여 일치하는 표현식을 얻을 수 있습니다.
group(num=0) 匹配的整个表达式的字符串,“group()”可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
下图是个实际例子:
输出结果如下图所示:
/检索和替换/
Python 的re模块提供了re.sub用于替换字符串中的匹配项。语法如下所示:
re.sub(pattern, repl, string, count=0, flags=0)
参数:
pattern : 正则中的模式字符串。
repl : 替换的字符串,也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
flags : 编译时用的匹配模式,数字形式。
前三个为必参数,后两个为可选参数。
下图是个实际例子:
输出结果如下图所示:
/compile函数/
compile 函数用于编译正则表达式,供match() 和 search() 这两个函数使用。语法格式为:
re.compile(pattern[, flags])
参数:
pattern : 一个字符串形式的正则表达式
flags 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L은 현재 환경에 따라 특수 문자 집합 w, W, b, B, s, S를 나타냅니다.
re.M 다중 행 모드
re.S는 ' '를 포함합니다. 개행 문자 (' . '(줄 바꿈 제외)
을 포함한 모든 문자 re.U는 특수 문자 세트 w, W, b, B, d, D, s, S를 나타내며 유니코드 문자 속성 데이터베이스에 의존합니다
레.
re.MatchObject: group()은 RE와 일치하는 문자열을 반환합니다. Start() 일치하는 시작 위치로 돌아갑니다.
END() 일치하는 위치의 위치를 반환합니다. 정규식 수정자 - 선택적 플래그/정규 표현식에는 일치하는 패턴을 제어하기 위한 선택적 플래그 수정자가 포함될 수 있습니다. 수정자는 선택적 플래그로 지정됩니다. 여러 플래그는 비트별 OR(|)로 지정할 수 있습니다. 예를 들어, re.I | re.M은 I 및 M 플래그로 설정됩니다.
re.I | 대소문자를 구분하지 않습니다. | ||||
re.L | 은 locale-aware 일치 | ||||
re ^ | 및 $을 수행합니다. 레. re.U | ||||
Unicode | 문자 집합에 따라 문자를 구문 분석합니다. 이 기호는 w, W, b, B.에 영향을 미칩니다. | ||||
레. | /regular 표현식 패턴/ 패턴 문자열은 특수 구문을 사용하여 정규 표현식을 나타냅니다. 문자와 숫자는 자신을 나타냅니다. 정규식 패턴의 문자와 숫자는 동일한 문자열과 일치합니다. 대부분의 문자와 숫자 앞에 백슬래시가 있으면 다른 의미를 갖습니다. 구두점은 이스케이프된 경우에만 일치하며, 그렇지 않은 경우에는 특별한 의미를 나타냅니다. 백슬래시 자체는 백슬래시로 이스케이프 처리해야 합니다. 정규식에는 일반적으로 백슬래시가 포함되므로 이를 표현하려면 원시 문자열을 사용하는 것이 좋습니다. 패턴 요소(예: r't', \t와 동일)는 해당 특수 문자와 일치합니다. 다음 표에는 정규식 패턴 구문의 특수 요소가 나열되어 있습니다. 패턴을 사용하고 선택적 플래그 인수를 제공하면 일부 패턴 요소의 의미가 변경됩니다. 정규식 예 문자 일치 예 설명 파이썬 은 "python"과 일치합니다. 字符类 /实际应用/ 以猫眼电影为例。我们需要获取(电影的名字作者,上映时间)等等都可以用正则表达式来解析。 分析一下,利用正则表达式提取。 可以看到我们要的名字在一个a里面,而他们被一个div包裹着。 我们把div想象成一个盒子,可以看到div里面还有一个div 我们可以先找他上面一层的div是一个表单 分析完再实际操作一下: (.*?)表示我们要的内容 (.*?) /小结/ 1. 정규식은 여러 데이터를 얻어야 하는 시나리오에 적합합니다. 우리가 원하는 데이터를 더 빠르게 얻을 수 있습니다. 2. 이 글에서는 주로 정규식과 그 기본 사용법을 소개합니다. 각 문자의 구체적인 사용법은 서문의 정규식 시리즈 기사를 참조하여 정규식 사용법을 더 잘 이해하는 데 도움이 되기를 바랍니다. . 위 내용은 Python의 정규식 및 일반적인 일치 함수 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요! 사실적인 누드 사진을 만들기 위한 AI 기반 앱 사진에서 옷을 제거하는 온라인 AI 도구입니다. 무료로 이미지를 벗다 AI 옷 제거제 완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요! 사용하기 쉬운 무료 코드 편집기 중국어 버전, 사용하기 매우 쉽습니다. 강력한 PHP 통합 개발 환경 시각적 웹 개발 도구 신 수준의 코드 편집 소프트웨어(SublimeText3) PHP는 주로 절차 적 프로그래밍이지만 객체 지향 프로그래밍 (OOP)도 지원합니다. Python은 OOP, 기능 및 절차 프로그래밍을 포함한 다양한 패러다임을 지원합니다. PHP는 웹 개발에 적합하며 Python은 데이터 분석 및 기계 학습과 같은 다양한 응용 프로그램에 적합합니다. PHP는 웹 개발 및 빠른 프로토 타이핑에 적합하며 Python은 데이터 과학 및 기계 학습에 적합합니다. 1.PHP는 간단한 구문과 함께 동적 웹 개발에 사용되며 빠른 개발에 적합합니다. 2. Python은 간결한 구문을 가지고 있으며 여러 분야에 적합하며 강력한 라이브러리 생태계가 있습니다. Python은 부드러운 학습 곡선과 간결한 구문으로 초보자에게 더 적합합니다. JavaScript는 가파른 학습 곡선과 유연한 구문으로 프론트 엔드 개발에 적합합니다. 1. Python Syntax는 직관적이며 데이터 과학 및 백엔드 개발에 적합합니다. 2. JavaScript는 유연하며 프론트 엔드 및 서버 측 프로그래밍에서 널리 사용됩니다. PHP는 1994 년에 시작되었으며 Rasmuslerdorf에 의해 개발되었습니다. 원래 웹 사이트 방문자를 추적하는 데 사용되었으며 점차 서버 측 스크립팅 언어로 진화했으며 웹 개발에 널리 사용되었습니다. Python은 1980 년대 후반 Guidovan Rossum에 의해 개발되었으며 1991 년에 처음 출시되었습니다. 코드 가독성과 단순성을 강조하며 과학 컴퓨팅, 데이터 분석 및 기타 분야에 적합합니다. VS 코드는 Windows 8에서 실행될 수 있지만 경험은 크지 않을 수 있습니다. 먼저 시스템이 최신 패치로 업데이트되었는지 확인한 다음 시스템 아키텍처와 일치하는 VS 코드 설치 패키지를 다운로드하여 프롬프트대로 설치하십시오. 설치 후 일부 확장은 Windows 8과 호환되지 않을 수 있으며 대체 확장을 찾거나 가상 시스템에서 새로운 Windows 시스템을 사용해야합니다. 필요한 연장을 설치하여 제대로 작동하는지 확인하십시오. Windows 8에서는 VS 코드가 가능하지만 더 나은 개발 경험과 보안을 위해 새로운 Windows 시스템으로 업그레이드하는 것이 좋습니다. VS 코드는 파이썬을 작성하는 데 사용될 수 있으며 파이썬 애플리케이션을 개발하기에 이상적인 도구가되는 많은 기능을 제공합니다. 사용자는 다음을 수행 할 수 있습니다. Python 확장 기능을 설치하여 코드 완료, 구문 강조 및 디버깅과 같은 기능을 얻습니다. 디버거를 사용하여 코드를 단계별로 추적하고 오류를 찾아 수정하십시오. 버전 제어를 위해 git을 통합합니다. 코드 서식 도구를 사용하여 코드 일관성을 유지하십시오. 라인 도구를 사용하여 잠재적 인 문제를 미리 발견하십시오. VS 코드 확장은 악의적 인 코드 숨기기, 취약성 악용 및 합법적 인 확장으로 자위하는 등 악성 위험을 초래합니다. 악의적 인 확장을 식별하는 방법에는 게시자 확인, 주석 읽기, 코드 확인 및주의해서 설치가 포함됩니다. 보안 조치에는 보안 인식, 좋은 습관, 정기적 인 업데이트 및 바이러스 백신 소프트웨어도 포함됩니다. 메모장에서 Python 코드를 실행하려면 Python 실행 파일 및 NPPEXEC 플러그인을 설치해야합니다. Python을 설치하고 경로를 추가 한 후 nppexec 플러그인의 명령 "Python"및 매개 변수 "{current_directory} {file_name}"을 구성하여 Notepad의 단축키 "F6"을 통해 Python 코드를 실행하십시오. |