Python의 정규식 및 일반적인 일치 함수 소개
/Introduction/
Python은 버전 1.5부터 Perl 스타일 정규식 패턴을 제공하는 re 모듈을 추가했습니다. re 모듈을 사용하면 Python 언어가 모든 정규식 기능을 가질 수 있습니다.
컴파일 함수는 패턴 문자열과 선택적 플래그 매개변수를 기반으로 정규식 개체를 생성합니다. 이 객체에는 정규식 일치 및 교체를 위한 일련의 메서드가 있습니다.
re 모듈은 이러한 메서드와 정확히 동일한 함수도 제공합니다. 이러한 함수는 패턴 문자열을 첫 번째 매개 변수로 사용합니다.
/re.match function/
re.match는 문자열의 시작 위치에서 패턴을 일치시키려고 시도합니다. 시작 위치가 성공적으로 일치하지 않으면 match()가 반환됩니다. 없음. 구문은 다음과 같습니다.
re.match(pattern, string, flags=0)
"pattern"은 정규식 "string" 및 문자열 "flags" 플래그와 일치합니다.
일치에 성공하면 re.match 메서드는 일치하는 개체를 반환하고, 그렇지 않으면 None을 반환합니다.
group(num) 또는 groups() 일치 개체 함수를 사용하여 일치하는 표현식을 얻을 수 있습니다.
group(num=0) 匹配的整个表达式的字符串,“group()”可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
下图是个实际例子:
输出结果如下图所示:
/检索和替换/
Python 的re模块提供了re.sub用于替换字符串中的匹配项。语法如下所示:
re.sub(pattern, repl, string, count=0, flags=0)
参数:
pattern : 正则中的模式字符串。
repl : 替换的字符串,也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
flags : 编译时用的匹配模式,数字形式。
前三个为必参数,后两个为可选参数。
下图是个实际例子:
输出结果如下图所示:
/compile函数/
compile 函数用于编译正则表达式,供match() 和 search() 这两个函数使用。语法格式为:
re.compile(pattern[, flags])
参数:
pattern : 一个字符串形式的正则表达式
flags 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L은 현재 환경에 따라 특수 문자 집합 w, W, b, B, s, S를 나타냅니다.
re.M 다중 행 모드
re.S는 ' '를 포함합니다. 개행 문자 (' . '(줄 바꿈 제외)
을 포함한 모든 문자 re.U는 특수 문자 세트 w, W, b, B, d, D, s, S를 나타내며 유니코드 문자 속성 데이터베이스에 의존합니다
레.
re.MatchObject: group()은 RE와 일치하는 문자열을 반환합니다. Start() 일치하는 시작 위치로 돌아갑니다.
END() 일치하는 위치의 위치를 반환합니다. 정규식 수정자 - 선택적 플래그/정규 표현식에는 일치하는 패턴을 제어하기 위한 선택적 플래그 수정자가 포함될 수 있습니다. 수정자는 선택적 플래그로 지정됩니다. 여러 플래그는 비트별 OR(|)로 지정할 수 있습니다. 예를 들어, re.I | re.M은 I 및 M 플래그로 설정됩니다.
re.I | 대소문자를 구분하지 않습니다. | ||||
re.L | 은 locale-aware 일치 | ||||
re ^ | 및 $을 수행합니다. 레. re.U | ||||
Unicode | 문자 집합에 따라 문자를 구문 분석합니다. 이 기호는 w, W, b, B.에 영향을 미칩니다. | ||||
레. | /regular 표현식 패턴/ 패턴 문자열은 특수 구문을 사용하여 정규 표현식을 나타냅니다. 문자와 숫자는 자신을 나타냅니다. 정규식 패턴의 문자와 숫자는 동일한 문자열과 일치합니다. 대부분의 문자와 숫자 앞에 백슬래시가 있으면 다른 의미를 갖습니다. 구두점은 이스케이프된 경우에만 일치하며, 그렇지 않은 경우에는 특별한 의미를 나타냅니다. 백슬래시 자체는 백슬래시로 이스케이프 처리해야 합니다. 정규식에는 일반적으로 백슬래시가 포함되므로 이를 표현하려면 원시 문자열을 사용하는 것이 좋습니다. 패턴 요소(예: r't', \t와 동일)는 해당 특수 문자와 일치합니다. 다음 표에는 정규식 패턴 구문의 특수 요소가 나열되어 있습니다. 패턴을 사용하고 선택적 플래그 인수를 제공하면 일부 패턴 요소의 의미가 변경됩니다. 정규식 예 문자 일치 예 설명 파이썬 은 "python"과 일치합니다. 字符类 /实际应用/ 以猫眼电影为例。我们需要获取(电影的名字作者,上映时间)等等都可以用正则表达式来解析。 分析一下,利用正则表达式提取。 可以看到我们要的名字在一个a里面,而他们被一个div包裹着。 我们把div想象成一个盒子,可以看到div里面还有一个div 我们可以先找他上面一层的div是一个表单 分析完再实际操作一下: (.*?)表示我们要的内容 (.*?) /小结/ 1. 정규식은 여러 데이터를 얻어야 하는 시나리오에 적합합니다. 우리가 원하는 데이터를 더 빠르게 얻을 수 있습니다. 2. 이 글에서는 주로 정규식과 그 기본 사용법을 소개합니다. 각 문자의 구체적인 사용법은 서문의 정규식 시리즈 기사를 참조하여 정규식 사용법을 더 잘 이해하는 데 도움이 되기를 바랍니다. . 위 내용은 Python의 정규식 및 일반적인 일치 함수 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요! 사실적인 누드 사진을 만들기 위한 AI 기반 앱 사진에서 옷을 제거하는 온라인 AI 도구입니다. 무료로 이미지를 벗다 AI 옷 제거제 AI Hentai를 무료로 생성하십시오. 사용하기 쉬운 무료 코드 편집기 중국어 버전, 사용하기 매우 쉽습니다. 강력한 PHP 통합 개발 환경 시각적 웹 개발 도구 신 수준의 코드 편집 소프트웨어(SublimeText3) "Debiantrings"는 표준 용어가 아니며 구체적인 의미는 여전히 불분명합니다. 이 기사는 브라우저 호환성에 직접 언급 할 수 없습니다. 그러나 "Debiantrings"가 Debian 시스템에서 실행되는 웹 응용 프로그램을 지칭하는 경우 브라우저 호환성은 응용 프로그램 자체의 기술 아키텍처에 따라 다릅니다. 대부분의 최신 웹 응용 프로그램은 크로스 브라우저 호환성에 전념합니다. 이는 웹 표준에 따라 웹 표준과 잘 호환 가능한 프론트 엔드 기술 (예 : HTML, CSS, JavaScript) 및 백엔드 기술 (PHP, Python, Node.js 등)을 사용하는 데 의존합니다. 응용 프로그램이 여러 브라우저와 호환되도록 개발자는 종종 브라우저 크로스 테스트를 수행하고 응답 성을 사용해야합니다. 모바일 XML에서 PDF의 속도는 다음 요인에 따라 다릅니다. XML 구조의 복잡성. 모바일 하드웨어 구성 변환 방법 (라이브러리, 알고리즘) 코드 품질 최적화 방법 (효율적인 라이브러리 선택, 알고리즘 최적화, 캐시 데이터 및 다중 스레딩 사용). 전반적으로 절대적인 답변은 없으며 특정 상황에 따라 최적화해야합니다. XML 컨텐츠를 수정하려면 프로그래밍이 필요합니다. 대상 노드를 추가, 삭제, 수정 및 확인하려면 정확한 찾기가 필요하기 때문입니다. 프로그래밍 언어에는 XML을 처리하기위한 해당 라이브러리가 있으며 운영 데이터베이스와 같이 안전하고 효율적이며 제어 가능한 작업을 수행 할 수있는 API를 제공합니다. XML을 PDF로 직접 변환하는 응용 프로그램은 근본적으로 다른 두 형식이므로 찾을 수 없습니다. XML은 데이터를 저장하는 데 사용되는 반면 PDF는 문서를 표시하는 데 사용됩니다. 변환을 완료하려면 Python 및 ReportLab과 같은 프로그래밍 언어 및 라이브러리를 사용하여 XML 데이터를 구문 분석하고 PDF 문서를 생성 할 수 있습니다. 작은 XML 파일의 경우 주석 내용을 텍스트 편집기로 직접 교체 할 수 있습니다. 큰 파일의 경우 XML 파서를 사용하여 효율성과 정확성을 보장하기 위해 수정하는 것이 좋습니다. XML 주석을 삭제할 때주의를 기울이면 주석을 유지하면 일반적으로 코드 이해 및 유지 관리에 도움이됩니다. 고급 팁은 XML 파서를 사용하여 댓글을 수정하기위한 파이썬 샘플 코드를 제공하지만 사용 된 XML 라이브러리에 따라 특정 구현을 조정해야합니다. XML 파일을 수정할 때 인코딩 문제에주의하십시오. UTF-8 인코딩을 사용하고 인코딩 형식을 지정하는 것이 좋습니다. XML 이미지를 먼저 변환하려면 먼저 XML 데이터 구조를 결정한 다음 Python의 Matplotlib와 같은 적절한 그래픽 라이브러리를 선택하고 데이터 구조를 기반으로 시각화 전략을 선택하고 데이터 볼륨 및 이미지 형식을 고려하고 효율적인 라이브러리를 수행하거나 필요에 따라 PNG, JPEG 또는 SVG로 저장하십시오. 대부분의 텍스트 편집기를 사용하여 XML 파일을여십시오. 보다 직관적 인 트리 디스플레이가 필요한 경우 Oxygen XML 편집기 또는 XMLSPy와 같은 XML 편집기를 사용할 수 있습니다. 프로그램에서 XML 데이터를 처리하는 경우 프로그래밍 언어 (예 : Python) 및 XML 라이브러 (예 : XML.etree.elementtree)를 사용하여 구문 분석해야합니다. 휴대폰에서 고품질로 XML을 PDF로 변환하려면 클라우드에서 XML을 구문 분석하고 서버리스 컴퓨팅 플랫폼을 사용하여 PDF를 생성합니다. 효율적인 XML 파서 및 PDF 생성 라이브러리를 선택하십시오. 오류를 올바르게 처리합니다. 휴대 전화에서 무거운 작업을 피하기 위해 클라우드 컴퓨팅 파워를 최대한 활용하십시오. 복잡한 XML 구조 처리, 다중 페이지 PDF 생성 및 이미지 추가를 포함하여 요구 사항에 따라 복잡성을 조정하십시오. 로그 정보를 인쇄하여 디버그를 돕습니다. 성능을 최적화하고 효율적인 파서 및 PDF 라이브러리를 선택하고 비동기 프로그래밍 또는 XML 데이터를 사용할 수 있습니다. 우수한 코드 품질과 유지 관리를 보장하십시오. |