歸納整理python正規表示式解析-Python教學-PHP中文網

本篇文章為大家帶來了關於python的相關知識，其中主要介紹了Python正規表示式的相關問題，總結了包括正規表示式函數、元字元、特殊序列、集合套裝、配對物等等，希望對大家有幫助。

歸納整理python正規表示式解析

正規表示式的作用是什麼？我們網頁抓取到的內容很多，我們不可能全部都獲取，只需要其中的一部分內容，因此我們需要使用正則來匹配我們想要的內容。

正規表示式模組

Python 有一個名為的內建套件re，可用來處理正規表示式。導入re模組：

import re

登入後複製

Python中的正規表示式

匯入re模組後，您可以開始使用正規表示式。
例如：搜尋字串以查看它是否以“The”開頭並以“Spain”結尾：

import re

txt = "The rain in Spain"x = re.search("^The.*Spain$", txt)if x:
  print("匹配成功!")else:
  print("匹配失败")

登入後複製

運行：
歸納整理python正規表示式解析
當然，你現在看不懂這個例子，既然手把手教學，並不會教大家一步登天。

正規表示式函數

findall() 函數

該findall()函數傳回一個包含所有符合項目的清單。
例如：列印所有符合項目的清單

import re

txt = "川川菜鸟啊菜鸟啊"x = re.findall("菜鸟", txt)print(x)

登入後複製

執行回傳：
歸納整理python正規表示式解析
# 此清單會依照找到的順序包含符合項目。如果未找到符合項，則傳回一個空列表：

import re

txt = "菜鸟并不菜"x = re.findall("川川", txt)print(x)if (x):
  print("匹配成功了哟")else:
  print("找不到这个呀！")

登入後複製

執行傳回：
歸納整理python正規表示式解析

search() 函數

此search()函數在字串中搜尋符合項，如果有符合項，則傳回Match 物件。如果有多個符合項，則只傳回符合項的第一次出現。
例如：搜尋字串中的第一個空白字元：

import re

txt = "菜鸟 呢"x = re.search("\s", txt)print("第一个空格字符位于位置:", x.start())

登入後複製

執行結果：
歸納整理python正規表示式解析
如果未找到符合項，None則傳回該值：

import re

txt = "天上飞的是菜鸟"x = re.search("川川", txt)print(x)

登入後複製

傳回：
歸納整理python正規表示式解析

split() 函數

該split()函數傳回一個列表，其中的字串在每次符合時都會被拆分。
例如：在每個空白字元中拆分

import re

txt = "菜鸟 学 python"x = re.split("\s", txt)print(x)

登入後複製

運行返回：
歸納整理python正規表示式解析
# 您可以透過指定maxsplit 參數來控制出現次數
例如：僅在第一次出現時拆分字串：

import re#Split the string at the first white-space character:txt = "飞起来 菜鸟 们"x = re.split("\s", txt, 1)print(x)

登入後複製

回傳：
歸納整理python正規表示式解析

#sub() 函數

##該sub()函數用您選擇的文字替換匹配項。

例如：用只替換就

import re

txt = "学python就找川川菜鸟"x = re.sub("就", "只", txt)print(x)

登入後複製

運行：

歸納整理python正規表示式解析您可以透過指定count 參數來控制替換次數：
例如替換前2 次出現：

import re

txt = "学python就就就川川菜鸟"x = re.sub("就", "只", txt,2)print(x)

登入後複製

傳回：

歸納整理python正規表示式解析

元字元

#列表符號

##[]

用於一組字元 例如：#按字母順序找出「a」和「m」之間的所有小寫字元

import re

txt = "apple chuanchuan "#按字母顺序查找“a”和“m”之间的所有小写字符x = re.findall("[a-m]", txt)print(x)

登入後複製

執行：

歸納整理python正規表示式解析 # #轉義符

**

表示特殊序列（也可用於轉義特殊字元）

例如符合所有數字：

import re

txt = "我今年20岁了"#查找所有数字字符x = re.findall("\d", txt)print(x)

登入後複製

運行返回：

歸納整理python正規表示式解析任意符號

.

可以任何字元（換行符號除外）。

例如：搜尋以「he」開頭、後面跟著兩個（任意）字元和一個「o」的序列

import re

txt = "hello world"#搜索以“he”开头、后跟两个（任意）字符和一个“o”的序列x = re.findall("he..o", txt)print(x)

登入後複製

運行返回：

歸納整理python正規表示式解析開始符

^符號用於匹配開始。

import re

txt = "川川菜鸟 飞起来了"x = re.findall("^川", txt)if x:
  print("哇，我匹配到了")else:
  print("哎呀，匹配不了啊")

登入後複製

執行：

结束符

$ 符号用于匹配结尾，例如：匹配字符串是否以“world”结尾

import re

txt = "hello world"#匹配字符串是否以“world”结尾x = re.findall("world$", txt)if x:
  print("匹配成功了耶")else:
  print("匹配不到哦")

登入後複製

运行：
歸納整理python正規表示式解析

星号符

星号符用于匹配零次或者多次出现。

import re

txt = "天上飞的是菜鸟，学python找川川菜鸟!"#检查字符串是否包含“ai”后跟 0 个或多个“x”字符：x = re.findall("菜鸟*", txt)print(x)if x:
  print("匹配到了!")else:
  print("气死了，匹配不到啊")

登入後複製

运行：
歸納整理python正規表示式解析

加号符

+ 用于匹配一次或者多次出现
例如：检查字符串是否包含“菜鸟”后跟 1 个或多个“菜鸟”字符：

import re

txt = "飞起来了，菜鸟们!"#检查字符串是否包含“菜鸟”后跟 1 个或多个“菜鸟”字符：x = re.findall("菜鸟+", txt)print(x)if x:
  print("匹配到了!")else:
  print("烦死了，匹配不到")

登入後複製

运行：
歸納整理python正規表示式解析

集合符号

{} 恰好指定的出现次数
例如：检查字符串是否包含“川”两个

import re

txt = "川川菜鸟并不菜!"#检查字符串是否包含“川”两个x = re.findall("川{2}", txt)print(x)if x:
  print("匹配到了两次的川")else:
  print("匹配不到啊，帅哥")

登入後複製

返回：
歸納整理python正規表示式解析

或符

| 匹配两者任一
例如：匹配字符串菜鸟或者是我了

import re

txt = "菜鸟们学会python了吗？串串也是菜鸟啊!"x = re.findall("菜鸟|是我了", txt)print(x)if x:
  print("匹配到了哦！")else:
  print("匹配失败")

登入後複製

运行：
歸納整理python正規表示式解析

特殊序列

指定字符

\A ：如果指定的字符位于字符串的开头，则返回匹配项。
例如：匹配以菜字符开头的字符

import re

txt = "菜鸟在这里"x = re.findall("\A菜", txt)print(x)if x:
  print("是的匹配到了")else:
  print("匹配不到")

登入後複製

运行：
歸納整理python正規表示式解析

指定开头结尾

\b 返回指定字符位于单词开头或结尾的匹配项（开头的“r”确保字符串被视为原始字符串）。
例如：匹配爱开头

import re

txt = "爱你，川川"x = re.findall(r"\b爱", txt)print(x)if x:
  print("匹配到了")else:
  print("匹配不到")

登入後複製

运行：
歸納整理python正規表示式解析
又例如：匹配川结尾

import re

txt = "爱你，川川"x = re.findall(r"川\b", txt)print(x)if x:
  print("匹配到了")else:
  print("匹配不到")

登入後複製

运行：
歸納整理python正規表示式解析

匹配中间字符

\B 返回存在指定字符但不在单词开头（或结尾）的匹配项（开头的“r”确保字符串被视为“原始字符串”）
比如我匹配菜鸟：

import re

txt = "我是菜鸟我是菜鸟啊"#检查是否存在“ain”，但不是在单词的开头：x = re.findall(r"\菜鸟", txt)print(x)if x:
  print("匹配到了嘛！!")else:
  print("匹配不到哇！")

登入後複製

运行：
歸納整理python正規表示式解析
但是你匹配结尾就会返回空，比如我匹配鸟：

import re

txt = "川川菜鸟"#检查是否存在“鸟”，但不是在单词的末尾：x = re.findall(r"鸟\B", txt)print(x)if x:
  print("匹配到了哦")else:
  print("找不到")

登入後複製

运行：
歸納整理python正規表示式解析

匹配数字

\d 返回字符串包含数字（0-9 之间的数字）的匹配项。
例如：

import re

txt = "我今年20岁了啊"#检查字符串是否包含任何位数（0-9的数字）x = re.findall("\d", txt)print(x)if x:
  print("哇哇哇，匹配到数字了")else:
  print("找不到哦")

登入後複製

运行：
歸納整理python正規表示式解析

匹配非数字

\D 返回字符串不包含数字的匹配项
例如：

import re

txt = "我今年20岁"#匹配任何非数字符号x = re.findall("\D", txt)print(x)if x:
  print("匹配到了，开心!")else:
  print("匹配不到，生气")

登入後複製

运行：
歸納整理python正規表示式解析

空格匹配

\s 返回一个匹配字符串包含空白空间字符的匹配项。
例如：

import re

txt = "我 是 川 川 菜 鸟"#匹配任何空格字符x = re.findall("\s", txt)print(x)if x:
  print("匹配到了")else:
  print("匹配不到啊")

登入後複製

运行：
歸納整理python正規表示式解析

匹配非空格

\S 返回字符串不包含空格字符的匹配项

import re

txt = "菜鸟是  我  了"#匹配任意非空字符x = re.findall("\S", txt)print(x)if x:
  print("匹配到了!")else:
  print("匹配不到啊")

登入後複製

运行：
歸納整理python正規表示式解析

匹配任意数字和字母

返回一个匹配，其中字符串包含任何单词字符（从 a 到 Z 的字符，从 0 到 9 的数字，以及下划线 _ 字符）
例如：

import re

txt = "菜鸟啊 是串串呀"#在每个单词字符（从a到z的字符，0-9的数字）返回匹配项，以及下划线_字符）：x = re.findall("\w", txt)print(x)if x:
  print("匹配到了啊")else:
  print("匹配不到哇")

登入後複製

运行：
歸納整理python正規表示式解析

匹配任意非数字和字母

返回字符串不包含任何单词字符的匹配项，在每个非单词字符中返回匹配（不在A和Z之间的字符。“！”，“？”空白位等）
例如：

import re

txt = "菜鸟 是 我嘛？我不信！！"#在每个非单词字符中返回匹配（不在A和Z之间的字符。“！”，“？”空白位等）：x = re.findall("\W", txt)print(x)if x:
  print("匹配到了!")else:
  print("匹配不到啊")

登入後複製

运行：
歸納整理python正規表示式解析

匹配结尾

\Z 如果指定的字符位于字符串的末尾，则返回匹配项。
例如：

import re

txt = "川川是菜鸟啊"x = re.findall("啊\Z", txt)print(x)if x:
  print("匹配到了哦!")else:
  print("匹配不到")

登入後複製

集合套装

指定符范围匹配

例如集合：[arn]

import re

txt = "The rain in Spain"x = re.findall("[arn]", txt)print(x)if x:
  print("匹配到了!")else:
  print("匹配不到")

登入後複製

匹配任意范围内小写字母

返回任何小写字符的匹配项，按字母顺序在 a 和 n 之间。
例如:

import re

txt = "hello wo r l d"x = re.findall("[a-n]", txt)print(x)if x:
  print("匹配到了!")else:
  print("匹配不到")

登入後複製

运行：
歸納整理python正規表示式解析
同样的道理，依次其它情况如下：

[^arn] 返回除 a、r 和 n 之外的任何字符的匹配项

[0123] 返回存在任何指定数字（0、1、2 或 3）的匹配项

[0-9] 返回 0 到 9 之间任意数字的匹配项

[0-5][0-9] 返回 00 到 59 中任意两位数的匹配项

[a-zA-Z] 按字母顺序返回 a 和 z 之间的任何字符的匹配，小写或大写

[+] 在集合中，+, *, ., |, (), $,{} 没有特殊含义，所以 [+] 的意思是：返回字符串中任意 + 字符的匹配项。这个我i举个例子：

import re

txt = "5+6=11"#检查字符串是否有任何 + 字符：x = re.findall("[+]", txt)print(x)if x:
  print("匹配到了")else:
  print("匹配不到")

登入後複製

运行：
歸納整理python正規表示式解析

匹配对象

匹配对象是包含有关搜索和结果的信息的对象。注意：如果没有匹配，None将返回值，而不是匹配对象。
直接举个例子：
执行将返回匹配对象的搜索

import re#search() 函数返回一个 Match 对象：txt = "hello world"x = re.search("wo", txt)print(x)

登入後複製

运行：
歸納整理python正規表示式解析

Match 对象具有用于检索有关搜索和结果的信息的属性和方法：

span()返回一个包含匹配开始和结束位置的元组。
string返回传递给函数的字符串
group()返回字符串中匹配的部分

登入後複製

span函数

例如：打印第一个匹配项的位置（开始和结束位置）。正则表达式查找任何以大写“S”开头的单词：

import re#搜索单词开头的大写“S”字符，并打印其位置txt = "The rain in Spain"x = re.search(r"\bS\w+", txt)print(x.span())

登入後複製

运行：
歸納整理python正規表示式解析

string函数

例如：打印传递给函数的字符串

import re#返回字符串txt = "The rain in Spain"x = re.search(r"\bS\w+", txt)print(x.string)

登入後複製

group函数

例如：打印字符串中匹配的部分。正则表达式查找任何以大写“S”开头的单词

import re#搜索单词开头的大写“w”字符，并打印该单词：txt = "hello world"x = re.search(r"\bw\w+", txt)print(x.group())

登入後複製

运行：
歸納整理python正規表示式解析
注意：如果没有匹配，None将返回值，而不是匹配对象。

推荐学习：python教程

以上是歸納整理python正規表示式解析的詳細內容。更多資訊請關注PHP中文網其他相關文章！

歸納整理python正規表示式解析

正規表示式模組

Python中的正規表示式

正規表示式函數

findall() 函數

search() 函數

split() 函數

#sub() 函數

#列表符號

**

.

^符號用於匹配開始。 import re txt = "川川菜鸟 飞起来了"x = re.findall("^川", txt)if x: print("哇，我匹配到了")else: print("哎呀，匹配不了啊")登入後複製

结束符

星号符

加号符

集合符号

或符

特殊序列

指定字符

指定开头结尾

匹配中间字符

匹配数字

匹配非数字

空格匹配

匹配非空格

匹配任意数字和字母

匹配任意非数字和字母

匹配结尾

集合套装

指定符范围匹配

匹配任意范围内小写字母

匹配对象

span函数

string函数

group函数

^符號用於匹配開始。
import re txt = "川川菜鸟飞起来了"x = re.findall("^川", txt)if x: print("哇，我匹配到了")else: print("哎呀，匹配不了啊")
登入後複製