python 正则表达式学习小结
在Python中实现正则的方式是通过re(regular expression的缩写)模块来实现的,你可以调用re模块的各种方法来实现不同的功能,下面我们就来说下,在Python中通过re模块可以调用那些方法,以及这些方法的作用都是什么;还有就是正则的实例以及各种特殊符号的含义:
1、re.sub和replace:
sub的全拼是substitute,也就是替换的意思;既然知道是替换了,那就很容易用到实例中了,其实replace也是替换的意思,只不过它们的用法不太相同,下面用一个例子来详细说明下它们的异同之处:
>>> import re >>> str1 = 'Hello 111 is 222' >>> str2 = str1.replace('111','222') >>> print(str2) Hello 222 is 222 >>>
这是一个简单的例子,如果是下面这种情形,把所有的数字都换成222,那么用replace实现起来就比较麻烦,而用re模块的sub方法实现起来就比较的简单:(如果是更复杂的操作,使用replace可能就无法实现了。)
>>> import re >>> str1 = 'Hello 123 is 456' >>> str2 = re.sub('\d+','222',str1) >>> print(str2) Hello 222 is 222 >>>
2、re.search()和re.match():
match: 只从字符串的开始与正则表达式匹配,匹配成功返回matchobject,否则返回none.
search:将字符串的所有字串尝试与正则表达式匹配,如果所有的字串都没有匹配成功则返回none,否则返回matchobject.
下面这个例子说明了match和search的异同点,也说明了,在实际的应用中,search用的还是比较多的:
import re str = 'helloword,i am alex' if not re.match('word',str): print('cannot match') print(re.match('hello',str1).group()) print(re.search('word',str1).group()) #显示结果 cannot match hello word
3、re.split:
在Python中,如果想对一个字符串进行分割的话,只需要调用str的split方法就可以实现,但是这个split只能根据某个字符来进行分割的操作,如果要同时指定多个字符来进行分割的话,它就无法实现了。
好在re模块也提供了split这个方法来对字符串进行分割,而且这个方法更加强大,可以同时根据多个字符进行分割的操作,下面来看分别看一下str的split和re的split有什么不同的地方:
str1 = 'helloword,i;am\nalex' str2 = str1.split(',') print(str2) import re str3 = re.split('[,|;|\n]',str1) print(str3) #下面是不同的输出结果 ['helloword', 'i;am\nalex'] ['helloword', 'i', 'am', 'alex']
从中我们可以看出,上面说的真实性。
4、findall:
findall方法基本上都是和compile方法同时出现的,它们的用法是:
先由compile将一个正则表达式的字符串形式转换成pattern实例,然后再使用patte实例调用findall方法生成match对象来获取结果,在将它们结合的实例之前,我们先来看下正则表达式中预设的特殊字符含义:
\d 匹配任何十进制数;它相当于类 [0-9]。
\D 匹配任何非数字字符;它相当于类 [^0-9]。
\s 匹配任何空白字符;它相当于类 [ "t"n"r"f"v]。
\S 匹配任何非空白字符;它相当于类 [^ "t"n"r"f"v]。
\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]。
看完这几个特殊字符的含义,我们再举一个例子来说明一下上面的论点:
import re str1 = 'asdf12dvdve4gb4' pattern1 = re.compile('\d') pattern2 = re.compile('[0-9]') mch1 = pattern1.findall(str1) mch2 = pattern2.findall(str1) print('mch1:\t%s'% mch1) print('mch2:\t%s'% mch2) #输出结果 mch1: ['1', '2', '4', '4']13 mch2: ['1', '2', '4', '4']
上面的两个实例都可以很好的阐述上面的论点,而且也表明了,特殊字符\d确实跟[0-9]是一样的,通过输出结果就可以看出,那么如果你不想把每个数字都拆分为一个元素放在列表中,而是想把12整体的输出出来,那么你可以这样做:(就是在\d的后面加上个+号来实现的,这里的+号表示的是把一个或者多个相连的十进制数字整体输出)
import re str1 = 'asdf12dvdve4gb4' pattern1 = re.compile('\d+') pattern2 = re.compile('[0-9]') mch1 = pattern1.findall(str1) mch2 = pattern2.findall(str1) print('mch1:\t%s'% mch1) print('mch2:\t%s'% mch2) #输出结果 mch1: ['12', '4', '4'] mch2: ['1', '2', '4', '4']
我们再举一个小例子,这个例子是结合特殊字符和re的sub功能实现一下把字符串中所有的空格都给去掉:
import re str1 = 'asd \tf12d vdve4gb4' new_str = re.sub('\s*','',str) print(new_str) #输出结果 asdf12dvdve4gb4
5、元字符:
我们通常所说的二元字符有;2元字符:. ^ $ * + ? { } [ ] | ( ) \
我们首先考察的元字符是"[" 和 "]"。它们常用来指定一个字符类别,所谓字符类别就是你想匹配的一个字符集。字符可以单个列出,也可以用“-”号分隔的两个给定
字符来表示一个字符区间。例如,[abc] 将匹配"a", "b", 或 "c"中的任意一个字符;也可以用区间[a-c]来表示同一字符集,和前者效果一致。如果你只想匹配小写字母,那么 RE 应写成 [a-z].元字符在类别里并不起作用。例如,[akm$]将匹配字符"a", "k", "m", 或 "$" 中的任意一个;"$"通常用作元字符,但在字符类别里,其特性被除去,恢复成普通字
符。
[]:元字符[]表示字符类,在一个字符类中,只有字符^、-、]和\有特殊含义。字符\仍然表示转义,字符-可以定义字符范围,字符^放在前面,表示非.(这个在上面的特殊字符示例中也有提现),
+ 匹配+号前内容1次至无限次
? 匹配?号前内容0次到1次
{m} 匹配前面的内容m次
{m,n} 匹配前面的内容m到n次
下面通过一个小例子,来阐述一下上面的字符在元字符[]中的使用:(在下面的这个例子中,要注意的有两点:一是在\d+后面的?号的含义,二是在匹配的前面加上了一个字符r,其实在这个示例中,加与不加都可以显示一样的结果)
>>> import re >>> print(re.findall(r"a(\d+?)","a123b")) ['1'] >>> print(re.findall(r"a(\d+)","a123b")) ['123'] >>>
以上所述是小编给大家介绍的python 正则表达式学习小结,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对PHP中文网的支持!
更多python 正则表达式学习小结相关文章请关注PHP中文网!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial ini menunjukkan cara menggunakan Python untuk memproses konsep statistik undang -undang ZIPF dan menunjukkan kecekapan membaca dan menyusun fail teks besar Python semasa memproses undang -undang. Anda mungkin tertanya -tanya apa maksud pengedaran ZIPF istilah. Untuk memahami istilah ini, kita perlu menentukan undang -undang Zipf. Jangan risau, saya akan cuba memudahkan arahan. Undang -undang Zipf Undang -undang Zipf hanya bermaksud: Dalam korpus bahasa semulajadi yang besar, kata -kata yang paling kerap berlaku muncul kira -kira dua kali lebih kerap sebagai kata -kata kerap kedua, tiga kali sebagai kata -kata kerap ketiga, empat kali sebagai kata -kata kerap keempat, dan sebagainya. Mari kita lihat contoh. Jika anda melihat corpus coklat dalam bahasa Inggeris Amerika, anda akan melihat bahawa perkataan yang paling kerap adalah "th

Artikel ini menerangkan cara menggunakan sup yang indah, perpustakaan python, untuk menghuraikan html. Ia memperincikan kaedah biasa seperti mencari (), find_all (), pilih (), dan get_text () untuk pengekstrakan data, pengendalian struktur dan kesilapan HTML yang pelbagai, dan alternatif (sel

Berurusan dengan imej yang bising adalah masalah biasa, terutamanya dengan telefon bimbit atau foto kamera resolusi rendah. Tutorial ini meneroka teknik penapisan imej di Python menggunakan OpenCV untuk menangani isu ini. Penapisan Imej: Alat yang berkuasa Penapis Imej

Fail PDF adalah popular untuk keserasian silang platform mereka, dengan kandungan dan susun atur yang konsisten merentasi sistem operasi, peranti membaca dan perisian. Walau bagaimanapun, tidak seperti Python memproses fail teks biasa, fail PDF adalah fail binari dengan struktur yang lebih kompleks dan mengandungi unsur -unsur seperti fon, warna, dan imej. Mujurlah, tidak sukar untuk memproses fail PDF dengan modul luaran Python. Artikel ini akan menggunakan modul PYPDF2 untuk menunjukkan cara membuka fail PDF, mencetak halaman, dan mengekstrak teks. Untuk penciptaan dan penyuntingan fail PDF, sila rujuk tutorial lain dari saya. Penyediaan Inti terletak pada menggunakan modul luaran PYPDF2. Pertama, pasangkannya menggunakan PIP: Pip adalah p

Tutorial ini menunjukkan cara memanfaatkan caching redis untuk meningkatkan prestasi aplikasi python, khususnya dalam rangka kerja Django. Kami akan merangkumi pemasangan Redis, konfigurasi Django, dan perbandingan prestasi untuk menyerlahkan bene

Artikel ini membandingkan tensorflow dan pytorch untuk pembelajaran mendalam. Ia memperincikan langkah -langkah yang terlibat: penyediaan data, bangunan model, latihan, penilaian, dan penempatan. Perbezaan utama antara rangka kerja, terutamanya mengenai grap pengiraan

Python, kegemaran sains dan pemprosesan data, menawarkan ekosistem yang kaya untuk pengkomputeran berprestasi tinggi. Walau bagaimanapun, pengaturcaraan selari dalam Python memberikan cabaran yang unik. Tutorial ini meneroka cabaran -cabaran ini, memberi tumpuan kepada Interprete Global

Tutorial ini menunjukkan mewujudkan struktur data saluran paip tersuai di Python 3, memanfaatkan kelas dan pengendali yang berlebihan untuk fungsi yang dipertingkatkan. Fleksibiliti saluran paip terletak pada keupayaannya untuk menggunakan siri fungsi ke set data, GE
