Heim Backend-Entwicklung Python-Tutorial Python匹配中文的正则表达式

Python匹配中文的正则表达式

Jun 10, 2016 pm 03:04 PM
python正则表达式

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。

Python正则表达式简介

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。

Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。

以上说的都是给正文做铺垫的,下面看下python正则表达式如何匹配中文的。

# -*- coding: utf-8 -*-
import re
def findPart(regex, text, name):
res=re.findall(regex, text)
if res:
print "There are %d %s parts:\n"% (len(res), name)
for r in res:
print "\t",r.encode("utf8")
print
text ="#who#helloworld#a中文x#"
usample=unicode(text,'utf8')
findPart(u"#[\w\u2E80-\u9FFF]+#", usample, "unicode chinese")
Nach dem Login kopieren

注:

几个主要非英文语系字符范围

2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。

3400~4DFFh:中日韩认同表意文字扩充A区,总计收容6,582个中日韩汉字。

4E00~9FFFh:中日韩认同表意文字区,总计收容20,902个中日韩汉字。

A000~A4FFh:彝族文字区,收容中国南方彝族文字和字根。

AC00~D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。

F900~FAFFh:中日韩兼容表意文字区,总计收容302个中日韩汉字。

FB00~FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角

(
#!/usr/bin/python3
# -*- coding: UTF-8 -*-
import re
message = u'天人合一'.encode('utf8')
print(re.search(u'人'.encode('utf8'), message).group())
交互模式下的例子
>>> import re
>>> s='Phone No. 010-87654321'
>>> 
>>> r=re.compile(r'(\d+)-(\d+)')
>>> m=r.search(s)
>>> m
<_sre.SRE_Match object at 0x010EE218>
)
Nach dem Login kopieren

以上所述是小编给大家介绍的Python正则表达式匹配中文的方法,希望对大家有所帮助!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

So verwenden Sie reguläre Python-Ausdrücke für die Verarbeitung von Word-Dateien So verwenden Sie reguläre Python-Ausdrücke für die Verarbeitung von Word-Dateien Jun 22, 2023 am 09:57 AM

Der reguläre Python-Ausdruck ist ein leistungsstarkes Matching-Tool, mit dem wir Text, Stile und Formate in der Word-Dateiverarbeitung schnell identifizieren und ersetzen können. In diesem Artikel wird erläutert, wie Sie reguläre Python-Ausdrücke für die Verarbeitung von Word-Dateien verwenden. 1. Installieren Sie die Python-docx-Bibliothek. Python-docx ist eine Funktionsbibliothek zur Verarbeitung von Word-Dokumenten in Python. Sie können sie zum schnellen Lesen, Ändern, Erstellen und Speichern von Word-Dokumenten verwenden. Bevor Sie Python-docx verwenden, müssen Sie sicherstellen

So verwenden Sie reguläre Python-Ausdrücke zur Verarbeitung von Zahlen und Beträgen So verwenden Sie reguläre Python-Ausdrücke zur Verarbeitung von Zahlen und Beträgen Jun 23, 2023 am 08:21 AM

Reguläre Python-Ausdrücke sind ein leistungsstarkes Werkzeug, das uns hilft, präzise und effiziente Abgleiche und Suchen in Textdaten durchzuführen. Reguläre Ausdrücke sind auch bei der Verarbeitung von Zahlen und Beträgen äußerst nützlich und können die Zahlen- und Beträgeinformationen genau finden und extrahieren. In diesem Artikel wird die Verwendung regulärer Python-Ausdrücke zur Verarbeitung von Zahlen und Beträgen vorgestellt, um den Lesern dabei zu helfen, die tatsächlichen Datenverarbeitungsaufgaben besser zu bewältigen. 1. Zahlen verarbeiten 1. Ganzzahlen und Gleitkommazahlen abgleichen In regulären Ausdrücken können Sie zum Abgleichen von Ganzzahlen und Gleitkommazahlen d+ verwenden.

So verwenden Sie reguläre Python-Ausdrücke für die Container-Orchestrierung So verwenden Sie reguläre Python-Ausdrücke für die Container-Orchestrierung Jun 22, 2023 am 09:16 AM

Bei der Container-Orchestrierung müssen wir häufig einige Informationen filtern, abgleichen und ersetzen. Python bietet reguläre Ausdrücke, ein leistungsstarkes Tool, das uns bei der Durchführung dieser Vorgänge helfen kann. In diesem Artikel wird die Verwendung regulärer Python-Ausdrücke für die Container-Orchestrierung vorgestellt, einschließlich Grundkenntnissen regulärer Ausdrücke, der Verwendung des Pythonre-Moduls und einiger gängiger regulärer Ausdrucksanwendungen. 1. Grundkenntnisse regulärer Ausdrücke. Regulärer Ausdruck (RegularExpression) bezieht sich auf ein verwendetes Textmuster

So verwenden Sie reguläre Python-Ausdrücke zur Wortsegmentierung So verwenden Sie reguläre Python-Ausdrücke zur Wortsegmentierung Jun 23, 2023 am 10:37 AM

Reguläre Python-Ausdrücke sind ein leistungsstarkes Werkzeug zur Verarbeitung von Textdaten. Bei der Verarbeitung natürlicher Sprache ist die Wortsegmentierung eine wichtige Aufgabe, die einen Text in einzelne Wörter zerlegt. In Python können wir reguläre Ausdrücke verwenden, um die Aufgabe der Wortsegmentierung abzuschließen. Im Folgenden wird Python3 als Beispiel verwendet, um die Verwendung regulärer Ausdrücke für die Wortsegmentierung vorzustellen. Importieren Sie das re-Modul. Das re-Modul ist das in Python integrierte Modul für reguläre Ausdrücke. Sie müssen das Modul zuerst importieren. Definitionstext importieren

So verwenden Sie reguläre Python-Ausdrücke zur Inhaltsextraktion So verwenden Sie reguläre Python-Ausdrücke zur Inhaltsextraktion Jun 22, 2023 pm 03:04 PM

Python ist eine weit verbreitete High-Level-Programmiersprache mit einem umfangreichen Satz an Bibliotheken und Tools, die die Inhaltsextraktion einfacher und effizienter machen. Unter diesen sind reguläre Ausdrücke ein sehr wichtiges Werkzeug, und Python bietet das re-Modul zur Verwendung regulärer Ausdrücke zur Inhaltsextraktion. In diesem Artikel werden Ihnen die spezifischen Schritte zur Verwendung regulärer Python-Ausdrücke zur Inhaltsextraktion vorgestellt. 1. Verstehen Sie die grundlegende Syntax regulärer Ausdrücke. Bevor Sie reguläre Python-Ausdrücke zur Inhaltsextraktion verwenden, müssen Sie zunächst die grundlegende Syntax regulärer Ausdrücke verstehen.

So verwenden Sie reguläre Python-Ausdrücke für die Code-Umgestaltung So verwenden Sie reguläre Python-Ausdrücke für die Code-Umgestaltung Jun 23, 2023 am 09:44 AM

Beim täglichen Codieren müssen wir den Code häufig ändern und rekonstruieren, um die Lesbarkeit und Wartbarkeit des Codes zu verbessern. Eines der wichtigsten Werkzeuge sind reguläre Ausdrücke. In diesem Artikel werden einige gängige Techniken zur Verwendung regulärer Python-Ausdrücke für die Code-Umgestaltung vorgestellt. 1. Suchen und Ersetzen Eine der am häufigsten verwendeten Funktionen regulärer Ausdrücke ist Suchen und Ersetzen. Angenommen, wir müssen alle Druckanweisungen im Code durch Protokollierungsanweisungen ersetzen. Wir können den folgenden regulären Ausdruck verwenden, um Folgendes zu finden: prints*((.

So verwenden Sie reguläre Python-Ausdrücke für Datenstrukturen und Algorithmen So verwenden Sie reguläre Python-Ausdrücke für Datenstrukturen und Algorithmen Jun 22, 2023 pm 08:01 PM

Der reguläre Python-Ausdruck ist ein auf Mustervergleich basierendes String-Verarbeitungstool, mit dem wir schnell und effizient die erforderlichen Informationen aus Text extrahieren können. In Datenstrukturen und Algorithmen können reguläre Ausdrücke verwendet werden, um Textabgleich, Ersetzung, Segmentierung und andere Funktionen zu implementieren und so unsere Programmierung leistungsfähiger zu unterstützen. In diesem Artikel wird erläutert, wie Sie reguläre Python-Ausdrücke für Datenstrukturen und Algorithmen verwenden. 1. Grundkenntnisse über reguläre Ausdrücke Bevor wir beginnen, wollen wir zunächst einige Grundkenntnisse über reguläre Ausdrücke verstehen: Zeichensatz: dargestellt durch eckige Klammern,

So verwenden Sie reguläre Python-Ausdrücke für Codeästhetik und Benutzererfahrung So verwenden Sie reguläre Python-Ausdrücke für Codeästhetik und Benutzererfahrung Jun 22, 2023 am 08:45 AM

Bei der Softwareentwicklung werden Codeästhetik und Benutzererfahrung häufig ignoriert, was bei der tatsächlichen Verwendung viele Softwareprobleme verursacht. Als leistungsstarke Programmiersprache stellt Python reguläre Ausdrücke als leistungsstarkes Werkzeug zur Verfügung, das uns bei der Lösung dieser Probleme hilft. In diesem Artikel wird erläutert, wie Sie reguläre Python-Ausdrücke für Codeästhetik und Benutzererfahrung verwenden. 1. Einführung in reguläre Ausdrücke in Python. Reguläre Ausdrücke sind eine Sprache, die Textmuster beschreibt und zum Zuordnen, Suchen, Ersetzen und Teilen von Text verwendet werden kann. Das re-Modul von Python bietet

See all articles