So implementieren Sie reguläre Ausdrücke in Python
Python-regulärer Ausdruck
Regulärer Ausdruck selbst ist ein Wissen, das unabhängig von der Programmiersprache ist, aber grundsätzlich hängt die von uns verwendete Programmiersprache von der Implementierung ab. Natürlich gibt es auch einige Unterschiede in der Bei der Implementierung unterstützen einige mehr Funktionen, andere weniger.
Da reguläre Ausdrücke in der Praxis ein weit verbreitetes Werkzeug sind, halte ich es für unzuverlässig, sie ohne Sprache zu lernen.
Einführung in reguläre Ausdrucksfunktionen
Haupt-API-Beziehungsdiagramm für reguläre Ausdrücke
Dieses Diagramm ist meine persönliche Zusammenfassung. Ich denke, ich habe hier im Wesentlichen die Beziehung zwischen den Funktionen geklärt:
match stimmt mit dem regulären Ausdruck vom Anfang des Textes überein und gibt das passende Objekt zurück. Wenn nicht, gibt es None zurück.
search Stimmt mit dem regulären Ausdruck im gesamten Text überein und gibt das erste passende Objekt zurück.
sub verwendet reguläre Ausdrücke zur Textersetzung (Funktion regulärer Ausdrücke: Suchen und Ersetzen)
findall sucht nach regulären Ausdrücken aus dem gesamten Text und gibt alle passenden Ergebnisse in Form einer Liste zurück.
finditer gleicht einen regulären Ausdruck aus dem gesamten Text ab und gibt alle passenden Ergebnisse als Iterator zurück.
split verwendet reguläre Ausdrücke, um Text aufzuteilen
Wie Sie hier sehen können, gibt es viele Funktionen, die direkt unter ·re· verwendet werden können, und es gibt viele Funktionen mit demselben Namen unter re .compile
-Funktion. Direkt unter dem ·re·-Modul befinden sich offiziell bereitgestellte Funktionen zur einfachen Verwendung. Die orthodoxste Art, sie zu verwenden, ist re.compile
. re.compile
下面有很多同名的函数。直接在 ·re· 模块下的是官方提供方便使用的函数,通过 re.compile
来使用是最正统的方式。所以,接下来的内容,我基本上智慧使用 re.compile
及其下的方法来实现。
re.compile 函数
compile
函数用于编译正则表达式,生成一个正则表达式 (Pattern)对象,供 match()
和 search()
以及其它函数使用。
语法:
re.compile(pattern[, flags])
pattern: 一个字符串形式的正则表达式
flags 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L 多行模式
re.S 即为 '.' 并且包括换行符在内的任意字符('.' 不包括换行符)
re.U 表示特殊字符集 w, W, b, B, d, D, s, S 依赖 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和 ‘#’ 后面的注释
示例:查找字符串中的所有数字
import re s = 'runoob 123 google 456' result1 = re.findall(r'\d+', s) pattern = re.compile(r'\d+') # 查找数字 result2 = pattern.findall(s) result3 = pattern.findall(s, 0, 20) print(result1) print(result2) print(result3) """ output: [‘123', ‘456'] [‘123', ‘456'] [‘123', ‘45'] """
学习模板
接下来我们要逐渐学习正则表达的内容,这些内容是非常有趣的!Interesting and Excited!
这里给出一个接下来会一直使用的示例模板,这个模板是这篇博客最重要的东西了,之后的内容都会基于它进行扩展。所以,请好好理解它。
import re # 需要进行搜索或者匹配的文本 text = """I love you yesterday and today.""" # 正则表达式 regexp = r'love' # 编译(对正则表达式进行编译获取 Pattern Object) pattern = re.compile(regexp) # 搜索 m = pattern.search(text) if m: print("匹配对象: ", m) print("匹配的字符串: ", m.group()) print("匹配的开始位置: ", m.start()) print("匹配的结束位置: ", m.end()) print("匹配位置的元组: ", m.span()) else: print("No match!") # 替换 new_text = pattern.sub("hate", text) print(new_text)
注意: 正则表达式 regexp 在开始前会使用 r
Für den folgenden Inhalt verwende ich grundsätzlich re.compile
und die folgenden Methoden, um dies zu erreichen.
compile
-Funktion wird verwendet, um reguläre Ausdrücke zu kompilieren und ein reguläres Ausdrucksobjekt (Muster) für match()
und search( zu generieren )
und andere Funktionen. Muster: ein regulärer Ausdruck in Form einer Zeichenfolge | |
re.I Groß- und Kleinschreibung ignorieren | |
re.L Mehrzeilenmodus | |
re.U stellt den Sonderzeichensatz w, W, b, B, d, D, s, S dar und basiert auf der Unicode-Zeichenattributdatenbank | |
re.X, um die Lesbarkeit zu erhöhen. Leerzeichen ignorieren und Kommentare nach „#’ |

r
. Der Zweck besteht darin, die Verwendung einer großen Anzahl von Escape-Zeichen im regulären Ausdruck zu vermeiden, was die allgemeine Lesbarkeit beeinträchtigt. 🎜🎜Die regulären Ausdrücke von Python umfassen viele sehr einfach zu verwendende Methoden, aber ich werde sie hier nicht zu sehr vorstellen. Wir werden immer das obige Muster verwenden, da diese einfach zu verwendenden Methoden nur eine Art Kapselung davon sind und das Erlernen der Verwendung dieser grundlegenden Methode natürlich zu anderen führt. 🎜🎜Das Matching -Objekt kann Informationen über reguläre Ausdrücke erhalten. 🎜start()🎜🎜Gibt die Startposition des Matches zurück🎜🎜🎜🎜end()🎜🎜Gibt die Endposition des Matches zurück🎜🎜🎜🎜span()🎜🎜Gibt ein Tupel zurück, das die passende (Start-, End-)Position enthält 🎜 🎜🎜🎜Das obige ist der detaillierte Inhalt vonSo implementieren Sie reguläre Ausdrücke in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Es gibt keine integrierte Summenfunktion in der C-Sprache, daher muss sie selbst geschrieben werden. Die Summe kann erreicht werden, indem das Array durchquert und Elemente akkumulieren: Schleifenversion: Die Summe wird für die Schleifen- und Arraylänge berechnet. Zeigerversion: Verwenden Sie Zeiger, um auf Array-Elemente zu verweisen, und eine effiziente Summierung wird durch Selbststillstandszeiger erzielt. Dynamisch Array -Array -Version zuweisen: Zuordnen Sie Arrays dynamisch und verwalten Sie selbst den Speicher selbst, um sicherzustellen, dass der zugewiesene Speicher befreit wird, um Speicherlecks zu verhindern.

Obwohl eindeutig und unterschiedlich mit der Unterscheidung zusammenhängen, werden sie unterschiedlich verwendet: Unterschieds (Adjektiv) beschreibt die Einzigartigkeit der Dinge selbst und wird verwendet, um Unterschiede zwischen den Dingen zu betonen; Das Unterscheidungsverhalten oder die Fähigkeit des Unterschieds ist eindeutig (Verb) und wird verwendet, um den Diskriminierungsprozess zu beschreiben. In der Programmierung wird häufig unterschiedlich, um die Einzigartigkeit von Elementen in einer Sammlung darzustellen, wie z. B. Deduplizierungsoperationen; Unterscheidet spiegelt sich in der Gestaltung von Algorithmen oder Funktionen wider, wie z. B. die Unterscheidung von ungeraden und sogar Zahlen. Bei der Optimierung sollte der eindeutige Betrieb den entsprechenden Algorithmus und die Datenstruktur auswählen, während der unterschiedliche Betrieb die Unterscheidung zwischen logischer Effizienz optimieren und auf das Schreiben klarer und lesbarer Code achten sollte.

Es gibt kein absolutes Gehalt für Python- und JavaScript -Entwickler, je nach Fähigkeiten und Branchenbedürfnissen. 1. Python kann mehr in Datenwissenschaft und maschinellem Lernen bezahlt werden. 2. JavaScript hat eine große Nachfrage in der Entwicklung von Front-End- und Full-Stack-Entwicklung, und sein Gehalt ist auch beträchtlich. 3. Einflussfaktoren umfassen Erfahrung, geografische Standort, Unternehmensgröße und spezifische Fähigkeiten.

! X Understanding! X ist ein logischer Nicht-Operator in der C-Sprache. Es booleschen den Wert von x, dh wahre Änderungen zu falschen, falschen Änderungen an True. Aber seien Sie sich bewusst, dass Wahrheit und Falschheit in C eher durch numerische Werte als durch Boolesche Typen dargestellt werden, ungleich Null wird als wahr angesehen und nur 0 wird als falsch angesehen. Daher handelt es sich um negative Zahlen wie positive Zahlen und gilt als wahr.

Die H5 -Seite muss aufgrund von Faktoren wie Code -Schwachstellen, Browserkompatibilität, Leistungsoptimierung, Sicherheitsaktualisierungen und Verbesserungen der Benutzererfahrung kontinuierlich aufrechterhalten werden. Zu den effektiven Wartungsmethoden gehören das Erstellen eines vollständigen Testsystems, die Verwendung von Versionstools für Versionskontrolle, die regelmäßige Überwachung der Seitenleistung, das Sammeln von Benutzern und die Formulierung von Wartungsplänen.

Es gibt keine integrierte Summenfunktion in C für die Summe, kann jedoch implementiert werden durch: Verwenden einer Schleife, um Elemente nacheinander zu akkumulieren; Verwenden eines Zeigers, um auf die Elemente nacheinander zuzugreifen und zu akkumulieren; Betrachten Sie für große Datenvolumina parallele Berechnungen.

Das Kopieren und Einfügen des Codes ist nicht unmöglich, sollte aber mit Vorsicht behandelt werden. Abhängigkeiten wie Umgebung, Bibliotheken, Versionen usw. im Code stimmen möglicherweise nicht mit dem aktuellen Projekt überein, was zu Fehlern oder unvorhersehbaren Ergebnissen führt. Stellen Sie sicher, dass der Kontext konsistent ist, einschließlich Dateipfade, abhängiger Bibliotheken und Python -Versionen. Wenn Sie den Code für eine bestimmte Bibliothek kopieren und einfügen, müssen Sie möglicherweise die Bibliothek und ihre Abhängigkeiten installieren. Zu den häufigen Fehlern gehören Pfadfehler, Versionskonflikte und inkonsistente Codestile. Die Leistungsoptimierung muss gemäß dem ursprünglichen Zweck und den Einschränkungen des Codes neu gestaltet oder neu gestaltet werden. Es ist entscheidend, den Code zu verstehen und den kopierten kopierten Code zu debuggen und nicht blind zu kopieren und einzufügen.

Wie erhalte ich dynamische Daten von 58.com Arbeitsseite beim Kriechen? Wenn Sie eine Arbeitsseite von 58.com mit Crawler -Tools kriechen, können Sie auf diese begegnen ...
