Heim Backend-Entwicklung PHP-Tutorial Erste Schritte mit regulären Ausdrücken

Erste Schritte mit regulären Ausdrücken

Nov 30, 2016 am 09:42 AM
入门 正则表达式

cjx arbeitet derzeit an einem Crawler-Projekt und muss dringend den gewünschten Inhalt von der Seite erfassen, aber es ist zu kompliziert, ihn durch logisches Urteilsvermögen zu erhalten. Ich habe das große Glück, über das leistungsstarke Tool für reguläre Ausdrücke zu verfügen. Cjx hatte zuvor auch einige Kenntnisse über reguläre Ausdrücke. Allerdings war ich in einem Zustand unvollständigen Verständnisses und es ist schwierig, selbst effektiv einen zufriedenstellenden regulären Ausdruck zu schreiben. Kürzlich habe ich im Internet ein Buch mit dem Titel „Mastering Regular Expressions“ von Jeffrey E.F. Fried gefunden. Nachdem ich das erste Kapitel gelesen hatte, stellte ich plötzlich fest, dass ich ein paar reguläre Regeln schreiben konnte, haha~~~ cjx fühlte sich plötzlich, als wäre er von einem Verlierer zu einem großen, reichen und gutaussehenden Mann aufgestiegen ... Das Folgende ist eine Zusammenfassung davon erstes Kapitel des Buches ~

Zeilenanfang und -ende

Die vielleicht am einfachsten zu verstehenden Metazeichen sind das Caretzeichen ^ und das Dollarzeichen $. Bei der Überprüfung einer Textzeile stellt ^ den Anfang dar einer Linie und $ stellt das Ende dar.

Leser entwickeln am besten die Gewohnheit, reguläre Ausdrücke entsprechend den Zeichen zu verstehen. Zum Beispiel:

^cat entspricht einer Zeile, die mit cat

beginnt, aber stattdessen:

^cat entspricht einer Zeile, die mit c als erstem Zeichen beginnt, gefolgt von ein a, gefolgt von einem Text von t.

Es gibt keinen Unterschied in den Ergebnissen dieser beiden Interpretationen, aber es ist einfacher, die interne Logik neu aufgetretener regulärer Ausdrücke zu verstehen, indem man sie anhand von Zeichen interpretiert.

Entsprechen Sie einem von mehreren Zeichen

Wenn wir nach dem Wort „grau“ suchen müssen und nicht sicher sind, ob es als „grau“ geschrieben ist, können wir es verwenden reguläre Ausdrücke Formelstruktur [...]. Es ermöglicht dem Benutzer, Zeichen aufzulisten, von denen erwartet wird, dass sie irgendwo übereinstimmen, was normalerweise als Zeichengruppe bezeichnet wird.

Gr[ea]y bedeutet also: Zuerst g finden, gefolgt von einem r, dann einem a oder e und schließlich einem y.

Innerhalb der Zeichengruppe stellt das Zeichenmetazeichen „-“ einen Bereich dar: ist genau dasselbe wie . Wir können Zeichenbereiche auch nach Belieben mit gewöhnlichem Text kombinieren:

[0-9A-Z_!.?] kann einer Zahl, einem Großbuchstaben, einem Unterstrich, einem Ausrufezeichen, einem Punkt oder einem Fragezeichen entsprechen.

Exklusive Zeichengruppe

Ersetzen Sie [...] durch [^...]. Diese Zeichengruppe entspricht allen nicht aufgeführten Zeichen. Beispiel: [^1-6] entspricht jedem Zeichen außer 1 bis 6. Das ^ am Anfang dieser Gruppe bedeutet Ausschluss. Hier werden also nicht die Zeichen aufgelistet, die Sie abgleichen möchten, sondern die Zeichen, die Sie nicht abgleichen möchten.

Verwenden Sie einen Punkt, um ein beliebiges Zeichen zu finden.

Metazeichen. Dies ist eine einfache Möglichkeit, eine Zeichengruppe zu schreiben, die für ein beliebiges Zeichen verwendet wird. Wenn wir in einem Ausdruck den Platzhalter „Übereinstimmung mit jedem Zeichen“ verwenden müssen, ist die Verwendung des Punkts praktisch.


entspricht jedem Unterausdruck

Das Metazeichen | ist ein sehr prägnantes Metazeichen, das „oder“ bedeutet. Darauf aufbauend können wir verschiedene Unterausdrücke zu einem Gesamtausdruck kombinieren, und dieser Gesamtausdruck kann mit jedem Unterausdruck übereinstimmen.

Optionale Elemente

Jetzt schauen wir uns die Abstimmung von Farbe und Farbe an. Der Unterschied zwischen ihnen besteht darin, dass das folgende Wort ein u mehr hat als das vorherige. Wir können coloru?r verwenden, um dieses Problem zu lösen. Das Metazeichen ? (also das Fragezeichen) steht für optionale Optionen. Das Hinzufügen nach einem Zeichen bedeutet, dass das Zeichen hier erscheinen darf, sein Vorkommen jedoch keine notwendige Bedingung für eine erfolgreiche Übereinstimmung ist.

Andere Quantoren: Wiederholtes Vorkommen von

+ (Pluszeichen) und * (Sternchen) funktioniert ähnlich wie Fragezeichen. Das Metazeichen + bedeutet, dass das unmittelbar vorhergehende Element einmal oder mehrmals vorkommt, während * bedeutet, dass das unmittelbar vorhergehende Element beliebig oft oder gar nicht vorkommt.
Schauen Sie sich als nächstes einen TAG wie


an, der eine horizontale Linie mit einer Höhe von 14 darstellt. Außerdem muss zwischen HR und SIZE ein Leerzeichen stehen, auf beiden Seiten des Gleichheitszeichens dürfen jedoch keine Leerzeichen stehen. Wenn Sie also eine solche HR auf einer Webseite finden möchten, wird der Ausdruck als
geschrieben. Manchmal ist der SIZE-Wert von HR oft variabel und das SIZE-Attribut ist möglicherweise nicht vorhanden. Dann kann der Ausdruck als ) umgeschrieben werden. Wow, das ist erstaunlich.

Klammern und Rückverweise

Bisher haben wir zwei Verwendungszwecke von Klammern gesehen: 1. Begrenzung des Bereichs mehrerer Optionen; 2. Kombination mehrerer Zeichen zu einer Einheit, abhängig von Quantifizierern wie Fragen Markierungen oder Sternchen funktionieren. Jetzt möchte ich eine weitere Verwendung von Klammern vorstellen, nämlich die Rückreferenzierung. Obwohl sie in egrep nicht üblich ist (obwohl die beliebte GNU-Version diese Funktion unterstützt), ist sie in anderen Tools sehr verbreitet.
In Tool-Software, die Rückverweise unterstützt, können sich Klammern den Text „merken“, der mit den darin enthaltenen Unterausdrücken übereinstimmt. Unabhängig davon, um welche Texte es sich handelt, kann sich die Metazeichenfolge 1 diese merken.

Natürlich können wir in einem Ausdruck mehrere Klammern verwenden. Verwenden Sie dann 1, 2, 3 usw., um den Text darzustellen, der mit dem ersten, zweiten und dritten Klammersatz übereinstimmt. Klammern werden in der Reihenfolge des Erscheinens der offenen Klammern '(' von links nach rechts ausgeführt, sodass 1 in ([a-z])([0-9])12 den Inhalt der [a-z]-Übereinstimmung darstellt, während 2 [0 - 9] Passende Inhalte.

Der magische Ausweg
besteht darin, dass wir manchmal einige Symbole wie .+*? zuordnen müssen, gleichzeitig aber feststellen, dass es sich um Metasymbole handelt Wir können sie vor

verwenden, um diesen speziellen Metasymbolen zu entsprechen.

Einige nützliche Abkürzungen
t Tabulatorzeichen
n Zeilenvorschubzeichen
r Wagenrücklaufzeichen
s Alle Leerzeichen wie Leerzeichen, Zeilenumbruch, Tabulatoreinzug usw. Alle Leerzeichen
S Jedes Zeichen außer s
w [a-zA-Z0-9] ist in w+ sehr nützlich und kann verwendet werden, um ein Wort zu finden
W Jedes Zeichen außer w
d [0-9], das heißt, die Zahl
D jedes Zeichen außer d, also [^0-9]


Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Ein Diffusionsmodell-Tutorial, das Ihre Zeit wert ist, von der Purdue University Ein Diffusionsmodell-Tutorial, das Ihre Zeit wert ist, von der Purdue University Apr 07, 2024 am 09:01 AM

Diffusion kann nicht nur besser imitieren, sondern auch „erschaffen“. Das Diffusionsmodell (DiffusionModel) ist ein Bilderzeugungsmodell. Im Vergleich zu bekannten Algorithmen wie GAN und VAE im Bereich der KI verfolgt das Diffusionsmodell einen anderen Ansatz. Seine Hauptidee besteht darin, dem Bild zunächst Rauschen hinzuzufügen und es dann schrittweise zu entrauschen. Das Entrauschen und Wiederherstellen des Originalbilds ist der Kernbestandteil des Algorithmus. Der endgültige Algorithmus ist in der Lage, aus einem zufälligen verrauschten Bild ein Bild zu erzeugen. In den letzten Jahren hat das phänomenale Wachstum der generativen KI viele spannende Anwendungen in der Text-zu-Bild-Generierung, Videogenerierung und mehr ermöglicht. Das Grundprinzip dieser generativen Werkzeuge ist das Konzept der Diffusion, ein spezieller Sampling-Mechanismus, der die Einschränkungen bisheriger Methoden überwindet.

Generieren Sie PPT mit einem Klick! Kimi: Lassen Sie zuerst die „PPT-Wanderarbeiter' populär werden Generieren Sie PPT mit einem Klick! Kimi: Lassen Sie zuerst die „PPT-Wanderarbeiter' populär werden Aug 01, 2024 pm 03:28 PM

Kimi: In nur einem Satz, in nur zehn Sekunden ist ein PPT fertig. PPT ist so nervig! Um ein Meeting abzuhalten, benötigen Sie einen PPT; um einen wöchentlichen Bericht zu schreiben, müssen Sie einen PPT vorlegen, auch wenn Sie jemanden des Betrugs beschuldigen PPT. Das College ähnelt eher dem Studium eines PPT-Hauptfachs. Man schaut sich PPT im Unterricht an und macht PPT nach dem Unterricht. Als Dennis Austin vor 37 Jahren PPT erfand, hatte er vielleicht nicht damit gerechnet, dass PPT eines Tages so weit verbreitet sein würde. Wenn wir über unsere harte Erfahrung bei der Erstellung von PPT sprechen, treiben uns Tränen in die Augen. „Es dauerte drei Monate, ein PPT mit mehr als 20 Seiten zu erstellen, und ich habe es Dutzende Male überarbeitet. Als ich das PPT sah, musste ich mich übergeben.“ war PPT.“ Wenn Sie ein spontanes Meeting haben, sollten Sie es tun

Alle CVPR 2024-Auszeichnungen bekannt gegeben! Fast 10.000 Menschen nahmen offline an der Konferenz teil und ein chinesischer Forscher von Google gewann den Preis für den besten Beitrag Alle CVPR 2024-Auszeichnungen bekannt gegeben! Fast 10.000 Menschen nahmen offline an der Konferenz teil und ein chinesischer Forscher von Google gewann den Preis für den besten Beitrag Jun 20, 2024 pm 05:43 PM

Am frühen Morgen des 20. Juni (Pekinger Zeit) gab CVPR2024, die wichtigste internationale Computer-Vision-Konferenz in Seattle, offiziell die besten Beiträge und andere Auszeichnungen bekannt. In diesem Jahr wurden insgesamt 10 Arbeiten ausgezeichnet, darunter zwei beste Arbeiten und zwei beste studentische Arbeiten. Darüber hinaus gab es zwei Nominierungen für die beste Arbeit und vier Nominierungen für die beste studentische Arbeit. Die Top-Konferenz im Bereich Computer Vision (CV) ist die CVPR, die jedes Jahr zahlreiche Forschungseinrichtungen und Universitäten anzieht. Laut Statistik wurden in diesem Jahr insgesamt 11.532 Arbeiten eingereicht, von denen 2.719 angenommen wurden, was einer Annahmequote von 23,6 % entspricht. Laut der statistischen Analyse der CVPR2024-Daten des Georgia Institute of Technology befassen sich die meisten Arbeiten aus Sicht der Forschungsthemen mit der Bild- und Videosynthese und -generierung (Imageandvideosyn

Von Bare-Metal bis hin zu einem großen Modell mit 70 Milliarden Parametern finden Sie hier ein Tutorial und gebrauchsfertige Skripte Von Bare-Metal bis hin zu einem großen Modell mit 70 Milliarden Parametern finden Sie hier ein Tutorial und gebrauchsfertige Skripte Jul 24, 2024 pm 08:13 PM

Wir wissen, dass LLM auf großen Computerclustern unter Verwendung umfangreicher Daten trainiert wird. Auf dieser Website wurden viele Methoden und Technologien vorgestellt, die den LLM-Trainingsprozess unterstützen und verbessern. Was wir heute teilen möchten, ist ein Artikel, der tief in die zugrunde liegende Technologie eintaucht und vorstellt, wie man einen Haufen „Bare-Metals“ ohne Betriebssystem in einen Computercluster für das LLM-Training verwandelt. Dieser Artikel stammt von Imbue, einem KI-Startup, das allgemeine Intelligenz durch das Verständnis der Denkweise von Maschinen erreichen möchte. Natürlich ist es kein einfacher Prozess, einen Haufen „Bare Metal“ ohne Betriebssystem in einen Computercluster für das Training von LLM zu verwandeln, aber Imbue hat schließlich erfolgreich ein LLM mit 70 Milliarden Parametern trainiert der Prozess akkumuliert

Eine Pflichtlektüre für technische Anfänger: Analyse der Schwierigkeitsgrade von C-Sprache und Python Eine Pflichtlektüre für technische Anfänger: Analyse der Schwierigkeitsgrade von C-Sprache und Python Mar 22, 2024 am 10:21 AM

Titel: Ein Muss für technische Anfänger: Schwierigkeitsanalyse der C-Sprache und Python, die spezifische Codebeispiele erfordert. Im heutigen digitalen Zeitalter ist Programmiertechnologie zu einer immer wichtigeren Fähigkeit geworden. Ob Sie in Bereichen wie Softwareentwicklung, Datenanalyse, künstliche Intelligenz arbeiten oder einfach nur aus Interesse Programmieren lernen möchten, die Wahl einer geeigneten Programmiersprache ist der erste Schritt. Unter vielen Programmiersprachen sind C-Sprache und Python zwei weit verbreitete Programmiersprachen, jede mit ihren eigenen Merkmalen. In diesem Artikel werden die Schwierigkeitsgrade der C-Sprache und von Python analysiert

KI im Einsatz |. AI hat einen Lebens-Vlog eines allein lebenden Mädchens erstellt, der innerhalb von drei Tagen Zehntausende Likes erhielt KI im Einsatz |. AI hat einen Lebens-Vlog eines allein lebenden Mädchens erstellt, der innerhalb von drei Tagen Zehntausende Likes erhielt Aug 07, 2024 pm 10:53 PM

Herausgeber des Machine Power Report: Yang Wen Die Welle der künstlichen Intelligenz, repräsentiert durch große Modelle und AIGC, hat unsere Lebens- und Arbeitsweise still und leise verändert, aber die meisten Menschen wissen immer noch nicht, wie sie sie nutzen sollen. Aus diesem Grund haben wir die Kolumne „KI im Einsatz“ ins Leben gerufen, um detailliert vorzustellen, wie KI durch intuitive, interessante und prägnante Anwendungsfälle für künstliche Intelligenz genutzt werden kann, und um das Denken aller anzuregen. Wir heißen Leser auch willkommen, innovative, praktische Anwendungsfälle einzureichen. Videolink: https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ Vor kurzem wurde der Lebens-Vlog eines allein lebenden Mädchens auf Xiaohongshu populär. Eine Animation im Illustrationsstil, gepaart mit ein paar heilenden Worten, kann in nur wenigen Tagen leicht erlernt werden.

Validierung regulärer PHP-Ausdrücke: Erkennung des Zahlenformats Validierung regulärer PHP-Ausdrücke: Erkennung des Zahlenformats Mar 21, 2024 am 09:45 AM

Überprüfung regulärer PHP-Ausdrücke: Erkennung des Zahlenformats Beim Schreiben von PHP-Programmen ist es häufig erforderlich, die vom Benutzer eingegebenen Daten zu überprüfen. Eine der häufigsten Überprüfungen besteht darin, zu überprüfen, ob die Daten dem angegebenen Zahlenformat entsprechen. In PHP können Sie reguläre Ausdrücke verwenden, um diese Art der Validierung zu erreichen. In diesem Artikel wird erläutert, wie Sie mithilfe regulärer PHP-Ausdrücke Zahlenformate überprüfen und spezifische Codebeispiele bereitstellen. Schauen wir uns zunächst die allgemeinen Validierungsanforderungen für Zahlenformate an: Ganzzahlen: enthalten nur die Zahlen 0–9, können mit einem Plus- oder Minuszeichen beginnen und enthalten keine Dezimalstellen. Gleitkomma

Der leitende NVIDIA-Architekt zählt die 12 Schwachstellen von RAG auf und vermittelt Lösungen Der leitende NVIDIA-Architekt zählt die 12 Schwachstellen von RAG auf und vermittelt Lösungen Jul 11, 2024 pm 01:53 PM

Retrieval-Augmented Generation (RAG) ist eine Technik, die Retrieval nutzt, um Sprachmodelle zu verbessern. Bevor ein Sprachmodell eine Antwort generiert, ruft es insbesondere relevante Informationen aus einer umfangreichen Dokumentendatenbank ab und verwendet diese Informationen dann zur Steuerung des Generierungsprozesses. Diese Technologie kann die Genauigkeit und Relevanz von Inhalten erheblich verbessern, das Problem der Halluzinationen wirksam lindern, die Geschwindigkeit der Wissensaktualisierung erhöhen und die Nachverfolgbarkeit der Inhaltsgenerierung verbessern. RAG ist zweifellos einer der spannendsten Bereiche der Forschung im Bereich der künstlichen Intelligenz. Weitere Informationen zu RAG finden Sie im Kolumnenartikel auf dieser Website „Was sind die neuen Entwicklungen bei RAG, das sich darauf spezialisiert hat, die Mängel großer Modelle auszugleichen?“ Diese Rezension erklärt es deutlich. Aber RAG ist nicht perfekt und Benutzer stoßen bei der Verwendung oft auf einige „Problempunkte“. Kürzlich die fortschrittliche generative KI-Lösung von NVIDIA

See all articles