Regelmäßige PHP PCRE-Analyse

little bottle
Freigeben: 2023-04-06 11:30:02
nach vorne
2967 Leute haben es durchsucht

Der Hauptinhalt dieses Artikels befasst sich mit der regelmäßigen PCRE-Analyse von PHP, die einen gewissen Referenzwert hat. Interessierte Freunde können mehr darüber erfahren und hoffen, dass sie Ihnen helfen können.

1. Vorwort

Im vorherigen Blog gibt es eine Analyse des Zeichensatzes. Dabei geht es nicht um den Zeichensatz. Viele Funktionen in PHP verarbeiten standardmäßig das UTF-8-Kodierungsformat in Unicode. Kommen wir also ohne weitere Umschweife direkt zur Sache.

2. PHP-Funktion mb_split Analyse

1 <?php
2 $preg_strings = &#39;测、试、一、下&#39;;
3 $preg_str = mb_split(&#39;、&#39;, $preg_strings);
4 print_r($preg_str);
Nach dem Login kopieren

Ergebnis drucken:

Array(
    [0] => 测
    [1] => 试
    [2] => 一
    [3] => 下)
Nach dem Login kopieren

Diese Funktion verwendet standardmäßig die zugrunde liegende Analyse im UTF-8-Kodierungsformat. Die Zeichen $preg_strings werden durch die hexadezimalen Codepunkte von UNICODE mit dem Trennzeichen (,) getrennt.

3. PHP-Funktion preg_split-Analyse

Teilen Sie die Zeichenfolge „Test it“

1 <?php
2 $strings = &#39;测试一下&#39;;
3 $mb_arr = preg_split(&#39;//u&#39;, $strings, -1, PREG_SPLIT_NO_EMPTY);
4 print_r($mb_arr);
Nach dem Login kopieren

Das Druckergebnis ist wie folgt:

Array(
    [0] => 测
    [1] => 试
    [2] => 一
    [3] => 下
)
Nach dem Login kopieren

4 PCRE

In PHP können reguläre Trennzeichen #, %, / usw. sein.

Manchmal stehen hinter einem regulären Ausdruck einige Modifikatoren. Was bedeuten sie also alle?

Zum Beispiel:

%[\x{4e00}-\x{9fa5}]+%u
Nach dem Login kopieren

Der folgende Modifikator u Codetabelle Verwendung Regelmäßiger Abgleich, um dem -Codierungsformat von utf-8 zu entsprechen.

Beispiel 1:

1 <?php
2 $strings = &#39;测试一下&#39;;
3 $is_true = preg_match_all(&#39;%[\x{4e00}-\x{9fa5}]+%u&#39;, $strings, $match);
4 var_dump($is_true);
Nach dem Login kopieren

Das Druckergebnis ist wie folgt:

Array(
    [0] => Array
        (
            [0] => 测试一下
        )
)
Nach dem Login kopieren

Hier [x{4e00}-x{9fa5}]Was bedeutet das?

Im regulären PHP-Code wird x zur Darstellung von Hexadezimalzahlen verwendet.

Chinesischer UNICODE-Codepunkt liegt in 4E00 - 9FFF (hier wird hexadezimal erwähnt)

Also, Die Art und Weise, wie man reguläre Übereinstimmungen schreibt, ist das Intervall [], [x{4E00}-x{9FFF}]

Die Wirkung dieser beiden regulären Ausdrücke Es ist alles das Gleiche.

Verwandte Tutorials: PHP-Video-Tutorial

Das obige ist der detaillierte Inhalt vonRegelmäßige PHP PCRE-Analyse. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
php
Quelle:cnblogs.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage