Heim > Backend-Entwicklung > PHP-Tutorial > Lösung des Problems verstümmelter chinesischer Zeichen, wenn PHP-Substr Zeichenfolgen abfängt

Lösung des Problems verstümmelter chinesischer Zeichen, wenn PHP-Substr Zeichenfolgen abfängt

WBOY
Freigeben: 2016-07-29 09:15:35
Original
1249 Leute haben es durchsucht

Bei der PHP-Programmentwicklung werden häufig String-Abfangoperationen durchgeführt. Beispielsweise sollte der Titel beim Drucken einer Artikelzusammenfassung nicht zu lang sein. Wenn wir auf diese Anforderungen stoßen, denken wir oft darüber nach, die Methode substr() zu verwenden, um dies zu erreichen. Substr() eignet sich besser zum Abfangen rein englischer Zeichenfolgen.

Aber solange chinesische Zeichen in der Zeichenfolge vorkommen, kann dies der Fall sein Ursache PHP Aufgrund der chinesischen UTF-8-Codierung belegt jedes chinesische Zeichen 3 Bytes, während GB2312 2 Bytes einnimmt und die Anzahl der abgefangenen Ziffern ungenau ist Zeichen. " in zwei Hälften, wodurch das gebrochene Zeichen das Folgende zu einem Wort zusammenfügt, sodass PHP-Substr-chinesische verstümmelte Zeichen erscheinen.


substr --- Teil der Zeichenfolge abrufen

Syntax: string substr (string string, int start [, int length])
Beschreibung:
substr( ) gibt einen Teil einer Zeichenfolge zurück, die durch die Parameter Start und Länge angegeben wird.
Wenn start eine positive Zahl ist, beginnt die zurückgegebene Zeichenfolge mit dem Startzeichen der Zeichenfolge.
Beispiel:

<?php
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"
?>
Nach dem Login kopieren

Wenn start eine negative Zahl ist, beginnt die zurückgegebene Zeichenfolge mit dem Startzeichen am Ende der Zeichenfolge.
Beispiel:

<?php
$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"
?>
Nach dem Login kopieren

Wenn die Parameterlänge angegeben ist und eine positive Zahl ist, besteht die zurückgegebene Zeichenfolge vom Anfang an aus Längenzeichen.
Wenn die Parameterlänge angegeben wird und eine negative Zahl ist, endet die zurückgegebene Zeichenfolge beim längenstärksten Zeichen vom Ende der Zeichenfolge.
Beispiel:

<?php
$rest = substr ("abcdef", 1, -1); // returns "bcde"
?>
Nach dem Login kopieren

Es gibt kein Problem mit Englisch, wir testen ein Chinesisch

Beispiel:

<?php
$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了
?>
Nach dem Login kopieren

Das Ergebnis des Abfangens von Zeichen ist definitiv nicht das Ergebnis, das wir wollen. Diese Situation mit verstümmelten chinesischen PHP-Substrängen kann dazu führen, dass das Programm nicht normal ausgeführt wird. Es gibt zwei Hauptlösungen:


1. Verwenden Sie mb_substr() der mbstring-Erweiterungsbibliothek, um verstümmelte Zeichen abzufangen und zu vermeiden.

Sie können die Funktion mb_substr()/mb_strcut() verwenden. Die Verwendung von mb_substr()/mb_strcut() ähnelt substr(), außer dass am Ende von mb_substr ein weiterer Parameter hinzugefügt werden muss ()/mb_strcut, um die String-Kodierung festzulegen, aber die meisten Server öffnen php_mbstring.dll nicht. Sie müssen php_mbstring.dll in php.ini öffnen.

Beispiel:

<?php
    echo mb_substr("php中文字符encode",0,4,"utf-8");
?>
Nach dem Login kopieren


Wenn der letzte Codierungsparameter nicht angegeben ist, sind es drei Bytes für ein chinesisches Zeichen . Dies ist das Merkmal der UTF-8-Kodierung. Wenn Sie die UTF-8-Zeichensatzbeschreibung hinzufügen, wird sie in Einheiten von einem Wort abgefangen.


Bitte achten Sie bei der Verwendung auf die Kodierung der PHP-Datei und die Kodierung bei der Anzeige der Webseite. Um diese mb_substr-Methode zu verwenden, müssen Sie die Codierung der Zeichenfolge im Voraus kennen. Wenn Sie die Codierung nicht kennen, müssen Sie sie beurteilen. Die mbstring-Bibliothek bietet auch mb_check_encoding, um die Zeichenfolgencodierung zu überprüfen .


PHP verfügt über mehrere Funktionen zum Abfangen von Zeichenfolgen, unter denen häufig substr und mb_substr verwendet werden. Wenn ersteres Chinesisch verarbeitet, beträgt GBK 2 Längeneinheiten und UTF 3 Längeneinheiten. Nachdem letzteres die Codierung angegeben hat, ist ein chinesisches Zeichen 1 Längeneinheit.

substr schneidet manchmal 1/3 Chinesisch oder die Hälfte Chinesisch ab und zeigt verstümmelte Zeichen an. Relativ gesehen ist mb_substr für uns besser geeignet. Aber manchmal scheint mb_substr nicht so nützlich zu sein. Wenn ich beispielsweise die kurzen Informationen eines kleinen Bildes anzeigen möchte, sind 5 chinesische Zeichen genau richtig. Wenn es mehr als 5 Zeichen sind, fangen Sie einfach die ersten 4 ab und fügen Sie „…“ hinzu Chinesisch, aber bei der Verarbeitung von Englisch oder Zahlen ist dieser Abfang zu kurz.


2. Schreiben Sie die Abfangfunktion selbst, aber die Effizienz ist nicht so hoch wie die Verwendung der mbstring-Erweiterungsbibliothek. Das Folgende ist eine Funktion in ecshop, die in UTF-8 codierte Zeichenfolgen abfängt.

Beispiel:

function sub_str($str, $length = 0, $append = true)
{
    $str = trim($str);
    $strlength = strlen($str);
 
    if ($length == 0 || $length >= $strlength)
    {
        return $str;  //截取长度等于0或大于等于本字符串的长度,返回字符串本身
    }
    elseif ($length < 0)  //如果截取长度为负数
    {
        $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度
        if ($length < 0)
        {
            $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度
        }
    }
 
    if (function_exists('mb_substr'))
    {
        $newstr = mb_substr($str, 0, $length, EC_CHARSET);
    }
    elseif (function_exists('iconv_substr'))
    {
        $newstr = iconv_substr($str, 0, $length, EC_CHARSET);
    }
    else
    {
        //$newstr = trim_right(substr($str, 0, $length));
        $newstr = substr($str, 0, $length);
    }
 
    if ($append && $str != $newstr)
    {
        $newstr .= '...';
    }
 
    return $newstr;
}
Nach dem Login kopieren

Das Obige stellt die Lösung für das Problem verstümmelter chinesischer Zeichen beim Abfangen von Zeichenfolgen mit PHP-Substr vor, einschließlich des relevanten Inhalts. Ich hoffe, dass es für Freunde hilfreich ist, die sich für PHP-Tutorials interessieren.

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage