Lösung zum Abfangen verstümmelter Zeichen in PHP-Strings: 1. Verwenden Sie zum Abfangen den [MB_substr()] der mbstring-Erweiterungsbibliothek. 2. Fangen Sie den [UTF-8]-codierten String ab. Der Code lautet [$str = trim($ str); 】.
Lösung zum Abfangen verstümmelter Zeichen in PHP-Strings:
1. Verwenden Sie mb_substr() der mbstring-Erweiterungsbibliothek, um verstümmelte Zeichen abzufangen.
Sie können die Funktion mb_substr()/mb_strcut() verwenden. Die Verwendung von mb_substr()/mb_strcut() ähnelt substr(), außer dass am Ende von mb_substr()/ ein weiterer Parameter hinzugefügt werden muss. mb_strcut zum Festlegen der Zeichenfolge.
Aber die meisten Server öffnen php_mbstring.dll nicht. Sie müssen php_mbstring.dll in php.ini öffnen.
echo mb_substr("php中文字符encode",0,4,"utf-8");
Wenn der letzte Kodierungsparameter nicht angegeben ist, werden drei Bytes als ein chinesisches Zeichen verwendet. Dies ist das Merkmal der UTF-8-Kodierung. Wenn die UTF-8-Zeichensatzbeschreibung hinzugefügt wird, wird sie in Einheiten von abgefangen ein Wort von.
Achten Sie bei der Verwendung auf die Kodierung der PHP-Datei und die Kodierung beim Anzeigen der Webseite. Um diese mb_substr-Methode zu verwenden, müssen Sie die Codierung der Zeichenfolge im Voraus kennen. Wenn Sie die Codierung nicht kennen, müssen Sie sie beurteilen. Die mbstring-Bibliothek bietet auch mb_check_encoding, um die Zeichenfolgencodierung zu überprüfen .
PHP verfügt über mehrere Funktionen zum Abfangen von Zeichenfolgen, unter denen häufig substr und mb_substr verwendet werden. Wenn ersteres Chinesisch verarbeitet, beträgt GBK 2 Längeneinheiten und UTF 3 Längeneinheiten. Nachdem letzteres die Codierung angegeben hat, ist ein chinesisches Zeichen 1 Längeneinheit.
substr schneidet manchmal 1/3 Chinesisch oder die Hälfte Chinesisch ab und zeigt verstümmelte Zeichen an. Relativ gesehen ist mb_substr für uns besser geeignet. Aber manchmal ist mb_substr nicht so einfach zu verwenden. Wenn ich beispielsweise die kurzen Informationen eines kleinen Bildes anzeigen möchte, sind 5 chinesische Zeichen genau richtig. Wenn es mehr als 5 Zeichen sind, fangen Sie einfach die ersten 4 ab und fügen Sie „…“ hinzu Chinesisch, aber bei der Verarbeitung von Englisch oder Zahlen ist dieser Abfang zu kurz.
Zweitens schreiben Sie die Abfangfunktion selbst, aber die Effizienz ist nicht so hoch wie die Verwendung der MBstring-Erweiterungsbibliothek. Das Folgende ist eine Funktion in ecshop, die in UTF-8 codierte Zeichenfolgen abfängt.
function sub_str($str, $length = , $append = true) { $str = trim($str); $strlength = strlen($str); if ($length == || $length >= $strlength) { return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身 } elseif ($length < ) //如果截取长度为负数 { $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度 if ($length < ) { $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度 } } if (function_exists('mb_substr')) { $newstr = mb_substr($str, , $length, EC_CHARSET); } elseif (function_exists('iconv_substr')) { $newstr = iconv_substr($str, , $length, EC_CHARSET); } else { //$newstr = trim_right(substr($str, , $length)); $newstr = substr($str, , $length); } if ($append && $str != $newstr) { $newstr .= '...'; } return $newstr; }
Wenn Sie mehr über das Erlernen des Programmierens erfahren möchten, achten Sie bitte auf die Spalte „PHP-Schulung“!
Das obige ist der detaillierte Inhalt vonWas tun, wenn der PHP-String verstümmelte Zeichen abfängt?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!