我透過微信介面讀取使用者的暱稱,但好多名字都是一些特殊字符,如上圖,這些特殊字符存不進mysql資料庫也沒有意義。所以我想過濾一下,名字字元中只把漢字字母與數字提取出來。這個用PHP怎麼寫。
我透過微信介面讀取使用者的暱稱,但好多名字都是一些特殊字符,如上圖,這些特殊字符存不進mysql資料庫也沒有意義。所以我想過濾一下,名字字元中只把漢字字母與數字提取出來。這個用PHP怎麼寫。
這些特殊字元存不進mysql資料庫也沒什麼意義
----有意義的,圖示啊,欄位類型用 varbinary 試試
其實是emoji表情符號存不進mysql
這種表情不處理直接儲存到mysql5.5以下的版本會報錯
可以修改資料庫字元集為utf8mb4試試
github上有emoji unicode提取的範圍,參照範圍在過濾的時候進行配對即可
首先,這些東西如果對你沒有什麼意義,不存就好了。
你提取出部分,也沒什麼用。
完整的訪問,mysql是支援的,轉換下字符集就好了,utf8mb4是utf8的超集,向下兼容的,修改這個是最完美的解決方法。
其次就是程式碼層面的轉碼,編碼一下,再存,取出來反編碼再展示,也可以。
最後就是這個方法,其實你只是存不進emoji而已。過濾掉emoji就OK。
<code>public static function emoji($text) { $clean_text = ""; // Match Emoticons $regexEmoticons = '/[\x{1F600}-\x{1F64F}]/u'; $clean_text = preg_replace($regexEmoticons, '', $text); // Match Miscellaneous Symbols and Pictographs $regexSymbols = '/[\x{1F300}-\x{1F5FF}]/u'; $clean_text = preg_replace($regexSymbols, '', $clean_text); // Match Transport And Map Symbols $regexTransport = '/[\x{1F680}-\x{1F6FF}]/u'; $clean_text = preg_replace($regexTransport, '', $clean_text); // Match Miscellaneous Symbols $regexMisc = '/[\x{2600}-\x{26FF}]/u'; $clean_text = preg_replace($regexMisc, '', $clean_text); // Match Dingbats $regexDingbats = '/[\x{2700}-\x{27BF}]/u'; $clean_text = preg_replace($regexDingbats, '', $clean_text); $regexDingbats = '/[\x{231a}-\x{23ab}\x{23e9}-\x{23ec}\x{23f0}-\x{23f3}]/u'; $clean_text = preg_replace($regexDingbats, '', $clean_text); return $clean_text; }</code>
來源在這裡