這篇文章主要跟大家介紹mysql中文資料的相關問題,希望對需要的朋友有幫助!
推薦參考教學:《mysql教學》
中文資料問題的本質就是字元集的問題。
由於電腦只辨識二進位數據,而人類則更傾向於辨識字元(符號),因此就需要一個二進位與字元的對應關係,也就是字元集。
在咱們透過MySQL 資料庫的客戶端向伺服器插入中文資料的時候,有可能失敗,原因則可能是客戶端和伺服器的字元集設定不同導致的,例如:
客戶端的字符集為gbk
,則一個中文字符,對應兩個位元組;
伺服器的字符集為 utf8
,則一個中文字符,對應三個位元組。
這樣顯然會在編碼轉換的過程中出現問題,從而導致插入中文資料失敗。
由於所有的資料庫伺服器表現的一些特性都是透過伺服器端的變數來維持的,因此系統會先讀取自己的變量,看看具體的表現形式。這樣的話,咱們就可以透過以下語句查看伺服器到底識別哪些字元集:
-- 查看服务器识别的全部字符集show character set;
透過以上查詢,咱們會發現:伺服器是萬能的,其支援所有字元集。
既然伺服器支援這麼多字元集,總會有一種是伺服器預設的和客戶端打交道的字元集。因此,咱可以透過以下語句查看伺服器預設的對外處理的字元集:
-- 查看服务器默认的对外处理的字符集show variables like &#MySQL 教學之中文資料問題9;character_set%&#MySQL 教學之中文資料問題9;;
標註MySQL 教學之中文資料問題:伺服器預設的客戶端傳來的資料字元集為utf8
;
標註2:連接層字元集為utf8
;
標註MySQL 教學之中文資料問題:目前資料庫的字元集為utf8
;
#標示MySQL 教學之中文資料問題:伺服器預設的對外處理的字元集utf8
.
透過上述查詢,咱們會發現:伺服器預設的對外處理的字元集是utf8
.
客戶端支援的字元集為gbk,而伺服器預設的對外處理的字元集為
utf8,因此產生矛盾。
修改伺服器預設接收的字元集為gbk.
-- 修改服务器默认接收的字符集为 GBK(不区分大小写)set character_set_client = gbk;
utf8),解析數據的是客戶端,而客戶端僅識別
gbk格式的數據,顯示亂碼也就在意料之中啦!
修改伺服器給客戶端的資料字元集為gbk.
-- 修改服务器给客户端的数据字符集为 GBK(不区分大小写)set character_set_results = gbk;
-- 修改的只是会话级别,即当前客户端当次连接有效,关闭后失效set 变量 = 值;
set names 字符集;
/** * 恒等于 set character_set_client = gbk; * 恒等于 set character_set_results = gbk; * 恒等于 set character_set_connection = gbk; */set names gbk;
connection為連接層,是字元集轉換的中間者,如果其和
client和
results的字元集一致,則效率更高,不一致也沒有關係。
以上是MySQL 教學之中文資料問題的詳細內容。更多資訊請關注PHP中文網其他相關文章!