-
- //php-5.2.11-SRC/ext/mysqli/mysqli_nonapi.c 342 行目
- PHP_FUNCTION(mysqli_set_charset)
- {
- MY_MYSQL*mysql;
- zval*mysql_link;
- 文字 *cs_name = NULL;
- unsigned int len;
-
- if (zend_parse_method_parameters(ZEND_NUM_ARGS() TSRMLS_CC, getThis()
- , "Os", &mysql_link, mysqli_link_class_entry, &cs_name, &len) == FAILURE) {
- return;
- }
- MYSQLI_FETCH_RESOURCE(mysql , MY_MYSQL*, &mysql_link, "mysqli_link"
- , MYSQLI_STATUS_VALID);
-
- if (mysql_set_character_set(mysql->mysql, cs_name)) {
- //**libmysqlの対応する関数を呼び出します
- RETURN_FALSE;
- }
- RETURN_TRUE;
- }
- ?>
コードをコピー
では、mysql_set_character_setは何をするのでしょうか?
-
- //mysql-5.1.30-SRC/libmysql/client.c、行 3166:
- int STDCALLmysql_set_character_set(MYSQL*mysql, const char *cs_name)
- {
- structcharset_info_st *cs;
- const char *save_csdir= charsets_dir;
-
- if (mysql->options.charset_dir)
- charsets_dir= mysql->options.charset_dir;
-
- if (strlen(cs_name) < MY_CS_NAME_SIZE &&
- ( cs= get_charset_by_csname(cs_name , MY_CS_PRIMARY, MYF(0))))
- {
- char buff[MY_CS_NAME_SIZE + 10];
- charsets_dir= save_csdir;
- /* 4.1 より前のサーバーの場合は「SET NAMES」の実行をスキップします*/
- if (mysql_get_server_version(mysql) & lt; 40100 )
- return 0;
- sprintf(buff, "SET NAMES %s", cs_name);
- if (!mysql_real_query(mysql, buff, strlen(buff)))
- {
- mysql->charset= cs;
- }
- }
- //以下略
- ?>
-
复制帽
我们可看到, mysqli_set_charset除了做了“SET NAMES”做以外、还多了一步:
-
- sprintf(buff, "SET NAMES %s", cs_name);
- if (!mysql_real_query(mysql, buff, strlen(buff)))
- {
- mysql->charset= cs;
- }
- ?>
-
复制代
一方、mysqlこの核心结构の構成文字セットまた有何か么作用呢?
これ要说说mysql_real_escape_string()了、この関数数とmysql_escape_stringの区别就是、它会考虑”当前”文字集。 那么这个当前字符集从哪里来呢?
对了、你猜的没错、就是mysql->charset.
mysql_real_string は判断宽字符集の字符の時候、これに基づいて異なる策略を採用し、比如果は utf-8、那么就会採用 libmysql/ctype-utf8.c.
例を参照、mysql连接字符集はlatin-1、(经典的5c问题):
-
- $db = mysql_connect('localhost:3737', 'root' ,'123456');
- mysql_select_db("test");
- $a = "x91x5c";//"慭"的gbk编码、低字节が5c、也就是ascii中的""
-
- var_dump(addslashes($a));
- var_dump(mysql_real_escape_string($a, $db));
-
- mysql_query("set names gbk");
- var_dump(mysql_real_escape_string($a, $db));
-
- mysql_set_charset("gbk");
- var_dump(mysql_real_escape_string($a, $db));
- ?>
复制發 「慭」のgbkコード小文字は5c、つまりascii中の「」であるため、mysql(i)_set_charset影響を除くmysql->charset以外、その他の時点ではmysql->charset全てが承認値であるため、 、結果就是:
$ php -f 5c.php
string(3) "慭"
string(3) "慭"
string(3) "慭"
string(2) "慭"
本文转自:http://www.laruence.com/2010/04/12/1396.html
|