데이터 베이스 MySQL 튜토리얼 Mysql 数据库字符集转换及版本升级/降级的详细教程_MySQL

Mysql 数据库字符集转换及版本升级/降级的详细教程_MySQL

Jun 01, 2016 pm 01:54 PM
discuz 버전 업그레이드

本文为穆亦风原创,原帖地址 http://club.muzone.cn/viewthread.php?tid=28605
转贴请注明出处,非常感谢!

最近discuz发布了新的版本,免费了,用的人更多了,以前使用其它论坛程序和discuz2.5/3.0的纷纷转换或升级到discuz4.0,可见discuz作为中国人开发的php论坛程序,确实是非常优秀的,在大家欣喜若狂的时候,也遇到了一些问题

看到不少用户反映转换完以后是乱码的情况,出现这种现象的主要原因是这类用户使用的都是mysql4.1以上的版本.下面作一个说明,希望出现这个问题的朋友都能耐心的把这个文档看完!!!

MySQL 4.1开始,对多语言的支持有了很大变化 (这导致了问题的出现)。尽管大部分的地方 (包括个人使用和主机提供商),MySQL 3、4.0 仍然占主导地位;但 MySQL 4.1 乃至5.0是 MySQL 官方推荐的数据库,已经有主机提供商开始提供并将会越来越多;因为 latin1 在许多地方 (下边会详细描述具体是哪些地方) 作为默认的字符集,成功的蒙蔽了许多 PHP 程序的开发者和用户,掩盖了在中文等语言环境下会出现的问题。

MySQL 4.1开始把多国语言字符集分的更加详细,所以导致数据库迁移,或则dz论坛升级到4.0后(dz4.0开始使用gbk或utf-8编码)出现乱码问题。

MySQL 4.1的字符集支持(Character Set Support)有两个方面:字符集(Character set)和排序方式(Collation)。对于字符集的支持细化到四个层次: 服务器(server),数据库(database),数据表(table)和连接(connection)。

查看系统的字符集和排序方式的设定可以通过下面的两条命令:

QUOTE:
mysql> SHOW VARIABLES LIKE 'character_set_%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
7 rows in set (0.00 sec)

mysql> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-------------------+
| Variable_name | Value |
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database | latin1_swedish_ci |
| collation_server | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.00 sec)
MySQL 4.1 对于字符集的指定可以细化到一台机器上安装的 MySQL,其中的一个数据库,其中的一张表,其中的一栏,应该用什么字符集。但是,传统的 Web 程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢?

编译 MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;
安装 MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;
启动 mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的;
此时 character_set_server 被设定为这个默认的字符集;
当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为 character_set_server;
当选定了一个数据库时,character_set_database 被设定为这个数据库默认的字符集;
在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;
当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;
这个字符集就是数据库中实际存储数据采用的字符集,mysqldump 出来的内容就是这个字符集下的;
当我们按照原来的方式通过PHP存取MySQL数据库时,就算设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,你会发现存入数据库的仍然是乱码。问题就出在这个connection连接层上。
想要进行“正确”的存储和得到“正确”的结果,最方便的是在所有query开始之前执行一下:

SET NAMES 'gbk';
其中gbk是数据库字符集。

它相当于下面的三句指令:
SET character_set_client = gbk;
SET character_set_results = gbk;
SET character_set_connection = gbk;

4.1和5.0默认使用的是latin1字符集(木头:妈的,老外真霸道,妄想让全世界都是使用瑞典字符集吗)
如果我们只想使用gbk字符集存储和获取数据,
我们在编译mysql 4.1和 5.0的时候,需要注意在my.ini或者my.cnf中添加两处参数

CODE:
[Copy to clipboard]
[mysqld]
default-character-set=utf8


CODE:
[Copy to clipboard]
#settings for clients (connection, results, clients)
[mysql]
default-character-set=utf8
下面我们来说主题,如何转换数据库字符集
两种方法,

QUOTE:
第一种----更改存储字符集
主要的思想就是把数据库的字符集有latin1改为gbk,big5,或者utf8; 以下操作必须拥有主机权限。假设当前操作的数据库名为:database

导出
首先需要把数据导为mysql4.0的格式,具体的命令如下:
mysqldump -uroot -p --default-character-set=latin1 --set-charset=gbk --skip-opt databse > d4.sql

--default-characte-set 以前数据库的字符集,这个一般情况下都是latin1的,
--set-charset 导出的数据的字符集,这个可以设置为gbk,utf8,或者big5
导入
首先使用下面语句新建一个GBK字符集的数据库(test)

CREATE DATABASE `d4` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;
然后把刚才导出的数据导入到当前的数据库中就ok了。

mysql -uroot -p --default-character-set=gbk -f d4 通过以上的导出和导入就把数据库的字符集改为正确的存储方式了。

其中d4为新建库的名称,d4.sql为导出文件的名字

但是这种方法,发现数据库数据存储量无端变大30%,真是郁闷


QUOTE:
另外一种其实原理相同,但是需要手动操作,一般用于第一种方法失败后的选择
不过这种方法如果数据库很大,估计很难做,因为光打开文件就能让你死机

首先还是用phpmyadmin或者用mysql本身的dump导出 .sql文件

然后用UltraEdit打开你备份的所有xxxx.sql文件,查找

CODE:
[Copy to clipboard]
DEFAULT CHARSET=latin1
latin1这里也许是别的,反正是你不想要的,要转成gbk或者big5的字符集
把这个替换为“空”
在查找

CODE:
[Copy to clipboard]
CREATE TABLE cdb_sessions (
sid char(6) character set latin1 collate latin1_bin NOT NULL default '',
ip1 tinyint(3) unsigned NOT NULL default '0',
ip2 tinyint(3) unsigned NOT NULL default '0',
ip3 tinyint(3) unsigned NOT NULL default '0',
ip4 tinyint(3) unsigned NOT NULL default '0',
uid mediumint(8) unsigned NOT NULL default '0',
username char(15) NOT NULL default '',
groupid smallint(6) unsigned NOT NULL default '0',
styleid smallint(6) unsigned NOT NULL default '0',
invisible tinyint(1) NOT NULL default '0',
`action` tinyint(1) unsigned NOT NULL default '0',
lastactivity int(10) unsigned NOT NULL default '0',
fid smallint(6) unsigned NOT NULL default '0',
tid mediumint(8) unsigned NOT NULL default '0',
nickname char(15) NOT NULL default '',
UNIQUE KEY sid (sid)
) ENGINE=HEAP MAX_ROWS=1000;
替换为

CODE:
[Copy to clipboard]
CREATE TABLE `cdb_sessions` (
`sid` char(6) binary NOT NULL default '',
`ip1` tinyint(3) unsigned NOT NULL default '0',
`ip2` tinyint(3) unsigned NOT NULL default '0',
`ip3` tinyint(3) unsigned NOT NULL default '0',
`ip4` tinyint(3) unsigned NOT NULL default '0',
`uid` mediumint(8) unsigned NOT NULL default '0',
`username` char(15) NOT NULL default '',
`groupid` smallint(6) unsigned NOT NULL default '0',
`styleid` smallint(6) unsigned NOT NULL default '0',
`invisible` tinyint(1) NOT NULL default '0',
`action` tinyint(1) unsigned NOT NULL default '0',
`lastactivity` int(10) unsigned NOT NULL default '0',
`fid` smallint(6) unsigned NOT NULL default '0',
`tid` mediumint(8) unsigned NOT NULL default '0',
`nickname` char(15) NOT NULL default '',
UNIQUE KEY `sid` (`sid`)
) TYPE=HEAP MAX_ROWS=2000;
这一步更为简单的办法就是删除掉关于cdb_sessions表的这一段,将来全新装一个d4,将这个表导出
将其内容复制,粘贴到 sql文件的最后面

保存后,再把这个sql文件导入到你的库中

就OK了
用这两种方法就可以很方便的把4.1和5.0的mysql数据库降级到4.0
简单的过程就是
A导出4.1/5.0的库
B进行处理,转换成gbk字符集
C彻底卸载4.1或者5.0
D安装4.0.26
E然后导入处理完的库

降级的时候导出库可以用这个方法
mysqldump -uroot -p --default-character-set=latin1 --set-charset=gbk --skip-opt databse --compatible=mysql40 > d4.sql
这样导出的就是4.0的库勒

至于mysql版本的升级,
如果数据文件中有中文信息,那么将MySQL 4.0的数据文件,直接拷贝到MySQL 4.1中就是不可以的,即便在my.ini中设置了default-character-set为正确的字符集。虽然貌似没有问题,但MySQL 4.1的字符集有一处非常恼人的地方,以gbk为例,原本MySQL 4.0数据中varchar,char等长度都会变为原来的一半,这样存储中文容量不变,而英文的存储容量就少了一半。这是直接拷贝数据文件带来的最大问题。

所以,升级的根本,如果想使用“正确”的字符集,还是先用mysqldump导出成文件,然后导入。


这里顺便提一个我的好友深海写的
用于MySQL4.1的论坛数据库字符集整理工具。

刚写的,处理部分代码可能写得有点龌龊,但是不影响使用,


主要用于处理整理MySQL4.1指定数据库、表、字段的字符集。

适用于将非允许的字符集范围内的数据结构(无数据!!)整理为适合Discuz!允许的字符集范围。

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Discuz 백그라운드 로그인 문제 해결 방법 공개 Discuz 백그라운드 로그인 문제 해결 방법 공개 Mar 03, 2024 am 08:57 AM

Discuz 백그라운드 로그인 문제에 대한 해결책이 공개되었습니다. 인터넷의 급속한 발전으로 인해 웹 사이트 구축이 점점 보편화되고 있으며 일반적으로 사용되는 포럼 웹 사이트 구축 시스템으로 Discuz가 선호되고 있습니다. 많은 웹마스터. 그러나 강력한 기능으로 인해 Discuz를 사용할 때 백그라운드 로그인 문제와 같은 몇 가지 문제가 발생할 수 있습니다. 오늘은 Discuz 백그라운드 로그인 문제에 대한 해결책을 공개하고 구체적인 코드 예시를 제공하여 도움이 필요한 분들에게 도움이 되기를 바라겠습니다.

디스커스란 무엇인가요? Discuz의 정의 및 기능 소개 디스커스란 무엇인가요? Discuz의 정의 및 기능 소개 Mar 03, 2024 am 10:33 AM

"Discovering Discuz: 정의, 기능 및 코드 예제" 인터넷의 급속한 발전과 함께 커뮤니티 포럼은 사람들이 정보를 얻고 의견을 교환하는 중요한 플랫폼이 되었습니다. 많은 커뮤니티 포럼 시스템 중에서 중국의 잘 알려진 오픈 소스 포럼 소프트웨어인 Discuz는 대다수의 웹 사이트 개발자 및 관리자가 선호합니다. 그렇다면 Discuz는 무엇입니까? 어떤 기능이 있으며 웹사이트에 어떻게 도움이 됩니까? 이 기사에서는 Discuz를 자세히 소개하고 독자가 이에 대해 더 자세히 알아볼 수 있도록 구체적인 코드 예제를 첨부합니다.

Discuz 사용자의 필수품! 소품명칭 종합분석! Discuz 사용자의 필수품! 소품명칭 종합분석! Mar 12, 2024 pm 10:15 PM

Discuz 사용자의 필수품! 소품명칭 종합분석! Discuz 포럼에서 이름 변경 기능은 항상 사용자들로부터 많은 관심과 요구를 받아왔습니다. 이름을 변경해야 하는 일부 사용자의 경우 이름 변경 소품을 사용하면 사용자 이름을 쉽게 수정할 수 있으며 이는 흥미로운 상호 작용 방법이기도 합니다. Discuz의 이름 바꾸기 소품을 얻는 방법, 사용 방법, 몇 가지 일반적인 문제에 대한 해결 방법을 포함하여 심층적으로 살펴보겠습니다. 1. 개명 소품은 Discuz에서 구입하세요. 개명 소품은 주로 포인트나 관리자를 통해 구매합니다.

잘못된 Discuz 비밀번호를 발견하면 어떻게 해야 합니까? 빠른 솔루션 공유! 잘못된 Discuz 비밀번호를 발견하면 어떻게 해야 합니까? 빠른 솔루션 공유! Mar 03, 2024 am 09:33 AM

잘못된 Discuz 비밀번호를 발견하면 어떻게 해야 합니까? 빠른 솔루션 공유! 토론하세요! 사용자에게 편리한 커뮤니케이션 플랫폼을 제공하는 매우 인기 있는 포럼 프로그램입니다. 디스커스를 이용해보세요! 포럼에 입장할 때, 때때로 잘못된 비밀번호를 접할 수 있으며, 이로 인해 사용자가 포럼에 정상적으로 로그인하고 이용하지 못할 수 있습니다. 자, Discuz를 만나보세요! 비밀번호가 틀리면 어떻게 신속하게 문제를 해결해야 합니까? 일부 솔루션은 참조용으로 제공된 특정 코드 예제와 함께 아래에서 공유됩니다. 1. 비밀번호가 맞는지 확인하세요

Discuz 백그라운드 로그인에 실패했나요? 쉽게 해결하는 방법을 가르쳐주세요! Discuz 백그라운드 로그인에 실패했나요? 쉽게 해결하는 방법을 가르쳐주세요! Mar 02, 2024 pm 06:03 PM

Discuz 백그라운드 로그인에 실패했나요? 쉽게 해결하는 방법을 가르쳐주세요! 인기 포럼 플랫폼인 Discuz는 웹 사이트 구축 및 관리에 널리 사용되기 때문에 때때로 백엔드 로그인 실패가 발생하여 사람들이 고민하는 경우가 있습니다. 오늘은 Discuz 백엔드 로그인 실패를 일으킬 수 있는 문제에 대해 논의하고 몇 가지 솔루션과 구체적인 코드 예제를 제공하겠습니다. 이 기사가 비슷한 문제를 겪고 있는 웹마스터와 개발자에게 도움이 되기를 바랍니다. 1. 문제 해결은 Discuz 백그라운드 로그인 실패 문제를 해결하는 것입니다.

Discuz Editor: 효율적인 게시물 레이아웃 도구 Discuz Editor: 효율적인 게시물 레이아웃 도구 Mar 10, 2024 am 09:42 AM

Discuz Editor: 효율적인 게시물 레이아웃 도구입니다. 인터넷의 발달로 인해 온라인 포럼은 사람들이 정보를 교환하고 공유하는 중요한 플랫폼이 되었습니다. 포럼에서는 사용자들이 자신의 의견과 아이디어를 표현할 수 있을 뿐만 아니라 다른 사람들과 토론하고 교류할 수도 있습니다. 게시물을 게시할 때 명확하고 아름다운 형식은 종종 더 많은 독자의 관심을 끌고 더 정확한 정보를 전달할 수 있습니다. 사용자가 게시물을 빠르게 입력하고 편집할 수 있도록 하기 위해 Discuz 편집기가 등장하여 효율적인 게시물 조판 도구가 되었습니다. 디스크

Discuz Editor: 강력한 웹페이지 편집 도구 Discuz Editor: 강력한 웹페이지 편집 도구 Mar 09, 2024 pm 06:06 PM

Discuz Editor: 특정 코드 예제가 필요한 강력한 웹 페이지 편집 도구입니다. 인터넷이 발달하면서 웹사이트 구축과 콘텐츠 편집이 점점 더 중요해지고 있습니다. 일반적인 웹 페이지 편집 도구인 Discuz 편집기는 웹 사이트 구축에 중요한 역할을 합니다. 풍부한 기능과 도구를 제공할 뿐만 아니라 사용자가 콘텐츠를 보다 편리하게 편집하고 게시할 수 있도록 도와줍니다. 이 글에서는 Discuz 편집기의 기능과 사용법을 소개하고, 독자들이 이를 더 잘 이해하고 사용할 수 있도록 몇 가지 구체적인 코드 예제를 제공합니다.

Discuz 도메인 이름 수정 단계에 대한 자세한 설명 Discuz 도메인 이름 수정 단계에 대한 자세한 설명 Mar 11, 2024 am 11:00 AM

Discuz 도메인 이름을 수정하는 단계에 대한 자세한 설명이 필요합니다. 웹사이트 개발 및 운영에 따라 브랜드 변경, 웹사이트 SEO로 인해 때때로 Discuz 도메인 이름을 수정해야 할 수 있습니다. 최적화 또는 기타 이유. 이유가 무엇이든 Discuz 도메인 이름을 변경하는 것은 신중한 작업이 필요한 과정입니다. 오늘은 Discuz 도메인 이름을 변경하는 단계를 자세히 소개하고 구체적인 코드 예제를 제공하겠습니다. 1단계: 데이터를 백업하세요. 도메인 이름을 수정하기 전에 먼저 웹사이트가 올바른지 확인해야 합니다.

See all articles