由于MySQL数据库通常保存着应用的核心数据,数据备份与恢复功能是必不可少的,大多数成熟的数据库管理系统都提供高性能的在线
由于MySQL数据库通常保存着应用的核心数据,数据备份与恢复功能是必不可少的,大多数成熟的数据库管理系统都提供高性能的在线数据备份与定点(Point-in-time)恢复功能。但作为最流行的开源数据库产品,MySQL在这方面的功能是比较弱的,即使与另一个知名开源数据库PostgreSQL相比也远远不足。一直以来,MySQL只提供一个mysqldump工具来进行数据备份。这是个与数据库核心完全独立外围工具,简单说起来就是对要备份的表执行"SELECT *"语句,,选出每条记录然后存储成INSERT语句或CSV格式。这种方式容易实现但显然性能不佳,尤其是恢复时需要导入数据,如果有大量数据将是一个非常慢的过程,一但发生故障,系统将长时间不能提供服务。不过,等到今年底MySQL 6.0发布之后(我估计会跳票),这一现象将完全改观。
MySQL 6.0中将计划引入全新的在线备份与恢复功能,届时备份与恢复功能将由各存储引擎提供的本地驱动(Native Driver)提供。各存储引擎可以以最方便高效的形式提供数据备份功能,前提是备份所得数据要对应于某个时间点数据库的一致状态(即备份包含且只包含当时所有已经提交事务(对于非事务存储引擎是所有已经完成的操作)修改的数据。这一时间点有两种选择,可以是备份刚开始的时间,也可以是备份刚刚结束时的时间。一个备份可能涉及到多个存储引擎(这也是MySQL实现在线备份功能的难点,目前MySQL备份功能不佳估计就与MySQL支持多个存储引擎的特性的关),但只要每个存储引擎都能提供对应于备份刚开始或刚结束时的一致数据,MySQL就能保证备份数据的全局一致性。这一点容易做到,MySQL会要求那些提供备份结束点一致性数据的存储引擎先进行备份,等到这些存储引擎备份完成后,再短暂的停止数据库写操作,然后启动那些提供备份起始点一致性数据的存储引擎的备份过程。
这样,MySQL上层只是把各个存储引擎备份的数据打个包(同时也提供备份数据压缩和加密功能),最关键的就是各存储引擎本地驱动的实现。由于备份与恢复功能由本地驱动提供,理论上可以提供比mysqldump好得多的备份与恢复性能,并且实现联机备份。以MyISAM存储引擎为例,原来要想对MyISAM类型的表作一个一致性备份,就并且锁定这个表,备份期间不能进行写操作,影响到系统服务。在将来的MySQL 6.0中,据开发人员的设想,MyISAM存储引擎的本地驱动将按如下方式进行数据备份:启动备份后,开启日志记录功能,记录备份过程中对被备份表的数据修改操作,然后拷贝.MYD和.MYI文件,最后拷贝备份期间的日志。这样备份将由.MYD/MYI文件和备份期间的更新日志构成,恢复时先恢复数据,再回放这些日志,就能将数据恢复到备份刚结束时的状态。并且由于这些日志是由MyISAM本地驱动提供的物理日志,不是逻辑的binlog,恢复性能会有很大提高。