首页 数据库 mysql教程 Mysql slave 同步错误解决_MySQL

Mysql slave 同步错误解决_MySQL

May 30, 2016 pm 05:10 PM
错误

分析解决

master 数据库提供服务,slave数据库作报表服务器,通过mysqlbin log做主从同步。

 

从报表数据来看,缺少了从10/28到现在(11/18)之前的数据,比对master、slave数据库主要表数据,发现:

 

10/28之后的slave库数据缺失,一致未同步。

 

查看slave mysql同步状态:

 

Mysql slave 同步错误解决_MySQL

关注图中黄色字段:

 

Slave_IO_Running: Yes

Slave_SQL_Running: No --- 表示sql进程未工作,问题就处在这。

 

图中粉色背景,Last_Error: ....

 

'Duplicate entry '1169595' for key 'PRIMARY'' on query. Default database: ''. Query: 'insert into  user。。。

 

这个错误很简单,违反主键唯一约束。

 

2. mysql 错误日志 通过my.conf 确定出错误日志文件,vi 查看,根据日志151028搜索到以下:

Mysql slave 同步错误解决_MySQL

 

 

从日志中,看到10/28 1:28:55 mysql 非正常关闭; 1:29 重启后,开始recovery。 1:29:16s 后I/O errror; 1:30:19s SQL error, slave SQL thread aborted(停止工作)。

 

mysql也给出了解决办法:

 

Fix the problem, and restart the slave SQL thread with "SLAVE START". We stopped at log 'mysql-bin.000274' position 504869752

 

重启,并告诉sql 执行的binlog 文件设置position, 重启slave. 错误仍存在,如下

 

 View Code

 

 

错误原因仍是

 

Last_SQL_Error: Error 'Duplicate entry '1169595' for key 'PRIMARY'' on query. Default database: ''. Query: 'insert into user (type,lang,ipAddr,activityStatus,extUserId,endpoint,createTime, email, userName, mobile, storageSize, tuner

)values ('normal','zh-xx','xxxx','active','913151000777430','xxx',now(),null,null,null,0,0)'

 

至此看来,虽然找到问题原因必须解决以上这个问题。 进一步了解mysql 同步机制及bin log, 原理:slave 获取master的binlog, 并执行,执行报错说明数据库已有这条记录,可能原因是日志中的position不准确,只能从binlog入手分析,

 

binlog查看参考: MySQL的binlog日志

 

这里通过第二种方式查看:

 

 mysql> show binlog events [IN 'log_name'] [FROM pos] [LIMIT [offset,] row_count];

 

             选项解析:

               IN 'log_name'   指定要查询的binlog文件名(不指定就是第一个binlog文件)

               FROM pos        指定从哪个pos起始点开始查起(不指定就是从整个文件首个pos点开始算)

               LIMIT [offset,] 偏移量(不指定就是0)

               row_count       查询总条数(不指定就是所有行)

log_name, pos 错误日志已知道,查询如下:

Mysql slave 同步错误解决_MySQL

 

 

binlog 包括所有数据库操作的sql,每条记录包含1个数据库操作。

 

在bin log 中,很容易找到出错的语句,现在问题是:找到slave SQL线程执行到哪个position. 这里只能采用最笨的办法,根据sql 语句,查看slave库中的数据,如:

 

Query | 1 | 504873619 | replace into content_preference(userId,contentId,playRecordId,status,createTime) 

values (587658,15308,1544691,0,now())

 

此sql语句为向content_preference 插入一条记录,那么在salve库中content_preference 表中确定是否有id=587658,contentId=15308的记录,如果有,表示此语句已执行。

 

一直向下查找,最终找到没有执行的sql 的记录, 找到position。

 

至此,可以判断出slave库中执行binlog 的position, 重新设定slave库的binlog position ,启动slave, 查看执行状态,running, 见下:

 

 

mysql> stop slave;
Query OK, 0 rows affected (0.00 sec)

mysql> CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000274',MASTER_LOG_POS=504873114;
Query OK, 0 rows affected (1.98 sec)

mysql> start slave;
Query OK, 0 rows affected (0.00 sec)


mysql> show slave status\G
*************************** 1. row ***************************
               Slave_IO_State: Queueing master event to the relay log
                  Master_Host: 172.17.128.15
                  Master_User: xxx
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: mysql-bin.000274
          Read_Master_Log_Pos: 693913486
               Relay_Log_File: app3-relay-bin.000002
                Relay_Log_Pos: 1819098
        Relay_Master_Log_File: mysql-bin.000274
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes

登录后复制

 

在备份执行完毕后,报表导出数据正常,问题解决。

 

反思

 mysql在11/28日重启,原因是当天线上服务出现异常,无法解决,重启了机器,当时没考虑到报表数据库也在此机器上,重启后也未检查数据库备份情况,直到用户使用才发现问题。

 

mysql意外重启,虽然在下次重启启动后,记录了异常信息,和备份的binlog 日志文件及位置。如果是正在执行binlog SQL,但此时mysql意外关闭,记录的position 较旧,导致下次启动时,

 

会有部分binlog 日志重复执行导致。 此问题,不能说是mysql bug,这种机制,可以保证slave数据不至于丢失,但需要人工找到posion,即可。

 

后续:

 

1. 对于机器重启情况, 可手动执行stop slave.  在正常关闭mysql, 重启后,手动start slave, 应该就可以正常同步。

 

2. 线上系统,重启一定要小心, 重启后监控相关模块是否启动,可以增加mysql slave工作监控。

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
2 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

无法完成操作(错误0x0000771)打印机错误 无法完成操作(错误0x0000771)打印机错误 Mar 16, 2024 pm 03:50 PM

如果您在使用打印机时遇到错误消息,例如操作无法完成(错误0x00000771),可能是因为打印机已断开连接。在这种情况下,您可以通过以下方法解决问题。在本文中,我们将讨论如何在Windows11/10PC上修复此问题。整个错误信息说:操作无法完成(错误0x0000771)。指定的打印机已被删除。修复WindowsPC上的0x00000771打印机错误若要修复打印机错误操作无法完成(错误0x0000771),指定的打印机已在Windows11/10PC上删除,请遵循以下解决方案:重新启动打印假脱机

Windows沙盒启动失败-访问被拒绝 Windows沙盒启动失败-访问被拒绝 Feb 19, 2024 pm 01:00 PM

Windows沙盒是否终止,并显示Windows沙盒无法启动,错误0x80070005,拒绝访问消息?一些用户报告说,Windows沙盒无法打开。如果您也遇到此错误,您可以按照本指南进行修复。Windows沙盒启动失败-访问被拒绝如果Windows沙盒终止,并显示Windows沙盒无法启动,错误0x80070005,拒绝访问消息,请确保您以管理员身份登录。此类错误通常是由于权限不足引起的。因此,请尝试以管理员身份登录并查看是否解决问题。如果问题仍然存在,可以尝试以下解决方案:以管理员身份运行Wi

揭秘HTTP状态码460的出现原因 揭秘HTTP状态码460的出现原因 Feb 19, 2024 pm 08:30 PM

解密HTTP状态码460:为什么会出现这个错误?引言:在日常的网络使用中,经常会遇到各种各样的错误提示,其中包括HTTP状态码。这些状态码是HTTP协议定义的一种机制,用于指示请求的处理情况。在这些状态码中,有一种比较罕见的错误码,即460。本文将深入探讨这个错误码,并解释为什么会出现这个错误。HTTP状态码460的定义:首先,我们需要了解HTTP状态码的基

解决电脑宽带连接错误代码651的方法 解决电脑宽带连接错误代码651的方法 Dec 24, 2023 am 11:19 AM

很多小伙伴打开电脑连接宽带的时候,电脑提示错误651,这是什么情况呢?出现651是由于用户终端电脑与网通局端设备连接不通所导致的,有可能是外部断线或者设备出了问题,我们可以联系运营商解决,或者检查一下设备,具体的教程一起来看看吧。解决电脑宽带连接651错误的详细教程方法1:网卡驱动故障1、首先考虑网卡驱动问题,这个问题比较常见,右键点击桌面计算机——管理,如下图所示2、在计算机属性页面选择“设备管理器”进入。3、在设备管理器页面找到“网络适配器”下面一般有两个网卡,一个有线一个无线网卡,点击有线

Windows Update 更新提示Error 0x8024401c错误的解决方法 Windows Update 更新提示Error 0x8024401c错误的解决方法 Jun 08, 2024 pm 12:18 PM

目录解决方法一解决方法二一、删除Windows更新的临时文件二、修复受损的系统文件三、查看并修改注册表项四、关闭网卡IPv6五、运行WindowsUpdateTroubleshootor工具进行修复六、关闭防火墙和其它相关的杀毒软件。七、关闭WidowsUpdate服务。解决方法三解决方法四华为计算机Windows更新出现“0x8024401c”报错问题现象问题原因解决方案仍未解决?最近web服务器因为系统漏洞需要更新,登录服务器之后,更新提示错误代码0x8024401c解决方法一

解决win11安装autocad时遇到的错误 解决win11安装autocad时遇到的错误 Dec 30, 2023 pm 03:23 PM

AutoCAD是最常用的图纸设计软件之一,但是我们在win11上想要使用时,有可能会遇到win11安装autocad出现错误的问题,这时候我们可以尝试修改注册表来解决。win11安装autocad出现错误:第一步,按下键盘“win徽标+r”打开运行。第二步,输入“regedit”回车打开注册表。3、将“计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Policies\System”粘贴进上方路径里。4、进入后,双击

服务器在创建新的虚拟机时遇到错误,0x80070003 服务器在创建新的虚拟机时遇到错误,0x80070003 Feb 19, 2024 pm 02:30 PM

在使用Hyper-V创建或启动虚拟机时,如果遇到错误代码0x80070003,可能是由于权限问题、文件损坏或配置错误造成的。解决方法包括检查文件权限、修复损坏文件、确保正确配置等。可通过逐一排除不同可能性来解决此问题。整个错误消息如下所示:服务器在创建[虚拟机名]时遇到错误。无法创建新的虚拟机。无法访问配置存储:系统找不到指定的路径。(0x80070003)。导致此错误的一些可能原因包括:虚拟机文件已损坏。这可能是由于恶意软件、病毒或广告软件攻击而发生的。虽然发生这种情况的可能性很低,但你不能完

解决Tomcat 404错误:快速实用技巧 解决Tomcat 404错误:快速实用技巧 Dec 28, 2023 am 08:05 AM

快速解决Tomcat404错误的实用技巧Tomcat是一个常用的JavaWeb应用服务器,在开发和部署JavaWeb应用时经常会用到。然而,有时候我们可能会遇到Tomcat的404错误,这意味着Tomcat无法找到请求的资源。这个错误可能由多个因素引起,但在本文中,我们将介绍一些常见的解决方案和技巧,帮助您快速解决Tomcat的404错误。检查URL路径

See all articles