MySQL 마스터-슬레이브 동기화 솔루션 프로세스
어제 테이블 구조가 수정되었고, 테이블 중 하나가 varchar(30)에서 varchar(50)으로 필드 구조로 확장되었습니다. 120만개 이상인데, 메인 데이터베이스에서는 실행하는데 40초 밖에 걸리지 않았지만, 슬레이브 데이터베이스에서는 동기화하는데 4시간이 걸렸습니다.
메인 라이브러리는 매우 빠르게 실행되지만 영향을 받는 행 수는 120만 행입니다. 슬레이브 라이브러리는 단순히 슬레이브 라이브러리를 수정하기 위해 sql 명령을 실행하는 대신 120만 행의 구조 변경 사항을 동기화합니다.
처음에는 눈치채지 못했으나 나중에 사업이 느려지자 뭔가 이상하다는 느낌이 들기 시작했습니다. 재빨리 mysql에 가서 현재 차단된 mysql 프로세스를 확인했습니다.
show proccesslist
여기 결과는 아닙니다. 그 당시의 결과(그 당시에는 쿼리가 많았음)가 차단되었습니다.):
| Id | User | Host | db | Command | Time | State | Info | +--------+-------+-----------------+------+-------------+--------+-----------------------------------------------------------------------+------------------+ | 722874 | bakup | 127.0.0.1:36759 | NULL | Binlog Dump | 281055 | Master has sent all binlog to slave; waiting for binlog to be updated | NULL | | 991867 | root | localhost | NULL | Sleep | 780 | | NULL | | 992585 | root | localhost | NULL | Query | 0 | NULL | show processlist |
1.Id: 프로세스 ID, 명령문을 종료하려는 경우 매우 유용합니다.
2.User: 이전 사용자 한 명을 표시합니다. 루트가 아닌 경우 이 명령은 권한 내의 SQL 문만 표시합니다.
3.Host: 이 명령문이
4.db에서 발행된 IP와 포트를 표시합니다. 4.db: 이 프로세스가 현재 연결된 데이터베이스를 표시합니다.
5.Command: 현재 연결 명령의 실행을 표시합니다. , sleep, query, connect, binlog (마스터-슬레이브)
6. 시간: 이 상태의 지속 시간(초)입니다.
7.State:현재 연결을 사용하는 SQL 문의 상태를 표시합니다. 모든 상태는 나중에 설명할 것입니다. A. 상태는 단지 특정 상태일 뿐입니다. 예를 들어, tmp 테이블로 복사, 결과 정렬, 데이터 전송 및 기타 상태를 거쳐야 할 수 있습니다.
8.info: 이 SQL 문 표시
현재 차단 프로세스가 종료되었습니다. 즉, 동기화 구조를 수정하는 프로세스
kill 722874
정상적인 비즈니스 쿼리를 재개할 수 있었지만 새로운 문제가 발생하여 마스터와 슬레이브가 강제로 일시 중지되었으며, 오류가 발생하여 마스터 데이터베이스를 슬레이브 데이터베이스와 동기화할 수 없으며 비즈니스 쿼리가 최신 데이터입니다. 데이터를 동기화할 수 없습니다.
라이브러리에서 명령을 쿼리합니다(여기 결과는 당시의 결과가 아닙니다(당시 오류 메시지였습니다)).
(Mon Jun 26 20:49:40 2017) db_2 >>show slave status\G*************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 127.0.0.1 Master_User: bakup Master_Port: 3306Connect_Retry: 60 Master_Log_File: mysql-bin.000330 Read_Master_Log_Pos: 445043216 Relay_Log_File: 174-relay-bin.000043Relay_Log_Pos: 445043362Relay_Master_Log_File: mysql-bin.000330 Slave_IO_Running: Yes Slave_SQL_Running: Yes Replicate_Do_DB: Replicate_Ignore_DB: information_schema,mysql,performance_schema,test,zabbix,information_schema,mysql,performance_schema,test,zabbix Replicate_Do_Table: Replicate_Ignore_Table: Replicate_Wild_Do_Table: Replicate_Wild_Ignore_Table: Last_Errno: 0 Last_Error: Skip_Counter: 0 Exec_Master_Log_Pos: 445043216 Relay_Log_Space: 445043559 Until_Condition: None Until_Log_File: Until_Log_Pos: 0 Master_SSL_Allowed: No Master_SSL_CA_File: Master_SSL_CA_Path: Master_SSL_Cert: Master_SSL_Cipher: Master_SSL_Key: Seconds_Behind_Master: 0Master_SSL_Verify_Server_Cert: No Last_IO_Errno: 0Last_IO_Error: Last_SQL_Errno: 0 Last_SQL_Error: Replicate_Ignore_Server_Ids: Master_Server_Id: 11 row in set (0.00 sec)
그래서 운영 및 유지보수측과 협의하여 다음과 같은 방법을 택했습니다.
恢复主库到改变字段前的状态 2 停止主从二进制日志的写入,主从同步停止 3 开始改变主库字段结构 4 改变从库字段结构(注意此时主从同步已经停止) 5 修正此前发生的同步错误 6 恢复主从二进制日志的写入 7 重新开启主从同步
문제가 해결되었습니다. 약 40분 정도 소요되었습니다.
이 작업도 약간 성급한 작업이므로 백엔드에 액세스하기 어려운 밤에 많은 양의 데이터에 대한 구조적 변경을 수행하는 것이 좋습니다. 평가도 당일 진행했는데, 2시간 안에 성공할 수 있었다.
첨부, 상태 열 정보:
Checking table 正在检查数据表(这是自动的)。 Closing tables 正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。 Connect Out 复制从服务器正在连接主服务器。 Copying to tmp table on disk 由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。 Creating tmp table 正在创建临时表以存放部分查询结果。 deleting from main table 服务器正在执行多表删除中的第一部分,刚删除第一个表。 deleting from reference tables 服务器正在执行多表删除中的第二部分,正在删除其他表的记录。 Flushing tables 正在执行FLUSH TABLES,等待其他线程关闭数据表。 Killed 发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。 Locked 被其他查询锁住了。 Sending data 正在处理SELECT查询的记录,同时正在把结果发送给客户端。 Sorting for group 正在为GROUP BY做排序。 Sorting for order 正在为ORDER BY做排序。 Opening tables 这个过程应该会很快,除非受到其他因素的干扰。例如,在执ALTER TABLE或LOCK TABLE语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。 Removing duplicates 正在执行一个SELECT DISTINCT方式的查询,但是MySQL无法在前一个阶段优化掉那些重复的记录。因此,MySQL需要再次去掉重复的记录,然后再把结果发送给客户端。 Reopen table 获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。 Repair by sorting 修复指令正在排序以创建索引。 Repair with keycache 修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。 Searching rows for update 正在讲符合条件的记录找出来以备更新。它必须在UPDATE要修改相关的记录之前就完成了。 Sleeping 正在等待客户端发送新请求. System lock 正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。 Upgrading lock INSERT DELAYED正在尝试取得一个锁表以插入新记录。 Updating 正在搜索匹配的记录,并且修改它们。 User Lock 正在等待GET_LOCK()。 Waiting for tables 该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:FLUSH TABLES tbl_name, ALTER TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。 waiting for handler insert INSERT DELAYED已经处理完了所有待处理的插入操作,正在等待新的请求。
위 내용은 mysql 마스터-슬레이브 동기화 문제 및 해결 과정에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!