社群

學習

工具庫

AI工具

休閒

繁体中文

首頁

資料庫

mysql教程

GitHub Availability Issue 总结_MySQL

GitHub Availability Issue 总结_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 pm 01:48 PM

資料庫

GitHub

bitsCN.com

这周GitHub网站发生了两次重大的不可访问事故，以及若干小时的服务降级。GitHub运维团队特地发了一篇Blog来总结整个事件的过程。

事故的主要原因可以归结为：

1. 数据库的Active角色在不应该发生failover切换时，进行了切换。 First, several failovers of the 'active' database role happened when they shouldn't have.

2. 数据库集群发生了脑裂，导致集群管理软件（Pacemaker+HeartBeat）做了错误的操作。Second, a cluster partition occurred that resulted in incorrect actions being performed by our cluster management software.

3. 前两点中提到的Failover切换，造成了比预计情况更恶劣的性能问题。Finally, the failovers triggered by these first two events impacted performance and availability more than they should have

基于这三点总结就抛出了三个问题：

1. 现有的HA软件是否可靠，可信？是否在正确的时候做了正确的判断和操作？

2. 没有集中管理机的HA架构（即内部投票）是否可靠？

3. HA的Failover过程是否要考虑数据预热？

以下是对于这三个问题的一些分析和个人看法：

问题一：现有的HA软件是否可靠，可信？是否在正确的时候做了正确的判断和操作？

GitHub团队认为：The automated failover of our main production database could be described as the root cause of both of these downtime events.

而对于这个问题，我的想法和 Xaprd的观点一致：事故的关键在于现有的HA软件都没法照顾到所有可能发生的情况，以至于在某些情况下的行为是不可预测的，或者非我们所想的。

因此一味的将切换操作置成手工模式，虽然避免了风险，但显然没有很好的使用HA软件所提供的service。

个人想法是，对于一些原因明确且有明确cookbook的事故，可以让HA去完成failover。而对于那些需要人工介入分析故障原因的事故，做手工切换，如果github遇到的timeout等。

问题二：没有集中管理机的HA架构（即内部投票）是否可靠？

从目前的流行程度来看，MMM，MHA这些使用Manager管理模式的架构，已经逐渐替代 Heartbeat + LVS/ Pacemaker 等投票模式的架构。

其主要原因就是在没有仲裁机的情况下，发生网络partition会造成脑裂，从而导致active角色的互相争抢，最后使整个cluster瘫痪。

Github再次用血的教训告诉我们脑裂是无仲裁架构的致命缺陷。

问题三：HA的Failover过程是否要考虑数据预热？

这个问题显然是引起本次问题的关键：没有预热的切换才是万恶之源。脑裂只是连锁反应而已。

而貌似整个社区的blog中对于这个问题的讨论却是少之又少，也许是重视程度不够？

会造成切换后压力剧增可能的情况，我总结为以下三种：

1. stand-by-master完全作为冗余，BufferPool 基本没有热点数据

2. stand-by-master提供read-only服务，但read-only 和 acitve master 的请求业务类型不同，导致热点数据不同

3. 原本active的MySQL宕机后重新回归，此时重启后的MySQL是处于完全Cold 状态

但目前众多HA软件中都没有考虑预热的因素，毕竟所有的failover都希望尽快的将业务转移至stand-by master，而预热则需要尽可能多的时间来获取业务的请求。

也许这是一个无解命题？

bitsCN.com

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

顯示更多

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

2 週前 By 尊渡假赌尊渡假赌尊渡假赌

倉庫：如何復興隊友

4 週前 By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island冒險：如何獲得巨型種子

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

擊敗分裂小說需要多長時間？

3 週前 By DDD

R.E.P.O.保存文件位置：在哪里以及如何保護它？

3 週前 By DDD

顯示更多

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

顯示更多

熱門話題

gmail信箱登陸入口在哪裡

7313

9

Java教學

1625

14

CakePHP 教程

1348

46

Laravel 教程

1260

25

PHP教程

1207

29

顯示更多

Related knowledge

Go語言如何實作資料庫的增刪改查操作？

Go語言如何實作資料庫的增刪改查操作？ Mar 27, 2024 pm 09:39 PM

Go語言如何實作資料庫的增刪改查操作？

在PHP中使用MySQLi建立資料庫連線的詳盡教學

在PHP中使用MySQLi建立資料庫連線的詳盡教學 Jun 04, 2024 pm 01:42 PM

在PHP中使用MySQLi建立資料庫連線的詳盡教學

Hibernate 如何實作多型映射？

Hibernate 如何實作多型映射？ Apr 17, 2024 pm 12:09 PM

Hibernate 如何實作多型映射？

iOS 18 新增「已復原」相簿功能可找回遺失或損壞的照片

iOS 18 新增「已復原」相簿功能可找回遺失或損壞的照片 Jul 18, 2024 am 05:48 AM

iOS 18 新增「已復原」相簿功能可找回遺失或損壞的照片

MySQL資料庫管理系統的基本原理解析

MySQL資料庫管理系統的基本原理解析 Mar 25, 2024 pm 12:42 PM

MySQL資料庫管理系統的基本原理解析

深入解析HTML如何讀取資料庫

深入解析HTML如何讀取資料庫 Apr 09, 2024 pm 12:36 PM

深入解析HTML如何讀取資料庫

PHP處理資料庫中文亂碼的技巧與實踐

PHP處理資料庫中文亂碼的技巧與實踐 Mar 27, 2024 pm 05:21 PM

PHP處理資料庫中文亂碼的技巧與實踐

如何在PHP中處理資料庫連線錯誤

如何在PHP中處理資料庫連線錯誤 Jun 05, 2024 pm 02:16 PM

如何在PHP中處理資料庫連線錯誤

See all articles