为什么MongoDB会丢数据-MySQL 튜토리얼-php.cn

집

데이터 베이스

MySQL 튜토리얼

为什么MongoDB会丢数据

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:38 PM

mongodb 왜 데이터

MongoDB 丢数据的说法已经出现很久很久了，传言甚多。这里简单总结下场景。 1.在MongoDB很早的版本，2.0之前，没有journal,加上默认不是安全写，系统一宕机就可能出现数据丢失，因为数据没有刷盘，也没有恢复日志恢复机制。这个问题倒默认启用journal以及安

MongoDB 丢数据的说法已经出现很久很久了，传言甚多。这里简单总结下场景。

1.在MongoDB很早的版本，2.0之前，没有journal,加上默认不是安全写，系统一宕机就可能出现数据丢失，因为数据没有刷盘，也没有恢复日志恢复机制。这个问题倒默认启用journal以及安全写之后，没有问题了。

2.选举机制造成的数据丢失。这里主要说这个。简单讲，MongoDB目前的选举机制是有缺陷的。在一些场景下会造成数据丢失。这些场景实际中会出现，如多机房情况下，但一般不会太多。

场景1

replica set有如下节点： n1, n2, n3, n4, n5

n1 主节点
n2,n3从n1同步
n4,n5从n3同步

假设发生如下事件：

(n1, n2)与(n3, n4, n5)之间发生网络分裂（network partition）
n3连不到n1，然后选举它自己
n4 n5 投票给 n3, 因此n3 变成主节点
n3执行写操作A，然后复制到n4，n5并确认，这样被复制集大部分成员确认了。
n1 重新连接到复制集, 但仍然是主节点. 它必须降级.

现在有2个主节点 n1 and n3.其中一个需要降级，如果 n1降级，不会产生什么后果, 但如果 n3 降级, 多数成员确认的写操作就丢失了.

MongoDB 2.4中这是非常可能的. 双主场景中,选择哪一个主节点降级是随意的. SERVER-9765 描述了这个问题. 现在 2.6版本中,其中一个主节点根据上一次选举的时间戳来决定哪一个降级.上面例子中 n3被选举为主的时间比 n1近, n3应该保持作为主而n1应该降级. 因为成员可能每30秒参与一次选举，因此成功的选举之间最小间隔为30秒. 虽然如此，我仍然不知道不同成员之间的时钟误差在这个算法上如何影响。

场景2

(n1, n2)与(n3, n4, n5)之间发生网络分裂（network partition）
n3连不到n1，然后选举它自己
n4 n5 投票给 n3, 因此n3 变成主节点
n3执行写操作A，然后复制到n4，n5并确认，这样被复制集大部分成员确认了。
n1 重新连接到复制集, 但仍然是主节点. 它必须降级.
n1接受写操作B,然后复制并被n2确认；
n4停止从n3复制并开始从n1复制；
因为n1没有写操作A，n4回滚写操作A，然后复制并确认写操作B.

这里问题就是有两个主，任意一个降级，都要回滚相应的写操作。这个例子也可以看出MongoDB复制的一个潜在问题，即简单的以来时间戳来决定oplog位置。

场景3

这个场景与2有点类似，但是考虑一下降级的时候考虑选举的时间，即选最近选举出来的为主，另一个主降级。

所有从节点从n1复制.
发生网裂，(n1, n2) 与 (n3, n4, n5)断开
n3连不到n1，然后选举它自己
n4 n5 投票给 n3, 但n3还没变为主节点
n4和n5投票后，网络恢复
n1发生写操作A，并被n2,n4,n5确认，n3还没变成主或者还没复制并确认这个写操作。
n3最终成为主了，还没机会复制并确认A操作
n1注意到n3是主并且选举的时间更近，因此n1降级
所有成员开始从n3复制，因此回滚A操作。

这里可以看出的问题是，写确认操作和投票选举操作之间并没有足够的交流，n4,n5投票给n3，确认了一个可能回滚的写操作，部分原因是因为刚刚完成选举操作。这是MongoDB选举协议没有考虑的地方。

总的来说，现在MongoDB的选举协议问题如下：
双主的情况下，必须解决一下问题

两个主节点必须不能产生交错的oplog
当双主情况下，oplog位置小的降级

数据同步线程和写确认操作线程必须与选举主节点线程有更多交流，简言之，应该如下：

成员不能投票会回滚写操作的节点为主节点；
成员不能确认因为选举投了赞成票可能造成回滚的写操作。

tokumx将通过ark选举协议来解决这个问题。

参考：
http://www.tokutek.com/2014/07/explaining-ark-part-3-why-data-may-be-lost-on-a-failover/

原文地址：为什么MongoDB会丢数据, 感谢原作者分享。

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7456

Cakephp 튜토리얼

1376

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

H5 페이지 생산에는 지속적인 유지 보수가 필요합니까? Apr 05, 2025 pm 11:27 PM

코드 취약점, 브라우저 호환성, 성능 최적화, 보안 업데이트 및 사용자 경험 개선과 같은 요소로 인해 H5 페이지를 지속적으로 유지해야합니다. 효과적인 유지 관리 방법에는 완전한 테스트 시스템 설정, 버전 제어 도구 사용, 페이지 성능을 정기적으로 모니터링하고 사용자 피드백 수집 및 유지 관리 계획을 수립하는 것이 포함됩니다.

H5 페이지 제작의 장점은 무엇입니까? Apr 05, 2025 pm 11:48 PM

H5 페이지 제작의 장점에는 경량 경험, 빠른 로딩 속도 및 사용자 유지 개선이 포함됩니다. 교차 플랫폼 호환성, 다른 플랫폼에 적응할 필요가 없어 개발 효율성을 향상시킵니다. 유연성 및 동적 업데이트, 감사가 필요하지 않아 콘텐츠를 쉽게 수정하고 업데이트 할 수 있습니다. 기본 앱보다 비용 효율적이고 개발 비용이 낮습니다.

플렉스 레이아웃의 자주색 슬래시 영역이 잘못된 '오버플로 공간'으로 간주되는 이유는 무엇입니까? Apr 05, 2025 pm 05:51 PM

플렉스 레이아웃의 보라색 슬래시 영역에 대한 질문 플렉스 레이아웃을 사용할 때 개발자 도구 (d ...)와 같은 혼란스러운 현상이 발생할 수 있습니다.

Edge 브라우저의 특정 DIV 요소가 표시되지 않는 이유는 무엇입니까? 이 문제를 해결하는 방법? Apr 05, 2025 pm 08:21 PM

사용자 에이전트 스타일 시트로 인한 디스플레이 문제를 해결하는 방법은 무엇입니까? 에지 브라우저를 사용하는 경우 프로젝트의 DIV 요소를 표시 할 수 없습니다. 확인 후 게시했습니다 ...

라우터 폴더 아래의 index.js 파일에서 vue.use (vuerouter)를 호출 해야하는 이유는 무엇입니까? Apr 05, 2025 pm 01:03 PM

vue 응용 프로그램을 개발할 때 라우터 폴더 아래에 index.js 파일에 vuerouter를 등록해야 할 필요성이 있으면 종종 라우팅 구성에 문제가 발생합니다. 특별한...

JS가 H5없이 실행할 수 있습니까? Apr 06, 2025 am 09:06 AM

JavaScript가 HTML5없이 실행할 수 있습니까? JavaScript 엔진 자체는 독립적으로 실행할 수 있습니다. 브라우저 환경에서 JavaScript를 실행하는 것은 코드를로드하고 실행하는 데 필요한 표준화 된 환경을 제공하기 때문에 HTML5에 따라 다릅니다. HTML5가 제공하는 API 및 기능은 최신 JavaScript 프레임 워크 및 라이브러리에 중요합니다. HTML5 환경이 없으면 많은 JavaScript 기능을 구현하기 어렵거나 구현할 수 없습니다.