讲讲关于 MongoDB 复制集的几个问题-MongoDB-PHP中文网

首页

数据库

MongoDB

讲讲关于 MongoDB 复制集的几个问题

coldplay.xixi

Dec 21, 2020 pm 06:01 PM

mongodb

MongoDB教程介绍为什么要使用复制集

讲讲关于 MongoDB 复制集的几个问题

推荐（免费）：MongoDB教程

为什么要使用复制集

1.备份数据
通过自带的 mongo_dump/mongo_restore 工具也可以实现备份，但是毕竟没有复制集的自动同步备份方便。

2.故障自动转移
部署了复制集，当主节点挂了后，集群会自动投票再从节点中选举出一个新的主节点，继续提供服务。而且这一切都是自动完成的，对运维人员和开发人员是透明的。当然，发生故障了还是得人工及时处理，不要过度依赖复制集，万一都挂了，那就连喘息的时间都没有了。

3.在某些特定的场景下提高读性能
默认情况下，读和写都只能在主节点上进行。
下面是MongoDB的客户端支持5种复制集读选项：

primary：默认模式，所有的读操作都在复制集的主节点进行的。
primaryPreferred：在大多数情况时，读操作在主节点上进行，但是如果主节点不可用了，读操作就会转移到从节点上执行。
secondary：所有的读操作都在复制集的从节点上执行。
secondaryPreferred：在大多数情况下，读操作都是在从节点上进行的，但是当从节点不可用了，读操作会转移到主节点上进行。
nearest：读操作会在复制集中网络延时最小的节点上进行，与节点类型无关。

来源：http://docs.mongoing.com/manual-zh/core/re...

不推荐在从节点上进行读操作，因为从节点上的数据可能不是最新数据（主要原因）。
在从节点上进行读操作的场景很有限，官方手册中写明了适用的场景和不推荐从节点读操作的多个原因：http://docs.mongoing.com/manual-zh/core/re...

说说我自己的看法：复制集并不是为了提高读性能而存在的，除了个别场景，不推荐在从节点上进行读操作。如果想提升读性能，那么请使用索引和分片。插一句，如果数据规模不大，就没必要使用分片了。我们线上数据库中单个集合记录有将近 2 亿条，性能还比较 OK（当然，机器配置也不差，而且上面就只跑了一个 Redis 和一个 MongoDB）。

如何部署复制集

请看手册：http://docs.mongoing.com/manual-zh/tutoria...

如何在程序中使用 MongoDB 复制集故障自动转移的特性

以 PHP 的 mongo 驱动为例。

$client = new MongoClient('mongodb://192.168.1.2:27018,192.168.1.3:27019,192.168.1.4:27020', array('replicaSet' => 'rs0'));

登录后复制

这样配置后，如果只是其中一台 MongoDB 服务挂断后，剩余的节点会自动选举出新的主节点，程序还是可以继续正常运行。在选举的过程中，程序还是会抛出异常的，尽管选举过程很快，但是为了程序的健壮性，必须考虑异常的处理。当然，如果选举不出新的主节点，那么整个 MongoDB 就不可用了。（根据上面讲的，如果复制集的读选项是配置的 primaryPreferred。如果没有了主节点，但是从节点还可用的话，那么读操作将转移到从节点上去，这样整个 MongoDB 复制集还能提供读操作服务）

其实如果指定了复制集名 'replicaSet' => 'rs0'，那么就算不列出所有节点地址，仅写一个有效节点地址，mongo 驱动会自动获取到所有有效节点，$client->getHosts() 方法可以查看所有有效节点的地址。

但是如果你只写了一个节点地址，刚好是那个节点挂掉了，那就连不上了。所有我建议配置完整的节点地址列表。

同步的原理是什么

开启复制集后，会在 local 库下生成一个集合叫 oplog.rs，这是一个有限集合，也就是大小是固定的。每次对数据库的写操作都会被记录到这个集合里面。复制集中的节点就是通过读取其他节点上面的 oplog 来实现数据同步的。

举个例子：
用客户端向主节点添加了 100 条记录，那么 oplog 中也会有这 100 条的 insert 记录。从节点通过获取主节点的 oplog，也执行这 100 条 oplog 记录。这样，从节点也就复制了主节点的数据，实现了同步。

需要说明的是：并不是从节点只能获取主节点的 oplog。

为了提高复制的效率，复制集中所有节点之间会互相进行心跳检测（通过ping）。每个节点都可以从任何其他节点上获取oplog。

还有，用一条语句批量删除 50 条记录，并不是在 oplog 中只记录一条数据，而是记录 50 条单条删除的记录。

oplog中的每一条操作，无论是执行一次还是多次执行，对数据集的影响结果是一样的，i.e 每条oplog中的操作都是幂等的。

什么情况下需要重新同步

在上一个问题中得知：oplog 大小是固定的，而且 oplog 里面的记录数不一定和节点中的数据量成正比。那么，新记录肯定会将前面的老记录给覆盖。

如果，有天一个从节点挂了，其他节点还在正常运行，继续有写操作，oplog 继续增长。而这个挂掉的节点一直不能从其他节点那里同步最新的 oplog 记录，当其他节点的 oplog 已经发生的覆盖。即使这个从节点后来恢复了正常，也不会和其他节点保持数据一致了。因为，覆盖的就永远回不来了。

那么，这个时候就得重新同步了。恩，回不去的就永远回不去了，再找个新的重新开始吧。(逃

如何重新同步

参见：复制集成员的重新同步

什么时候应该使用投票节点

当复制集中有偶数个节点时，应该再加一个投票节点，用于打破投票僵局。

比如：我线上共有3台服务器，其中1台是作为 Web 服务器；其余2台作为 DB 服务器，各部署了1个MongoDB节点，构成了2个节点的复制集。这个时候，我并没有多余的机器了。在这个情况下，如果任意一台 DB 服务器上的 MongoDB 挂了，那么另外一台的 MongoDB 必然变为 SECONDARY 节点，那么就意味着 MongoDB 是不可用的了。为了避免这种情况，提高服务的可用性，可以在 Web 服务器上部署一个投票节点。投票节点并不存储数据，因此不能升职为 PRIMARY 节点，它对于硬件资源要求很低，并不会对 Web 服务器上的其他程序产生太大影响。这种情况下，如果任意一台 DB 服务器挂了，另外一台服务器上的 MongoDB 将成为 PRIMARY 节点，此时 MongoDB 还是依旧对外提供服务的。乘此时机，赶紧排查出故障的那台服务器的原因，尽快恢复服务。

为了让投票节点可以占用更少的资源，可以在配置文件中添加以下几个配置项：

journal = false
smallfiles = true
noprealloc = true

登录后复制

主从复制

master-slave 复制架构已经不推荐使用了，建议使用 replica sets 复制集架构。
参见：http://docs.mongoing.com/manual-zh/core/ma...

以上是讲讲关于 MongoDB 复制集的几个问题的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7533

CakePHP 教程

1379

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

navicat过期怎么办 Apr 23, 2024 pm 12:12 PM

解决 Navicat 过期问题的方法包括：续订许可证；卸载并重新安装；禁用自动更新；使用 Navicat Premium Essentials 免费版；联系 Navicat 客户支持。

navicat怎么连mongodb Apr 24, 2024 am 11:27 AM

要使用 Navicat 连接 MongoDB，您需要：安装 Navicat创建 MongoDB 连接：a. 输入连接名称、主机地址和端口b. 输入认证信息（如果需要）添加 SSL 证书（如果需要）验证连接保存连接

net4.0有什么用 May 10, 2024 am 01:09 AM

.NET 4.0 用于创建各种应用程序，它为应用程序开发人员提供了丰富的功能，包括：面向对象编程、灵活性、强大的架构、云计算集成、性能优化、广泛的库、安全性、可扩展性、数据访问和移动开发支持。

无服务器架构中Java函数与数据库的集成 Apr 28, 2024 am 08:57 AM

在无服务器架构中，Java函数可以与数据库集成，以访问和操作数据库中的数据。关键步骤包括：创建Java函数、配置环境变量、部署函数和测试函数。通过遵循这些步骤，开发人员可以构建复杂的应用程序，无缝访问存储在数据库中的数据。

如何在Debian上配置MongoDB自动扩容 Apr 02, 2025 am 07:36 AM

本文介绍如何在Debian系统上配置MongoDB实现自动扩容，主要步骤包括MongoDB副本集的设置和磁盘空间监控。一、MongoDB安装首先，确保已在Debian系统上安装MongoDB。使用以下命令安装：sudoaptupdatesudoaptinstall-ymongodb-org二、配置MongoDB副本集MongoDB副本集确保高可用性和数据冗余，是实现自动扩容的基础。启动MongoDB服务:sudosystemctlstartmongodsudosys

MongoDB在Debian上的高可用性如何保障 Apr 02, 2025 am 07:21 AM

本文介绍如何在Debian系统上构建高可用性的MongoDB数据库。我们将探讨多种方法，确保数据安全和服务持续运行。关键策略：副本集(ReplicaSet)：利用副本集实现数据冗余和自动故障转移。当主节点出现故障时，副本集会自动选举新的主节点，保证服务的持续可用性。数据备份与恢复：定期使用mongodump命令进行数据库备份，并制定有效的恢复策略，以应对数据丢失风险。监控与报警：部署监控工具（如Prometheus、Grafana）实时监控MongoDB的运行状态，并