大规模运行MongoDB应该知道的10件事_MySQL-mysql教程-PHP中文網

首頁

資料庫

mysql教程

大规模运行MongoDB应该知道的10件事_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 pm 01:18 PM

mongodb

MongoDB

MongoDB的首席解决方案架构师Asya Kamsky 最近发表了一篇文章，概括了大规模运行MongoDB需要知道的10件事。

MongoDB也需要DevOps。MongoDB是一个数据库。和任何其他的数据存储一样，它也需要容量计划、调整、监控和维护。不要因为它很容易安装、入门，同时与关系型数据库相比能够更加自然地满足开发人员的范例就认为MongoDB不需要适当的照顾和喂养。开发时它能在小样本数据集上超快地运行并不意味着你就不需要良好的模式、索引策略以及产品环境所需要的正确的硬件资源了。但是如果你准备的很好，并且理解最佳实践，那么运营大型MongoDB集群就会变得很无聊，而不是令人非常头痛。
成功的MongoDB用户会监控所有的事情，同时会做好增长的准备。在任何数据库系统中跟踪当前的容量以及容量计划都是基本的实践，MongoDB也是如此。你需要知道集群现在能够支撑多少工作，最高使用率时它会处理哪些需求。如果你没有注意到服务器上增长的负载，那么最终会遇到没有足够容量的错误。监控MongoDB可以使用MongoDB管理服务（MMS），通过查看操作计数器（opscounters）图表可视化自己的操作：
你可能并不希望系统随着使用量的增长出现性能扩展障碍。根据大量用户的部署经验，性能瓶颈通常是（按顺序）：
- 应用程序访问模式没有使用最优的模式设计
- 索引不佳或者缺失索引，抑或有太多不必要的索引
- 磁盘较慢/磁盘IOPS不足
- 索引没有足够的RAM
事实证明，在真正的大型部署实践中对性能影响最大的是模式设计与应用程序需求的契合程度。而缺少索引、索引错误或者索引太多则是影响性能的第二大因素。在模式设计非常完美，索引也最优的情况下，磁盘IO吞吐能力就成了下一个限制因素，尤其是写吞吐量。RAM不足会引发很多页错误，同时也会增加磁盘IO的压力。
很多成功的MongoDB用户使用单复制集。太早分片可能是过早优化，并不是每个MongoDB部署都需要分片。分片处理非常特殊的需求，不能不加思索地认为它就是解决“数据库很慢”的最佳方案。如果你的协调模式非常差劲或者有错误索引，那么分片并不能解决问题，相反的你最终会得到一些差劲的协调和差劲的执行碎片。当单台机器或者复制集上的某种特殊资源成为瓶颈，同时基于成本的考虑无法添加更多这种资源的时候才适合分片。你可能需要更多的磁盘IO吞吐量，或者更多的内存，或者更多的存储，再或者更多的并发，这种情况下分片才是有意义的。
即使没有将整个数据库放在内存中，MongoDB依然能够取得非常好的性能。对于MongoDB常见的一个误解是：为了获得更好的性能需要将整个数据库放在内存中。这可能是最错误的一件事情，因为这依赖于集群正在处理的负载的类型。有一些标志和指标能够告诉你：相对于你放到数据库上的负载类型你所拥有的内存数量是否充足。正如你所看到的，随着数据库大小的增长，能够放到内存中的相关部分将会受限于可用物理内存的大小。如果内存的数量不能满足性能需求，那么你将会看到页面错误，随着页面错误率的上升，opcounters最终会低于期望值。
必须将数据写刷新到磁盘。如果磁盘利用率达到了100%，那么处理更多写操作的速度比起现在得不到丝毫的提升。可以通过MMS中的“Background flush average”图表查看将数据文件中的脏页刷新到磁盘花费了多长时间。通过这种趋势你会发现，随着写操作的增长，刷新将花费更多的时间。这种问题可以通过使用更快的磁盘解决，将工作拆分到更多的分片上，或者调整应用程序使之减少写数据的总量。你应该记住：写入的所有内容都会被刷新到磁盘两次——立即刷新到日志同时周期性地刷新到数据文件。将这两种操作分离到不同的物理设备上将会消除它们对可用磁盘IO带宽的竞争。
复制 != 备份。所有人都清楚备份的重要性。但是为什么备份这么重要呢？想必是因为当某些影响所有复制集节点的灾难性事件发生的时候我们可以恢复数据。复制并不是备份的原因是：它并不能让你避免人为错误——例如某些人突然删除了产品数据，或者部署了错误版本的应用程序代码以致于搞乱了部分或者所有数据。必须要有一个能够让我们从这种场景中恢复数据的备份。通过文件系统快照、mongodump或者MMS备份练习数据恢复。第一次从备份恢复产品数据的操作不应该发生在真正的“数据紧急事件”发生的时候。
复制集的健康不仅仅是复制延迟。“复制延迟”仅仅是复制集健康状况的指标之一。关注复制操作日志（oplog）窗口和监控复制延迟一样重要。它表示的是基于现在的写流量完全“滚动”oplog所要花费的时间。换句话说，它指的是将一个复制节点拿下来以后依然能够重新加入集合而不必对所有数据进行重新同步的时间。随着时间的推移，复制操作日志窗口将会随着写负载的变化而浮动。流量高峰时窗口会缩短。这在容量计划中是非常重要的，你需要为最繁忙的数据吸收时间做好准备。下面是MMS中的一个并行视图，它展示了整个复制集的复制操作日志窗口。
MongoDB并不清楚数据需要什么样的安全级别。和其他数据库一样，你应该遵循最小特权原则。必须自己配置数据库的安全。不要让所有人都能访问你的数据。打开MongoDB自己本身的安全机制是非常重要的，但是这样也锁定了从任何地方对集群的访问，除非你确实认为自己的客户端进程可以在那里运行。只修改MongoDB进程的默认端口并不能保证安全。
没必要修改引擎里面的东西。除非文档或者MongoDB支持告诉你做一些非常特殊的事情，否则你没有必要直接修改系统集合、本地、管理或者配置数据库。你可以借助于管理命令和shell执行所需的操作，如果数据库并不能按照期望运行，或者某些地方发生了错误，那么成功的钥匙并不是试图通过直接操作内部的“bits”强制它运行。你需要熟悉的唯一一个“特殊的”、由系统产生的集合是分析器集合，定期地分析你的查询是确保事情按照期望运行的一个非常好的方式。

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1664

CakePHP 教程

1423

Laravel 教程

1317

PHP教程

1268

C# 教程

1246

Related knowledge

使用 Composer 解決推薦系統的困境：andres-montanez/recommendations-bundle 的實踐 Apr 18, 2025 am 11:48 AM

在開發一個電商網站時，我遇到了一個棘手的問題：如何為用戶提供個性化的商品推薦。最初，我嘗試了一些簡單的推薦算法，但效果並不理想，用戶的滿意度也因此受到影響。為了提升推薦系統的精度和效率，我決定採用更專業的解決方案。最終，我通過Composer安裝了andres-montanez/recommendations-bundle，這不僅解決了我的問題，還大大提升了推薦系統的性能。可以通過一下地址學習composer：學習地址

如何在Debian上配置MongoDB自動擴容 Apr 02, 2025 am 07:36 AM

本文介紹如何在Debian系統上配置MongoDB實現自動擴容，主要步驟包括MongoDB副本集的設置和磁盤空間監控。一、MongoDB安裝首先，確保已在Debian系統上安裝MongoDB。使用以下命令安裝：sudoaptupdatesudoaptinstall-ymongodb-org二、配置MongoDB副本集MongoDB副本集確保高可用性和數據冗餘，是實現自動擴容的基礎。啟動MongoDB服務:sudosystemctlstartmongodsudosys

MongoDB在Debian上的高可用性如何保障 Apr 02, 2025 am 07:21 AM

本文介紹如何在Debian系統上構建高可用性的MongoDB數據庫。我們將探討多種方法，確保數據安全和服務持續運行。關鍵策略：副本集(ReplicaSet)：利用副本集實現數據冗餘和自動故障轉移。當主節點出現故障時，副本集會自動選舉新的主節點，保證服務的持續可用性。數據備份與恢復：定期使用mongodump命令進行數據庫備份，並製定有效的恢復策略，以應對數據丟失風險。監控與報警：部署監控工具（如Prometheus、Grafana）實時監控MongoDB的運行狀態，並

Navicat查看MongoDB數據庫密碼的方法 Apr 08, 2025 pm 09:39 PM

直接通過 Navicat 查看 MongoDB 密碼是不可能的，因為它以哈希值形式存儲。取回丟失密碼的方法：1. 重置密碼；2. 檢查配置文件（可能包含哈希值）；3. 檢查代碼（可能硬編碼密碼）。

CentOS MongoDB備份策略是什麼 Apr 14, 2025 pm 04:51 PM

CentOS系統下MongoDB高效備份策略詳解本文將詳細介紹在CentOS系統上實施MongoDB備份的多種策略，以確保數據安全和業務連續性。我們將涵蓋手動備份、定時備份、自動化腳本備份以及Docker容器環境下的備份方法，並提供備份文件管理的最佳實踐。手動備份:利用mongodump命令進行手動全量備份，例如：mongodump-hlocalhost:27017-u用戶名-p密碼-d數據庫名稱-o/備份目錄此命令會將指定數據庫的數據及元數據導出到指定的備份目錄。

CentOS上GitLab的數據庫如何選擇 Apr 14, 2025 pm 04:48 PM

CentOS系統上GitLab數據庫部署指南選擇合適的數據庫是成功部署GitLab的關鍵步驟。 GitLab兼容多種數據庫，包括MySQL、PostgreSQL和MongoDB。本文將詳細介紹如何選擇並配置這些數據庫。數據庫選擇建議MySQL:一款廣泛應用的關係型數據庫管理系統(RDBMS)，性能穩定，適用於大多數GitLab部署場景。 PostgreSQL:功能強大的開源RDBMS，支持複雜查詢和高級特性，適合處理大型數據集。 MongoDB:流行的NoSQL數據庫，擅長處理海

Debian MongoDB如何進行數據加密 Apr 12, 2025 pm 08:03 PM

在Debian系統上為MongoDB數據庫加密，需要遵循以下步驟：第一步：安裝MongoDB首先，確保您的Debian系統已安裝MongoDB。如果沒有，請參考MongoDB官方文檔進行安裝：https://docs.mongodb.com/manual/tutorial/install-mongodb-on-debian/第二步：生成加密密鑰文件創建一個包含加密密鑰的文件，並設置正確的權限：ddif=/dev/urandomof=/etc/mongodb-keyfilebs=512

mongodb怎麼設置用戶 Apr 12, 2025 am 08:51 AM

要設置 MongoDB 用戶，請按照以下步驟操作：1. 連接到服務器並創建管理員用戶。 2. 創建要授予用戶訪問權限的數據庫。 3. 使用 createUser 命令創建用戶並指定其角色和數據庫訪問權限。 4. 使用 getUsers 命令檢查創建的用戶。 5. 可選地設置其他權限或授予用戶對特定集合的權限。

See all articles

大规模运行MongoDB应该知道的10件事_MySQL

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題