分布式缓存能否作为NoSQL数据库?
对于文档、对象图、键值对这样的非关系型数据类型,NoSQL数据库为它们提供了另一种可选的数据存储方式。分布式缓存能被用作NoSQL数据库吗?Ehcache的Greg Luck
对于文档、对象图、键值对这样的非关系型数据类型,NoSQL数据库为它们提供了另一种可选的数据存储方式。分布式缓存能被用作NoSQL数据库吗?Ehcache的Greg Luck撰文描述了分布式缓存与NoSQL数据库的相似性。InfoQ就此采访了他,讨论了该方案的利弊之处。
InfoQ:你能否就分布式缓存解决方案与NoSQL数据库做个对比?
Greg Luck:分布式缓存通常会把数据放在内存里,用于降低延时。NoSQL数据库是没有R的DBMS(即没有关系的数据库管理系统),一般也缺乏对事务和其他高级特性的支持。对于不支持关系的系统,表关系的关联是SQL里最麻烦的部分,这也正是NoSQL这个名字的起源。
其中一种NoSQL数据库是键值存储。典型的例子包括Dynamo、Oracle NoSQL Database和Redis。缓存也是键值存储,因此说这两者是相关的。很多缓存实现能被配置为可持久化的,之所以很多时候不那么做,是因为缓存是要提升性能而不是做持久化。而NoSQL数据库则与此相反,它是用来做持久化的。
持久化缓存也可当作键值NoSQL数据库来使用。NoSQL也提到了Big Data,通常是指比能放进一个单独的RDBMS节点的量要大的数据,一般从几TB到几PB。
分布式缓存通常用于降低事务性数据的延时,这些数据开始时并不大,但慢慢就会往Big Data这个方向发展。由于缓存将数据保存在内存里,这提高了存储的成本,而且需要限制数据的大小。如果依赖于堆存储,每个服务器节点可能只有可怜的2GB。如果依赖于分布式缓存,Ehcache还提供了堆外存储,每台服务器可以存储几百GB数据,可以用作TB级别的缓存。
持久化、分布式的缓存可以适用于一些NoSQL的场景。NoSQL数据库也可以应对一些缓存的场景,只是延时稍高而已。
InfoQ:从架构角度来看,分布式缓存和NoSQL数据库有什么相似之处吗?
Greg:它们都想提供优于RDBMS的TPS和可扩展性。为此,它们都在功能上做了简化,抛开了那些麻烦的问题,比如表关联、存储过程和ACID事务。
虽然Java缓存领域里有JSR 107,它为Spring和Java EE程序员提供了一套标准的缓存API,但是比起标准化接口,它们都更倾向于使用私有接口。
它们都采用对客户端透明的方式对数据进行分区,做向外扩展。非Java产品向上扩展做得也很好。拥有Terracotta BigMemory,我们在Java平台上的向上扩展方面也做得很特别。最后,两者都可以部署在常见的硬件和操作系统上,这让它们都能理想地运行于云端。
InfoQ:架构上这两项技术又有何不同呢?
Greg:NoSQL和RDBMS通常使用的是磁盘。磁盘是机械设备,延时很厉害,因为寻道时间是磁头移动到正确的磁道的时间,读写时间依赖于磁盘的RPM。NoSQL尝试优化磁盘的使用,例如,仅仅在磁头当前位置追加日志,偶尔才刷新到磁盘上。相反,缓存主要都把数据放内存里。
NoSQL和RDBMS的客户端很薄(想想Thrift或JDBC),只是在网络中传输数据,而像Ehcache这样的缓存使用进程内存储和远程存储,因此常用请求在本地就能被成功处理。在分布式缓存上下文中,每个应用程序服务器的进程内存储中都会缓存热点数据,增加服务器数量并不会增加网络或后端的负载。
RDBMS专注于成为通用的SOR(System of Record)。NoSQ希望成为某类特定数据类型的SOR,比如键值对、文档、稀疏表(宽表)或图。缓存着眼于性能,一般会与RDBMS或NoSQL数据库结合使用,数据类型就是SOR。往往缓存中会存储Web服务调用的结果,业务对象的计算结果,这个结果可能需要成百SOR调用才能得到。
像Ehcache这样的缓存部分运行在应用程序的操作系统进程里,部分运行在网络那头自己机器的进程里。但也不是全部分布式缓存都这样:memcache就是一个例子,所有的数据都跨网络存储。
InfoQ:哪类应用程序最适合这种方式?
Greg:这还得从先前的问题说起,要将分布式缓存用于你现有的应用程序,通常只需要很小的工作量,而NoSQL则需要做很多事,还有大的架构变更。
因此适用分布式缓存的第一类应用程序是现有系统,特别是有以下需要的:
由于使用量或负载激增而需要向外扩展
为达到SLA而需要有更低的延时
为了将大型机这样的昂贵基础设施的使用减到最低
减少Web服务调用而带来的费用
应对极端负载高峰(比如黑色星期五一样的促销)
InfoQ:这种方式有什么局限么?
Greg:缓存,置于内存之中,在大小上有制约,它们的技术局限受限于有多少内存给它们使用(下面还会具体展开说明)。
缓存,就算它提供持久化功能,也未必算的上作为SOR的上选。缓存故意回避了备份到磁盘和从中还原的复杂功能,尽管也有简单的。RDMBS在过去30年里开发了丰富的备份、还原、迁移、报表和ETL特性。而NoSQL则介于两者之间。
缓存提供了改变数据与访问数据的编程API。NoSQL和RDBMS则提供了工具,可以执行脚本化语言(比如SQL、UnSQL和Thrift)。
但关键一点是要记住缓存并不想成为你的SOR。它能轻松地与你的RDBMS和睦相处,为此它并不需要RDBMS所有用的复杂功能。
InfoQ:以后分布式缓存解决方案、NoSQL数据库和传统RDBMS互相协同工作,你有何看法?
Greg:速度大幅快于RDBMS,依赖于部署拓扑的NoSQL,还有数据访问模式,分布式缓存可以位于这三者之间的任意位置。那些需要更低延时的人可以将缓存作为NoSQL的一个补充,就像现在对待RDBMS那样。
稍有不同的是,在你想将RDBMS扩展到多个节点时,经常会难于扩展,或者影响编程契约,或者受制于CAP做出权衡;而使用NoSQL,就算只使用一个节点,你也可以简单地将其视为多节点安装。如果是向上扩展就没有这些问题。在RDBMS中,添加缓存是为了避免向外扩展会遇到的麻烦。通常缓存能解决系统的容量问题,你不用费太多力气。因此当需要向外扩展时,加入缓存吧。
对于NoSQL而言,内建了向外扩展的能力,在需要低延时的时候使用缓存吧。
查看英文原文:Distributed Cache as a NoSQL Data Store?
译者 丁雪丰 是InfoQ中文站编辑,满江红翻译组核心成员,出版过《Spring攻略》、《JRuby实战》等多部译著。主要关注领域:企业级应用、海量数据计算、动态语言应用等。

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

五大熱門Go語言庫總結:開發必備利器,需要具體程式碼範例Go語言自從誕生以來,受到了廣泛的關注和應用。作為一門新興的高效、簡潔的程式語言,Go的快速發展離不開豐富的開源程式庫的支援。本文將介紹五大熱門的Go語言庫,這些庫在Go開發中扮演了至關重要的角色,為開發者提供了強大的功能和便利的開發體驗。同時,為了更好地理解這些庫的用途和功能,我們會結合具體的程式碼範例進行講

Pillow庫是Python中一個非常強大的影像處理庫,它是基於PythonImagingLibrary(PIL)發展而來,並在其基礎上進行了最佳化和擴展。 Pillow庫提供了豐富的影像處理功能,可以處理各種類型的影像文件,並進行影像的編輯、合併、濾鏡處理等操作。本文將為大家提供一個Pillow庫的安裝指南,幫助你輕鬆掌握這個強大的影像處理工具。一、安裝P

如今全球各產業內 Python 的使用狀況呢?這個問題就是我寫這篇文章的初衷。我找出了22個最常用的 Python 包,希望能給你一些啟發。首先我列出了最近一年內 PyPI 上下載量最高的 Python 套件。讓我們來看看這些包的作用,它們的之間的關係,以及為什麼會如此流行。 1、Urllib38.93億次下載Urllib3 是 Python 的 HTTP 用戶端,它提供了許多 Python 標準函式庫沒有的功能。線程安全 連線池 用戶端 SSL/TLS 驗證 使用 multipart 編碼進行

PHP8.0中的國際化庫:UnicodeCLDR和Intl擴展隨著全球化的進程,開發跨語言、跨地域的應用程式變得越來越普遍。國際化是實現這一目標的重要組成部分。在PHP8.0中,引入了UnicodeCLDR和Intl擴展,這兩個組件都為開發者提供了更好的國際化支援。 UnicodeCLDRUnicodeCLDR(CommonLocaleDat

簡介XML(可擴展標記語言)是一種用於儲存和傳輸資料的流行格式。在Java中解析XML是許多應用程式的必要任務,從資料交換到文件處理。為了有效地解析XML,開發人員可以使用各種Java函式庫。本文將比較一些最受歡迎的XML解析函式庫,重點放在它們的特性、功能和效能,以幫助開發人員做出明智的選擇。 DOM(文件物件模型)解析函式庫JavaXMLDOMAPI:由oracle提供的標準DOM實作。它提供了一個物件模型,允許開發人員存取和操作XML文件。 DocumentBuilderFactoryfactory=D

uniapp實現如何使用圖片裁剪和壓縮庫實現圖片處理功能在開發行動應用程式時,經常會涉及圖片處理的需求,如圖片裁剪和壓縮。針對這些需求,uniapp提供了豐富的插件和元件,讓開發者可以輕鬆實現圖片處理功能。本文將介紹如何使用uniapp中的圖片裁剪和壓縮庫實現圖片處理功能,並提供對應的程式碼範例。圖片裁剪圖片裁剪是指根據需要,將圖片的一部分區域剪下來。

在現代C++開發中,利用工具和函式庫進行最佳化至關重要。 Valgrind、Perf和LLDB等工具可識別瓶頸、測量效能並進行除錯。 Eigen、Boost和OpenCV等函式庫可提升線性代數、網路I/O和電腦視覺等領域的效率。例如,使用Eigen可優化矩陣乘法,Perf可分析程式效能,Boost::Asio可實現高效能網路I/O。

PyCharm添加程式庫的方法與技巧大揭秘PyCharm是一款功能強大的Python整合開發環境,為Python開發者提供了豐富的功能與工具。在使用PyCharm進行開發的過程中,新增庫是一個常見的需求。本文將詳細介紹PyCharm新增庫的方法和技巧,包括透過PyCharm自備的功能和使用pip工具安裝程式庫。一、透過PyCharm自
