首页 数据库 mysql教程 DB2一个基于Cache Table的数据复制方案

DB2一个基于Cache Table的数据复制方案

Jun 07, 2016 pm 05:54 PM
db2 数据复制 方案

IBM 数据库复制产品 Infosphere Replication Server 中的多向 SQL 复制既能捕获源表也能捕获目标表的数据变化,因此能很好地保持数据在各方的一致。

但数据冲突的现象仍是无法完全杜绝。因此我们需要尽可能地改进方案,以期接近完美效果。本文在这样的背景下,介绍了 IBM 相关产品 Infosphere Replication Server 和 Infosphere Federation Server 通过合作提出的一个基于 Cache Table 的数据复制方案。

计算机、网络、传感技术等各项信息技术的发展,使得我们生活的环境变成了今天这个由数据统治的世界,每天都有大量纷繁复杂的数据、信息充斥耳边。据称现在只需两天就能创造出自文明诞生以来到 2003 年所产生的数据总量。而企业数据也以 55% 的速率逐年增长。这些大量的交易数据、交互数据中并不是 100% 都是有意义的,但我们又不得不去接收它们。这是因为数据当中隐含着有价值的信息,并且这些信息都是有时效的,需要及时进行整合、分析、再创造,然后才能更好地与用户交互,实现在合适的时间、通过合适的途径、销售合适的产品,最终实现企业利润增长。数据复制产品正是这一数据处理过程中最关键的一环,它能够将接收到的数据分发到各个场所,用于及时整合数据,产生实时报表,或者为实时统计提供输入。

数据集中 / 分发经典场景

对于集团型企业,例如银行、电信、保险等,通常包含多个子系统,每个系统对应一项或多项业务,而业务终端也往往部署在各个省市地区。某个地区的某个子系统里数据在一定时间内只能代表该地区的业务特征。因此,业务的广泛性和区域性使得企业不能对内部的数据进行全盘规划和统一,这大大影响了企业对业务的分析决策。具体影响有:

  1. 关键数据不唯一,集团无法判断数据的准确性,需要花费更多的人工和资源验证并纠正数据,因此不能对分公司或子公司的数据进行及时分析,从而进行全盘分析和规划;
  2. 分公司或子公司间数据无交互或交互较少,各自为政,数据无共享,造成各分公司或子公司间不能有效借鉴或沿用有价值或有代表性的决策和方案,集团范围内数据管理困难,数据丢失的风险性较高。

没有统一的关键数据管理会造成集团范围内不能实时监控并及时分配关键资源,不能及时获取各地数据掌握全局趋势,也往往会造成决策失误。这些问题严重的话会造成企业无法弥补的损失。因此企业通常会建立数据中心、部署一套数据集中 / 分发方案以保证各地各项业务数据的统一。典型场景如图 1 所示,在集团所在地或附近建立中心,在各分公司或子公司部署分级。中心服务器与分级服务器间通过网络实时通信,分发或集中数据。各分级服务期间根据需要也可进行通信。

图 1. 数据集中 / 分发场景
图 1. 数据集中 / 分发场景

数据集中 / 分发对数据冲突和负载均衡的要求

数据的集中和分发根据实际情况要求和设计考虑的角度的不同,具体实现起来方案有很多。有些由中心服务器承担主要业务输入,有些反之,有些根据具体情况不同,对不同的业务指定不同的主承受服务器。但究其本质是如何保证事务的原子性和数据在各个副本中的一致性。这方面从技术发展历程来看,早期主要通过两阶段提交协议实现原子性,通过两阶段锁或时间戳模型实现副本的一致性。这种模式即为通常所说的同步复制过程,涉及到各副本与提交事务的节点间的互相确认过程,因此具有一定的性能影响。后来为提高吞吐率,缩短响应时间,对一致性级别进行了放松,出现了异步复制,面对不同的目的,出现了不同的异步复制协议。目前企业中使用的复制产品大多为异步复制。这种方案不能像同步复制那样实现完全实时复制,必然会出现一定的延时,虽然这种延时通过各种技术手段可以控制在秒级,甚至更小,但对于在每个副本都能操作数据的系统中,还是有可能出现数据冲突。

数据冲突简单地说,是因为某一行数据在不同地点被不同的应用同时进行了修改。这种修改具体表现有插入、更新、删除。举例来说,有表(列 1,列 2,列 3),其中列 1 是表的主键,该表同时部署在两地的 Server A 和 Server B 中。最普遍的冲突情况是,A 和 B 同时有应用对该表插入了具有相关关键字的数据,该事务在本地服务器上能执行成功,但当数据变化传递到对方时,会发现以这个关键字值标记的行已存在,冲突发生;另一种普遍的冲突是,A 和 B 同时修改了相同关键字行的非关键字列,这样当变化传递到对方时,冲突发生。无论具体冲突是什么情况,在异步复制中都无法完全避免,因此在设计方案时必须要有在发生数据冲突时,一些有效的冲突解决方案,这样才能最终保证数据的一致。

由于业务的多样性,由单个服务器承受所有的业务具有很高的风险性,当出现断电等意外,或者更大的自然灾害时,损失是无法挽回的。因此设计数据集中 / 分发方案时需要考虑如何实现负载均衡。从全局来看,需要合理分配各项业务的连接;从具体业务来看,需要合理均衡读连接和写连接,特别对于具有大用户量的业务,用户对系统响应一般都具有较高的期望,用户量也往往跟系统响应时间负相关,而受限于服务器以及数据库系统的处理能力,单个表是很难满足大量同时的读写连接的。

多向 SQL 复制实现数据集中 / 分发

IBM InfoSphere Replication Server 产品中的 SQL 复制框架最早可以追溯到 1994 年 IBM DB2 发布的 DataPropagator Relational(DPropR)的第一个版本。因此,相较于 2004 年推出的 Q 复制框架,SQL 复制功能的客户基础较深厚,事实证明它在实现数据集中 / 分发方面具有较好的优势和稳定性。本节将带领读者简单回顾一下多向 SQL 复制的实现。

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

仓库:如何复兴队友
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

迈向可验证的 AI:形式化方法的五大挑战 迈向可验证的 AI:形式化方法的五大挑战 Apr 09, 2023 pm 02:01 PM

人工智能试图模仿人类智能的计算系统,包括人类一些与智能具有直观联系的功能,例如学习、解决问题以及理性地思考和行动。在广义地解释上,AI 一词涵盖了许多密切相关的领域如机器学习。那些大量使用 AI 的系统在医疗保健、交通运输、金融、社交网络、电子商务和教育等领域都产生了重大的社会影响。这种日益增长的社会影响,也带来了一系列风险和担忧,包括人工智能软件中的错误、网络攻击和人工智能系统安全等方面。因此,AI 系统的验证问题以及更广泛的可信 AI 的话题已经开始引起研究界的关注。“可验证 AI”已经被确

db2和oracle语法有什么区别 db2和oracle语法有什么区别 Jul 05, 2023 am 10:39 AM

db2和oracle语法区别:1、SQL语法差异,虽然db2和oracle都使用结构化查询语言,但它们在语法方面存在一些差异;2、db2和oracle拥有不同的数据类型;3、外键约束定义,db2可以定义在创建表时或者使用“ALTER TABLE”语句后添加,oracle需要在创建表时一起定义;4、db2和oracle存储过程和函数的语法也存在一些区别。

如何在Java中实现分布式系统的数据复制和数据同步 如何在Java中实现分布式系统的数据复制和数据同步 Oct 09, 2023 pm 06:37 PM

如何在Java中实现分布式系统的数据复制和数据同步随着分布式系统的兴起,数据复制和数据同步成为保障数据一致性和可靠性的重要手段。在Java中,我们可以利用一些常见的框架和技术来实现分布式系统的数据复制和数据同步。本文将详细介绍如何利用Java实现分布式系统中的数据复制和数据同步,并给出具体的代码示例。一、数据复制数据复制是将数据从一个节点复制到另一个节点的过

PHP高并发处理中的线程池优化方案 PHP高并发处理中的线程池优化方案 Aug 11, 2023 am 10:45 AM

PHP高并发处理中的线程池优化方案随着互联网的快速发展和用户需求的不断增长,高并发成为了现代Web应用开发中的一个重要问题。在PHP中,由于其单线程的特性,处理高并发请求是一项挑战。为了解决这个问题,引入线程池的概念是一个有效的优化方案。线程池是一种可重复利用的线程集合,用于执行大量的并发任务。它的基本思想是将线程的创建、销毁和管理分离出来,通过复用线程来减

如何使用PHP数据库连接实现数据的同步和复制 如何使用PHP数据库连接实现数据的同步和复制 Sep 08, 2023 pm 02:54 PM

如何使用PHP数据库连接实现数据的同步和复制在许多Web应用程序中,数据的同步和复制是非常重要的。例如,当您有多个数据库服务器时,您可能需要确保这些服务器上的数据保持同步,以便用户在访问应用程序时始终获取最新的数据。幸运的是,使用PHP数据库连接,您可以轻松地实现数据的同步和复制。本文将介绍使用PHP数据库连接实现数据同步和复制的步骤,并提供相应的代码示例供

MySQL中如何实现数据的异步复制和延迟复制? MySQL中如何实现数据的异步复制和延迟复制? Jul 31, 2023 pm 12:58 PM

MySQL是一种常用的关系型数据库管理系统,在实际应用中,我们经常会遇到需要进行数据复制的场景。数据的复制可以分为同步复制和异步复制两种形式。同步复制是指在主数据库写入数据后必须立即将数据复制到从数据库,而异步复制则是主数据库写入数据后可以延迟一定时间再进行复制。本文将重点介绍MySQL中如何实现数据的异步复制和延迟复制。首先,为了实现异步复制和延迟复制,我

深入剖析MongoDB的数据复制与故障恢复机制 深入剖析MongoDB的数据复制与故障恢复机制 Nov 04, 2023 pm 04:07 PM

深入剖析MongoDB的数据复制与故障恢复机制引言:随着大数据时代的到来,数据的存储和管理变得愈发重要。在数据库领域,MongoDB作为一种广泛应用的NoSQL数据库,其数据复制和故障恢复机制对于保障数据的可靠性和高可用性至关重要。本文将深入剖析MongoDB的数据复制与故障恢复机制,以便读者对该数据库有更深入的了解。一、MongoDB的数据复制机制数据复制

0门槛克隆方案再升级,开源模型完整复现,在线体验无需注册 0门槛克隆方案再升级,开源模型完整复现,在线体验无需注册 Apr 14, 2023 pm 10:58 PM

以ChatGPT、GPT4为代表的AI应用和大模型火爆全球,被视为开启了新的科技工业革命和AGI(通用人工智能)的新起点。不仅科技巨头间你追我赶,争相推出新品,许多学术界、工业界的AI大佬也纷纷投入投身相关创业浪潮。生成式AI正以“天”为单位,快速迭代,持续狂飙!然而,OpenAI并未将其开源,它们背后的技术细节有哪些?如何快速跟进、追赶并参与到此轮技术浪潮中?如何降低AI大模型构建和应用的高昂成本?如何保护核心数据与知识产权不会因使用第三方大模型API外泄?作为当下最受

See all articles