アクティブ/アクティブの理由 - ビジネス要件WebSphere で必要な 2 つのノード QREPオブジェクトQPREPARE アクションの MQOBJECTSQ CONTROL TABLES -PARMTABLESQ マップの作成Q サブスクリプションの作成Q HOUSE-KEEPINT WORK ACTIONCHANLE ACTION:MQ QUEUE ACTIONQAPPLYレイテンシ分析LATENCY OUTLOOKCAPTURE LATENCY ANALYSISQ apply latencyQREP RECOVERY
現在、IDC は非常に人気があり、同じ都市/オフサイトでのデュアルアクティブ、さらにはマルチアクティブの概念がますます人気が高まっています。 2012 年に、私は mysql での MASTER/SLAVE の実装に関する記事「mysql レプリケーション --- 1 台の PC でのマスター/スレーブ」を書きました。 DBMS が異なれば、Hyperactive の具体的な実装は異なりますが、それらはすべて同じ理論、つまり SQL REPLICATION または LOG REPLICATION に基づいています。ここでは、IBM における A/A の実装について説明します。Q のアーキテクチャと実装を紹介する特別な章が設けられています。ここでは、Q を知覚的に理解するための実践的な記事を紹介します。この記事の最後にある Q レイテンシーの部分については、RPO/RTO にとっての重要性は自明のことであるため、すべてのシステム運用および保守担当者はこれを習得する必要があります。
ビジネス継続性のためのレプリケーションテクノロジー
テクノロジーを選択する際に考慮すべき要件とトレードオフ:
What needs to be recovered?: Application Data vs. DBMS vs. Entire SystemsHow long does it take? Recovery Time Objective (RTO): One hours or more vs. few secondsHow much data could you lose? Recovery Point Objective (RPO): No data loss vs. seconds of dataDistance required between sites?: 10s of kilometers vs. 100s of kilometersHardware Utilization: Standby vs. ActiveImpact on applications: Direct overhead (synchronous technologies) vs. no impact (async technologies)CPU Overhead: Negligible (hardware e.g., PPRC) vs. Proportional to the workload (transaction replaytechnology)
オブジェクト定義の説明
オブジェクト名 | NODE1 | NODE2 |
---|---|---|
ホスト名 | SITEA | SITEB |
IP | 10 .1.1.1 | 10.2.1.1 |
DB2バージョン | 10 | 11 |
サブシステム | DB1 | DB2 |
LOCATION | DB0A | DB0B |
データベースポート | 8000 | 9000 |
データベース | DB1 | DB2 |
Q MGR | QMGR1 | QMGR2 |
MQ PROT | 8001 | 9001 |
RESTARTQ | MQ1.RESTARTQ | MQ2.RESTARTQ |
ADMINQ | MQ1.ADMINQ | MQ2.ADMINQ |
SENDQ | MQ1.SENDQ.Q1 | MQ2.SENDQ.Q1 |
SENDQ | MQ1.SENDQ.Q2 | MQ2.SENDQ. Q2 |
SENDQ | MQ1.SENDQ.Q3 | MQ2.SENDQ.Q3 |
REP スキーマ | ASN1 | ASN2 |
BIND REPLICATION PROGRAM
APF AUTHORIZE Q-RELATED PROGRAM
ENABLE Q TABEL DATA CAPTURES
ALTER TABLE QTABLE DATA CAPTURE CHANGES;
CONFIG CDB TABLE
远程DB2连接使用DRDA协议,在使用之前需要配置对应的CDB信息。CDB 主要是Qapply用来连接Qcapture的属性配置,第一条SQLP配置了本端的连接信息,后面3条SQL配置了,对端的连接信息。
NODE1:
INSERT INTO SYSIBM.LOCATIONS(LOCATION, LINKNAME, PORT) VALUES ('DB0A', 'DB0A', '');INSERT INTO SYSIBM.IPNAMES(LINKNAME, SECURITY_OUT, USERNAMES, IPADDR) VALUES ('DB0B', 'P', 'O', 'demo.TEST.com');INSERT INTO SYSIBM.USERNAMES(TYPE, LINKNAME, NEWAUTHID, PASSWORD) VALUES ('O', 'DB0B', 'TESTUSER', 'NOTTELLYOU');INSERT INTO SYSIBM.LOCATIONS(LOCATION, LINKNAME, PORT) VALUES ('DB0B', 'DB0B', '9000');
NODE2:
INSERT INTO SYSIBM.LOCATIONS(LOCATION, LINKNAME, PORT) VALUES ('DB0B', 'DB0B', '');INSERT INTO SYSIBM.IPNAMES(LINKNAME, SECURITY_OUT, USERNAMES, IPADDR) VALUES ('DB0A', 'P', 'O', 'DEMO.TEST.com');INSERT INTO SYSIBM.USERNAMES(TYPE, LINKNAME, NEWAUTHID, PASSWORD) VALUES ('O', 'DB0A', 'BRIDDEL', 'XXXXXXXX');INSERT INTO SYSIBM.LOCATIONS(LOCATION, LINKNAME, PORT) VALUES ('DB0A', 'DB0A', '8000');
定义MQ传输使用的各种对象。
<pre style="box-sizing:border-box;font-size:inherit;line-height:1.5rem;font-family:inherit;padding:0px 4px;border-radius:0px;border-width:0px;margin-top:0px;margin-bottom:0px;white-space:pre-wrap;color:inherit;z-index:2;position:static;overflow:visible;word-break:normal;width:inherit;background:transparent;">
DEFINE QLOCAL(MQ1.ADMINQ) DESC('ADMINQ OF MQ2 IN SITEA') PUT(ENABLED) GET(enabled) SHARE DEFSOPT(SHARED) MAXDEPTH(1000) DEFPSIST(YES)
DEFINE QLOCAL(MQ1.RESTARQ) DESC('RESTARTQ OF MQ2 IN SITEA') PUT(ENABLE) GET(ENABLE) SHARE DEFSOPT(SHARED) MAXDEPTH(1) INDEXTYPE(MSGID) DEFPSIS(YES)
DEFINE QLOCAL(MQ1.SENDFQ.Q1) REPLACE DESC('LOCAL SEND Q FOR FX Q') PUT(ENABLED) GET(ENABLED) SHARE DEFSOPT(SHARED) DEFPSIS(YES) MAXDEPTH(99999) INDEXTYPE(MSGID)
DEFINE QMODEL('IBMQREP.SPILL,QMODELQ') REPLACE DEFSOPT(SHARED) MAXDEPTH(99999999) MSGDLVSQ(FIFO) DEFTYPE(PERMDYN)
DEFINE CHANNEL('MQ1.TO.MQ2') REPLACE CHLTYPE(SDR) TRPTYPE(TCP) DISCINT(0) DESC('SENDER CHANNEL TO MQ2') XMITQ(XMQ1) CONNAME('10.2.1.1(9001)')
DEFPSIST
YES means that unless instructed otherwise, the Queue Manager logs transactions to these queues and can recover those messages in the event of failure or restart.
All control tables that are located on a node have to have the same schema.both the Q Capture and Q Apply on NODE 1 will use the replication schema ASN1 AND CONTROL TABLE ON NODE USE ASN2.
这里配置Q脚本是通过 ASNCLP配置的。它既支持交互方式,也支持批量方式。
举例说明
SET QMANAGER "MQ1A" FOR NODE 1;SET QMANAGER "MQ1B" FOR NODE 2;CREATE CONTROL TABLES FOR NODE 1 USINGCAPPARMSRESTARTQ "MQ1.RESTARTQ"ADMINQ "MQ1.ADMINQ"MONITOR INTERVAL 10000APPPARMSIN ZOS PAGE LOCK DB DEMODB QCNTLAP CREATEROW LOCK DB DEMODB2 QCNTLAR CREATEMONITOR INTERVAL 10000;CREATE CONTROL TABLES FOR NODE 2 USINGCAPPARMSRESTARTQ "MQ2.RESTARTQ"ADMINQ "MQ2.ADMINQ"MONITOR INTERVAL 10000APPPARMSIN ZOS PAGE LOCK DB RBBDEMO QCNTLAP CREATEROW LOCK DB RBBDEMO QCNTLAR CREATEMONITOR INTERVAL 10000;
Two Q Maps were used for the first part of this exercise. Even though a single Q
Map can efficiently contain hundreds of Q Subscriptions, you might want to
separate your subscriptions into multiple Q Maps for administrative purposes.
这里即确定了表的订阅关系。
CREATE REPLQMAP BIDIND1_TO_BIDIND2_MAP1 ( NODE 1, NODE 2 ) USINGADMINQ "BIDIND1.ADMINQ"RECVQ "BIDIND1.TO.BIDIND2.DATAQ1"SENDQ "BIDIND1.TO.BIDIND2.DATAQ1"NUM APPLY AGENTS 2;CREATE REPLQMAP BIDIND1_TO_BIDIND2_MAP2 ( NODE 1, NODE 2 ) USINGADMINQ "BIDIND1.ADMINQ"RECVQ "BIDIND1.TO.BIDIND2.DATAQ2"SENDQ "BIDIND1.TO.BIDIND2.DATAQ2"NUM APPLY AGENTS 2;
定义一张表属于哪一个Qmap,以及是否进行Q复制。
## Use MAP1 for TABLE1 and TABLE2#SET CONNECTION SOURCE DB1A.ASNB1 TARGET DB1C.ASNB2REPLQMAP BIDIND1_TO_BIDIND2_MAP1 ;SET TABLES (DB1.ASN1.TABLE1);CREATE QSUB SUBTYPE UFROM NODE DB1A.ASNB1 SOURCE HAS LOAD PHASE NTARGET CONFLICT ACTION IFROM NODE DB1C.ASNB2 SOURCE HAS LOAD PHASE NTARGET CONFLICT ACTION F;
START CHANNEL(MQ1A.TO.MQ1B)
DISPLAY CHSTATUS(MQ1BA.TO.MQ1B)
START CHANNEL(MQ1B.TO.MQ1A)
DISPLAY CHSTATUS(MQ1B.TO.MQ1A)
+MQ2 CLEAR QLOCA(MQ2.SENDQ.Q1)DISPLAY QLOCAL(MQ2.SENDQ.Q1) CURDEPTH
关于Q latency它与我们搭建Q的目标息息相关,特别是对IDC RPT/ROT 两个指标的影响巨大。因此分析Q lantency变成了DBA一项必须掌握的技能。要想进行latency分析,你必须明确latency是如何定义的,现有的工具以及如何进行调整。
Control tables for replication monitoring
? IBMQREP_CAPMON
? IBMQREP_CAPQMON
? IBMQREP_APPLYMON
上の図の各番号に対応するアクションは次のとおりです:
t1 = ソース・サイトでコミットされたトランザクション
t2 = Q キャプチャー・プログラムがログからトランザクションを読み取ります
t3 = Q キャプチャー・プログラムがメッセージを送信キューにコミットしました
t4 = Q アプライ・プログラムが受信キューからメッセージを読み取りました
t5 = Q アプライがターゲット・サイトでトランザクションを正常にコミットしました
対応する Q END-TO -END latency=T5-T1
は、ターゲット側とソース側のトランザクションのコミット間の時間間隔です。 Q レイテンシーに影響を与える要因は 10 個あり、具体的な分布は次のとおりです。
青色の背景の影響要因は、Q 構成と SQL ステートメントにより密接に関連していることに注意してください。 MQ と DBMS が適切に機能していれば、白い背景部分の影響は比較的制御可能です。
上記の 10 個の影響要因の定義、対応するモニター情報、およびチューニング方法を以下に示します。
seq | レイテンシに影響を与える要因 | 関連する統計 |
---|---|---|
1 | Q キャプチャログレイテンシ | IBMQREP_CAPMON:CURRENT_LOG_TIME |
2 | Q DB2 ログ レコードの読み取り時間のキャプチャ (DB2 IFI 呼び出し) ) | IBMQREP_CAPMON:LOGREAD_API_TIME |
3 | Q メモリー待機中のキャプチャ時間 | IBMQREP_CAPMON:LOGRDR_SLEEPTIME,NUM_END_OF_LOGS |
4 | Q 挿入するキャプチャ時間送信キュー内の WebSphere MQ メッセージと送信までの Q キャプチャ時間すべての WebSphere MQ トランザクションをコミットします | IBMQREP_CAPQMON: MQPUT_TIME、QFULL_ERROR_COUNT IBMQREP_CAPMON:MQCMIT_TIME |
5 | WebSphere MQ の WebSphere MQ メッセージの送信およびステージング時間 | モニターテーブルには保存されません |
6 | Q 受信キューから WebSphere MQ メッセージを取得する時間を適用します | IBMQREP_APPLYMON:MQGET_TIME |
7 | Q トランザクションの依存関係による待機時間を適用します | IBMQREP_APPLYMON:DEPENDENCY_DELAY |
8 | Qエージェントが適用の準備ができた DBMS トランザクションを取得するのを待って適用します | IBMQREP_APPLYMON:WORKQ_WAIT_TIME |
9 | Q RI、固有違反、またはデッドロックによる SQL の再試行時間 | IBMQREP_APPLYMON:RETRY_TIME |
10 | 成功したトランザクションを処理する DB2 の Q 適用時間 | IBMQREP_APPLYMON:DBMS_TIME |
LOGREAD_API_TIME:IBMQREP_CAPMON The time spent in DB2 returning log records to Q CaptureNUM_END_OF_LOGS:IBMQREP_CAPMON table, lists the number of times that the Q Capture program reached the end of the DB2 logLOGRDR_SLEEPTIME:IBMQREP_CAPMON LOGREADER SLEEP TIME FOR NUM_END_OF+_LOGS OR it reached its memory limit thresholdMQPUT_TIME:IBMQREP_CAPMONThe time delay spent in WebSphere MQ to put new messages in the send queue MQCMIT_TIME: IBMQREP_CAPMON The time delay spent in WebSphere MQ to commit the MQ transactions XMITQDEPTH : IBMQREP_CAPQMON The transmit queue depth valu If the transmit queue depth keeps growing and there is a lot of I/O to the physical pageset of the transmit queue, this means that the capacity of the MQ channel has been exceeded
TRAN_BATCH_SZIE
平均每一个交易的大小 = MQ_BYTES/TRANS_PUBLISHED
平均每一个消息所包含的交易数目=MQ_MESSAGES /TRANS_PUBLISHED,该值应该近似等于TRAN_BATCH_SIZE
WORKQ_WAIT_TIME:IBMQREP_APPLYMON table tracks how long it takes transactions that are ready to be applied at the target site to be picked up by a Q Apply agentRETRY_TIME :IBMQREP_APPLYMON Q Apply is retrying some of the SQL statements included inthe replicated transactions,SUCH RI,UI,TIMEOUT,DEADLOCKThe DBMS_TIME :IBMQREP_APPLYMON tracks the average time spent in DB2 applying the transactions for a given Q Apply monitor interval. The transactions include user tables (replicated tables) and Q Replication tables (control table data that tracks the Q Apply progress)
STARTLRSN: lsn value from where it is safe to start reading the DB2 log
commit lsn: lsn value up to which it is safe to skip committed transactions as Q Capture is reading the log records, because the transactions were previously published.
本文所有的内容均整理自互联网,仅供参考学习,如有涉及版权问题,请自行删除本文,谢谢。