java - 如何设计大型分布式系统报表？

Question

真是无语了，第二次提交又被拒绝了，理由是“该内容属于技术讨论，建议就该问题，简单地谈一谈你的想法思路，以便更好地和他人做一个技术交流“，要是第一次的是因为排版的原因我也认了，想发个问答贴怎么就这么难...

过去多啦不再A梦 · Answer

你说的需求基本算是建设数据仓库，基本的思路是：

1、数据仓库和业务系统的数据库独立，数据仓库的建模一般要分层设计，不是简单的建成大表。
普遍会分为缓冲层、基础层、聚合层、报表层等，每层的侧重点不太一样，基础层还是以范式模型为主，聚合层就要普遍要做数据冗余，报表层一般是列很多的宽表设计。

2、数据同步，在数据量大的情况下必须有增量机制，如果没有需应用系统改造。

3、同步方法有几种思路：

a. 用dblink打通数据库，人工写存储过程。
b. 用informatic powercenter 或kettle类似的ETL工具
c. 专用的数据库层同步软件，如oracle的ogg等