php - 求解统计系统设计的一些技术方案和实现

Question

从数据源到数据呈现说说目前的情况吧， 数据源： 1、mysql 2、日志文件 呈现： 1、csv文件导出或者发送邮件 2、提供接口数据给web呈现图标 当前涉及的一些技术点： 从日志文件读取数据主要是 shell ＋ awk ，从 m...

天蓬老师 · Answer

0、方案取决于你的目标和团队实力。自建方案的复杂度和你的期望成正比，和数据量成正比。
1、你可以研究一下Splunk或者Logstash + ES + Kibana这两个方案，相信会有惊喜。
2、如果还想更深入，可以了解一下SIEM。
3、Dirty And Quick是一种选择；Flexable是另一种选择。

黄舟 · Answer

源数据整理好格式，定好Schema，用Hive统计，用Oozie定时跑作业，结果放在约定好的地方，用Web呈现。
基本上都是这么个套路。

ringa_lee · Answer

只能采纳一个答案.
其实这是一个讨论性的话题，希望有更多的人参与吧。