导读 | 大家好,北京早上很堵,这个点可能有些嘉宾还在路上,我先抛砖引玉。我这次分享的主题是《敏捷运维趋势与管理实践》。说到运维,大数据时代的运维面临“业务、规模、团队”三大难题多种压力,这让我们一谈到企业IT系统的运维,往往总是想到被动救火、背锅不断。我们的运维工作到底怎么做才能将风险扼杀在故障发生之前?如何能够摆脱繁琐、低效、高风险的传统人肉运维方式?如何能够更直观的在公司呈现我们的价值和存在感?这些难题,在AIOps被广泛提及的当下变得尤为迫切。 |
新炬网络董事、副总经理程永新
那么,作为运维人员,我们应该如何主动寻求变革呢?这里我分享一个思路,就是“企业级敏捷运维三板斧”,也就是可视化呈现价值、自动化解放效率、智能化驱动能力。
1. 可视化呈现价值在软件市场,国内和国外有很大的区别,国外的软件可视化做得其实没有国内好,真心话。为什么?因为国外所有的这些软件叫工具软件,这些工具软件是给干活的人用的,所以国外的这些工具软件不管是开源的还是商业的,其实做得没有那么好。但是国内不一样,国内企业的领导更希望看到的是:你说我出问题了,好,我要看哪里出问题了,纯技术层面你可能会发现,解释半天也解释不清楚,所以这时候,可视化就变得更为重要了,一方面是我们操作人员自己本身工作是需要的,另一方面关键是在客户端,在领导那里怎么样呈现这个价值,我们的工作怎么能被看到,这很重要。
在可视化层面,我们的做法是通过纵向打通应用层、平台层和设备层,横向接入全网IT设备,采集全网数据,并在此基础上结合具体的算法去做展现的。
比如新炬网络通过自研的打分形式具象呈现所有设备的健康度,便于用户第一时间发现、下钻和解决问题;通过自研的APM 应用自动埋点,实现交易过程的透视,并对相关数据进行分析和存储,实现调用过程分解及性能问题的快速定位等。真正实现了随时随地、全网透明的可视化,支持APP、Web工作界面和大屏展示等多屏呈现工作内容与价值。
2. 自动化解放效率自动化解放效率这个不用说了,对于我们运维来说,如果我们能多出一些时间看书、学习、研究,我们自己的技术能够有点提高,这个对我们来说是最好的事情,而不是说一天到晚都在做重复性的劳动。
其实自动化我们一直在做,我相信所有做过的人都会知道这中间有很多很多的坑,这些坑我们怎么样踩过去的呢?自动化的主要目的,一是提升效率,二是安全可控,三是降低人员依赖。要做到这三点则必须明白:一切没有固化到平台的标准化过程都是无用功;一切没有场景驱动的运维平台建设都是假大空。
对此,我们的做法是:
第一步,落地八大自动化运维场景,包括自动化运维操作及自动化资源开通及部署等,覆盖90%以上的运维工作场景。因为从运维的角度切入,要想让运维变得更加敏捷就应该是场景化的驱动,我的业务场景到底是什么?这个业务场景是不是真实的,是不是真的对生产运维有帮助的,还是说只是个人的偏好,还是临时出了一个故障,领导压力比较大,还是怎么一回事,所以一定要理清楚。
第二步,通过集中式自动化运维管理,实现运维操作的安全、高效,并形成知识资产,确保知识的有效传递。
第三步,自动化运维能力支持API开放:将自动化运维能力封装API,供各系统、各终端调用,如在手机端、系统拓扑上可直接进行运维操作。
第四步,构建自动化运维PaaS平台:支持场景的自定义开发,驱动运维团队能力转型。要把标准化工作固化到平台里,没有放到平台的标准化都是无用功,没有场景驱动的运维就是假大空。你想想传统应用的功能做了多少不是场景应用的功能,有多少企业写了一堆的标准:操作标准、运维标准、安全规范……要满足一堆的标准,最后,这些标准在操作平台上有限制吗,在操作平台上管用吗,如果操作标准压根儿跟你的平台不对应,那就是一个摆设。
智能化首先要做的就是日志分析,当设备类型越来越多的时候,日志分析则变得越来越重要。从这个层面出发,我们也是通过自研的IVORY大数据日志分析平台,采用大数据底层框架和拖拽式的独家专利切割算法,实时聚合海量日志,准确搜索统计日志,智能分析日志内容,只需简单操作就能实现大数据的分析和挖掘工作。
此外,做任何运维产品如果没有运维经验其实只是做一个框架,想要真正实现智能化,光有工具是不够的,还需要结合实际运维场景,优化数据价值,以智能化驱动运维能力,最终实现从发现、决策分析到问题解决的问题闭环解决手段。
个是我们整体的敏捷运维全站的解决方案框架,以“可视化、自动化、智能化”为敏捷运维全栈解决方案的核心:通过“运维可视化”实现随时随地、全网透明的运维价值呈现;通过“运维自动化”全面提升运维服务效率和质量;通过“运维智能化”实现以智能化驱动运维能力。在这个过程中,我们通过运维分层构建,实现不同层级解决不同层次的问题。这就是我今天的分享,谢谢大家!
以上是企业级运维的三个必备技巧的详细内容。更多信息请关注PHP中文网其他相关文章!