目录
问题预览
采访实录
扩展阅读
首页 运维 安全 途游邹轶:中小公司的运维怎么做?

途游邹轶:中小公司的运维怎么做?

Jun 09, 2023 pm 01:56 PM
运维 途游

途游邹轶:中小公司的运维怎么做?

通过采访和约稿的方式,请运维领域老炮输出深刻洞见,共同碰撞,以期形成一些先进的共识,推动行业更好得前进。

这一期我们邀请到的是邹轶,途游游戏运维总监,邹总经常戏称自己是世界500万强企业的运维代表,可见内心中是觉得中小公司的运维建设思路和大型企业是有差别的,今天我们带着几个问题,来请邹总分享一下他的中小公司研运一体化之路。

这里是接地气、有高度的《​​​运维百家讲坛​​》第 6 期,开讲!

问题预览

  • 途游是游戏公司,您觉得游戏运维有哪些独特性?面临的最大运维挑战是什么?您又是如何解决这些挑战的?
  • 游戏运维的人才技能是什么样子的,如果想在游戏运维方向发展,您对职业路径规划上有没有什么建议?
  • 中型公司的运维团队通常不会很大,您是如何对这有限的人力排兵布阵的,有没有什么心得可以分享给大家?
  • 您是否会遇到因为团队人才水平不行,导致自己的想法落地慢,落地难的问题,您是如何解决的?
  • 您说您特别认同《运维的未来是平台工程》文章中的观点,您的团队也是一个产研式的全功能组织,想请您介绍一下:对于业务研发,相比直接使用云厂商提供的平台产品,您这个团队带来的Delta增益是什么?
  • 您经常说成本节省要硬桥硬马,节省了大量成本,公司给发个奖状,说明这个FinOps的项目大概率是在自嗨,在云上、云下Infra建设上,您的团队为公司带来了巨额成本节省,而且得到了公司的物质奖励,能否分享一下相关的心得?
  • 运维团队一直是站在公司业务的后面,离业务的距离相对远,对如何更好的支持业务,或如何说明运维对业务的价值这个点,您有什么建议?

采访实录

问:途游是游戏公司,您觉得游戏运维有哪些独特性?面临的最大运维挑战是什么?您又是如何解决这些挑战的?

整体游戏运维架构相对传统互联网业务来比较,相对简单,但是单机可靠性要求比较高,运维日常工作,相对事务性的工作较多,比如开服合服等等。 面临最大的运维挑战,其实不是技术层面的,更多的是价值认可度层面的,怎么让我们业务部门认可我们的价值,这个挑战我相信也是整个运维赛道同仁们一致的挑战。要去赢得业务部门的认可,提升运维团队的价值,从我以及我团队的实践来总结,其实就是一句话:扎扎实实的做好服务,以业务部门/用户为中心

问:游戏运维的人才技能是什么样子的,如果想在游戏运维方向发展,您对职业路径规划上有没有什么建议?

游戏运维的人才技能和传统互联网行业没有太大的区别,对于运维这个赛道来说,认知比较低和缺乏体系的成长环境,是我们中小厂运维面临的比较现实的问题,我们常年和机器底层打交道,很少去认真思考过,未来10年,15年后的发展,更多的是追逐热点,追逐变化,很少去思考沉淀那些不变的内容,以及怎么去利用这些内容来做时间的朋友形成自己的竞争力。我个人建议中小厂的运维同学,还是要在理论方法论学习和技能提升两手抓,用理论指导实践,通过实践完善自己对理论的理解。学习理论和方法这块,我也提几点建议:

  1. 持有开放的心态去学习,ITIL,SRE,lean,scrum,平台工程,可观测等等,不要纠结于门派之见,只要对自己有价值的内容,都可以去学习去吸收融合,比如ITIL抓住变更管理、故障管理、问题管理、持续服务改进,这几个流程去学习并应用于实践,其实就能解决好大部分运维问题。又比如对SRE的理念的学习,抓住SLO的理念,开展可靠性建设,引导业务部门与运维团队建立一个可靠性目标共担的协作模式。而在实践的SLO落地的过程中,又可以引入可观测性理念和方法,来加强自己对可观测性能力的建设。
  2. 面向国外科技公司学习为主,面向国内大厂学习为辅,国外科技公司的理论和工程方法相对严谨和体系,不太受场景限制,可以学以致用,国内的大厂更多偏向于特殊场景的实践,理论和工程方法抽象不够,基本上都是万亿并发,千亿流量的场景,其实和中小厂的运维没啥关系,中小厂去深度对标学习,价值杠杆率不高

问:中型公司的运维团队通常不会很大,您是如何对这有限的人力排兵布阵的,有没有什么心得可以分享给大家?

有限的资源,往往容易激发创新,团队规模可以不大,但是要保持精干、敏捷,换句话说就是你团队要足够能打,而且应对不确定性能力要强,要想达到这个效果,我个人总结了我们这5年的组织能力建设实践:

  1. 人才结构要做深度优化,要引入专业产研人才,用产研驱动团队价值输出。目前途游的运维安全团队,产研和传统运维比例接近1:1。
  2. 研运一体化的组织模式去构建,要形成一支全职能,端到端的混合型团队。目前的途游的运维安全团队,有产品经理、研发负责人,前,后端工程师,服务运营工程师,运维工程师,IT工程师。
  3. 围绕互信、目标一致、信息共享、去中心化去构建敏捷的文化氛围。通过敏捷的文化氛围,来形成一支能应对不确定性的敏捷组织。

关于敏捷组织的实践,可以看我的分享:https://tuyoo.feishu.cn/docs/doccnFlAD2m7WnSpcLYxFJRImZb

问:您是否会遇到因为团队人才水平不行,导致自己的想法落地慢,落地难的问题,您是如何解决的?

这个肯定会遇到,我们解决思路:

  1. 保持耐心,对团队持续迭代,这个就和打牌一样,你不能期望上手一手好牌,这个都得不断的进出的换牌,最后把牌理顺去赢得比赛。
  2. 对新人的标准是潜力要高于团队现有70%的人员,不符合标准宁可不招聘,招人谨慎,对人的培养才会用心。
  3. 团队负责人自己一定是团队首席HR,要主动出击去找人才,我最近4年在BOSS直聘上大概聊过接近两万人吧,看过的简历应该超过2万多份,这个可能很难有中小公司的运维负责人会做到这点。
  4. 利用敏捷组织作为基础支持,发挥集体智慧。

关于我团队转型实践分享:https://tuyoo.feishu.cn/docx/doxcnGMuijglK6NdENYC2vD7KKh

问:您说您特别认同《运维的未来是平台工程》文章中的观点,您的团队也是一个产研式的全功能组织,想请您介绍一下:对于业务研发,相比直接使用云厂商提供的平台产品,您这个团队带来的Delta增益是什么?

在回答这个问题之前,我还是想阐述下我们对造轮子和外采服务的认知:

我们其实对外采还是自研,蛮开放的心态,也是蛮简单的判断,就是看ROI的投入产出比,标准化的,投入巨大的,自己搞不定的肯定是尽量用外部三方的服务或者产品来帮助我们解决问题,我们更关注的是如何服务好我们的业务部门,关注我们提供的服务结果和质量,不太关注这个能力是我们自己具备的还是三方的服务能力,只要能帮助我们提升服务质量和效率的,我们都非常开放的心态去吸收和融合。

再来回答这个产研团队对我们的增益问题,每个公司都有它本身一些特性或者定制化场景需求,这些东西外来产品肯定不能完全覆盖到位,所以这样的一支端到端的团队,其实是让整个团队有了解决一些非标问题的能力。这种能力其实非常关键,很大程度决定了团队的价值实现。

另外再来说说我们对运维的未来是平台工程的理解,我对平台工程的理解有两点关键要素:

  1. 平台工程面向的对象是以业务部门为主,而不是运维为主
  2. 平台工程提供的是自服务,平台工程输出的产品和工具一定是业务部门自服务为主

我们团队转型探索,就是主要按照这两个要素来做的实践,但是理论水平不够,没有清晰的去提出平台工程的理念。我们游戏运维有一个蛮大的痛点就是琐事很多,比如CDN的上传发布,游戏的配置更新,例行起停服,都是游戏运维日常的事务,不可或缺,但是都是事务性的,价值很低,可能在我们游戏运维的常识里面,我们会想到做一些自动化的工具,去提升运维的人效,把运维从人肉或者写脚本的状态,变成WEBOPS状态,这个感觉杠杆率还是太低,并没有把运维释放出来,所以在解决这些问题过程中,诞生了我对平台工程理念的原始理解,目前我们游戏运维的日常事务性工作有50%都是项目组自服务,通过我们提供的工具,这在我们接触平台工程的理念后,发现是高度认知一致的。所以对运维的未来是平台工程,我相信只要尝过自服务的甜头,吃过人肉运维的苦的同学,应该都会有很深的认同感。

问:您经常说成本节省要硬桥硬马,节省了大量成本,公司给发个奖状,说明这个FinOps的项目大概率是在自嗨,在云上、云下Infra建设上,您的团队为公司带来了巨额成本节省,而且得到了公司的物质奖励,能否分享一下相关的心得?

对于FINOPS这件事,平时也和行业一些专家老师做过一些交流碰撞,结合我们团队自己的实践,我个人感觉FINOPS实践落地难,难在改变老板的认知,目前行业还是偏技术实现或者理念碰撞阶段,还停留在比谁更专业,更规范的阶段,个人感觉不能影响到老板认知的FINOPS,基本都是无价值,或者价值极低,做和不做没啥区别。对于FINOPS这个领域不过多评价,我们缩小到成本优化这件事来讲,在我们团队我没有设定过成本优化的OKR,我们一直用精益的理念在指导开展工作,精益有一个核心的理念,一切不产生价值的都是浪费,持续消除浪费, 这样在工作开展过程中,其实就不用搞运动式的成本优化。很多省了几个亿的成本优化,可能在老板眼里就是应该的,以前浪费太大了,现在只是消除浪费,这自然就不会得到价值认可。

成本优化实践过程中我个人总结了几点:

  1. 要用精益的理念去持续指导成本优化,而不是简单的运动式降本增效。
  2. 要拉齐价值共识,要和相关部门比如总办,财务等监管部门达成共识。
  3. 成本优化的计算模型不能太复杂,模型计算太复杂,很难去达成共识。
  4. 数据要统一按照财务口径进行核对,不能我们从技术角度想当然。

编者按:邹总做成本优化,具体节省多少钱是经过财务最终测算的,个人觉得很值得借鉴,很多公司的成本优化,都是自己测算的,缺乏公信力,老板较难有体感。

问:这是老问题了,运维团队一直是站在公司业务的后面,离业务的距离相对远,对如何更好的支持业务,或如何说明运维对业务的价值这个点,您有什么建议?

具体怎么去体现价值,我建议运维团队要想体现价值,首先是要有服务意识,然后是要对服务体系进行建设,再就是保持耐心和持续改善,通过这个去形成一个正循环,从而把时间做朋友。

在这块我简单分享下我们团队的服务体系建设指导纲要。我们以客户为中心,构建安全、可靠、高效、低成本、可持续的服务。通过服务运营输出价值,通过产品和工具落地服务运营,并持续改善。在这个指导纲要中,我们将团队里的运维、产研和运营三个职能角色进行了深度融合。通过服务运营的输出来把价值进行体现。很多时候,做技术的人往往不太容易意识到服务运营的重要性,我们常常听到人们谈论技术运营和产品运营,但很少有人谈论服务运营。这与我们做技术出身的惯性认知有很大关系,更多的是站在自己专业领域去表达,很少去站在我们服务对象的角度去看我们的价值。很多人提到服务可能就会简单联想到端茶倒水、跑腿这种角色,比较排斥提服务。但实际上,每个团队都是服务型团队。比如我们服务项目组,项目组服务我们最终的用户,我们的最终用户可能是在他的工作领域服务其他客户。因此,提供服务是一件非常重要的事情。只有服务好了客户,帮助他们获得结果,才能真正体现自己的价值。

扩展阅读

  • ​​运维百家讲坛第5期:度小满陈存利:20年老“司令”聊运维、绩效、成长​​
  • ​​运维百家讲坛第4期:又拍云邵海杨:25年Linux老兵聊DevOps八荣八耻​​
  • ​运维百家讲坛第3期:Flashcat来炜:如何把运维的饭碗端稳​
  • ​​运维百家讲坛第2期:作业帮聂安:运维如何转型,听听作业帮的OPaS思路​​
  • ​​运维百家讲坛第1期:井源:运维几何​​

以上是途游邹轶:中小公司的运维怎么做?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

Spring Boot Actuator端点大揭秘:轻松监控你的应用程序 Spring Boot Actuator端点大揭秘:轻松监控你的应用程序 Jun 09, 2023 pm 10:56 PM

一、SpringBootActuator端点简介1.1什么是Actuator端点SpringBootActuator是一个用于监控和管理SpringBoot应用程序的子项目。它提供了一系列内置的端点(Endpoints),这些端点可以用于查看应用程序的状态、运行情况和运行指标。Actuator端点可以以HTTP、JMX或其他形式暴露给外部系统,便于运维人员对应用程序进行监控、诊断和管理。1.2端点的作用和功能Actuator端点主要用于实现以下功能:提供应用程序的健康检查,包括数据库连接、缓存、

运维工作十多年,无数个瞬间、我觉得自己还是个小白... 运维工作十多年,无数个瞬间、我觉得自己还是个小白... Jun 09, 2023 pm 09:53 PM

​曾几何时,当我还是一名初出茅庐的计算机专业应届生的时候,在招聘网站上浏览了很多招聘贴,眼花缭乱的技术岗位让我摸不着头脑:研发工程师、运维工程师、测试工程师...‍大学期间专业课马马虎虎,更谈不上有什么技术视野,对于具体从事那个技术方向并没有什么明确的想法。直到一位学长对我说:“做运维吧,做运维不用天天写代码,会玩Liunx就行!比做开发轻松多了!”‍‍‍‍‍‍‍‍我选择了相信......入行十多年,吃过很多苦,背了很多锅,弄死过服务器,经历过部门裁员,如果有人现在跟我说做运维比开发简单,那我会

PG数据库运维工具要覆盖哪些能力 PG数据库运维工具要覆盖哪些能力 Jun 08, 2023 pm 06:56 PM

​过节前我和PG中国社区合作搞了一个关于如何使用D-SMART来运维PG数据库的线上直播,正好我的一个金融行业的客户听了我的介绍,打电话过来聊了聊。他们正在做数据库信创的选型,也试用了多个国产数据库,最后他们准备选择TDSQL。当时我觉得有点意外,他们从2020年就开始在做国产数据库选型,不过好像最初使用TDSQL后的感受并不太好。后来经过沟通才了解到,他们刚开始使用TDSQL的分布式数据库,发现对研发要求太高,所以后来就全部选择TDSQL的集中式MYSQL实例,用下来发现挺好用的。整个数据库云

Spring Cloud微服务架构部署与运维 Spring Cloud微服务架构部署与运维 Jun 23, 2023 am 08:19 AM

随着互联网的快速发展,企业级应用的复杂度日益增加。针对这种情况,微服务架构应运而生。它以模块化、独立部署、可扩展性高等特点,成为当今企业级应用开发的首选。作为一种优秀的微服务架构,SpringCloud在实际应用中展现出了极大的优势。本文将介绍SpringCloud微服务架构的部署与运维。一、部署SpringCloud微服务架构SpringCloud

途游邹轶:中小公司的运维怎么做? 途游邹轶:中小公司的运维怎么做? Jun 09, 2023 pm 01:56 PM

通过采访和约稿的方式,请运维领域老炮输出深刻洞见,共同碰撞,以期形成一些先进的共识,推动行业更好得前进。这一期我们邀请到的是邹轶,途游游戏运维总监,邹总经常戏称自己是世界500万强企业的运维代表,可见内心中是觉得中小公司的运维建设思路和大型企业是有差别的,今天我们带着几个问题,来请邹总分享一下他的中小公司研运一体化之路。这里是接地气、有高度的《​​​运维百家讲坛​​》第6期,开讲!问题预览途游是游戏公司,您觉得游戏运维有哪些独特性?面临的最大运维挑战是什么?您又是如何解决这些挑战的?游戏运维的人

什么是可观测性?初学者需要知道的一切 什么是可观测性?初学者需要知道的一切 Jun 08, 2023 pm 02:42 PM

可观测性一词来源于工程领域,近年来在软件开发领域也日益流行。简而言之,可观测性是指根据外部输出以了解系统内部状态的能力。IBM对可观测性的定义为:通常,可观测性是指基于对复杂系统外部输出的了解就能够了解其内部状态或状况的程度。系统越可观测,定位性能问题根本原因的过程就能越快速且准确,而无需进行额外的测试或编码。在云计算中,可观测性还指对分布式应用系统及支撑其运行的基础设施的数据进行聚合、关联和分析的软件工具和实践,以便对应用系统进行更有效地监控、故障排除和调试,从而实现客户体验优化、服务水平协议

运维要不要学golang吗 运维要不要学golang吗 Jul 17, 2023 pm 01:27 PM

运维不要学golang,其原因是:1、golang主要被用于开发高性能和并发性能要求较高的应用程序;2、运维工程师通常使用的工具和脚本语言已经能够满足大部分的管理和维护需求;3、学习golang需要一定的编程基础和经验;4、运维工程师的主要目标是确保系统的稳定和高可用性,而不是开发应用程序。

度小满陈存利:20年老“司令”聊运维、绩效、成长 度小满陈存利:20年老“司令”聊运维、绩效、成长 Jun 09, 2023 am 09:56 AM

通过采访和约稿的方式,请运维领域老炮输出深刻洞见,共同碰撞,以期形成一些先进的共识,推动行业更好得前进。这一期我们邀请到的是陈存利,度小满系统运维部总经理,20多年的职业生涯中绝大部分时间在互联网领域。在百度运维部期间由于带队风格过硬,兄弟团队称其为”陈司令”。今天我们请“陈司令”来聊聊他的观点。这里是接地气、有高度的《​​​运维百家讲坛​​》第5期,开讲!问题预览您很早加入了百度,后来随度小满独立,我们了解到您身边有许多员工其实是很长时间一直跟随着您,经历了很多业务的运维考验,相信大家都很感兴

See all articles