目录
介绍一下您自己以及现在的公司?" >介绍一下您自己以及现在的公司?
有些运维老炮反映公司对运维的价值所知甚少,您是怎么给公司讲清楚运维的价值的?" >有些运维老炮反映公司对运维的价值所知甚少,您是怎么给公司讲清楚运维的价值的?
您觉得运维工作最重要的几个目标是什么?您是怎么落地这些目标的?运维的价值如何更好的得到体现?" >您觉得运维工作最重要的几个目标是什么?您是怎么落地这些目标的?运维的价值如何更好的得到体现?
ChatGPT这样的AI能力您觉得未来是否有可能解决运维行业的问题?" >ChatGPT这样的AI能力您觉得未来是否有可能解决运维行业的问题?
工具选型这块,到底是自研,还是使用开源,还是使用商业产品,是如何抉择的?" >工具选型这块,到底是自研,还是使用开源,还是使用商业产品,是如何抉择的?
业内有观点认为云计算和Kubernetes这样的基础设施的崛起会让运维岗位逐渐消亡,您是怎么看待这样的观点呢?" >业内有观点认为云计算和Kubernetes这样的基础设施的崛起会让运维岗位逐渐消亡,您是怎么看待这样的观点呢?
可选的监控工具有很多,用户选择贵司的 Flashcat 平台,理由是什么?" >可选的监控工具有很多,用户选择贵司的 Flashcat 平台,理由是什么?
首页 运维 安全 Flashcat来炜:如何把运维的饭碗端稳

Flashcat来炜:如何把运维的饭碗端稳

Jun 08, 2023 pm 06:42 PM
运维 快猫

Flashcat来炜:如何把运维的饭碗端稳

讲坛第1期《​​井源 - 运维几何​​​》和前段时间马驰的《​​是时候让运维集体下岗了​​》在业界引起广泛讨论,运维岗位真的没有前途了吗?如何把饭碗端稳?这一期,我们采访了快猫星云的来炜,来炜是运维破圈创业人士,既然能创业,一定是在行业内有很深的积累的,他会怎么看待这个问题?让我们一起来听一种新的声音!

这里是接地气、有高度的《​​运维百家讲坛​​》第 3 期,开讲!

介绍一下您自己以及现在的公司?

大家好,我是快猫星云的来炜。快猫星云是一家云原生智能运维科技公司,由开源监控工具“夜莺监控”的核心开发团队组成。快猫星云打造的云原生监控分析平台——“Flashcat平台”,旨在解决云原生架构、混合云架构下统一监控难、故障定位慢的问题。

如果想更多了解快猫星云创立背后的故事,大家可以进一步阅读 ITPub 对我的一个专访​​《十年死磕,从一线工程师到CEO》​​,欢迎大家指正。

有些运维老炮反映公司对运维的价值所知甚少,您是怎么给公司讲清楚运维的价值的?

把工作的价值,如何通俗易懂的给公司管理层讲清楚,并取得理解和支持,是所有中后台技术团队普遍面临的难题,否则失业分分钟的事情,运维工作的价值讲清楚更是难上加难。

从我的朋友圈来看,时不时就会看到劝运维下岗/转行的帖子:

  • 比如瑞典马工的​​《是时候让运维集体下岗了》​​​,振聋发聩,开篇就提到:​​明人不说暗话:在云原生和DevOps成熟的今天,运维作为一个岗位和团队已经完成了历史任务,应该退出舞台了。​
  • 再比如带我入行的井老板,在 SRETalk 第一期中,用心良苦的劝导:​​随着科技的发展,时代的变化,一个岗位的消亡是很正常的事情,及时做好调整和规划才是思考的重心。​

但是,运维这个岗位以及背后的运维人,从来都是一次次站在要被淘汰的边缘徘徊,又一次次倔强的起死回生,柳暗花明。他们往往乐于自嘲、主动拥抱危机、敢于求变。回想下,近十年来,云计算也好、云原生也罢、DevOps 也算,SRE 也行,所有这些 IT 的大变革,都是尝试在不断优化和改进“大运维”这个领域。运维这个行业没有消亡,反而是不断进化,生发出了新的内涵。

这说明了什么?说明运维很重要,说明运维也很难!但是如何把这个价值说清楚,我们从站位、目标设定、投入产出比上来分别着手分析,下个问题见。

您觉得运维工作最重要的几个目标是什么?您是怎么落地这些目标的?运维的价值如何更好的得到体现?

聚焦经典的运维领域,最主要的几个工作职责

  1. 代码发布和交付(delivery),做好最后一公里的价值交付;
  2. 提升架构的可伸缩性(scalability)并付诸实施;
  3. 保障系统的稳定性(reliability)并不断改善;
  4. 在满足前三项目标的同时,不断优化并降低系统的运行成本(finops)。

如果你发现自己的工作,并不是围绕着以上范畴展开,那么有两种可能,你不是运维或者你的工作超纲了!

明确了工作范畴,说大点就是明确了运维的使命之后,设定目标就相对容易些了,比如:

  1. 针对代码发布和交付,可以简单的用发布次数来度量;
  2. 针对系统的伸缩性,可以用扩容的时效性来度量;
  3. 针对稳定性,我们可以通过观察核心功能的不可用时长来度量;
  4. 针对系统运行成本,我们可以计算到每完成一笔核心交易所花费的资源成本和人力成本来表示和追踪。

关于如何体现运维的价值

首先我们运维人要转变的是态度和立场:坚定和业务站在一起,争取共背业务目标。

我举个例子,HR部门,也是属于公司内部后台的不能再后台的部门了,但是我所接触过的优秀的hr中,不管是recruiter、还是hrbp,从来都是把自己当作业务部门的一份子,把业务部门的目标当作自己的目标。当立场一致,大家都是自己人的时候,价值就好说了。

其次,价值这个事情,永远都是和“成本投入”相对应的。你如果组建了一个很大的运维团队,人力成本在公司很显眼,那么你就很容易成为老板眼中的“重点关注对象”,也会受到业务方更苛刻的挑战,正所谓,楚人无罪怀璧其罪:) 客观上来讲,运维团队的资源投入,一定是要和业务收入相匹配的,过高过低都是不健康的,不利于团队发展的。所以,“运维的价值创造”最后会落到运维效率的竞争上来。

最后,关于价值,定量和定性的描述都得有。譬如和行业水平的定量对比,来自公司内业务部门满意度调查的定量数据。也要有比如对公司战略项目支撑中的“存在感”这些定性数据。

ChatGPT这样的AI能力您觉得未来是否有可能解决运维行业的问题?

首先我们看看,ChatGPT的核心优势是什么?ChatGPT,在知识的丰富度、自然语言理解能力(以及上下文理解)、内容生成能力方面,有着代际的革新。

然后,我们再分析下运维行业的核心问题是什么?

  • 是缺少领域知识吗?
  • 是交互效率低吗?
  • 是内容输出难吗?

以上都不是,运维行业所处理的问题,本质上还是一个系统性的工程问题,是为了解决IT系统价值快速交付的问题、解决伸缩性的问题、解决稳定性的问题、是不断提高系统运行维护性价比的问题。

目前来看,云计算、微服务对于运维行业的改变来的要更实质性一些。ChatGPT能有效改善运维行业知识沉淀的问题,或许会很快代替一些初级的运维架构师岗位。

工具选型这块,到底是自研,还是使用开源,还是使用商业产品,是如何抉择的?

这个问题没有绝对的答案,从我个人的从业经验来看,大概有以下几种情况:

自研的好处

  1. 心理上的自主可控感会更强一些;
  2. 短中期维度来看,对于团队的发展空间会更有利;
  3. 能根据自己的实际情况进行有针对性的、灵活的设计。

自研的弊端

  1. 时间成本很高,会造成较长一段时间拖后腿的情况,给业务的发展带来一定的影响;
  2. 人力成本高,以北京为例,要招聘一位相对资深的工程师,每年的薪资大概在50万,如果要自研相关运维工具到成熟,投入两位工程师还是需要的;
  3. 受限于研发人员的认知,自研容易和行业最佳实践脱钩,长期会造成内部工具落后于时代。

开源和开源二次开发

好处是能很快见效,投入生产。

坏处有三:

  1. 开源工具一般注重灵活性,功能上也比较聚焦,在产品化和用户体验上通常比较欠缺,拿来快速使用存在体验方面的问题;
  2. 写代码的朋友大家都有个体会,完全读懂和理解别人的代码和自己开发一套,难度其实是相当的,所以开源项目投入到生产环境,也是要投入足够的人力和时间去掌握的;
  3. 大多数针对开源项目的二次开发,会导致和社区主干脱钩,导致无法顺利升级到后续的最新版本,享受不到开源项目真正的红利。

使用商业产品和解决方案

优势:

  1. 时间成本优势明显,借助商业产品能够快速敏捷的支持业务的发展需要,首先做到不拖后腿!
  2. 原则上来讲,商业化产品的成本相比自研会有数倍的降低。这个成本差距是由商业模式决定的。商业产品能盈利的根本原因就是产品研发成本(加上销售成本)随着客户数量的增加而摊薄,否则这个公司没有存在的意义和可能;
  3. 商业产品的核心竞争力包括领域know-how、极致的产品体验、良好的技术支持和服务共同构成的,这通常意味着采用商业产品的技术团队会在公司业务方取得更好的口碑。

不足:

  1. 国内tob领域起步较晚,目前阻碍客户采用商业化产品最大的问题是缺少极致好用的产品,以及价格优势还不明显;
  2. 很多甲方客户技术历史包袱较重,个性化方案多,商业化产品往往很难做到完全匹配,导致客户不得不硬着头皮选择自研。

业内有观点认为云计算和Kubernetes这样的基础设施的崛起会让运维岗位逐渐消亡,您是怎么看待这样的观点呢?

诚然,云计算、K8s的出现,核心是为了改进“运维”这个行业,对运维行业的工作方式发生了重大影响。比如:

  • 以前的 clickops 逐步过渡到 IaC
  • 传统监控升级为更全面的可观测性体系
  • release 也从大版本定期发布变成了更敏捷的持续集成
  • 老中医式的开源软件维护模式,变成了对应的云服务的正确选型和使用
  • 扛机器上架的体力活变成了简单的控制台分分钟开通
  • 手敲命令配置网络路由的专家工作转变成云服务的各个网络产品的组合搭配
  • 从物理机混部提升利用率转变为采用微服务、云原生架构成本天然下降

我们看到,运维工作的内涵并没有变,工作的价值也并没有变弱,只是运维要掌握的技能树在升级。运维人继续保持危机感、保持主动求变精神、立足服务好业务,就能永立潮头,处处柳暗花明。

可选的监控工具有很多,用户选择贵司的 Flashcat 平台,理由是什么?

的确,开源的、商业化的监控平台有很多,我之前也写过一篇博客:​​《二十年里12个开源监控工具大对比》​​,大家可以参考。

回到为什么选择Flashcat平台,需要从监控系统的发展趋势以及Flashcat平台的特点说起。监控系统的发展趋势,可以参考我之前的博客文章 ​​《云原生监控的十大特点和趋势》​​。而Flashcat平台,正是面向这些趋势而生的针对性的解决方案:

  1. Flashcat面向更广泛多元的用户群:从面向运维工程师群体到面向全体研发、运营、CTO/CIO,Flashcat 让监控分析、信息拉齐如此简单;
  2. Flashcat与业务指标密切联动:当业务受损时,Flashcat 总能第一时间发现,并和 IT 系统深入联动,辅助技术团队快速展开调查;
  3. 云原生、混合云统一监控:无论采用什么样的 IT 架构,您只需要一套 Flashcat 平台。

以上是Flashcat来炜:如何把运维的饭碗端稳的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

Spring Boot Actuator端点大揭秘:轻松监控你的应用程序 Spring Boot Actuator端点大揭秘:轻松监控你的应用程序 Jun 09, 2023 pm 10:56 PM

一、SpringBootActuator端点简介1.1什么是Actuator端点SpringBootActuator是一个用于监控和管理SpringBoot应用程序的子项目。它提供了一系列内置的端点(Endpoints),这些端点可以用于查看应用程序的状态、运行情况和运行指标。Actuator端点可以以HTTP、JMX或其他形式暴露给外部系统,便于运维人员对应用程序进行监控、诊断和管理。1.2端点的作用和功能Actuator端点主要用于实现以下功能:提供应用程序的健康检查,包括数据库连接、缓存、

运维工作十多年,无数个瞬间、我觉得自己还是个小白... 运维工作十多年,无数个瞬间、我觉得自己还是个小白... Jun 09, 2023 pm 09:53 PM

​曾几何时,当我还是一名初出茅庐的计算机专业应届生的时候,在招聘网站上浏览了很多招聘贴,眼花缭乱的技术岗位让我摸不着头脑:研发工程师、运维工程师、测试工程师...‍大学期间专业课马马虎虎,更谈不上有什么技术视野,对于具体从事那个技术方向并没有什么明确的想法。直到一位学长对我说:“做运维吧,做运维不用天天写代码,会玩Liunx就行!比做开发轻松多了!”‍‍‍‍‍‍‍‍我选择了相信......入行十多年,吃过很多苦,背了很多锅,弄死过服务器,经历过部门裁员,如果有人现在跟我说做运维比开发简单,那我会

Spring Cloud微服务架构部署与运维 Spring Cloud微服务架构部署与运维 Jun 23, 2023 am 08:19 AM

随着互联网的快速发展,企业级应用的复杂度日益增加。针对这种情况,微服务架构应运而生。它以模块化、独立部署、可扩展性高等特点,成为当今企业级应用开发的首选。作为一种优秀的微服务架构,SpringCloud在实际应用中展现出了极大的优势。本文将介绍SpringCloud微服务架构的部署与运维。一、部署SpringCloud微服务架构SpringCloud

PG数据库运维工具要覆盖哪些能力 PG数据库运维工具要覆盖哪些能力 Jun 08, 2023 pm 06:56 PM

​过节前我和PG中国社区合作搞了一个关于如何使用D-SMART来运维PG数据库的线上直播,正好我的一个金融行业的客户听了我的介绍,打电话过来聊了聊。他们正在做数据库信创的选型,也试用了多个国产数据库,最后他们准备选择TDSQL。当时我觉得有点意外,他们从2020年就开始在做国产数据库选型,不过好像最初使用TDSQL后的感受并不太好。后来经过沟通才了解到,他们刚开始使用TDSQL的分布式数据库,发现对研发要求太高,所以后来就全部选择TDSQL的集中式MYSQL实例,用下来发现挺好用的。整个数据库云

途游邹轶:中小公司的运维怎么做? 途游邹轶:中小公司的运维怎么做? Jun 09, 2023 pm 01:56 PM

通过采访和约稿的方式,请运维领域老炮输出深刻洞见,共同碰撞,以期形成一些先进的共识,推动行业更好得前进。这一期我们邀请到的是邹轶,途游游戏运维总监,邹总经常戏称自己是世界500万强企业的运维代表,可见内心中是觉得中小公司的运维建设思路和大型企业是有差别的,今天我们带着几个问题,来请邹总分享一下他的中小公司研运一体化之路。这里是接地气、有高度的《​​​运维百家讲坛​​》第6期,开讲!问题预览途游是游戏公司,您觉得游戏运维有哪些独特性?面临的最大运维挑战是什么?您又是如何解决这些挑战的?游戏运维的人

运维要不要学golang吗 运维要不要学golang吗 Jul 17, 2023 pm 01:27 PM

运维不要学golang,其原因是:1、golang主要被用于开发高性能和并发性能要求较高的应用程序;2、运维工程师通常使用的工具和脚本语言已经能够满足大部分的管理和维护需求;3、学习golang需要一定的编程基础和经验;4、运维工程师的主要目标是确保系统的稳定和高可用性,而不是开发应用程序。

什么是可观测性?初学者需要知道的一切 什么是可观测性?初学者需要知道的一切 Jun 08, 2023 pm 02:42 PM

可观测性一词来源于工程领域,近年来在软件开发领域也日益流行。简而言之,可观测性是指根据外部输出以了解系统内部状态的能力。IBM对可观测性的定义为:通常,可观测性是指基于对复杂系统外部输出的了解就能够了解其内部状态或状况的程度。系统越可观测,定位性能问题根本原因的过程就能越快速且准确,而无需进行额外的测试或编码。在云计算中,可观测性还指对分布式应用系统及支撑其运行的基础设施的数据进行聚合、关联和分析的软件工具和实践,以便对应用系统进行更有效地监控、故障排除和调试,从而实现客户体验优化、服务水平协议

Uber实践:运维大型分布式系统的一些心得 Uber实践:运维大型分布式系统的一些心得 Jun 09, 2023 pm 04:53 PM

本文是Uber的工程师GergelyOrosz的文章,原文地址在:https://blog.pragmaticengineer.com/operating-a-high-scale-distributed-system/在过去的几年里,我一直在构建和运营一个大型分布式系统:优步的支付系统。在此期间,我学到了很多关于分布式架构概念的知识,并亲眼目睹了高负载和高可用性系统运行的挑战(一个系统远远不是开发完了就完了,线上运行的挑战实际更大)。构建系统本身是一项有趣的工作。规划系统如何处理10x/100

See all articles