Flashcat來煒:如何把運維的飯碗端穩
講壇第1期《井源- 運維幾何》和前段時間馬馳的《是時候讓維運集體下崗了》在業界引起廣泛討論,維運崗位真的沒有前途了嗎?如何把飯碗端穩?這一期,我們訪問了快貓星雲的來煒,來煒是維運破圈創業人士,既然能創業,一定是在行業內有很深的積累的,他會怎麼看待這個問題?讓我們一起來聽一種新的聲音!
這裡是接地氣、有高度的《運維百家講壇》第 3 期,開講!
介紹一下您自己以及現在的公司?
大家好,我是快貓星雲的來煒。快貓星雲是一家雲端原生智慧維運科技公司,由開源監控工具「夜鶯監控」的核心開發團隊所組成。快貓星雲打造的雲端原生監控分析平台—“Flashcat平台”,旨在解決雲端原生架構、混合雲架構下統一監控難、故障定位慢的問題。
如果想更多了解快貓星雲創立背後的故事,大家可以進一步閱讀ITPub 對我的一個專訪《十年死磕,從一線工程師到CEO》 ,歡迎大家指正。
有些維運老炮反映公司對維運的價值知之甚少,您是怎麼給公司講清楚運維的價值的?
把工作的價值,如何通俗易懂的給公司管理層講清楚,並取得理解和支持,是所有中後台技術團隊普遍面臨的難題,否則失業分分鐘的事情,維運工作的價值講清楚更是難上加難。
從我的朋友圈來看,時不時就會看到勸運維下崗/轉行的貼文:
- 例如瑞典馬工的《是時候讓維運集體下崗了》,振聾發聵,開篇就提到:
明人不說暗話:在雲原生和DevOps成熟的今天,維作為一個職位和團隊已經完成了歷史任務,應該退出舞台了。
- #再例如帶我入行的井老闆,在SRETalk 第一期中,用心良苦的勸導:
隨著科技的發展,時代的變化,一個崗位的消亡是很正常的事情,及時做好調整和規劃才是思考的重心。
但是,維運這個崗位以及背後的維運人,從來都是一次次站在要被淘汰的邊緣徘徊,又一次次倔強的起死回生,柳暗花明。他們往往樂於自嘲、主動擁抱危機、敢於求變。回想下,近十年來,雲端運算也好、雲端原生也罷、DevOps 也算,SRE 也行,所有這些 IT 的大變革,都是嘗試在不斷優化和改進「大運維」這個領域。維運這個產業沒有消亡,反而是不斷進化,生發出了新的內涵。
這說明了什麼?說明維運很重要,說明維運也很難!但如何把這個價值說清楚,我們從站位、目標設定、投入產出比上來分別著手分析,下個問題見。
您覺得維運工作最重要的幾個目標是什麼?您是怎麼落地這些目標的?維運的價值如何更好的體現?
聚焦經典的維運領域,最主要的幾個工作職責:
- 程式碼發佈與交付(delivery),做好最後一公里的價值交付;
- 提升架構的可擴展性(scalability)並付諸實施;
- 保障系統的穩定性(reliability)並不斷改善;
- 在滿足前三個目標的同時,不斷優化並降低系統的運作成本(finops)。
如果你發現自己的工作,並不是圍繞著以上範疇展開,那麼有兩種可能,你不是運維或你的工作超綱了!
明確了工作範疇,說大點就是明確了維運的使命之後,設定目標就相對容易些了,例如:
- 針對程式碼發布和交付,可以簡單的用發布次數來度量;
- 針對系統的伸縮性,可以用擴容的時效性來度量;
- 針對穩定性,我們可以透過觀察核心功能的不可用時長來度量;
- 針對系統運行成本,我們可以計算到每完成一筆核心交易所花費的資源成本和人力成本來表示和追蹤。
關於如何體現維運的價值:
首先我們維人要轉變的是態度和立場:堅定和業務站在一起,爭取共背業務目標。
我舉個例子,HR部門,也是屬於公司內部後台的不能再後台的部門了,但是我所接觸過的優秀的hr中,不管是recruiter、還是hrbp,從來都是把自己當作業務部門的一份子,把業務部門的目標當作自己的目標。當立場一致,大家都是自己人的時候,價值就好了。
其次,價值這個事情,永遠都是和「成本投入」相對應的。你如果組建了一個很大的維運團隊,人力成本在公司很顯眼,那麼你就很容易成為老闆眼中的“重點關注對象”,也會受到業務方更苛刻的挑戰,正所謂,楚人無罪懷璧其罪:) 客觀上來講,維運團隊的資源投入,一定是要和業務收入相匹配的,過高過低都是不健康的,不利於團隊發展的。所以,「運維的價值創造」最後會落到維運效率的競爭上來。
最後,關於價值,定量和定性的描述都得有。譬如和產業層級的量化對比,來自公司內業務部門滿意度調查的量化資料。也要有例如對公司策略專案支撐中的「存在感」這些定性資料。
ChatGPT這樣的AI能力您覺得未來是否有可能解決維運產業的問題?
首先我們來看看,ChatGPT的核心優勢是什麼? ChatGPT,在知識的豐富度、自然語言理解能力(以及情境理解)、內容生成能力方面,有著世代的革新。
然後,我們再分析下維運產業的核心問題是什麼?
- 是缺乏領域知識嗎?
- 是互動效率低嗎?
- 是內容輸出很難嗎?
以上都不是,維運產業所處理的問題,本質上還是一個系統性的工程問題,是為了解決IT系統價值快速交付的問題、解決伸縮性的問題、解決穩定性的問題、是不斷提高系統運作維護性價比的問題。
目前來看,雲端運算、微服務對於維運產業的改變來的要更實質一些。 ChatGPT能有效改善維運產業知識沉澱的問題,或許很快就會代替一些初級的維運架構師職位。
工具選型這塊,到底是自研,還是使用開源,還是使用商業產品,是如何抉擇的?
這個問題沒有絕對的答案,從我個人的經驗來看,大概有以下幾種情況:
自研的好處:
- 心理上的自主可控感會更強一些;
- 短中期維度來看,對於團隊的發展空間會更有利;
- #能依照自己的實際狀況進行有針對性的、靈活的設計。
自研的弊端:
- 時間成本很高,會造成較長一段時間拖後腿的情況,為業務的發展帶來一定的影響;
- 人力成本高,以北京為例,要招募一位相對資深的工程師,每年的薪資大概在50萬,如果要自研相關運維工具到成熟,投入兩位工程師還是需要的;
- 受限於研發人員的認知,自研容易和行業最佳實踐脫鉤,長期會造成內部工具落後於時代。
開源與開源二次開發:
好處是能很快見效,投入生產。
壞處有三:
- 開源工具一般注重彈性,功能上也比較聚焦,在產品化和使用者體驗上通常比較欠缺,拿來快速使用存在體驗方面的問題;
- 寫程式碼的朋友大家都有個體會,完全讀懂和理解別人的程式碼和自己開發一套,難度其實是相當的,所以開源專案投入到生產環境,也是要投入足夠的人力和時間去掌握的;
- 大多數針對開源專案的二次開發,會導致和社區主幹脫鉤,導致無法順利升級到後續的最新版本,享受不到開源專案真正的紅利。
使用商業產品和解決方案:
優勢:
- 時間成本優勢明顯,借助商業產品能夠快速敏捷的支援業務的發展需要,首先做到不拖後腿!
- 原則上來講,商業化產品的成本比自研會有數倍的降低。這個成本差距是由商業模式決定的。商業產品能獲利的根本原因就是產品研發成本(加上銷售成本)隨著客戶數量的增加而攤薄,否則這個公司沒有存在的意義和可能;
- 商業產品的核心競爭力包括領域know-how、極致的產品體驗、良好的技術支援和服務共同構成的,這通常意味著採用商業產品的技術團隊會在公司業務方取得更好的口碑。
不足:
- 國內tob領域起步較晚,目前阻礙客戶採用商業化產品最大的問題是缺少極致好用的產品,以及價格優勢還不明顯;
- 許多甲方客戶技術歷史包袱較重,個性化方案多,商業化產品往往很難做到完全匹配,導致客戶不得不硬著頭皮選擇自研。
業內有觀點認為雲端運算和Kubernetes這樣的基礎設施的崛起會讓運維崗位逐漸消亡,您是怎麼看待這樣的觀點呢?
誠然,雲端運算、K8s的出現,核心是為了改善「維運」這個產業,對維運產業的工作方式發生了重大影響。例如:
- 以前的clickops 逐步過渡到IaC
- 傳統監控升級為更全面的可觀測系統
- release 也從大版本定期發布變成了更敏捷的持續整合
- 老中醫式的開源軟體維護模式,變成了對應的雲端服務的正確選型和使用
- 扛機器上架的體力活變成了簡單的控制台分分鐘開通
- 手敲指令配置網路路由的專家工作轉變成雲端服務的各個網路產品的組合搭配
- 從實體機混部提升利用率轉變為採用微服務、雲端原生架構成本自然下降
- …
我們看到,維運工作的內涵並沒有變,工作的價值也沒有變弱,只是維運要掌握的技能樹正在升級。維運人持續保持危機感、保持主動求變精神、立足服務好業務,就能永立潮頭,處處柳暗花明。
可選的監控工具很多,使用者選擇貴司的 Flashcat 平台,理由是什麼?
的確,開源的、商業化的監控平台有很多,我之前也寫過一篇部落格:《二十年裡12個開源監控工具大對比》,大家可以參考。
回到為什麼選擇Flashcat平台,需要從監控系統的發展趨勢以及Flashcat平台的特色說起。監控系統的發展趨勢,可以參考我之前的部落格文章 《雲端原生監控的十大特點和趨勢》。而Flashcat平台,正是面向這些趨勢而生的針對性的解決方案:
- #Flashcat面向更廣泛多元的用戶群:從面向運維工程師群體到面向全體研發、營運、CTO/CIO,Flashcat 讓監控分析、資訊拉齊如此簡單;
- Flashcat與業務指標密切連動:當業務受損時,Flashcat 總能第一時間發現,並和IT 系統深入連動,輔助技術團隊快速展開調查;
- 雲端原生、混合雲統一監控:無論採用什麼樣的IT 架構,您只需要一套Flashcat 平台。
以上是Flashcat來煒:如何把運維的飯碗端穩的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

曾幾何時,當我還是一名初出茅廬的電腦專業應屆生的時候,在招聘網站上瀏覽了很多招聘貼,眼花繚亂的技術職位讓我摸不著頭腦:研發工程師、運維工程師、測試工程師...大學期間專業課馬馬虎虎,更談不上有什麼技術視野,對於具體從事那個技術方向並沒有什麼明確的想法。直到一位學長對我說:「做運維吧,做運維不用天天寫程式碼,會玩Liunx就行!比做開發輕鬆多了!」我選擇了相信......入行十多年,吃過很多苦,背了很多鍋,弄死過服務器,經歷過部門裁員,如果有人現在跟我說做維運比開發簡單,那我會

一、SpringBootActuator端點簡介1.1什麼是Actuator端點SpringBootActuator是一個用來監控和管理SpringBoot應用程式的子專案。它提供了一系列內建的端點(Endpoints),這些端點可以用於查看應用程式的狀態、運行情況和運行指標。 Actuator端點可以以HTTP、JMX或其他形式暴露給外部系統,以便於維運人員對應用程式進行監控、診斷和管理。 1.2端點的作用和功能Actuator端點主要用於實現以下功能:提供應用程式的健康檢查,包括資料庫連接、快取、

隨著網路的快速發展,企業級應用的複雜度日益增加。針對這種情況,微服務架構應運而生。它以模組化、獨立部署、可擴展性高等特點,成為當今企業級應用開發的首選。作為一種優秀的微服務架構,SpringCloud在實際應用中展現了極大的優勢。本文將介紹SpringCloud微服務架構的部署與維運。一、部署SpringCloud微服務架構SpringCloud

過節前我和PG中國社區合作搞了一個關於如何使用D-SMART來運維PG數據庫的線上直播,正好我的一個金融行業的客戶聽了我的介紹,打電話過來聊了聊。他們正在做資料庫信創的選型,也試用了多個國產資料庫,最後他們準備選擇TDSQL。當時我覺得有點意外,他們從2020年就開始在做國產資料庫選型,不過好像最初使用TDSQL後的感受並不太好。後來經過溝通才了解到,他們剛開始使用TDSQL的分散式資料庫,發現對研發要求太高,所以後來就全部選擇TDSQL的集中式MYSQL實例,用下來發現挺好用的。整個資料庫雲

可觀測性一詞源自於工程領域,近年來在軟體開發領域也日益普及。簡而言之,可觀測性是指根據外部輸出以了解系統內部狀態的能力。 IBM對可觀測性的定義為:通常,可觀測性是指基於對複雜系統外部輸出的了解就能夠了解其內部狀態或狀況的程度。系統越可觀測,定位效能問題根本原因的過程就能越快速且準確,而無需進行額外的測試或編碼。在雲端運算中,可觀測性也指對分散式應用系統及支撐其運作的基礎設施的資料進行聚合、關聯和分析的軟體工具和實踐,以便對應用系統進行更有效地監控、故障排除和調試,從而實現客戶體驗優化、服務等級協議

透過採訪和約稿的方式,請維運領域老砲輸出深刻洞見,共同碰撞,以期形成一些先進的共識,推動產業更好得前進。這一期我們邀請到的是鄒軼事,途遊遊戲運維總監,鄒總經常戲稱自己是世界500萬強企業的運維代表,可見內心中是覺得中小公司的運維建設思路和大型企業是有差別的,今天我們帶著幾個問題,來請鄒總分享一下他的中小公司研運一體化之路。這裡是接地氣、有高度的《運維百家講壇》第6期,開講!問題預覽途遊是遊戲公司,您覺得遊戲維有哪些獨特性?面臨的最大維運挑戰是什麼?您又是如何解決這些挑戰的?遊戲維運的人

維運不要學golang,原因是:1、golang主要被用於開發高效能和並發效能要求較高的應用程式;2、維運工程師通常使用的工具和腳本語言已經能夠滿足大部分的管理和維護需求;3、學習golang需要一定的程式設計基礎和經驗;4、維運工程師的主要目標是確保系統的穩定和高可用性,而不是開發應用程式。

透過採訪和約稿的方式,請維運領域老砲輸出深刻洞見,共同碰撞,以期形成一些先進的共識,推動產業更好得前進。這一期我們邀請到的是陳存利,度小滿系統維運部總經理,20多年的職業生涯中絕大部分時間在互聯網領域。在百度維運部期間由於帶隊風格過硬,兄弟團隊稱其為」陳司令」。今天我們請「陳司令」來聊聊他的觀點。這裡是接地氣、有高度的《運維百家講壇》第5期,開講!問題預覽您很早加入了百度,後來隨度小滿獨立,我們了解到您身邊有許多員工其實是很長時間一直跟著您,經歷了很多業務的維運考驗,相信大家都很感興
