曾幾何時,當我還是一名初出茅廬的電腦專業應屆生的時候,在招聘網站上瀏覽了很多招聘貼,眼花繚亂的技術崗位讓我摸不著頭腦:研發工程師、運維工程師、測試工程師. ..
大學期間專業課馬馬虎虎,更談不上有什麼技術視野,對於具體從事那個技術方向並沒有什麼明確的想法。
直到一位學長對我說:「做運維吧,做運維不用天天寫程式碼,會玩Liunx 就行!比做開發輕鬆多了!」
我選擇了相信......
入行十多年,吃過很多苦,背了很多鍋,弄死過服務器,經歷過部門裁員,如果有人現在跟我說做維運比開發簡單,那我會毫不猶豫的把他拉黑...
在我看來,維運工作可能是最複雜的技術工種之一,需要處理大量的技術細節、不同平台的整合和配置,以及解決各種複雜的問題和故障。因此需要維運人員擁有廣泛的技能和知識,以應對不斷變化的技術和業務需求:
維運常常要面對的複雜平台維運工作。原因是企業通常需要管理和監控的不是單一的平台和系統,而是複雜的多,這些系統可能來自不同的供應商,使用不同的協定和技術,包括伺服器、儲存、網路、應用程式等。
繁瑣的配置管理也是維運工作的困難之一。配置管理涉及大量的任務,例如係統安裝、配置更新、軟體安裝和更新等。這些任務需要在整個系統中協調和執行。
大規模叢集的管理工作同樣不簡單。大型企業需要管理數千台伺服器,這需要強大的工具和自動化技術。運維人員需要使用自動化工具來管理配置、更新、監視和報告。
維運安全問題同樣不能忽視。維運人員需要保護公司的資產和數據,並確保系統的安全性。這可能包括防火牆、入侵偵測系統、安全性修補程式管理等。
維運也需要有豐富的故障處理經驗。故障是維運工作中的常見問題,當系統出現問題時,維運人員需要快速定位故障,並採取措施恢復服務。
持續學習是對維運人最基本的要求。維運工具和技術的快速演進十分誇張,IT技術不斷發展,新技術和工具不斷湧現,維運人員需要不斷學習和更新知識,以跟上技術的快速演進。
如果說高風險職業,維運絕對可以算一個,即使在不少大公司,也常發生運維人為操作引起的宕機事故:
太平洋石油公司網路攻擊( 2021年):2021年5月,美國太平洋石油公司遭到一次勒索軟體攻擊,導致該公司的網路和伺服器故障和停機。據報道,該事件是由於一名員工在誤操作時打開了一個惡意連結導致的。
GitLab故障(2017年):2017年1月,程式碼託管服務供應商GitLab發生了一次嚴重的資料遺失事件,導致許多客戶的資料被永久刪除。根據GitLab後來的官方聲明,這是由於一名員工在誤操作時刪除了一個生產資料庫的文件所導致的。
沃爾瑪伺服器宕機(2019年):2019年11月,美國零售巨頭沃爾瑪的伺服器在一小時內多次宕機,導致該公司的網站、應用程式和支付系統無法正常運作。據報道,該事件是由於一名員工在進行例行的伺服器維護時出現錯誤導致的。
微軟Azure雲端服務中斷(2020年):2020年9月,微軟的Azure雲端服務出現了全球性的中斷,導致許多客戶的應用程式和服務無法正常運作。後來證實,該事件是由於一個網路配置錯誤導致的。
菲律賓颱風(2013年):2013年11月,菲律賓遭遇了一場強烈的颱風,這是自1947年以來菲律賓遭遇最強的颱風。這場颱風造成了超過6,000人的死亡和失踪,並且對該國的基礎設施造成了嚴重破壞。該災難也導致許多國際企業在菲律賓的資料中心和伺服器停機。
美國颶風(2012年):2012年10月,美國東海岸遭遇了一場強烈的颶風,造成了大規模的停電、通訊中斷和水災。這場災難也導致了一些知名公司和服務提供者的資料中心和伺服器停機,包括亞馬遜、谷歌和Netflix。
硬技能落後可能是運維人面對的最大難題。隨著科技的不斷進步,維運工作需要不斷學習新的技能和工具,以適應不斷變化的市場需求。然而,對於一些從事運維工作多年的人來說,他們可能會發現自己的技能已經落後於市場需求,這會讓他們感到困惑和不知所措。
大環境不好真不是維運造成的。與其他技術領域相比,維運領域的職涯發展路徑相對較模糊。在一些組織中,維運工程師往往只被視為“後勤部門”,缺乏與其他技術團隊平等的地位和待遇,例如無法得到應有的認可和獎勵。這更加重了維運的負面情緒,因此一定程度導致維運工程師對職涯發展前景不夠明確。
只顧低頭走路,無暇抬頭看天。維運工作的本質是確保系統的穩定性和可靠性,因此維運工程師必須隨時保持高度的警覺和專注。這可能會導致他們的工作壓力非常大,特別是在面對系統故障或緊急事件時。疲於應付生活中的苟且,無暇思考職涯發展的遠方。
因此我們常常在思考,維運生涯如何更好的發展?
布萊恩·費瑟斯通豪所著《遠見》一書中描述了職業生涯的普遍發展規律,其中提到的原則或許能給我們答案:
具備未來45年的思維,如果以較長的時間跨度為規劃,例如45年,你就不會在乎眼下一城一池的得失。而且在有明確職涯規劃的前提下,更容易克服困難,堅持下去。
而我們要做的是明確運維技術發展的路徑,從而在一個細分技術領域做到極致
向DevOps 轉型:不知何時,技術圈開始流行一種所謂的「DevOps已死」的論調。然而 DevOps 絕不是簡單的讓開發去做維,讓維運無路可走。
維運工作已經很難了,別在給我們製造恐慌了。
真正DevOps 的必要組成部分應是一個內部DevOps 平台和維護內部平台的專門團隊,而不是一堆需要程式設計師自己去搞定的零散開源工具,或者說讓開發去幹運維的活。真正的 DevOps 團隊應該讓開發和維運緊密團結在一起,共責,協同提升IT效能,從而為業務賦能。
維運向DevOps 的轉型需要維運人員掌握一些關鍵的工具和技術,如持續整合、持續交付、自動化測試、容器化等,同時DevOps 團隊應引入敏捷開發、迭代開發和持續交付等方法。在一個建立完備 DevOps 文化的企業,維運轉型 DevOps 工作是一個非常好的發展路徑。
向 AIOps 轉型:同樣 AIOps 也是維運一直比較好的職涯發展路徑。 AIOps 可以幫助 IT 維運人員自動化一些常規的、繁瑣的、低價值的操作,如日誌分析、故障排除等,從而釋放更多的時間和精力來解決更複雜的問題。
同時維運工作涉及到許多方面,包括基礎設施管理、應用程式部署、監控、故障排除等等,這些任務需要人類維運人員的專業知識和經驗。
AIOps 技術可以提高 IT 維運效率和準確性,但是它並不會完全取代人類維運人員的工作。相反,它們可以共同工作,提高整個 IT 維運團隊的效率和生產力。
轉型為SRE:不斷學習軟體開發技能,掌握DevOps中的自動化工具、測試、部署和監控等實踐。學習雲端運算和容器技術,SRE需要了解雲端運算平台和容器技術,掌握基本的雲端服務和容器管理工具,如AWS、Docker、Kubernetes等。掌握數據分析技能同時在組織內建立SRE文化,如可靠性、自動化和實驗文化等核心概念。
以上是維運工作十多年,無數個瞬間、我覺得自己還是個小白...的詳細內容。更多資訊請關注PHP中文網其他相關文章!