首頁 運維 安全 我為什麼要把退休前的這段時間都用在和維運知識自動化系統死磕上

我為什麼要把退休前的這段時間都用在和維運知識自動化系統死磕上

Jun 10, 2023 am 10:49 AM
最佳化 系統 自動化

我的團隊做系統優化是從2003年開始的。應HP SERVICE的邀請,2003年我加入了他們的海爾系統優化小組,負責Oracle資料庫的最佳化工作。這是我第一次參加大型系統的最佳化工作,甚至那時我還不知道一個大型售後服務系統的優化該從何處開始。我是帶著李維斯的一本書出發去青島參加這個優化項目的,透過這個項目,我對Oracle資料庫的優化有了初步的認識。後來我又幫助HP完成了對華為SCM系統所採用的CAF平台的效能評估,並對決策者建議及時中止這個項目,避免更大的資金浪費,因為這個項目已經無法優化了。後來HP採納了我的建議,關閉了基於CAF平台的項目,華為也重新選擇了Oracle EBS作為SCM系統和ERP系統的基礎。從那以後,我們的團隊規模越來越大,做的優化專案也越來越多,也鍛鍊出了一批做系統優化的專家。

2011年,我們開始幫助國家電網做系統優化,剛開始的幾個專案在專家的帶領下,效果都特別好。客戶希望我們擴大優化範圍,訂訂了一個需要近百個DBA的大型優化專案。我們從許多合作夥伴處招募了數十名DBA共同參與這個項目,為了確保項目的質量,我們對整個團隊進行了多次集中培訓。不過最後這個專案做下來效果很不理想,最主要的原因就是DBA的能力參差不齊,大多數沒有參加過大型優化專案。從那個計畫開始,我也在思考傳統的依靠人和專家的維運模式存在的問題,希望找到一條道路,能讓專家的經驗發揮更大的作用。這是我開發D-SMART,一個維運知識自動化系統的初衷。要建構一個知識自動化系統,必須提高運中的數位化程度。不過傳統產業IT運維的數位化程度很低。其主要原因有幾個面向。

資源有限:許多企業可能沒有足夠的資源投入研發和實施智慧化維運系統,或者可能認為將資源投入其他方面更有回報。

文化因素:有些企業可能更願意依靠人工經驗而不是自動化系統,可能是因為他們缺乏對自動化系統的信任,或者他們可能認為在緊急情況下專家的判斷比機器更可靠。

技術限制:有些企業可能缺乏必要的技術基礎設施來支援智慧化維運系統,這可能需要較高的成本投入來升級設備和系統。

意識不足:有些企業可能沒有意識到數位化維運的潛在優勢,或者可能沒有足夠的知識和了解數位化維運的實施方法。

雖然傳統產業在維運數位化上有各種認知的不足,但隨著科技的發展和數位化的日益重要,智慧化維運將成為未來資訊系統維運的趨勢,也是一個必然的方向。

反思我們這些年做系統優化與維運的工作經歷,經驗不足的技術人員是導致優化工作效果不佳的重要因素。優化工作需要專業知識和技能,而不是只依靠經驗。可能需要更系統化的培訓來確保所有參與優化工作的人員具備必要的技能和知識。此外,優化工作的效果也受到多個因素的影響,如係統設計,數據品質和優化工作的過程等。

隨著科技的不斷發展,現在已經有許多智慧化的演算法與方法可供使用,可以大幅提高維運效率和減少人為錯誤。透過維運知識自動化工具可以提供智慧化分析和自動化操作,以幫助DBA更好地管理和最佳化系統。如果企業有足夠的資源,可以考慮引進這些工具和系統來改善維運效率。 「維運知識自動化系統」結合了大數據分析、人工智慧等技術,以及專家經驗和工作積累,建構了一個全面的維運知識體系,可以幫助提高維運工作的效率和品質。透過監控指標體系、健康模型、維運知識圖譜、異常檢測演算法等技術,「運維知識自動化系統」可以自動化地分析和解決系統性能問題,同時還能提供智慧化的最佳化建議和決策支持,為企業的維運工作提供了強而有力的支持。

實際上D-SMART系統開發的最重要的目的是對我們這個團隊這二十多年在IT維與系統優化上的經驗的總結,讓團隊中的專家把這些年積累的經驗變成可自動化執行的數位化知識庫。並透過不斷的迭代知識庫,讓維運知識不斷的能夠在平台中沉澱與積累,從而不斷提升自動化分析的能力。

這個系統的研發不僅依賴研發團隊,知識工具的研發完全由DBA完成,而沒有借助於普通的維運人員。這是因為普通的研發人員並不了解IT維,不了解資料庫,也不了解效能優化。只有做過維運工作的DBA才能夠更準確的把專家的思路變成自動化的工具。

D-SMART系統的起點是指標體系,我認為指標是專家經驗的一部分,而且是十分重要的一部分,專家認知後的指標才是可以完全解讀的指標。而目前很多資料庫監控軟體提供的許多指標,維運人員無法正確解讀,即使這些指標出現了異常,可能也無法被發現,或者說發現了指標異常也無法感知到系統哪個地方出現了問題。而專家梳理出來的指標數據都是單一可被專家解讀的,因此每個指標都會被專家標註,打上特定的標籤。

D-SMART的第二步是完成指標的準確收集,準確的收集到每個指標的數據對於智慧化運維系統來說十分關鍵。要確保每個資料都能夠準確的反映出資料庫的真實狀態十分關鍵。很多數據被收集回來後,需要經過加工才能變成可以被使用的指標,而這些加工演算法裡也反映了專家的經驗。透過這個步驟,D-SMART系統在不斷的獲取資料庫運作狀態的數位化模型。

第三步是對採集回來的指標、日誌資料進行自動化的建模分析。我們透過健康模型判斷資料庫的運作狀態是否正常,是否有風險;透過效能模型了解資料庫的整體效能狀態;透過負載模型了解資料庫目前的負載;透過故障模型發現資料庫可能存在的隱患,並及時報警。

第四步是利用這些被收集回來的資料自動完成各種巡檢工作。例如日檢,每天半夜系統會自動對前一天採集的數據做分析,發現其中的風險與隱患,並產生日檢報告。每個月或每個星期,可以自訂任務對最近採集的數據進行自動化分析,產生巡檢報告。這種巡檢能夠分析全面的數據,比傳統的靠人工採集數據,人工進行分析的方式擁有更豐富的數據。透過自動化分析的演算法也更有效率。

利用這些數據,還可以做很多有價值的分析工作,例如容量預測、效能最佳化、專案審計等。同時利用標準化的指標體系,我們也可以建構一線維運與二、三線維運的數位化溝通,透過完善的指標集,可以盡可能全面的為三線維運提供資料庫運作的全景視圖,真正做到不用到現場,專家可以盡知天下事。

前陣子80多歲的母親一定要給我過個生日,這些年在外面跑,已經有十多年沒有過生日了。插蠟燭的時候才發現,過完生日已經54歲,離退休已經時日無多了。我想在現在還能做點事情的時候,盡可能的能夠把這些年累積的經驗都數字化了,能夠留下來,這樣也就沒有遺憾了。

#

以上是我為什麼要把退休前的這段時間都用在和維運知識自動化系統死磕上的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1319
25
PHP教程
1269
29
C# 教程
1248
24
CUDA之通用矩陣乘法:從入門到熟練! CUDA之通用矩陣乘法:從入門到熟練! Mar 25, 2024 pm 12:30 PM

通用矩陣乘法(GeneralMatrixMultiplication,GEMM)是許多應用程式和演算法中至關重要的一部分,也是評估電腦硬體效能的重要指標之一。透過深入研究和優化GEMM的實現,可以幫助我們更好地理解高效能運算以及軟硬體系統之間的關係。在電腦科學中,對GEMM進行有效的最佳化可以提高運算速度並節省資源,這對於提高電腦系統的整體效能至關重要。深入了解GEMM的工作原理和最佳化方法,有助於我們更好地利用現代計算硬體的潛力,並為各種複雜計算任務提供更有效率的解決方案。透過對GEMM性能的優

华为乾崑 ADS3.0 智驾系统 8 月上市 享界 S9 首发搭载 华为乾崑 ADS3.0 智驾系统 8 月上市 享界 S9 首发搭载 Jul 30, 2024 pm 02:17 PM

7月29日,在AITO问界第四十万台新车下线仪式上,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东出席发表演讲并宣布,问界系列车型将于今年8月迎来华为乾崑ADS3.0版本的上市,并计划在8月至9月间陆续推送升级。8月6日即将发布的享界S9将首发华为ADS3.0智能驾驶系统。华为乾崑ADS3.0版本在激光雷达的辅助下,将大幅提升智驾能力,具备融合端到端的能力,并采用GOD(通用障碍物识别)/PDP(预测决策规控)全新端到端架构,提供车位到车位智驾领航NCA功能,并升级CAS3.0全

常用常新!華為Mate60系列升級HarmonyOS 4.2:AI雲端增強、小藝方言太好用了 常用常新!華為Mate60系列升級HarmonyOS 4.2:AI雲端增強、小藝方言太好用了 Jun 02, 2024 pm 02:58 PM

4月11日,華為官方首次宣布HarmonyOS4.2百機升級計劃,此次共有180餘款設備參與升級,品類覆蓋手機、平板、手錶、耳機、智慧螢幕等設備。過去一個月,隨著HarmonyOS4.2百機升級計畫的穩定推進,包括華為Pocket2、華為MateX5系列、nova12系列、華為Pura系列等多款熱門機型也已紛紛展開升級適配,這意味著會有更多華為機型用戶享受到HarmonyOS帶來的常用常新體驗。從使用者回饋來看,華為Mate60系列機種在升級HarmonyOS4.2之後,體驗全方位躍升。尤其是華為M

C++ 程式最佳化:時間複雜度降低技巧 C++ 程式最佳化:時間複雜度降低技巧 Jun 01, 2024 am 11:19 AM

時間複雜度衡量演算法執行時間與輸入規模的關係。降低C++程式時間複雜度的技巧包括:選擇合適的容器(如vector、list)以最佳化資料儲存和管理。利用高效演算法(如快速排序)以減少計算時間。消除多重運算以減少重複計算。利用條件分支以避免不必要的計算。透過使用更快的演算法(如二分搜尋)來優化線性搜尋。

Linux與Windows系統中cmd指令的差異與相似之處 Linux與Windows系統中cmd指令的差異與相似之處 Mar 15, 2024 am 08:12 AM

Linux和Windows是兩種常見的作業系統,分別代表了開源的Linux系統和商業的Windows系統。在這兩種作業系統中,都存在著命令列介面,用於使用者與作業系統互動。在Linux系統中,使用者使用的是Shell命令列,而在Windows系統中,使用者使用的是cmd命令列。 Linux系統中的Shell命令列是一個非常強大的工具,可以完成幾乎所有的系統管理任

華為將在智慧穿戴領域推出玄璣感知系統 可根據心率評估用戶情緒狀態 華為將在智慧穿戴領域推出玄璣感知系統 可根據心率評估用戶情緒狀態 Aug 29, 2024 pm 03:30 PM

近日,華為宣布將於9月推出搭載玄璣感知系統的全新智慧穿戴新品,預計為華為的最新智慧手錶。該新品將整合先進的情緒健康監測功能,玄璣感知系統以其六大特性——準確性、全面性、快速性、靈活性、開放性和延展性——為用戶提供全方位的健康評估。系統採用超感知模組,優化了多通道光路架構技術,大幅提升了心率、血氧和呼吸速率等基礎指標的監測精度。此外,玄璣感知系統也拓展了以心率資料為基礎的情緒狀態研究,不僅限於生理指標,還能評估使用者的情緒狀態和壓力水平,並支持超過60項運動健康指標監測,涵蓋心血管、呼吸、神經、內分泌、

優化WIN7系統開機啟動項目的操作方法 優化WIN7系統開機啟動項目的操作方法 Mar 26, 2024 pm 06:20 PM

1.在桌面上按組合鍵(win鍵+R)開啟運行窗口,接著輸入【regedit】,回車確認。 2.開啟登錄編輯程式後,我們依序點選展開【HKEY_CURRENT_USERSoftwareMicrosoftWindowsCurrentVersionExplorer】,然後看目錄裡有沒有Seri​​alize項,如果沒有我們可以點選右鍵Explorer,新建項,並將其命名為Serialize。 3.接著點選Serialize,然後在右邊窗格空白處點選滑鼠右鍵,新建一個DWORD(32)位元值,並將其命名為Star

解決 PHP 函數效率低的方法有哪些? 解決 PHP 函數效率低的方法有哪些? May 02, 2024 pm 01:48 PM

PHP函數效率最佳化的五大方法:避免不必要的變數複製。使用引用以避免變數複製。避免重複函數呼叫。內聯簡單的函數。使用數組優化循環。

See all articles