運(yùn)維數(shù)字化

嘗試用數(shù)字化的理解說(shuō)一下運(yùn)維。

首先是要將硬件都數(shù)字化,也就是機(jī)器的配置,IP,網(wǎng)絡(luò)配置都要記錄到 CMDB 中,但是實(shí)現(xiàn)了準(zhǔn)確記錄也只是信息化,因?yàn)樽疃嗍切畔?,沒(méi)有做到輔助決策,如果查看機(jī)器時(shí)可以提供硬件更新提醒,例如硬盤(pán)使用生命周期快到了,并且有 20%損壞的概率,提示做備份或者更換,同時(shí)支持成本對(duì)比,那么對(duì)于設(shè)備管理員來(lái)說(shuō),就是一個(gè)有理有據(jù)的決策依據(jù)。

好的,繼續(xù)聊現(xiàn)在流行實(shí)時(shí)報(bào)警,這個(gè)確實(shí)厲害,但是只是起到一個(gè)提醒作用,輔助決策的比重不大。難點(diǎn)在于數(shù)據(jù)量大和實(shí)時(shí)性之間的矛盾,但是在用戶看到真實(shí)報(bào)警后往往是懵逼的,因?yàn)楝F(xiàn)在系統(tǒng)太復(fù)雜,提示信息往往只是原始錯(cuò)誤的信息,很難馬上判斷出來(lái)根本原因以及解決方案,這個(gè)我太有感覺(jué)了,以往安裝 pip 包的時(shí)候,總是各種錯(cuò)誤,上網(wǎng)查找要么賭對(duì)遇到一模一樣的錯(cuò)誤,要么就是找靈感,試圖從相似的錯(cuò)誤中找到可用的解決方案,但概率不高,后來(lái)用了 GPT 效率才大幅提升,本質(zhì)上 GPT 分析了錯(cuò)誤信息,并給出了他知道的最有效的解決方案,也就是幫我做了決策,這個(gè)才是有用的。

回頭繼續(xù)說(shuō)實(shí)時(shí)報(bào)警,理想的數(shù)字化是給出報(bào)警的可能原因(最好是準(zhǔn)確的原因)以及有效的應(yīng)對(duì)措施這才是數(shù)字化的目標(biāo),僅僅提示并不是,不論他有多快。

還有一個(gè)指標(biāo)體系,本質(zhì)上指標(biāo)是對(duì)事物衡量的簡(jiǎn)化方式(沒(méi)辦法事物的維度太多,只能簡(jiǎn)化)。最重要的是指標(biāo)是手段不是目的,追求指標(biāo)體系是錯(cuò)誤的,追求的應(yīng)該是對(duì)事物的把握程度。那么問(wèn)題來(lái)了,什么是追求的目標(biāo)?

如果我現(xiàn)在追求系統(tǒng)穩(wěn)定,那么性能指標(biāo)就需要一大堆,用來(lái)刻畫(huà)我監(jiān)控的對(duì)象的性能狀態(tài)。如果追求應(yīng)用錯(cuò)誤的發(fā)現(xiàn)速度(尤其是測(cè)試中的應(yīng)用),那么錯(cuò)誤日志以及告警速度就是關(guān)鍵指標(biāo)。如果追求伸縮性好,那么最高最低的性能指標(biāo)就是我要采集的數(shù)據(jù),如此類(lèi)推,追求什么,就采集什么,然后判斷是否能夠滿足對(duì)目標(biāo)的刻畫(huà),如果不足,就再采集。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容