01. 場景簡述
采用WeOps監(jiān)控+健康巡檢模塊,將原本線下手工例行巡檢工作,替換為平臺上自動實現(xiàn),原本需要4個人日的工作量縮短成1個人兼任即可完成,同時,對系統(tǒng)可用性和業(yè)務(wù)效率等帶來極大提升。
02. 故事背景
該公司全國有1400+臺服務(wù)器,主要分布在香港、深圳、順德、武漢四個大區(qū),共12個小區(qū)。
IDC數(shù)據(jù)中心關(guān)鍵職責(zé)是保證服務(wù)器及系統(tǒng)的穩(wěn)定性,要求每天完成所有資源的例行巡檢,主要包括:服務(wù)器資源、系統(tǒng)日志、備份及網(wǎng)絡(luò)等;每個區(qū)域安排1人,以人力巡檢為主,幾乎需要花一整天的時間才能完成,四個區(qū)域總計每天需要4個人/日的工作量,效率低;巡檢準(zhǔn)確度低,手工容易錯漏;并且由于范圍廣,一邊還沒有巡檢完,另一邊就有系統(tǒng)報障,難以實時監(jiān)測,發(fā)現(xiàn)問題以被動為主,時效性低。
1)用WeOps健康巡檢+監(jiān)控,自動完成巡檢工作的同時,實時監(jiān)測資源運行狀態(tài)
通過在香港、深圳、順德、武漢等四個大區(qū),共12個小區(qū)部署Proxy節(jié)點,集中接管1400+臺服務(wù)器,實時監(jiān)控系統(tǒng)資源、系統(tǒng)日志關(guān)鍵字、備份任務(wù)狀態(tài)及網(wǎng)絡(luò)狀態(tài);
配置每天巡檢任務(wù),對系統(tǒng)資源、備份狀態(tài)等進行日常檢查,自動輸出巡檢報告,用于趨勢分析,提前消除隱患;
根據(jù)業(yè)務(wù)需求,調(diào)優(yōu)告警策略,巡檢的同時,保持對系統(tǒng)的實時監(jiān)測,提升告警準(zhǔn)確性。
2)WeOps實現(xiàn)效果:
03. 場景適用性
該IDC例行日檢場景,對于高度關(guān)注服務(wù)器及系統(tǒng)穩(wěn)定性、有嚴(yán)格的運維規(guī)范要求的客戶特別適用,例如金融行業(yè)、醫(yī)院等企業(yè)。系統(tǒng)例行檢查自動化,極大提升巡檢效率,變被動為主動,釋放運維工程師的精力完成更有價值的工作。
OpsPilot:知識庫 RAG 預(yù)處理強化,細(xì)化文檔提取和分塊策略
查看詳細(xì)
嘉為藍鯨亮相 2025中物院超算與數(shù)智大會,共探數(shù)智運維新路徑
查看詳細(xì)
3月13日起!嘉為藍鯨春季發(fā)布會,DeepSeek 重磅加持,AI 賦能多款研運產(chǎn)品強勢升級!
查看詳細(xì)
聚焦信創(chuàng):嘉為藍鯨 OpsPilot× 華為昇思,共筑運維 AI 融合新生態(tài)
查看詳細(xì)
嘉為藍鯨支持軟件開發(fā)運維一體化能力成熟度(DOMM)國家標(biāo)準(zhǔn)教材編制與培訓(xùn)
查看詳細(xì)
滔搏斬獲 “鼎新杯” 優(yōu)秀案例,引入嘉為藍鯨打造智能運維平臺
查看詳細(xì)
申請演示