北塔 發(fā)表于:13年09月16日 10:53 [綜述] DOIT.com.cn
很多“成功”的運(yùn)維大師都會以解決各種奇異問題為榮,但如果支撐業(yè)務(wù)系統(tǒng)的對象數(shù)量超越了你的記憶容量,那些憑借經(jīng)驗修復(fù)網(wǎng)絡(luò)的高手就很可能敗下陣來。
有一些很蹊蹺的網(wǎng)絡(luò)故障時常會發(fā)生在我們身邊,在對各種可能因素進(jìn)行逐一排除后,仍然不能找到故障原因。而當(dāng)手中拿著數(shù)十個故障診斷工具,原始命令熟記于心的時候,在這些特殊網(wǎng)絡(luò)故障面前,如果只給你2分鐘怎么辦?
某公司網(wǎng)絡(luò)與上級公司網(wǎng)絡(luò),每隔兩個小時就會斷開兩分鐘,之后又會自動恢復(fù)正常。同時,由于這套網(wǎng)絡(luò)系統(tǒng)涉及到廣域網(wǎng)絡(luò),跨越的節(jié)點非常多,且數(shù)十套業(yè)務(wù)流量也跑在里面,理論上講,可能的故障點非常多,很長一段時間,用戶都束手無策。進(jìn)而,公司請來了“高手”,但留給運(yùn)維大師捕捉故障的時間段很短,2小時等待,再加上2分鐘的破案時限,面對這個十分奇怪的現(xiàn)象,即使這位高手擁有十多年的運(yùn)維經(jīng)驗,最后也只能卑躬臣服。
求醫(yī)無果,最后,這家企業(yè)決定尋求專業(yè)運(yùn)維廠商的支持。在采用北塔軟件的北塔BTIM后,通過北塔BTIM的物理拓?fù)鋱D發(fā)現(xiàn)某臺路由器異常,再通過BTIM抓獲嫌犯,察看該設(shè)備的歷史記錄,發(fā)現(xiàn)該路由器的2M端口每隔兩個小時就會自動DOWN掉,然后再重新啟動,重啟的時間剛好就是兩分鐘左右。在定位了故障設(shè)備后,對其進(jìn)行針對性的分析,發(fā)現(xiàn)是由光端機(jī)和該路由器之間的時鐘不同步引起的,由此成功地解決了該問題。
在我們崇尚的ITIL參考讀物中,“故障管理”的目標(biāo)就是將 IT 基礎(chǔ)設(shè)施錯誤引起的事故和問題對業(yè)務(wù)的負(fù)面影響減到最小,并防止與這些錯誤相關(guān)的事故再度發(fā)生。為了實現(xiàn)這個目標(biāo),“故障管理”力求第一時間找到引發(fā)事故的根源,并著手改善或糾正該情況。
北塔軟件認(rèn)為:IT運(yùn)維管理部門的真正價值并不是出現(xiàn)故障之后的處理,而是在故障發(fā)生前能夠準(zhǔn)確判斷,排除隱患,并避免故障的發(fā)生。所以,一個最能幫助企業(yè)有效對抗故障難題的方法,是建立主動性的發(fā)現(xiàn)機(jī)制和流程,可利用北塔BTIM等運(yùn)維管理軟件,首先實施全網(wǎng)范圍的基礎(chǔ)設(shè)施監(jiān)控,并對每次故障進(jìn)行“記錄、跟蹤、監(jiān)督和分析”。之后,便可限時完成受理、派工、處理、反饋和回訪,將服務(wù)過程按流程自動化、規(guī)范化和標(biāo)準(zhǔn)化運(yùn)作起來。
在IT運(yùn)維管理中,我們決不能低估人的價值,但完全依賴個人經(jīng)驗,就很難讓IT運(yùn)維服務(wù)水平再上一個臺階。反之,利用IT運(yùn)維管理軟件,將有價值的維修方法、故障排除的方案和經(jīng)驗知識,統(tǒng)一納入知識庫,日積月累后,便建成了IT運(yùn)維部門“百科全書”。這種良性的循環(huán),既能發(fā)揮核心人員的故障排查經(jīng)驗,又能幫助監(jiān)控或值班工程師快速找到解決辦法,提高服務(wù)的及時率,從而構(gòu)建一個超越現(xiàn)在的運(yùn)維團(tuán)隊。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.