日常生活中,我們經常看到各種類型的演習:防火、防洪及救治演習,即使在和平年代,也經常進行軍事演習。演習的好處頗多,能夠預演災難發(fā)生后的應對方案。
今年3月,在寧波世貿大樓發(fā)生了一場相當大的火災,調動了10個消防中隊、22輛消防車進行撲救,而整座大樓里的近萬人在20分鐘內被成功疏散,未造成人員傷亡。這是一個奇跡??這么大的火,又是在鬧市區(qū),來得如此突然,然而竟無一人傷亡,這一奇跡是怎么創(chuàng)造的?應該歸功于平時的消防演習。
所以,對于用戶重金構建的容災解決方案,是不是也應該經常進行演習呢?答案當然是肯定的,事實上,無論用戶采用了多么先進的容災解決方案,都無法確保在災難發(fā)生時的萬無一失。因為無論當初的容災方案設計得多么周密,在災難發(fā)生時都會有些地方考慮不到。演習的好處就在于能及時發(fā)現(xiàn)并排除隱患。業(yè)界在災難恢復演習方面提供了豐富的方案。比如,在大型機系統(tǒng)中,一般需要三套系統(tǒng)來保障業(yè)務運行,其中一套就是用來演習、測試使用的。為什么不能使用第二套來承擔演習任務呢?原因在于第二套系統(tǒng)時刻作為主系統(tǒng)的備份系統(tǒng),如果演習過程中發(fā)生一些故障,而此時主系統(tǒng)同時發(fā)生故障,那么就會造成災難。NetApp的FlexClone軟件提供了一種在線Clone(克?。┘夹g,它幾乎不多占用另外的空間便能夠生成額外的Clone,用戶可以使用Clone數據進行災難恢復演習。此外,賽門鐵克的Veritas Cluster Server軟件中包括災難襲擊之前進行準備、規(guī)劃和測試的工具,可以幫助用戶進行災難恢復演習。
在與用戶交流過程中,有用戶反映,盡管他們意識到了演習的必要性,但是,實際使用的運營系統(tǒng)使得他們根本不敢進行演習。他們認為,在三種級別的容災系統(tǒng)(數據級、設備級和系統(tǒng)級)中,只有系統(tǒng)級的容災方案才可以進行災難恢復演習嘗試,而對于大多數用戶來說,往往都不具備昂貴的系統(tǒng)級容災方案,因此無法進行演習。
然而事實并非如此,系統(tǒng)級的容災方案進行的是在線的災難恢復演習,而即使是數據級和設備級的容災方案,仍然可以進行相應程度的災難恢復演習。比如,設想在線的設備發(fā)生故障,其中的數據全部丟失,用戶可以演習如何將備份的數據恢復到其他位置。而按照某調查機構的統(tǒng)計,在使用磁帶系統(tǒng)恢復備份數據時,不能夠完全成功恢復的比率超過80%。
由此可見,災難恢復演習適用于每個用戶,只有敢于演習、經常演習,才能夠降低數據丟失的風險。