云計算在RTO和RPO規(guī)劃中的作用
機房360 發(fā)表于:13年05月10日 11:00 [轉載] DOIT.com.cn
到2012年,平均每小時的停機成本增加到了9.8萬美元到13.8萬美元之間。盡管不同的企業(yè)可能所遭受到的停機時間所帶來的確切的影響和實際成本會有所不同,但最近的一系列的極端天氣事件,已然引發(fā)了許多企業(yè)開始更迫切要求進行業(yè)務連續(xù)性規(guī)劃(BCP)了。
應用程序的重要性與停機時間的成本
采用一種市場的方法,停機時間所帶來的影響可以通過應用程序的重要性來理解:關鍵任務和關鍵業(yè)務應用程序。如果關鍵任務應用程序發(fā)生中斷,不會產生企業(yè)喲營收,服務級別協議(SLA)被打破,而在客戶方面的損失幾乎是肯定的了。而關鍵業(yè)務應用程序發(fā)生故障則意味著企業(yè)員工生產力的下降,同時也動搖了客戶的信心,并有可能造成企業(yè)營收的損失。企業(yè)掌握停機成本是了解災難恢復的切入點。這同時也闡明了提供最佳的投資回報(ROI)的選項,以及災難恢復和保持業(yè)務連續(xù)性預算的具體金額大致應該是多少。
然而,盡管有了多種的技術選擇,但如果沒有關于RTO政策的準確定義,即使是最好的IT企業(yè)也可能難以在發(fā)生災難時區(qū)分哪些系統是最關鍵的。企業(yè)的各部門相關人員必須與IT部門聯合起來協同工作,必須提前確定明確的時間目標,以便在線恢復能夠快速進行。除了提供方向,設計RTO政策還將會給IT部門確定那些RTO目標的障礙的機會。
同樣,恢復點目標(RPO)有助于確定多少信息(包括從幾分鐘前的信息到傳統遺留的信息)必須被恢復。隨著企業(yè)所收集的數據量不斷變大,而且對于企業(yè)來說也更具價值,RPO窗口將只在兩個方向上繼續(xù)擴大,對于RPO政策,更多的歷史數據將被認為是重要的,因而,初始RPO點將越來越接近災難事件。
云基礎設施也可以提供調整恢復服務水平的能力(RSL)。RSL是一個百分比的測量(0-100%)方式,能夠測量出在災難發(fā)生時,生產系統所需要的計算能力百分比。例如,如果一個大型呼叫中心所收集的呼叫統計信息被洪水淹沒了,只需要有一小部分的生產能力。然而,如果是一家大型金融機構經歷相同的災難,則充分的生產能力將要求重新定位最終用戶到一個單獨的地理位置,并在維修期間,盡量減少對最終用戶的影響。從經濟學的角度來看,這兩個選項是完全不同的。
很多時候,當在進行業(yè)務連續(xù)性規(guī)劃目標的定義時,數據中心服務提供商往往聽到客戶要求即時恢復和零數據丟失。雖然這是不現實的,但從技術的角度來看,這是一個可以實現的目標,RTO和RPO都將顯著影響基礎設施、復制和備份策略,特別是頻率。然而,業(yè)務目標必須權衡成本,這就像一條拋物線型的增長,要求RTO和RPO是下降的。
數據中心和數據中心服務提供商可能會發(fā)現他們的角色轉變越來越多。在Forrester最近的一份研究報告中,高級分析師Rachel Dines寫道:“超過三分之二的IT專業(yè)人士都是積極的RAAS采用者,或至少對于實施基于云的恢復即服務(recovery-as-a-service,RAAS)感興趣。”
企業(yè)必須通過問自己當前是否有沒有虛擬化的系統;重新審視恢復服務水平是否有益的;或他們是否可以使用符合成本效益的公共云和混合云來承擔工作負載,以便能夠積極主動地提高他們的RTO和RPO政策。