災害與風險具有不可預測性,企業(yè)也難以每次準確捕捉到即將面臨的威脅。但通過以下七大步驟,你可以大幅提高商業(yè)持續(xù)性與容災恢復計劃的效率,增加自身的抵抗力。

  步驟1:認識威脅的存在

  商業(yè)持續(xù)性與容災恢復(BCDR)計劃的第一步首先是要認識到企業(yè)面臨著有形的威脅,并且會對公司資產(chǎn)構成損害。只有公司管理層意識到這一問題,以下的步驟才能順利展開。

  步驟2:列出并分類企業(yè)可能面臨的威脅

  商業(yè)、物理及社會環(huán)境都會影響到企業(yè)所面對的威脅種類。在列出威脅之后,應當根據(jù)它們對系統(tǒng)可能的影響予以分類。容災響應的成本應當視企業(yè)對系統(tǒng)恢復時間的要求而定?;謴蜁r間越快,響應成本就越高。有些關鍵系統(tǒng)必須在若干分鐘內(nèi)恢復運行,而有些可以當機幾個小時到幾天不等,也不會產(chǎn)生太大的影響。

  步驟3:規(guī)劃企業(yè)BCDR技術基礎架構

  BCDR基礎架構主要是由一座主數(shù)據(jù)中心、一個用來復制資源的遠程站點,和一條高速網(wǎng)絡連接所組成。最佳的BCDR戰(zhàn)略應當自始至終地貫穿“冗余”這個概念。大型機和服務器應當配備數(shù)據(jù)備份工具,這樣當任何組件遇到問題時,就能立即切換到本地備份作為第一道防線。在BCDR戰(zhàn)略中,供電穩(wěn)定性是一大關鍵。根據(jù)行業(yè)分析,供電中斷是最常見,也是最容易預防的威脅。

  此外,網(wǎng)絡部署如果缺乏審慎的規(guī)劃,也會變成一種負擔。因此網(wǎng)絡連接不僅要留有足夠的冗余,而且必須根據(jù)廣域網(wǎng)(WAN)拓撲中的不同路徑來防止某一威脅造成商業(yè)運營的中斷。

  步驟4:盤點企業(yè)IT資產(chǎn)

  在企業(yè)規(guī)劃完BCDR基礎架構拓撲后,下一步就要準確盤點其IT資產(chǎn)。這能讓企業(yè)了解自己有哪些資源與商業(yè)流程需要被保護。

  市面上有一系列的企業(yè)管理工具可以幫助公司制定并維護IT資源。這些工具廠商提供了軟件與模塊來掃描IT基礎架構,儲存硬件與軟件資產(chǎn)的詳細信息,以及它們在配置管理數(shù)據(jù)庫(CMDB)中的配置參數(shù)。

  步驟5:設置服務等級預期,定義恢復策略

  CMDB不僅儲存了企業(yè)硬件與軟件資產(chǎn)的詳細信息,同時也收集了服務等級協(xié)議信息,定義出這些IT資產(chǎn)的運行時間和恢復參數(shù)。如步驟二中所提到的,企業(yè)管理層對服務等級預期的認可至關重要,它決定了某項IT資產(chǎn)需要在多少時間范圍內(nèi)進行恢復,同時也直接影響了BCDR的預算開支。

  只有在明確的資產(chǎn)、配置和服務等級協(xié)議知識的基礎上,企業(yè)才可定義出突發(fā)情況恢復策略。這一策略必須得到管理層的支持,并將IT資產(chǎn)績效直接與商業(yè)要求關聯(lián)起來。要做到這一點,企業(yè)將需要執(zhí)行一套商業(yè)影響分析,獲取系統(tǒng)要求、流程和系統(tǒng)內(nèi)部關聯(lián)性的詳細信息。而管理人員也需要了解系統(tǒng)中斷所帶來的后果,以便對突發(fā)情況恢復策略提供充分的支持。

  步驟6:制定BCDR恢復計劃

  突發(fā)情況恢復計劃詳細定義了部門與個人在保持技術系統(tǒng)可用性方面的角色與責任,以及在發(fā)生緊急情況后恢復IT系統(tǒng)的流程。一份有效的計劃應當包括資源要求、培訓要求、培訓與測試的頻率、維護計劃,以及數(shù)據(jù)備份計劃等要素,并覆蓋從緊急情況發(fā)生時的通知,到處理團隊到位后的恢復措施,到最終恢復正常運行的所有流程。

  步驟7:測試BCDR恢復計劃

  專家認為,容災恢復計劃中最重要,但卻經(jīng)常被忽略的一個方面就是在制定了正式的策略和流程之后,沒有定期去測試它。恢復計劃必須接受持續(xù)的測試,以檢驗其效率與完善度,并根據(jù)IT基礎架構和商業(yè)流程的變化做出相應的調(diào)整。

  現(xiàn)實環(huán)境的復雜性或許無法讓企業(yè)規(guī)避每一次威脅,但是通過適當?shù)募夹g、明確的服務等級預期、務實的恢復策略、完善的恢復計劃,以及嚴格的測試機制,企業(yè)完全可以將災害所帶來的商業(yè)影響減少到最低。

責任編輯:admin