一直以來,儲存和備份是兩個相近的概念,但又有很大差別的。如果不是專業的技術專家,是比較難搞清楚這兩者之間差別,特別是雲的出現,這兩個概念往往容易混在一起看。那麼備份與儲存的差異有哪些呢?
備份是不能獨立資料容器存在,永遠建構在儲存之上(推薦學習:PHP影片教學)
儲存是資料保存容器的統稱,例如軟碟,光碟,磁碟,磁碟陣列,中小規模業務用的NAS,專業的磁帶庫,專業的光纖儲存網路SAN。儲存容量從幾MB,到上100TB,甚至P級。近幾年出現新的一種方案,雲端存儲,其本身也分為個人用途和企業用途的。個人資料儲存用途如百度網盤, 360網盤,DropBox等,通稱保存個人的一些資圖片,文檔等;企業用途的如AWS的S3, 阿里雲的OSS,以及七牛雲存儲,又拍雲,金山雲的雲端儲存等,通常用於關鍵業務系統,例如用戶產生的文檔,圖片,視訊等資料儲存。雲端儲存有個好處是可以動態擴充儲存空間,平台供應商由於採用低成本硬碟等方案,採用分散式技術,把本身廉價的硬碟聚集起來,建構成1個具備較高可靠性的儲存方案; 一些大平台,當具備規模效應後,平攤到用戶,TCO成本會低不少,這是傳統儲存方案比較軟肋的一個地方。
備份是一種資料保護的機制和方案,其實作必須依賴特定的儲存容器。目前在備份這塊的市場有非常多的品牌,如Symantec 的NBU ,CommVault的備份產品,IBM的TSM,EMC的NetWorker,還有專注混合雲端資料備份保護服務的多重備份。備份通常用於保護業務系統產生的核心資料或個人重要的資料。一般的備份系統,通常會與硬體儲存設備搭配組合成備份方案。多備份目前是構建在阿里雲存儲,AWS的S3,七牛,以及金山雲,百度雲等雲存儲之上,所有備份的數據會存儲在這些大存儲平台上。
儲存通常解決地理空間的存取問題;而備份解決地理空間上的冗餘保存問題
我們工作用的WORD軟體,如果沒有資料儲存介質,編輯產生的文件無法儲存,配上IDE或SATA硬碟後,應用軟體產生的資料可以很快地保存在硬碟上。這是一個簡單的硬碟儲存支援軟體工作的範例。一旦本地硬碟如果壞掉,努力工作一週的成功,可能得重新再來。
通常的重要業務系統架構設計的時候,會充分考慮儲存方案的構成,什麼樣的業務系統,在幾個位置,資料如何分佈,需要的容量,擴展需求等進行規劃設計,重點解決業務系統不斷增長的資料儲存問題。一般會就近業務應用伺服器來部署儲存架構。不管是雲端存儲,還是傳統的儲存架構,都有1個目標,讓業務系統,在不同的位置和儲存在空間上的存取是穩定連續進行的。
資料在一個地方始終是不可靠,機房斷電,線路故障,硬體故障,火災等,特別對於重要業務系統,如支付系統,一旦業務系統為了保持業務連續訪問,考慮到了多個地點的資料鏡像,就有一點備份的味道。雲端儲存目前在空間資料冗餘保存方面,一般也有做資料垮地區的冗餘保存,防止災難的發生。
備份在此基礎上,進一步封裝邏輯,對資料在不同的地方,可以訂製不同的複製策略。較重要的數據,通常可以在1個地方進行冗餘,例如用戶產生的日誌,圖片等可以冗餘1份;對於更關鍵的數據,如用戶註冊數據,數據存儲索引數據,交易數據,金融系統相關數據等,必要時多冗餘。雲端儲存的出現,使得基於雲端的備份方案,實現起來更加容易,輕易按需建置不同的地理位置的通道,只要你願意,資料備份到全球數十個地區的雲端儲存中心都可以。這一切可以用最簡單的手動複製方案,也可以用自動管理的方案,例如多備份等。
儲存通常解決連續資料讀寫,保存問題;備份解決時間版本凍結和回溯問題
保存1個word文檔,上傳完一部電影,修改一個帖子,發送1條微信訊息,這些要么被順序寫入硬碟,要么被寫入專業的資料庫或檔案系統。這是儲存典型的一個應用場景,就是不斷回應從業務或軟體發送的資料保存需求,文檔,電影,貼文最後只會有最新的一個狀態,歷史的狀態一直被最新的狀態覆蓋。
既然有新增,那就也有刪除,也有修改,所以儲存並不識別上層軟體的意圖,可能是正常,也可能是惡意入侵,或誤操作,新增和刪除同樣在底層會進行操作。部分儲存設計,帶有一定的備份復原能力,當然要想使用備份復原能力,可能比部署一套備份方案,來的成本會更大。我們都知道恢復一個硬碟的數據,通常得數上千塊,硬碟不值錢,但裡面的數據值錢。
解決新增,刪除,修改等有意無意的行為對資料儲存系統帶來的影響,這時候得專業功能-備份上場。備份系統最主要考慮的一個功能就是時間軸版本凍結與回溯。每次對儲存系統的備份,都會形成1個當前備份時刻的資料鏡像版本,恢復的時候就可以直接選擇對應的版本恢復,資料就回到從前那一時刻狀態。當然不同的產品實作備份方案不一樣,對於基於混合雲架構的多重備份來說,版本理論上可以一直保持下來,想怎麼恢復,就怎麼恢復。另外,不同的實現,鏡像的一致性結果不盡相同。對於一致性要求高的場景,版本可能會凍結寫入請求,例如資料庫備份直接加寫鎖,這時候對業務會有短時間影響;如果你說自己是土豪出得起價,需要對業務系統幾乎無幹擾,幾十上百萬無所謂,則可以購買比較牛的連續資料保護方案(CDP),如國外的飛康CDP。
儲存通常面向硬體故障為安全設計目標;備份解決軟硬體故障在內的多種因素引起的資料安全問題
在我們日常概念中,儲存就等於安全,特別是雲端運算概念出現後,包括週邊的一些技術高手也有類似看法,其實這是一個迷思。
從最常用的機械硬碟開始,通常圍繞著溫度,讀寫壽命,抗衝擊力等設計,一些硬碟在讀寫超過幾百TB後,就開始工作不正常,SSD硬碟在環境溫度變化,可能也會引起數據有效性變化。隨著儲存安全技術的加強,出現了冗餘整理的技術,把多塊硬碟進行聚合,資料寫入多塊硬碟;提高了單塊硬碟的可靠性。進入NAS,SAN等專用儲存解決方案後,透過冗餘陣列,通道冗餘,快照鏡像等技術,進一步提高了儲存容量和整個讀寫環節的可靠性。但這些都是圍繞硬體故障或儲存區域故障進行設計。雲端存儲,包括物件儲存和彈性塊存儲,核心設計目標仍是資料在硬體或儲存節點或區域系統出問題時候,有能力從其它節點恢復。
備份系統一個重要設計想法就是圍繞著復原設計。備份把資料從1個節點,一個系統複製到另一個節點,一個系統,規避了硬體、軟體在同一時期發生問題的可能性;備份系統通常會在資料儲存這裡增加高層次的冗餘配置,或冗餘複製,或低成本的算術冗餘資料分佈。備份系統透過時間版本化,空間冗餘分佈進一步規避了因為各種有意,無意的資料讀寫動作,包括人為操作,系統故障,軟體缺陷,駭客入侵,病毒,自然災難等,造成的資料遺失,新增,修改等問題。有些設計得比較好的方案,會輕鬆還原資料。即時在備份系統軟體出現問題,也能把資料透過一定的流程還原回去。多備份在業務系統出現問題後,甚至可以在選定資料庫表或某1個文件獨立恢復;如果資料採用混合雲模式,資料再TB級別,也可以在極度短暫的情況下恢復到業務系統中。
儲存通常以資料規模變」大」為美,而備份通常以最大程度把資料變「小」為美
這裡的變大,是指儲存解決的問題是如何儲存超大規模的資料。在我們日常話題中,通常溝通交流的是誰家的硬碟支援1TB,2TB,4TB等,業務系統支援多少用戶規模,產生了多少TB數據,資料庫儲存規模如何等,衡量一個儲存系統設計的是否好,就是在大規模資料下,系統反應良好,使用者感覺流暢。而支援這個目標,通常會說儲存伺服器支援的硬碟區塊數,單塊硬碟的容量,當然IO通道能力也是配套指標。
為了支援足夠的大,配上專門的儲存交換機,快速把大容量儲存陣列映射到不同的伺服器上;而資料集中儲存在SAN網路中,有的高達幾百TB甚至PB級別。即使這樣,支援壓縮的特性也能派上用場,特別龐大的資料量,對儲存的資料預設進行壓縮或去重,降低資料佔用空間。雲端儲存的出現,更是把容量推向了幾乎無限;單一雲端平台或準確受限於儲存機房區域的容量和區域的數量。由於動態擴容特性,當儲存網路不夠時,在IDC空間足夠的情況下,可以不斷增加節點完成儲存節點的增加。
通常當資料夠大,資料夠久的時候,資料就需要歸檔備份起來。而備份就是解決如何保持完整的資料同時,能更好的減低儲存開銷。所以,一般來說,由於備份會採取在原端去重,或儲存端全域去重等技術,保持最小的備份空間。同時包含壓縮等方案,也會自動在備份流程中引入。在傳統的實施方案中,由於要定期作全量,數據會變得很大,所以一般保留3個月,或半年,或按年做次全量等策略; 在快照模型下,由於產生的數據規模比較大,通常雲端主機對雲端磁碟採取的快照備份一般也保持幾個快照。傳統備份產品也有全增量策略,只是結合硬體儲存方案,使用和管理成本依然比較高; 多備份採取的全增量策略,優勢主要集中在混合雲索引增量模型,資料保持最小成長規模可靠儲存的同時,還可以保持更簡單的快速復原體驗,大規模資料備份非常省空間。
更多PHP相關技術文章,請造訪PHP圖文教學欄位進行學習!
以上是備份 儲存區別的詳細內容。更多資訊請關注PHP中文網其他相關文章!