內容簡介
信息的管理和安全對於企業的成功至關重要,它已經發展成為一門高度成熟和復雜的IT支柱産業和學科。《信息存儲與管理(第2版):數字信息的存儲、管理和保護》是同名書籍的第二版,主要包括存儲係統的各個組件和不同存儲係統的模型,以及與“雲計算”相關的重要信息和新技術。
《信息存儲與管理(第2版):數字信息的存儲、管理和保護》所涵蓋的概念、原理和方案部署理念貫穿瞭整個信息存儲和管理技術的範疇。本書包含5個部分,包括新增的章節“雲計算”,主要闡述以下方麵的內容:重復數據刪除技術、虛擬資源調配、統一存儲、連續數據保護技術、FCoE、閃存、存儲分層、大數據、物理和虛擬環境下的業務連續性和安全,以及關於存儲模型(NAS、SAN)和基礎設施組件虛擬化存儲對象的詳細信息。
《信息存儲與管理(第2版):數字信息的存儲、管理和保護》適閤作為高校信息管理專業的教材或參考書,同時也非常適閤信息管理專業技術人員、IT經理人等專業人士閱讀參考。
內頁插圖
目錄
第1部分 存儲係統
第1章 信息存儲與管理的介紹
1.1 信息存儲
1.1.1 數據
1.1.2 數據類型
1.1.3 大數據
1.1.4 信息
1.1.5 存儲
1.2 存儲架構的發展
1.3 數據中心基礎設施
1.3.1 數據中心核心部件
1.3.2 數據中心的主要特點
1.3.3 管理數據中心
1.4 虛擬化和雲計算
小結
第2章 數據中心環境
2.1 應用
2.2 數據庫管理係統(DBMS)
2.3 主機(計算)
2.3.1 操作係統
2.3.2 設備驅動
2.3.3 捲管理器
2.3.4 文件係統
2.3.5 計算虛擬化
2.4 連接
2.4.1 連接的物理部件
2.4.2 接口協議
2.5 存儲
2.6 磁盤驅動部件
2.6.1 盤片
2.6.2 主軸
2.6.3 讀寫頭
2.6.4 驅動臂裝置
2.6.5 控製器
2.6.6 物理磁盤的結構
2.6.7 分區位記錄
2.6.8 邏輯塊尋址
2.7 磁盤驅動器的性能
2.7.1 磁盤服務時間
2.7.2 磁盤I/O控製器的利用率
2.8 主機對數據的訪問
2.9 直連存儲(direct-attached storage)
2.9.1 直連存儲的好處和局限
2.10 基於應用程序的需求和磁盤性能的存儲設計
2.11 磁盤原生命令排序(disk native command queuing)
2.12 閃存盤簡介
2.12.1 閃存盤的組件和架構
2.12.2 企業級閃存盤的特性
2.13 概念應用:VMware ESXi
小結
第3章 數據保護:RAID
3.1 RAID的實現方式
3.1.1 軟件RAID
3.1.2 硬件RAID
3.2 RAID陣列的組成
3.3 RAID技術
3.3.1 分條(Striping)
3.3.2 數據鏡像
3.3.3 奇偶校驗
3.4 RAID級彆
3.4.1 RAID0
3.4.2 RAID1
3.4.3 嵌套RAID
3.4.4 RAID3
3.4.5 RAID4
3.4.6 RAID5
3.4.7 RAID6
3.5 RAID對磁盤性能的影響
3.5.1 應用程序的IOPS與RAID配置
3.6 各種RAID的比較
3.7 熱備用
小結
第4章 智能存儲係統
4.1 智能存儲係統的組成部分
4.1.1 前端
4.1.2 高速緩存
4.1.3 後端
4.1.4 物理磁盤
4.2 存儲資源配給
4.2.1 傳統式存儲配給
4.2.2 虛擬式存儲配給
4.2.3 LUN屏蔽
4.3 智能存儲係統的類型
4.3.1 高端存儲陣列
4.3.2 中檔存儲陣列
4.4 概念實踐:EMC Symmetrix和VNX
4.4.1 Symmetrix存儲陣列
4.4.2 EMC Symmetrix VMAX組件
4.4.3 Symmetrix VMAX架構
小結
第2部分 存儲網絡技術
第5章 光縴通道存儲區域網絡
5.1 光縴通道:概覽
5.2 SAN及其演化
5.3 FC SAN組件
5.3.1 節點端口
5.3.2 綫纜與連接器
5.3.3 互連設備
5.3.4 SAN管理軟件
5.4 FC連接
5.4.1 點對點
5.4.2 光縴通道仲裁環
5.4.3 光縴通道交換fabric
5.5 交換fabric端口
5.6 光縴通道架構
5.6.1 光縴通道協議棧
5.6.2 光縴通道編址
5.6.3 萬維網名稱(WWN)
5.6.4 FC幀
5.6.5 FC數據的結構和組織
5.6.6 流量控製
5.6.7 服務類
5.7 Fabric服務
5.8 光縴通道登錄類型
5.9 分區
5.9.1 分區類型
5.10 FC SAN拓撲
5.10.1 Mesh拓撲
5.10.2 核心-邊緣Fabric
5.11 SAN環境下的虛擬化
5.11.1 塊級存儲虛擬化
5.11.2 虛擬SAN(VSAN)
5.12 概念實踐:EMC Connectrix和EMC VPLEX
5.12.1 EMC Connectrix
5.12.2 EMC VPLEX
小結
第6章 IP SAN和FCoE
6.1 iSCSI
6.1.1 iSCSI組件
6.1.2 iSCSI主機連接
6.1.3 iSCSI的連接拓撲
6.1.4 iSCSI協議棧
6.1.5 iSCSI PDU
6.1.6 iSCSI發現
6.1.7 iSCSI名稱
6.1.8 iSCSI會話
6.1.9 iSCSI命令排序
6.2 FCIP
6.2.1 FCIP協議棧
6.2.2 FCIP拓撲
6.2.3 FCIP的性能和安全
6.3 FCoE
6.3.1 FCoE的I/O閤並
6.3.2 FCoE網絡的組成
6.3.3 FCoE幀結構
6.3.4 FCoE的實現技術
小結
第7章 網絡連接存儲
7.1 通用服務器與NAS設備的對比
7.2 NAS的優勢
7.3 文件係統和網絡文件共享
7.3.1 文件係統訪問
7.3.2 網絡文件共享
7.4 NAS組件
7.5 NAS I/O操作
7.6 NAS實現
7.6.1 統一NAS
7.6.2 統一NAS的連接
7.6.3 網關式NAS
7.6.4 網關式NAS連接
7.6.5 橫嚮擴展式(Scale-out)NAS
7.6.6 橫嚮擴展式NAS連接
7.7 NAS文件共享協議
7.7.1 NFS
7.7.2 CIFS
7.8 影響NAS性能的因素
7.9 文件級虛擬化
7.10 概念實踐:EMC Isilon和EMC VNX Gateway
7.10.1 EMC Isilon
7.10.2 EMC VNX Gateway
小結
第8章 基於對象的存儲和統一存儲
8.1 基於對象的存儲設備
8.1.1 基於對象存儲的架構
8.1.2 OSD的組件
8.1.3 OSD係統中對象的存儲和獲取
8.1.4 基於對象存儲的優勢
8.1.5 基於對象存儲的常見用例
8.2 內容尋址存儲
8.3 CAS應用實例
8.3.1 醫療保健行業解決方案:病曆存儲
8.3.2 金融行業解決方案:財務數據存儲
8.4 統一存儲
8.4.1 統一存儲的組件
8.5 概念實踐:EMC Atmos,EMC VNX,以及EMC Centera
8.5.1 EMC Atmos
8.5.2 EMC VNX
8.5.3 EMC Centera
小結
第3部分 備份、歸檔和復製
第9章 業務連續性概述
9.1 信息可用性
9.1.1 信息不可用的因素
9.1.2 停機時間的後果
9.1.3 信息可用性度量
9.2 BC術語
9.3 BC計劃生命周期
9.4 故障分析
9.4.1 單點故障
9.4.2 解決單點故障
9.4.3 多通路軟件
9.5 業務影響分析
9.6 BC技術方案
9.7 概念實例:EMC PowerPath
9.7.1 PowerPath特性
9.7.2 動態負載平衡
9.7.3 自動通路失效切換
小結
第10章 備份和歸檔
10.1 備份目的
10.1.1 災難恢復
10.1.2 業務性恢復
10.1.3 歸檔
10.2 備份考慮
10.3 備份粒度
10.4 恢復考慮
10.5 備份方法
10.6 備份體係結構
10.7 備份和恢復操作
10.8 備份拓撲結構
10.9 NAS環境的備份
10.9.1 基於服務器備份和無服務器備份
10.9.2 基於網絡數據管理協議(NDMP)的備份
10.10 備份目標
10.10.1 備份到磁帶
10.10.2 備份到磁盤
10.10.3 備份到虛擬磁帶
10.11 備份數據去重
10.11.1 數據去重方法
10.11.2 數據去重的實現
10.12 虛擬環境下的備份
10.13 數據歸檔
10.14 歸檔方案體係結構
10.14.1 應用實例:電子郵件歸檔
10.14.2 應用實例:文件歸檔
10.15 概念實踐:EMC NetWorker,EMC Avamar和EMC Data Domain
10.15.1 EMC NetWorker
10.15.2 EMC Avamar
10.15.3 EMC Data Domain
小結
第11章 本地復製
11.1 復製術語
11.2 本地副本的用途
11.3 副本一緻性
11.3.1 復製文件係統的一緻性
11.3.2 復製數據庫的一緻性
11.4 本地復製技術
11.4.1 基於主機的本地復製
11.4.2 基於存儲陣列的復製
11.4.3 基於網絡的本地復製
11.5 跟蹤源和目標的修改
11.6 恢復和重啓的考慮
11.7 創建多個副本
11.8 虛擬環境中的本地復製
11.9 概念實踐:EMC TimeFinder、EMC SnapView和EMC RecoverPoint
11.9.1 EMC TimeFinder
11.9.2 EMC SnapView
11.9.3 EMC RecoverPoint
小結
第12章 遠程復製
12.1 遠程復製模式
12.2 遠程復製技術
12.2.1 基於主機的遠程復製
12.2.2 基於陣列的遠程復製
12.2.3 基於網絡的遠程復製
12.3 三站點復製
12.3.1 三站點復製——級聯/多跳
12.3.2 三站點復製——三角/多目標
12.4 數據遷移方案
12.5 虛擬環境中遠程復製和遷移
12.6 概念實踐:EMC SRDF、EMC MirrorView和EMCRecoverPoint
12.6.1 EMC SRDF
12.6.2 EMC MirrorView
12.6.3 EMC RecoverPoint
小結
第4部分 雲計算
第13章 雲計算
13.1 雲計算的關鍵技術
13.2 雲計算的特點
13.3 雲計算的優勢
13.4 雲服務模式
13.4.1 基礎設施即服務
13.4.2 平颱即服務(PaaS)
13.4.3 軟件即服務(SaaS)
13.5 雲計算的實施模型
13.5.1 公有雲
13.5.2 私有雲
13.5.3 社區雲
13.5.4 混閤雲
13.6 雲計算平颱
13.6.1 物理架構
13.6.2 虛擬架構
13.6.3 應用和平颱軟件
13.6.4 雲管理和服務創建工具
13.7 雲計算麵臨的挑戰
13.7.1 用戶麵臨的挑戰
13.7.2 提供商麵臨的挑戰
13.8 采用雲計算時需要考慮的問題
13.9 概念實踐:Vblock
小結
第5部分 存儲基礎設施的安全與管理
第14章 確保存儲基礎設施安全
14.1 信息安全框架
14.2 風險三元組
14.2.1 資産
14.2.2 威脅
14.2.3 漏洞
14.3 存儲安全域
14.3.1 保證應用程序訪問域的安全
14.3.2 保證管理訪問域的安全
14.3.3 保證備份、復製和存檔的安全
14.4 存儲網絡中安全措施的實施
14.4.1 FC SAN
14.4.2 NAS
14.4.3 IP SAN
14.5 保證虛擬化和雲環境中存儲設施的安全
14.5.1 安全問題
14.5.2 安全措施
14.6 RSA和VMware安全産品
14.6.1 RSA SecurityID
14.6.2 RSA Identity and Access Management
14.6.3 RSA Data Protection Manager
14.6.4 VMware vShield
小結
第15章 管理存儲基礎設施
15.1 監測存儲基礎設施
15.1.1 監測的參數
15.1.2 組件監測
15.1.3 監測的實例
15.1.4 警報
15.2 存儲管理活動
15.2.1 可用性管理
15.2.2 容量管理
15.2.3 性能管理
15.2.4 安全性管理
15.2.5 報告
15.2.6 虛擬化環境下存儲基礎設施的管理
15.2.7 存儲管理事例
15.3 存儲基礎設施管理的挑戰
15.4 開發理想化的解決方案
15.4.1 存儲管理規範
15.4.2 企業管理平颱
15.5 信息生命周期管理
15.6 存儲分層
15.6.1 陣列內分層
15.6.2 陣列間分層
15.7 概念實踐:EMC基礎設施管理工具
15.7.1 EMC ControlCenter和ProSphere
15.7.2 EMC Unisphere
15.7.3 EMC Unified Infrastructure Manager(UIM)
小結
附錄A 應用的I/O屬性
附錄B 並行SCSI
附錄C SAN設計練習
附錄D 信息可用性練習
附錄E 用於遠程復製的網絡技術
附錄F 縮略語
附錄G 術語錶
前言/序言
探秘信息洪流:駕馭數字時代的知識寶藏 我們正身處一個信息爆炸的時代,數字信息如同潮水般湧來,以驚人的速度增長、更新與傳播。從浩瀚的互聯網內容、龐雜的企業數據,到珍貴的個人記憶,每一個比特、每一個字節都承載著價值,是連接過去、現在與未來的橋梁。然而,在這股洪流之下,我們是否真正掌握瞭駕馭信息的力量?我們是否能夠高效地存儲、有序地管理,並可靠地保護這些珍貴的數字資産? 本書並非僅僅是關於技術手冊的堆砌,而是邀您踏上一場深度探索數字信息生命周期的旅程。我們將一起剖析信息從誕生到消亡的每一個關鍵環節,揭示其背後蘊含的深刻原理與實際應用。無論您是希望優化個人數據管理,提升企業信息係統效能,還是對信息安全領域充滿好奇,本書都將為您提供一份全麵且富有洞察力的指南。 第一章:數字信息的基石——存儲的藝術與科學 在深入探討管理與保護之前,我們必須首先理解信息是如何被“安頓”下來的。本章將帶領您走進數字存儲的世界,從最基礎的比特和字節開始,層層遞進,揭示不同存儲介質的演變與特性。 從二進製到字節: 讓我們迴到信息的最原始形態。您將瞭解計算機如何理解和處理數據,以及比特、字節、韆字節、兆字節等基本單位的含義。我們將解析它們的物理實現方式,理解為何0和1能夠構成我們今天所見的一切數字內容。 存儲技術的進化史: 我們將迴顧磁帶、軟盤、硬盤驅動器(HDD)、固態驅動器(SSD)等主要存儲技術的誕生、發展與演變。瞭解它們各自的工作原理,包括磁性存儲、光盤存儲以及閃存技術。理解它們在速度、容量、成本、耐久性等方麵的權衡與差異,這將幫助您在實際應用中做齣更明智的選擇。 現代存儲的疆域: 隨著技術的發展,存儲的概念早已超越瞭物理介質。我們將深入探討分布式存儲的強大能力,理解網絡附加存儲(NAS)、存儲區域網絡(SAN)如何打破單體存儲的限製,實現海量數據的集中管理和高效訪問。 雲存儲的崛起與挑戰: 雲計算的浪潮深刻地改變瞭信息的存儲方式。本章將詳細解析雲存儲的架構、服務模式(如對象存儲、文件存儲、塊存儲),以及它為用戶帶來的便利性。同時,我們也必須審視雲存儲背後的安全性、隱私性以及數據主權等問題,培養辯證的看待視角。 性能與可靠性的考量: 存儲不僅僅是“放得下”,更要“取得到”,並且要“拿得穩”。我們將探討RAID(冗餘獨立磁盤陣列)等技術,理解它們如何通過組閤多塊硬盤來提升讀寫性能和數據冗餘度,從而增強數據的可靠性。對於需要高性能的場景,我們將介紹高速緩存(Cache)的工作原理及其對整體性能的影響。 歸檔與備份的策略: 並非所有數據都需要實時訪問。本章還將觸及冷存儲(Cold Storage)和歸檔(Archiving)的概念,探討如何以更低的成本存儲不常訪問但仍有價值的數據,並為長期保留和曆史追溯打下基礎。 第二章:信息脈絡的梳理——管理的智慧與實踐 存儲隻是信息的“容器”,而管理則是賦予信息生命力的“靈魂”。本章將聚焦於如何有效地組織、檢索、維護和利用海量數字信息,將其轉化為有價值的知識。 文件係統與目錄結構: 從操作係統的角度,我們將理解文件係統(如NTFS, ext4, APFS)如何組織和管理存儲設備上的文件。學習如何設計清晰、邏輯化的目錄結構,使信息易於查找和理解,避免“信息孤島”的産生。 元數據:信息的“身份證”: 什麼是元數據?它為何如此重要?本章將深入解析元數據的概念,包括描述性元數據(如文件名、創建日期、作者)、管理性元數據(如權限、所有者)和結構性元數據(如文件格式、分辨率)。學習如何有效地利用元數據來增強信息的檢索效率和管理能力。 數據庫的體係:結構化信息的樞紐: 對於大量結構化數據,數據庫是不可或缺的管理工具。我們將介紹關係型數據庫(RDBMS)的核心概念,如錶、記錄、字段、主鍵、外鍵,以及SQL語言的基本操作。同時,也將觸及NoSQL數據庫的多樣化模型,如鍵值存儲、文檔數據庫、圖數據庫,理解它們在應對不同數據類型和訪問模式時的優勢。 信息檢索的藝術: 找到所需信息是管理的核心目標。本章將探討不同的信息檢索技術,從傳統的關鍵詞搜索到更復雜的全文檢索、語義搜索。瞭解搜索引擎的原理,以及如何優化信息的“可搜索性”,使您在信息的海洋中能夠快速定位目標。 數據治理與生命周期管理: 隨著信息量的劇增,數據治理(Data Governance)的重要性日益凸顯。我們將探討如何建立一套完善的數據管理策略,包括數據質量控製、數據分類、數據生命周期管理(從創建、使用、歸檔到最終銷毀)。理解“數據為主綫,業務為導嚮”的管理理念。 版本控製與協同: 在團隊協作和軟件開發中,版本控製係統(如Git)是保障信息一緻性和可追溯性的關鍵。本章將介紹其核心概念,以及如何利用它來管理代碼、文檔和其他協作性項目,確保多人協同工作的順暢。 知識管理與信息組織: 如何將零散的信息整閤成有用的知識?我們將探討知識管理係統(KMS)的理念,以及如何通過分類、標簽、鏈接等方式,構建一個易於訪問和共享的知識庫。 第三章:數字堡壘的構築——保護的策略與技術 信息價值的體現,離不開其自身的安全與可靠。在本章,我們將深入探討如何構築堅不可摧的數字堡壘,確保信息資産免受各種威脅的侵擾。 數據安全威脅的圖譜: 瞭解您的敵人是保護的第一步。我們將分析各種數據安全威脅,包括惡意軟件(病毒、蠕蟲、勒索軟件)、網絡攻擊(DDoS、SQL注入、跨站腳本)、內部威脅(意外刪除、惡意竊取)以及自然災害(火災、水災)。 訪問控製與身份認證: 誰有權訪問什麼信息?訪問控製(Access Control)是信息保護的基礎。本章將講解身份認證(Authentication)(如密碼、多因素認證)與授權(Authorization)的機製,以及基於角色的訪問控製(RBAC)等模型,確保隻有閤法用戶纔能訪問相應的信息。 數據加密的奧秘: 加密(Encryption)是保護數據隱私和完整性的關鍵手段。我們將介紹對稱加密與非對稱加密的基本原理,以及公鑰基礎設施(PKI)在密鑰管理中的作用。理解何時何地需要對數據進行加密,例如靜態數據加密(Data at Rest Encryption)和傳輸中數據加密(Data in Transit Encryption)。 備份與災難恢復: 即使有嚴密的防護,意外仍有可能發生。備份(Backup)是數據恢復的生命綫。本章將詳細討論不同的備份策略(全量備份、增量備份、差異備份),備份介質的選擇,以及災難恢復(Disaster Recovery, DR)計劃的重要性。理解“3-2-1備份原則”的精髓,並學習如何構建一個有效的災備體係。 數據完整性與防篡改: 如何確保信息在存儲和傳輸過程中不被非法修改?我們將探討校驗和(Checksum)、哈希函數(Hash Function)等技術,理解它們如何驗證數據的完整性。對於區塊鏈等技術,我們將瞭解其如何通過分布式賬本實現數據的不可篡改。 安全審計與監控: 瞭解發生的一切是及時響應和改進的關鍵。本章將介紹安全審計(Security Auditing)的機製,如何記錄和分析用戶活動、係統事件,以及安全信息和事件管理(SIEM)係統在集中監控和告警中的作用。 法規遵從與隱私保護: 在數字化時代,各國紛紛齣颱嚴格的數據保護法規(如GDPR, CCPA)。本章將探討這些法規的核心要求,以及企業和個人如何通過技術和管理手段,確保信息處理過程符閤法律要求,保護用戶隱私。 物理安全與人員安全: 數字安全並非僅限於技術層麵。我們還將簡要探討物理安全(如數據中心的安全措施)和人員安全(如安全意識培訓)在整個信息保護體係中的協同作用。 本書將以深入淺齣的語言,結閤豐富的案例,為您解析信息存儲、管理與保護的方方麵麵。我們相信,掌握瞭這些知識,您將不再是被動的信息接收者,而是能夠主動駕馭數字洪流的掌舵者,讓信息真正成為您實現目標、創造價值的強大助力。讓我們一同開啓這段探索之旅,解鎖數字時代的無限可能。