編輯推薦
國內外知名數據分析專傢、行業領袖聯袂推薦!
世界數據倉庫公司Teradata首席分析專傢Bill Franks傾力巨獻!
揭秘駕馭大數據的技術和方法,詮釋大數據專業分析之道!
抓住大數據!理解大數據!駕馭大數據!在大數據掘金浪潮中脫穎而齣!
你是否在大數據麵前猶豫、恐懼、不知所措?你是否無法說服你的老闆投入人力、財力、物力去進行大數據分析?你是否已經身處大數據中而依舊茫然?你是否在做瞭很多大數據分析後仍然無法發現新的商業價值和機會?
如何不再因循守舊,如何積極主動地去改變、探索、創新,如何在駕馭大數據的過程中遊刃有餘、成竹在胸?
答案就在《駕馭大數據》一書中!
《駕馭大數據》將會告訴你:
· 什麼是大數據?
· 目前有哪些大數據源?
· 這些大數據源有什麼價值?
· 有哪些技術和方法可以幫助我們駕馭大數據?
· 需要招聘什麼樣的分析師?
· 如何打造一支Super分析團隊?
· 什麼樣的文化氛圍纔能促進分析創新?
內容簡介
《駕馭大數據》為讀者提供瞭處理大數據和在你的企業中培養一種創新和發現的文化所需的工具、過程和方法,描繪瞭一個易於實施的行動計劃,以幫助你的企業發現新的商業機會,實現新的業務流程,並做齣更明智的決策。
本書主要介紹瞭如何駕馭大數據浪潮,並詳細地介紹瞭什麼是大數據,大數據為什麼重要,以及如何應用大數據。本書還從具體實用的角度,介紹瞭用於分析和操作大數據的工具、技術和方法;以及人纔和企業文化的角度,介紹瞭如何使分析專傢、分析團隊以及所需的分析原則更加高效,如何通過分析創新中心使得分析更加有創造力,以及如何改變分析文化。
《駕馭大數據》適於所有對數據、數據挖掘、數據分析感興趣的技術人員和決策者閱讀。
作者簡介
Bill Franks,是Teradata公司全球閤作夥伴計劃的首席分析專傢,他負責跟蹤研究分析領域的前端趨勢,幫助客戶理解Teradata和其分析閤作夥伴如何為客戶創造價值。Bill還負責管理Teradata與SAS閤作成立的業務分析創新中心,並專注於幫助客戶獲得創新分析能力。此外,Bill負責製定Teradata公司在高級分析領域的戰略與定位。
Bill是國際數據分析研究所的一名講師,國際數據分析研究所(International Institute for Analytics)是由分析領域專傢Tom Davenport成立的研究機構。Bill還是一名活躍的演講人和博客作者。
Bill一直專注於如何將復雜的分析轉化為業務人員可以理解的語言,並幫助企業更有效地使用這些分析成果。他曾服務於很多不同行業和公司規模的客戶,其中有財富前100強的大型企業,也有小型的非營利組織。
Bill擁有弗吉尼亞科技大學應用統計專業的學士學位,以及北卡羅來納州立大學應用統計專業的碩士學位。
精彩書評
“隨著信息技術的飛速發展,人類社會已進入一個數字信息時代。即時獲取和掌握信息的多少,己成為衡量一個國傢實力強弱的標誌。但一切信息,又隨不同需求者而定義為有益與否,而一切有益信息都是從海量數據中經過分析而生成的。海量數據又隨時間不斷産生,不斷流動、擴散,形成一股像海潮的大數據流。隻有經過對大數據的分析纔能形成各自需要的信息,纔能從信息中産生知識,纔能造就智慧型社會。本書作者就大數據興起及分析方法和技巧作齣瞭深入淺齣的錶述,在當前大數據熱潮中,值得一讀。”
——吳基傳 原國傢信息産業部部長
“信息技術的飛速發展,以及互聯網企業商業模式的不斷創新,使得全球數據量呈現齣幾何級數般的爆炸性增長,全球進入瞭大數據時代。紅樓夢中‘任憑弱水三韆,我隻取一瓢飲’,在浩瀚的信息海洋中,誰能夠更快速、更準確地獲取有價值的信息並充分利用,誰就能在大數據時代立於不敗之地,獲得成功。如何充分利用大數據、挖掘大數據所蘊含的價值,需要我們把握大數據的特點,積極探索海量數據存儲、實時數據處理、新型分析挖掘技術的應用,以及新的數據架構的設計等解決之道。本書對上述問題進行瞭深入探討,提齣瞭許多真知灼見,值得一讀。”
——王曉初 中國電信集團公司董事長
“大數據時代不以人的意誌而來。對此,不僅要認知和熟悉,更要學會駕馭與運用。與一般大數據書籍不同,本書聚焦如何在分析中凝煉數據價值、在運用中創造數據財富,發乎啓迪,止乎‘駕馭’,對於人們在大數據的浪潮中暢享更多精彩大有裨益。”
——常小兵 中國聯通集團公司董事長
“現代信息技術推動瞭大數據的發展,大數據給各行各業帶來瞭許多新的機會。麵對大數據的浪潮,人們關心如何去釆集和匯總海量的數據,人們更關心如何對采集到的數據進行係統性的分析,通過分析體現齣數據的價值,並在實際工作中得到充分的利用。本書很好地迴答瞭這些問題。”
——王建宙 原中國移動集團公司董事長
“大數據浪潮催生瞭一個新的産業,也催生瞭一本又一本關於大數據的新書。這一本由業內的技術先驅和行業領導者之一Teradata的專傢 Bill Franks 撰寫的著作,從豐富的實戰經驗中萃取齣大數據相關的若乾關鍵的概念,並給予瞭精確而易懂的解讀。它可以讓大數據的客戶、方案提供者、分析師們在短時間內通盤瞭解關於大數據的概念、主要技術、工具、方法和流程,快速走上決勝未來的大數據之路。”
——劉博 明博智創(北京)軟件技術有限責任公司董事長
“麵對大數據帶來的挑戰和機遇,科技和商業領袖都認識到大數據分析技術和實踐的優勢。完成這種煉數成金的思想轉變,領悟到洞察力的真正價值,將獲得驅動業務發展的無窮能量。本書不僅涵蓋駕馭大數據的技術、方法和流程,而且介紹瞭如何培養優秀的分析師及創新文化,專注於大數據鏈條中核心的分析和決策行動環節,是大數據時代每一位思想傢、技術精英和商業領袖必讀的書籍。”
——吳輔世 SAS賽仕軟件大中華區總裁
目錄
第一部分 大數據的興起
第1章 什麼是大數據,大數據為什麼重要
1.1 什麼是大數據
1.2 大數據中的“大”和“數據”哪個更重要
1.3 大數據有何不同
1.4 大數據為何是數量更多的、相同類型的傳統數據
1.5 大數據的風險
1.6 你為什麼需要駕馭大數據
1.7 大數據的結構
1.8 探索大數據
1.9 很多大數據其實並不重要
1.10 有效過濾大數據
1.11 將大數據和傳統數據混閤
1.12 對大數據標準的需求
1.13 今天的大數據將不再是明天的大數據
1.14 本章小結
第2章 網絡數據:原始的大數據
2.1 網絡數據概觀
2.1.1 你遺漏瞭什麼
2.1.2 想象各種可能性
2.1.3 一個全新的信息來源
2.1.4 應當收集什麼數據
2.1.5 關於隱私
2.2 網絡數據揭示瞭什麼
2.2.1 購物行為
2.2.2 顧客的購買路徑和偏好
2.2.3 研究行為
2.2.4 反饋行為
2.3 行動中的網絡數據
2.3.1 最優的推薦商品
2.3.2 流失模型
2.3.3 響應模型
2.3.4 顧客分類
2.3.5 評估廣告效果
2.4 本章小結
第3章 典型大數據源及其價值
3.1 汽車保險業:車載信息服務數據的價值
3.2 多個行業:文本數據的價值
3.3 多個行業:時間數據與位置數據的價值
3.4 零售製造業:RFID數據的價值
3.5 電力行業:智能電網數據的價值
3.6 博彩業:籌碼跟蹤數據的價值
3.7 工業發動機和設備:傳感器數據的價值
3.8 視頻遊戲:遙測數據的價值
3.9 電信業與其他行業:社交網絡數據的價值
3.10 本章小結
第二部分 駕馭大數據:技術、過程以及方法
第4章 分析可擴展性的演進
4.1 分析可擴展性的曆史
4.2 分析與數據環境的關聯性
4.3 海量並行處理係統
4.3.1 使用MPP係統進行數據準備與評分
4.3.2 使用MPP係統進行數據準備與評分小結
4.4 雲計算
4.4.1 公有雲
4.4.2 私有雲
4.4.3 雲計算小結
4.5 網格計算
4.6 MapReduce
4.6.1 MapReduce工作原理
4.6.2 MapReduce優缺點
4.6.3 MapReduce小結
4.7 這不是一個單選題
4.8 本章小結
第5章 分析流程的演進
5.1 分析沙箱
5.1.1 分析沙箱:定義與範圍
5.1.2 分析沙箱的好處
5.1.3 內部分析沙箱
5.1.4 外部分析沙箱
5.1.5 混閤式分析沙箱
5.1.6 不要僅僅使用數據,而要豐富數據
5.1.7 係統負載管理和容量規劃
5.2 什麼是分析數據集
5.2.1 兩種分析數據集
5.2.2 傳統的分析數據集
5.3 企業分析數據集
5.3.1 什麼時候創建企業分析數據集
5.3.2 企業分析數據集裏有什麼
5.3.3 邏輯結構與物理結構
5.3.4 更新企業分析數據集
5.3.5 匯總錶還是概要視圖
5.3.6 分享財富
5.4 嵌入式評分
5.4.1 嵌入式評分集成
5.4.2 模型與評分管理
5.5 本章小結
第6章 分析工具與方法的演進
6.1 分析方法的演進
6.1.1 組閤建模
6.1.2 簡易模型
6.1.3 文本分析
6.1.4 跟上分析方法的發展腳步
6.2 分析工具的演進
6.2.1 圖形化用戶界麵的崛起
6.2.2 單點解決方案的興起
6.2.3 開源的曆史
6.2.4 數據可視化的曆史
6.3 本章小結
第三部分 駕馭大數據:人和方法
第7章 如何提供優質分析
7.1 分析與報錶
7.1.1 報錶
7.1.2 分析
7.2 分析的G.R.E.A.T原則
7.2.1 導嚮性(Guided)
7.2.2 相關性(Relevant)
7.2.3 可解釋性(Explainable)
7.2.4 可行性(Actionable)
7.2.5 及時性(Timely)
7.3 核心分析方法與高級分析方法
7.4 堅持你的分析
7.5 正確地分析問題
7.6 統計顯著性與業務重要程度
7.6.1 統計顯著性
7.6.2 業務重要程度
7.7 樣本VS全體
7.8 業務推斷與統計計算
7.9 本章小結
第8章 如何成為優秀的分析專傢
8.1 哪些人是分析專傢
8.2 對分析專傢常見的誤解
8.3 每一位優秀的分析專傢都是獨特的
8.3.1 教育
8.3.2 行業經驗
8.3.3 當心“人力資源清單”
8.4 優秀分析專傢身上經常被低估的特質
8.4.1 承諾
8.4.2 創造力
8.4.3 商業頭腦
8.4.4 演講能力與溝通技巧
8.4.5 直覺
8.5 分析認證有意義嗎,還是乾擾視聽的噪音
8.6 本章小結
第9章 如何打造優秀的分析團隊
9.1 各個行業並非生而平等
9.2 行動起來
9.3 人纔緊縮
9.4 團隊組織結構
9.4.1 分布式組織結構
9.4.2 集中式組織結構
9.4.3 混閤式組織結構
9.5 持續更新團隊技能
9.5.1 矩陣式方法
9.5.2 管理人員不能眼高手低
9.6 應該由誰來做高級分析工作
9.6.1 前後矛盾的地方
9.6.2 如何幫助剛剛從事分析工作的新手茁壯成長
9.7 IT人員和分析專傢為何相處不好
9.8 本章小結
第四部分 整閤:分析文化
第10章 促進分析創新
10.1 商業需要更多創新
10.2 傳統的方法阻礙瞭創新
10.3 定義分析創新
10.4 在創新分析中使用迭代方法
10.5 考慮換個角度
10.6 你是否為建立分析創新中心做好瞭準備
10.6.1 組件1:技術平颱
10.6.2 組件2:第三方的産品和服務
10.6.3 組件3:承諾和支持
10.6.4 組件4:強大的團隊
10.6.5 組件5:創新委員會
10.6.6 分析創新中心的指導原則
10.6.7 分析創新中心的工作範圍
10.6.8 處理失敗
10.7 本章小結
第11章 營造創新和探索的文化氛圍
11.1 做好準備
11.1.1 Crocs和Jibbitz的傳說
11.1.2 推動創新
11.2 關鍵原則概述
11.2.1 原則1:打破思維定勢
11.2.2 原則2:形成連鎖反應
11.2.3 原則3:統一行動目標
11.3 本章小結
結論:再敢想一些
精彩書摘
使用傳感器數據
發動機的結構很復雜,有很多移動部件,必須在高溫下運轉,會經曆各種各樣的運轉狀況。因為它們的成本太高,所以期望壽命越長越好。因此,穩定的、可預測的性能就變得異常重要,因為機器的壽命依賴於此。例如,對故障飛機進行保養維修會花掉航空公司或者空軍部隊一筆不小的錢,但這種事情我們還必須做,因為我們要識彆齣飛機是否存在安全隱患。因此,飛機或者飛機發動機以及其他設備的停機時間一定要降到最低,航空公司或者空軍部隊對此都有非常迫切的需求。
停機時間最小化策略包括準備備件或後備發動機快速割接時需要維修的設備、從診斷結果中快速識彆需要更換的部件、針對問題部件投資開發更可靠的新版本。要想有效實施這3種策略,必須得有數據。我們要用數據生成診斷算法,或者用數據作為輸入來診斷某個特定的問題。工程部門可以使用傳感器數據準確地定位問題的原因,設計新的措施支持更長、更可靠的操作。不管發動機是飛機的,還是船隻的,或者是陸地設備的,這些考慮因素都適用。
通過提取和分析詳細的發動機運轉數據,我們可以精確地定位那些會導緻立即失效的某些模式。然後我們就能識彆齣會降低發動機壽命的時間分段模式以及更加頻繁的維修。多個變量的排列組閤數目,特彆是一段時間內的排列組閤數目,使得這類數據分析活動變成瞭一項挑戰。這個過程不僅會涉及到大數據,就連隨之開發齣來的分析也會變得異常復雜和睏難。以下是我們可以研究的一些問題。
前言/序言
你收到一封郵件,郵件中提供瞭一套個人電腦的報價。而你幾個小時前剛剛在這傢零售商的網站上搜索過電腦的信息,似乎它們已經讀齣瞭你的想法……當你驅車前往這傢商店購買這套個人電腦時,你路過瞭一傢咖啡店,你看到瞭這傢咖啡店的一條摺扣信息。你獲知由於你剛來到這片區域,你可以在未來20分鍾內享受10%的摺扣……
在你享用咖啡的時候,你收到瞭一傢製造商關於某産品的道歉,而你昨天剛剛在你的Facebook主頁和這傢公司的網站上抱怨瞭它們的産品……
最後,當你迴到傢之後,你又收到瞭一條關於購買你最喜歡的在綫視頻遊戲升級裝備的信息。有瞭這些裝備,你纔能順利通過某些你曾經苦苦掙紮的關卡……
聽起來很瘋狂嗎?難道這些事情都是在很遠的未來纔發生的嗎?不,這些場景都是我們今天可能見到的!大數據、高級分析、大數據分析,似乎今天你已經逃脫不瞭這些術語瞭。無論在哪裏,你都會聽到人們在討論大數據和高級分析,看到關於它們的文章或是宣傳推銷它們。好瞭,現在你也可以將這本書加入關於它們的討論中瞭。
什麼是真實的,什麼是炒作?這些關注可能會使你懷疑大數據分析是一種炒作,而非真實的東西。盡管在過去的幾年曾經有不少被炒作的概念,然而就分析能力和處理海量數據而言,我們確實處在一個轉型的年代。如果你肯花一些時間來理清並過濾掉那些有時被媒體過分炒作的部分,你會發現大數據背後有一些非常真實和強大的東西。隨著時間的推移,大數據分析會使企業和消費者都獲益,而收益帶來的興奮和期待又會繼續引發更多的炒作。
大數據是下一波新數據源的浪潮,並會驅動分析在商業、政府及教育界的下一次革新。這些革新將有可能快速地改變企業審視它們自身業務的方式。大數據分析可以促成更加明智的決策,在某些情況下,促成這些決策的方式將明顯不同於今天。它帶來的很多洞察在今天看起來都像是在做夢。你會看到,徵服大數據的需求和一直以來徵服新數據源的需求在很大程度上是一緻的。然而,大數據的額外規模必須使用新的工具、技術、方法和流程。傳統的分析方法已經不再適用於新的環境,我們有必要使用高級分析將商業界帶入更高的層次。這就是這本書要講的內容。
“駕馭大數據”並不隻是本書的書名,而是下一個十年中,決定哪些商業活動將振興,而哪些商業活動將消亡的決定性因素。準備主動接受大數據,企業可以通過駕馭大數據浪潮而取得成功,而不是遭受大數據浪潮連綿不斷的拍打。你需要瞭解些什麼?你如何為徵服大數據做準備?你如何從大數據中獲得振奮人心的分析結果?坐下來,找一個舒服的姿勢,準備好發現大數據的秘密!
讀者對象
這些年來有無數關於高級分析的書籍問世,最近也開始有關於大數據的書籍齣現。本書是從一個與其他書籍不同的角度來看大數據的,主要幫助讀者理解什麼是大數據,如何通過分析來利用大數據,以及在如今的大數據環境中,如何處理世界範圍內的高級分析生態係統的創新和變革。大部分讀者都將發現這本書有價值且充滿趣味。無論你是分析專傢,還是使用分析結果的商人,或者隻是對大數據和高級分析感興趣的人,這本書都有適閤你閱讀的內容。
本書並不會深入介紹它所涉及主題的技術細節。本書的技術高度剛剛能夠讓讀者從高層次來理解其所討論的概念。本書的目的是使讀者可以理解,並開始運用這些概念,以及幫助他們認識在哪些方麵還需要更加深入的研究。這本書更像是一本手冊而非教科書,完全可以被非技術人員理解和掌握。同時,那些對這些主題已經有深入瞭解的讀者,也可以從本書的一些討論中獲得一些技術方麵更深層次的啓示。
內容提要
本書由四部分組成,每一部分都從一個方麵來介紹如何駕馭大數據浪潮。第一部分將介紹什麼是大數據,大數據為什麼重要,以及如何應用大數據。第二部分集中介紹那些能夠用於分析和操作大數據的工具、技術和方法。第三部分介紹如何使分析專傢、分析團隊以及所需的分析原則更加高效。第四部分將前三部分結閤在一起,重點介紹瞭如何通過分析創新中心使得分析更加有創造力,以及如何改變分析文化。以下是關於各章節所涉及內容的詳細提綱。
第一部分 大數據的興起
第一部分重點介紹瞭什麼是大數據,大數據為什麼重要,以及分析大數據可以帶來什麼好處。本部分覆蓋瞭10種類型的大數據源,以及如何利用這些資源來幫助企業提高其業務水平。如果讀者拿起這本書時,還不知道什麼是大數據,以及大數據的應用有多麼廣泛,那麼第一部分會幫助你瞭解這部分內容。
第1章 什麼是大數據,大數據為什麼重要
本章首先介紹瞭大數據的背景知識,以及大數據到底是關於什麼的。然後給齣瞭一些企業如何利用大數據的案例。如果讀者想要幫助他們的企業駕馭大數據浪潮,那麼請首先理解本章所講的內容。
第2章 網絡數據:原始的大數據
如今,或許應用最為廣泛並為人們所熟知的大數據源是從互聯網網站上收集來的詳細數據。用戶瀏覽互聯網所産生的日誌信息,是等待分析和挖掘的信息寶庫。不同行業的企業都將從它們網站上收集到的詳細用戶信息整閤到它們的企業業務分析中。本章將探索這些數據將如何增強和改變一係列的商務決策。
駕馭大數據 [Taming The Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Anal epub pdf mobi txt 電子書 下載 2025
駕馭大數據 [Taming The Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Anal 下載 epub mobi pdf txt 電子書
駕馭大數據 [Taming The Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Anal mobi pdf epub txt 電子書 下載 2025
駕馭大數據 [Taming The Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Anal epub pdf mobi txt 電子書 下載 2025