當下,大數據是一個熱門的話題,很多領域的學者,從不同的角度進行瞭深入的討論。《品味大數據》從大數據的曆史、內涵、哲學和技術四個角度,全麵解析大數據,讓讀者對大數據有更深入的瞭解。
全書共11章,大緻分為4塊:第1-3章主要漫談瞭大數據的有趣的曆史,包括數據的啓濛、信息載體的演變和數據管理的發展脈絡。第4-6章主要聊聊大數據的內涵,包括大數據與哲學及第四科學範式的關聯。第7-9張是大數據的雜談,包括大數據的用途、可能麵臨的陷阱以及通過小故事對大數據進行一些反思,第10-11章主要涉及大數據的技術,包括100餘篇大數據論文的漫讀及Hadoop的初級實戰篇。
圖書結構完整,行文幽默,並以圖文並茂、通俗易懂的方式力圖讓讀者心有餘地品味大數據。圖書援引瞭數以百計大傢牛人的觀點,或褒或貶,高手過招,精彩紛呈,是一本不容讀者錯過的大數據圖書。
張玉宏 留美博士,曾跟隨導師Alok Choudhary教授參加瞭奧巴馬總統辦公室有關Big Data(大數據)研討會。
目錄
序 在路上,學而時習之 / 張玉宏
第一章 大數據簡史漫談之一——數字的來源及數據思維的發展
1.1 人類的“數覺”與計數係統
1.2 關於二進製的一點討論
1.3 數字的誕生與廣泛應用的匹配法
1.4 數學的“問世”與“算法”的祖師爺
1.5 文字的“齣爐”與羅馬語言的來曆
1.6 古代的數據保存之道與文言文的“無奈”精簡
1.7 古代的“數據中心”——圖書館
1.8 古代計算工具的誕生及其演變
1.9 統計學誕生——數據思維的漸起
1.10 美國式的人口普查——大數據催生新技術
1.11 中國式的人口統計與數目字管理
1.12 本章小結與思考
第二章 大數據簡史漫談之二——近代存儲體係發展中的那些人和事
2.1 數據復製與傳播中的問題及解決方案
2.2 影響人類發展進程的幾次能源革命
2.3 不能遺忘的電氣時代的傳奇——特斯拉
2.4 霍爾瑞斯的穿孔卡
2.5 現代通用計算機的奠基者——圖靈和馮·諾伊曼
2.6 波弗勞姆的磁帶發明
2.7 華人王安電腦的磁芯存儲器
2.8 IBM 的傳奇磁存儲世界
2.9 網絡存儲世界的興起
2.10 本章小結與思考
第三章 大數據簡史漫談之三——數據庫的發展與大數據的興起
3.1 近代“數據中心”之夢殤
3.2 “窮”則思變之網狀數據庫
3.3 濃墨重彩之關係數據庫
3.4 突破數據共享封鎖綫的領頭人
3.5 高手對決的數據倉庫領域兩俠客
3.6 嚮非結構化進發的數據大趨勢
3.7 大數據術語的曆史淵源
3.8 現代大數據的誕生
3.9 在混沌和秩序轉化中螺鏇上升
3.10 本章小結與思考
第四章 大數據的內涵
4.1 從數據、信息到知識、智慧的飛躍
4.2 大數據的多版本定義
4.3 大數據——新時代的生産資料
4.4 信息(數據)化、第二經濟與數據思維的轉變
4.5 大數據——來自學術界的青睞
4.6 大數據——來自政府層麵的重視
4.7 大數據——來自工商業的熱捧
4.8 大數據內涵——“豈止於大”
4.8.1 大數據之“大”有不同(Volume)
4.8.2 大數據之唯“快”不破(Velocity)
4.8.3 大數據之五彩繽紛(Variety)
4.8.4 大數據之價“值”無限(Value)
4.8.5 包括但不限於 4V
4.9 本章小結與思考
第五章 大數據時代的一點哲學思考
5.1 哲學與科學的關係——為什麼計算機專業博士也發個哲學文憑(Ph.D)
5.2 大、小數據的“質”不同
5.3 大數據的數理哲學基礎——同構關係
5.4 大數據認識主體的變化——“替人消災”式的認識能免責嗎
5.5 波普爾的世界 3——秦始皇的長生夢,找錯瞭空間
5.6 大數據認識對象的變化——提升普羅大眾的權重 :“長尾理論”
5.7 認識論對大數據研究的指導意義
5.7.1 科學始於觀察——證實主義
5.7.2 證實主義的睏頓——來自波普爾的批判
5.7.3 科學始於問題——波普爾的貢獻
5.7.4 科學始於數據——大數據時代的科學轉機與思考
5.7.5 大數據的悲觀思潮
5.8 本章小結與思考
第六章 大數據研究的第四範式
6.1 榖歌公司的“不務正業”
6.2 塞吉·布林的“秘密”病情
6.3 布林病情的“治療”方案
6.4 詹姆斯·格雷的科學第四範式
6.5 科學研究的其他三個範式
6.6 本章小結與思考
第七章 大數據,大有為
7.1 洞察帶來價值
7.2 案例 1 :榖歌是如何“越俎代庖”地預測流感的
7.2.1 流感治療網絡化
7.2.2 “無意間”生産的搜索數據
7.2.3 榖歌工程師們的傑作——流感預測趨勢(GFT)
7.2.4 榖歌的“越俎代庖”為何成功
7.2.5 案例小結 :數據、模型與理論
7.3 案例 2 :“全數據”是如何為葉詩文抱不平的
7.3.1 葉詩文事件的新聞背景
7.3.2 什麼是性能分析法
7.3.3 質疑的閤理性在哪裏
7.3.4 “大數據 = 全數據”的威力——為葉詩文抱不平
7.3.5 案例小結
7.4 案例 3 :大數據是如何對抗癌癥的
7.4.1 癌癥大數據的特徵是什麼
7.4.2 癌癥從哪裏來
7.4.3 大數據用之於癌癥鬥爭,挑戰何在
7.4.4 癌癥診療的基礎大數據——獲取難
7.4.5 數據化帶來的顛覆式醫療——執行難
7.4.6 哪些機構在用大數據對抗癌癥
7.4.7 癌癥大數據的重要源頭——基因組數據
7.4.8 大數據對抗癌癥,前景如何
7.4.9 案例小結
7.5 更多大數據應用案例
7.6 本章小結與思考
第八章 大數據之坑與小數據之美
8.1 引子——哪個 V 纔是大數據最重要的特徵
8.1.1 “大”有不同——Volume(大量)
8.1.2 數據共徵——Velocity(快速)與 Value(價值)
8.1.3 五彩繽“紛”——Variety(多樣)
8.2 大數據的力量與陷阱
8.2.1 大數據的力量
8.2.2 大數據的陷阱
8.2.3 今日王謝堂前燕,暫未飛入百姓傢——大數據還沒那麼普及
8.2.4 你若安好,便是晴天——小數據之美
8.3 本章小結與思考
第九章 12 個小故事,思考大數據
9.1 故事 1 :大數據都是騙人的啊——大數據預測得準嗎
9.2 故事 2 :顛簸的街道——對不起,“n=all”隻是一個幻覺
9.3 故事 3 :醉漢路燈下找鑰匙——大數據的研究方法可笑嗎
9.4 故事 4 :園中有金不在金——大數據的價值
9.5 故事 5 :蓋洛普抽樣的成功——大小之爭,“大”數據一定勝過小抽樣嗎
9.6 故事 6 :點球成金——數據流 PK 球探,誰更重要
9.7 故事 7 :啤酒和尿布——經典故事是僞造的,你知道嗎
9.8 故事 8 :榖歌流感預測——預測是如何失效的
9.9 故事 9 :Target 超市預測女孩懷孕——“大數據”智慧,還是愚蠢
9.10 故事 10 :你的一夜情我知道——大數據的隱私之痛
9.11 故事 11 :大數據,無須懼——比薩店員更能知道顧客所有的信息嗎
9.12 故事 12 :撲朔離迷的“因果關係”——蘇格拉底的“詭辯術”
9.13 本章小結與思考
第十章 大數據技術漫談——需要讀懂的 100 篇大數據文獻
10.1 大數據價值的實現
10.2 大數據分析的關鍵架構層
10.3 架構的演進
10.4 幾個重要的概念
10.5 文件係統層
10.6 數據存儲層
10.7 資源管理器層(Resource Managers)
10.8 調度器(Schedulers)
10.9 協調器(Coordination)
10.10 計算框架(Computational Frameworks)
10.11 數據分析層(Data Analysis)
10.12 數據集成層(Data Integration)
10.13 操作框架層(Operational Frameworks)
10.14 本章小結與思考
第十一章 牛刀小試之 Hadoop 實戰
11.1 什麼是 Hadoop
11.2 Hadoop 發展曆程
11.3 Hadoop 集群服務器的安裝與配置
11.3.1 安裝 CentOS 7
11.3.2 配置 Java 環境
11.3.3 啓動和配置 SSH 服務
11.3.4 安裝 Hadoop
11.3.5 啓動 Hadoop
11.4 運行 Hello World 版 Hadoop 程序——WordCount
11.5 全分布模式下的 Hadoop 集群構建
11.5.1 Linux 以運行等級 3 啓動
11.5.2 在 Windows 和 Mac OS 環境下剋隆虛擬機
11.5.3 設置靜態 IP 地址
11.5.4 修改 hosts 文件
11.5.5 虛擬機的同步配置
11.5.6 SSH 的免密碼登錄
11.5.7 全分布模式下安裝 Hadoop
11.5.8 同步配置文件
11.5.9 創建所需目錄
11.5.10 關閉防火牆
11.5.11 格式化文件係統
11.5.12 啓動 Hadoop 守護進程
11.5.13 驗證全分布模式
11.5.14 默認配置文件所在位置
11.5.15 關閉 Hadoop
11.5.16 Hadoop 的運行錯誤查找
11.6 WordCount 代碼詳解
11.6.1 MapReduce 編程模型
11.6.2 WordCount 的 MapReduce 處理流程
11.6.3 WordCount 源碼解讀
11.7 本章小結與思考
後 記
這本書給我最深刻的印象,莫過於它對於“品味”這個詞的獨特解讀。我原以為“品味大數據”會是一本純粹的技術指南,講解各種算法模型和工具的使用。然而,讀完之後,我發現它遠不止於此。作者似乎想傳遞一種“數據思維”的哲學,一種如何用更敏銳的眼光去審視和理解數據背後的故事。書中不僅僅是羅列數據,更側重於如何從看似雜亂無章的數據洪流中,提煉齣有價值的信息,發現那些隱藏在錶象之下的規律和聯係。我尤其喜歡其中關於“數據洞察”的章節,作者用瞭很多生動的比喻,比如將數據比作“土壤”,將分析師比作“農夫”,將洞察比作“收獲的果實”。這種形象的描述,讓原本抽象的概念變得鮮活起來。在閱讀過程中,我常常會停下來,迴味書中的觀點,思考自己的工作和生活中,是否有被忽略的數據信號。這本書讓我意識到,真正的“品味”大數據,不僅僅在於技術手段的嫻熟,更在於一種對數據的敏感度,一種從數據中發現美、發現價值的能力。它像一位經驗豐富的嚮導,引領我在數據世界的叢林中,找到前行的方嚮。
評分坦白說,我一開始對這本書抱有的期待,是希望能找到一些可以直接應用到工作中的實操技巧,比如如何搭建數據倉庫,或者如何運用某種特定的分析工具。而《品味大數據》這本書,確實也在一定程度上滿足瞭我的需求,但它的價值遠不止於此。它提供瞭一個非常全麵的視角,讓我看到瞭大數據在不同行業、不同領域是如何發揮作用的,從金融風控到醫療健康,從市場營銷到內容創作,幾乎涵蓋瞭我們生活的方方麵麵。我印象最深的是關於“數據驅動決策”的部分,書中詳細闡述瞭企業如何建立一套科學的數據分析體係,如何將數據分析的結果有效地轉化為商業策略。這對於我來說,非常有藉鑒意義。而且,書中的語言風格比較輕鬆,沒有那種學術論文的生硬感,讀起來非常流暢。作者在舉例的時候,也盡量選取瞭讀者容易理解的場景,並且會追溯到最初的數據采集和處理過程,讓我們清楚地知道,每一個分析結果的背後,都有著嚴謹的邏輯鏈條。讀完之後,我感覺自己的視野被極大地拓寬瞭,對大數據的認知也從“是什麼”提升到瞭“怎麼用”和“為什麼這麼用”的層麵。
評分這本書給我帶來的最大衝擊,是它對於“數據倫理”的深度探討。在如今這個信息爆炸、數據泛濫的時代,我們常常聽到關於數據隱私泄露、算法歧視等負麵新聞。《品味大數據》這本書,並沒有迴避這些敏感話題,而是選擇正麵應對,並給齣瞭自己獨到的見解。它詳細分析瞭大數據在應用過程中可能帶來的倫理睏境,例如如何平衡數據收集與用戶隱私,如何避免算法中的偏見,以及如何確保數據使用的公平性和透明度。作者在書中提齣瞭一些非常具有建設性的觀點,比如構建負責任的數據使用框架,加強數據倫理教育等,這些都讓我受益匪淺。讀到這部分內容時,我常常會陷入沉思,思考作為信息時代的個體,我們應該如何保護自己的數據權益,同時也要認識到數據在推動社會進步中的積極作用。這本書讓我明白,技術的發展固然重要,但與之相伴而生的倫理問題,同樣不容忽視。它不僅僅是一本關於大數據的科普讀物,更是一本關於如何在數據時代保持理性、負責任的思考指南,讓我對這個時代有瞭更深刻的理解和敬畏。
評分這本書最大的特點,我認為在於它對“用戶體驗”的關注。在很多關於大數據的討論中,往往聚焦於技術本身,而這本書則將視角巧妙地轉嚮瞭大數據如何影響和改善我們的生活體驗。它讓我明白瞭,我們每天接觸到的各種APP、網站,背後都在悄悄地收集和分析著我們的行為數據,而這些數據,最終的目的都是為瞭提供更個性化、更便捷的服務。書中的一些案例,比如推薦係統是如何學習我們的喜好,個性化廣告是如何精準投放,甚至是智能傢居是如何根據我們的習慣自動調整設置,都讓我感到非常驚嘆。作者用一種非常貼近生活的方式,揭示瞭大數據在我們日常生活中的“幕後故事”。這讓我對周圍的技術應用有瞭更深刻的理解,也開始重新審視自己的數據隱私。更重要的是,這本書讓我看到瞭大數據不僅僅是冰冷的算法,更是連接人與技術,人與人之間的一種全新的溝通方式。它讓我覺得,大數據並非遙不可及,而是與我們每個人息息相關,甚至在潛移默化中塑造著我們的生活方式。
評分這本書的封麵設計就透著一股子沉穩大氣,厚重的質感讓人忍不住想翻開一探究竟。我一直對數據分析和可視化有著濃厚的興趣,但總覺得理論知識有些枯燥,不夠接地氣。《品味大數據》這本書,從我拿到它開始,就給我帶來瞭驚喜。它沒有那種高高在上的說教感,而是用一種非常親切、甚至可以說是“分享”的方式,把大數據這個看似高深的概念,一層層剝開,展現齣它在日常生活和商業應用中的真實模樣。書中的案例分析非常紮實,不是那種停留在錶麵的“大數據能做什麼”的泛泛而談,而是深入到具體場景,比如如何通過用戶行為分析優化電商平颱的推薦算法,如何利用社交媒體數據洞察市場趨勢,甚至是如何在城市管理中運用大數據提升效率。作者在講述這些案例的時候,語言通俗易懂,即使是對大數據完全沒有基礎的讀者,也能很快理解其中的邏輯。而且,書裏穿插的一些關於數據倫理和隱私保護的討論,也讓我受益匪淺,這在當前信息爆炸的時代,顯得尤為重要。總而言之,這本書給我最大的感受就是“實用”和“啓發”,它讓我看到瞭大數據不僅僅是冰冷的數字,更是連接人、連接世界,甚至改變生活的一股強大力量。
評分還可以吧……………………………………………………
評分很不錯啊不錯不錯不錯不錯不錯
評分很不錯啊不錯不錯不錯不錯不錯
評分就是太慢瞭,等瞭十幾天,東西印刷質量不錯
評分漲知識瞭,還好啦,大數據哲學部分,相比於其它大數據圖書,個人覺得最有特色!技術講的少瞭點!總體來說,不錯,好評吧!
評分很不錯啊不錯不錯不錯不錯不錯
評分沒意思
評分一般很少評價,書還是不錯的,少的那一分是賣傢的鍋,拿到一本二手書
評分書城看到,很好,618趁機買瞭。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有