| > 書名: | Python數據分析與挖掘實戰|4894338 |
| > 圖書定價: | 69元 |
| > 圖書作者: | 張良均;王路;譚立雲;蘇劍林 |
| > 齣版社: | 機械工業齣版社 |
| > 齣版日期: | 2016/1/1 0:00:00 |
| > ISBN號: | 9787111521235 |
| > 開本: | 16開 |
| > 頁數: | 335 |
| > 版次: | 1-1 |
| 作者簡介 |
| 張良均 資深大數據挖掘專傢和模式識彆專傢,高級信息項目管理師,有10多年的大數據挖掘應用、谘詢和培訓經驗。為電信、電力、政府、互聯網、生産製造、零售、銀行、生物、化工、醫藥等多個行業上百傢大型企業提供過數據挖掘應用與谘詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級應用開發,是廣東工業大學、華南師範大學、華南農業大學、貴州師範學院、韓山師範學院、廣東技術師範學院兼職教授,著有《神經網絡實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等暢銷書。 |
| 內容簡介 |
| 10餘位數據挖掘領域資深專傢和科研人員,10餘年大數據挖掘谘詢與實施經驗結晶。從數據挖掘的應用齣發,以電力、航空、醫療、互聯網、生産製造以及公共服務等行業真實案例為主綫,深入淺齣介紹Python數據挖掘建模過程,實踐性極強。 本書共15章,分兩個部分:基礎篇、實戰篇。基礎篇介紹瞭數據挖掘的基本原理,實戰篇介紹瞭一個個真實案例,通過對案例深入淺齣的剖析,使讀者在不知不覺中通過案例實踐獲得數據挖掘項目經驗,同時快速領悟看似難懂的數據挖掘理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模數據,藉助相關的數據挖掘建模工具,通過上機實驗,以快速理解相關知識與理論。 基礎篇(第1~5章),第1章的主要內容是數據挖掘概述;第2章對本書所用到的數據挖掘建模工具Python語言進行瞭簡明扼要的說明;第3章、第4章、第5章對數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用算法與原理進行瞭介紹。 實戰篇(第6~15章),重點對數據挖掘技術在電力、航空、醫療、互聯網、生産製造以及公共服務等行業的應用進行瞭分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最後完成模型構建的順序進行的,在建模過程的關鍵環節,穿插程序實現代碼。最後通過上機實踐,加深讀者對數據挖掘技術在案例應用中的理解。 |
| 目錄 |
前 言 基 礎 篇 第1章 數據挖掘基礎2 1.1 某知名連鎖餐飲企業的睏惑2 1.2 從餐飲服務到數據挖掘3 1.3 數據挖掘的基本任務4 1.4 數據挖掘建模過程4 1.4.1 定義挖掘目標4 1.4.2 數據取樣5 1.4.3 數據探索6 1.4.4 數據預處理7 1.4.5 挖掘建模7 1.4.6 模型評價7 1.5 常用的數據挖掘建模工具7 1.6 小結9 第2章 Python數據分析簡介10 2.1 搭建Python開發平颱12 2.1.1 所要考慮的問題12 2.1.2 基礎平颱的搭建12 2.2 Python使用入門13 2.2.1 運行方式14 2.2.2 基本命令15 2.2.3 數據結構17 2.2.4 庫的導入與添加20 2.3 Python數據分析工具22 2.3.1 Numpy23 2.3.2 Scipy24 2.3.3 Matplotlib24 2.3.4 Pandas26 2.3.5 StatsModels27 2.3.6 Scikit-Learn28 2.3.7 Keras29 2.3.8 Gensim30 2.4 配套資源使用設置31 2.5 小結32 第3章 數據探索33 3.1 數據質量分析33 3.1.1 缺失值分析34 3.1.2 異常值分析34 3.1.3 一緻性分析37 3.2 數據特徵分析37 3.2.1 分布分析37 3.2.2 對比分析40 3.2.3 統計量分析41 3.2.4 周期性分析44 3.2.5 貢獻度分析45 3.2.6 相關性分析47 3.3 Python主要數據探索函數50 3.3.1 基本統計特徵函數50 3.3.2 拓展統計特徵函數53 3.3.3 統計作圖函數54 3.4 小結59 第4章 數據預處理60 4.1 數據清洗60 4.1.1 缺失值處理60 4.1.2 異常值處理64 4.2 數據集成64 4.2.1 實體識彆64 4.2.2 冗餘屬性識彆65 4.3 數據變換65 4.3.1 簡單函數變換65 4.3.2 規範化66 4.3.3 連續屬性離散化68 4.3.4 屬性構造70 4.3.5 小波變換71 4.4 數據規約74 4.4.1 屬性規約74 4.4.2 數值規約77 4.5 Python主要數據預處理函數80 4.6 小結81 第5章 挖掘建模83 5.1 分類與預測83 5.1.1 實現過程83 5.1.2 常用的分類與預測算法84 5.1.3 迴歸分析85 5.1.4 決策樹89 5.1.5 人工神經網絡95 5.1.6 分類與預測算法評價100 5.1.7 Python分類預測模型特點103 5.2 聚類分析104 5.2.1 常用聚類分析算法104 5.2.2 K-Means聚類算法105 5.2.3 聚類分析算法評價111 5.2.4 Python主要聚類分析算法111 5.3 關聯規則113 5.3.1 常用關聯規則算法114 5.3.2 Apriori算法114 5.4 時序模式119 5.4.1 時間序列算法120 5.4.2 時間序列的預處理120 5.4.3 平穩時間序列分析122 5.4.4 非平穩時間序列分析124 5.4.5 Python主要時序模式算法132 5.5 離群點檢測134 5.5.1 離群點檢測方法135 5.5.2 基於模型的離群點檢測方法136 5.5.3 基於聚類的離群點檢測方法138 5.6 小結141 實 戰 篇 第6章 電力竊漏電用戶自動識彆144 6.1 背景與挖掘目標144 6.2 分析方法與過程147 6.2.1 數據抽取148 6.2.2 數據探索分析148 6.2.3 數據預處理151 6.2.4 構建專傢樣本156 6.2.5 模型構建157 6.3 上機實驗161 6.4 拓展思考162 6.5 小結163 第7章 航空公司客戶價值分析164 7.1 背景與挖掘目標164 7.2 分析方法與過程166 7.2.1 數據抽取168 7.2.2 數據探索分析168 7.2.3 數據預處理169 7.2.4 模型構建173 7.3 上機實驗177 7.4 拓展思考178 7.5 小結179 第8章 中醫證型關聯規則挖掘180 8.1 背景與挖掘目標180 8.2 分析方法與過程181 8.2.1 數據獲取183 8.2.2 數據預處理186 8.2.3 模型構建190 8.3 上機實驗193 8.4 拓展思考194 8.5 小結194 第9章 基於水色圖像的水質評價195 9.1 背景與挖掘目標195 9.2 分析方法與過程195 9.2.1 數據預處理197 9.2.2 模型構建199 9.2.3 水質評價201 9.3 上機實驗202 9.4 拓展思考202 9.5 小結203 第10章 傢用電器用戶行為分析與事件識彆204 10.1 背景與挖掘目標204 10.2 分析方法與過程205 10.2.1 數據抽取206 10.2.2 數據探索分析207 10.2.3 數據預處理207 10.2.4 模型構建217 10.2.5 模型檢驗219 10.3 上機實驗220 10.4 拓展思考221 10.5 小結222 第11章 應用係統負載分析與磁盤容量預測223 11.1 背景與挖掘目標223 11.2 分析方法與過程225 11.2.1 數據抽取226 11.2.2 數據探索分析226 11.2.3 數據預處理227 11.2.4 模型構建229 11.3 上機實驗235 11.4 拓展思考236 11.5 小結237 第12章 電子商務網站用戶行為分析及服務推薦238 12.1 背景與挖掘目標238 12.2 分析方法與過程240 12.2.1 數據抽取242 12.2.2 數據探索分析244 12.2.3 數據預處理251 12.2.4 模型構建256 12.3 上機實驗266 12.4 拓展思考267 12.5 小結269 第13章 財政收入影響因素分析及預測模型270 13.1 背景與挖掘目標270 13.2 分析方法與過程272 13.2.1 灰色預測與神經網絡的組閤模型273 13.2.2 數據探索分析274 13.2.3 模型構建277 13.3 上機實驗294 13.4 拓展思考295 13.5 小結296 第14章 基於基站定位數據的商圈分析297 14.1 背景與挖掘目標297 14.2 分析方法與過程299 14.2.1 數據抽取299 14.2.2 數據探索分析299 14.2.3 數據預處理301 14.2.4 模型構建304 14.3 上機實驗308 14.4 拓展思考309 14.5 小結309 第15章 電商産品評論數據情感分析310 15.1 背景與挖掘目標310 15.2 分析方法與過程310 15.2.1 評論數據采集311 15.2.2 評論預處理314 15.2.3 文本評論分詞320 15.2.4 模型構建320 15.3 上機實驗333 15.4 拓展思考334 15.5 小結335 參考文獻336 |
| 編輯推薦 |
| 10餘位數據挖掘領域專傢和科研人員,10餘年大數據挖掘谘詢與實施經驗結晶。 從數據挖掘的應用齣發,以電力、航空、醫療、互聯網、生産製造以及公共服務等行業真實案例為主綫,深入淺齣介紹Python數據挖掘建模過程,實踐性極強 |
我是一名經驗豐富的程序員,近期想拓展自己的技能棧,學習數據挖掘方麵的知識,所以選擇瞭這本書《Python數據分析與挖掘實戰》。坦白說,我一開始對純理論的書籍有些抵觸,更傾嚮於動手實踐。這本書在這方麵做得非常到位,它緊密結閤實際項目,用大量代碼示例來演示各種數據挖掘技術。從數據預處理到特徵工程,再到各種監督學習和無監督學習算法的應用,書中都提供瞭詳細的代碼實現和解釋。我尤其欣賞它在講解算法時,不僅僅是羅列公式,而是通過實際案例來展示算法的原理和應用場景。例如,在講解聚類算法時,它會用用戶畫像的例子來闡釋K-Means的應用,讓我能快速地理解算法的精髓。此外,書中還涉及瞭數據挖掘項目中的一些高級話題,如模型評估、參數調優、特徵選擇策略等,這些對於想要深入理解數據挖掘過程的開發者來說,是非常有價值的。這本書讓我能夠將Python的編程能力與數據挖掘技術相結閤,為我開闢瞭新的職業發展方嚮。
評分這本《Python數據分析與挖掘實戰》真的讓我眼前一亮。作為一個對數據分析充滿興趣但又剛入門的新手,我一直希望能找到一本既能係統講解理論,又能提供大量實操案例的書籍。這本書在這方麵做得非常齣色。它從Python基礎講起,循序漸進地介紹瞭數據清洗、數據可視化、特徵工程、機器學習算法等關鍵環節。我尤其喜歡它在每個章節都提供瞭詳細的代碼示例,而且這些代碼不僅能運行,還附帶瞭解釋,讓我能清楚地理解每一步操作的含義和背後的邏輯。書中使用的案例也非常貼近實際,涵蓋瞭用戶行為分析、商品推薦、金融風險預測等多個領域,這讓我能夠將學到的知識與現實世界的業務場景聯係起來,增加瞭學習的動力。書中的圖錶也畫得清晰明瞭,幫助我更好地理解復雜的數據模式和模型結果。總的來說,這本書為我打下瞭堅實的數據分析基礎,讓我對未來深入學習和應用數據科學充滿瞭信心。我不再害怕麵對龐大的數據集,也敢於嘗試使用各種工具和算法去挖掘數據背後的價值。
評分作為一名對互聯網行業充滿好奇的學生,我一直想瞭解數據在互聯網公司中是如何被使用的。這本書《Python數據分析與挖掘實戰》恰好滿足瞭我的需求。它用非常通俗易懂的語言,解釋瞭許多在互聯網公司裏常見的數據分析場景。比如,如何通過分析用戶點擊流數據來優化網站設計,如何利用用戶購買記錄來做精準營銷,如何識彆欺詐行為等。書中不僅提供瞭代碼,還對每一個步驟背後的商業邏輯做瞭深入的剖析,讓我不僅僅是學會瞭“怎麼做”,更理解瞭“為什麼要這樣做”。我特彆喜歡它關於數據可視化那一章,通過豐富的圖錶示例,我學會瞭如何用圖錶來講述數據故事,讓復雜的數據變得直觀易懂。而且,它介紹的爬蟲技術,也讓我對如何獲取互聯網上的公開數據有瞭初步的瞭解,這對於一些需要大量數據進行分析的項目來說,是非常有用的技能。這本書讓我看到瞭數據分析在互聯網領域的巨大潛力,也讓我對未來的職業發展有瞭更清晰的規劃。
評分我最近讀瞭這本《Python數據分析與挖掘實戰》,感覺它特彆適閤有一定編程基礎,但想在數據分析領域有所建樹的開發者。它並沒有停留在簡單的概念介紹,而是直接深入到實際操作層麵。書中對Pandas、NumPy、Matplotlib、Scikit-learn等常用庫的講解,都是圍繞實際應用展開的。比如,在處理缺失值和異常值時,它會介紹不同的策略,並給齣相應的Python代碼實現,讓你學會如何根據數據特性選擇最閤適的方法。在特徵工程部分,書中講解瞭如何進行特徵編碼、特徵選擇、特徵降維等,這些都是提升模型性能的關鍵步驟。而且,它還詳細介紹瞭多種機器學習算法,如綫性迴歸、邏輯迴歸、決策樹、隨機森林、支持嚮量機、K-Means聚類等,並提供瞭使用Scikit-learn庫來實現這些算法的範例。最讓我印象深刻的是,書中對於模型評估和調優的部分也講解得非常到位,讓我們能夠理解如何衡量模型的優劣,以及如何通過交叉驗證、網格搜索等方法來優化模型參數。這本書的內容非常充實,涵蓋瞭數據分析從數據獲取到模型部署的整個流程,是一本非常寶貴的實戰指南。
評分這本書《Python數據分析與挖掘實戰》給我帶來的最大價值在於它對於“實戰”二字的深刻詮釋。它不是一本停留在概念層麵、空泛地講解理論的書籍,而是真正地將讀者帶入到數據分析的實際操作中。從最基礎的數據加載、清洗、轉換,到中級的特徵工程、模型選擇,再到高級的模型評估與優化,書中每一個環節都提供瞭詳細的代碼和解釋。我個人最看重的是它在處理實際問題時的策略和方法。例如,在麵對不完整數據時,它會給齣多種填充策略的對比,並分析它們的優劣。在進行特徵選擇時,它會介紹不同的過濾法、包裹法和嵌入式方法,並給齣相應的代碼實現。書中大量的案例,覆蓋瞭文本分析、時間序列預測、用戶行為分析等多個領域,讓我能清晰地看到不同技術在實際應用中的效果。這種“學以緻用”的學習方式,極大地提升瞭我解決實際數據問題的能力,讓我能夠更自信地將所學應用於工作中。
評分快遞很給力,以後買書還來
評分很贊
評分書不錯,發票也寄過來瞭
評分發貨速度較慢 書整體質量ok
評分非常好啊,學習用的上
評分此用戶未填寫評價內容
評分非常好啊,學習用的上
評分書很新很滿意
評分很棒的書,實戰很好
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有