Python數據挖掘入門與實踐

Python數據挖掘入門與實踐 pdf epub mobi txt 電子書 下載 2025

[澳] Robert Layton 著,杜春曉 譯
圖書標籤:
  • Python
  • 數據挖掘
  • 機器學習
  • 數據分析
  • 入門
  • 實踐
  • 數據科學
  • 算法
  • 可視化
  • 案例
想要找書就要到 靜思書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
齣版社: 人民郵電齣版社
ISBN:9787115427106
版次:1
商品編碼:11982572
包裝:平裝
叢書名: 圖靈程序設計叢書
開本:16開
齣版時間:2016-07-01
用紙:膠版紙
頁數:236
正文語種:中文

具體描述

産品特色

編輯推薦

  在數據規模急速膨脹的大數據時代,數據挖掘這項甄彆重要數據的核心技術正發揮越來越重要的作用。它將賦予你解決實際問題的“超能力”:預測體育賽事結果、投放廣告、根據作品的風格解決作者歸屬問題,等等。
  本書使用簡單易學且擁有豐富第三方庫和良好社區氛圍的Python語言,由淺入深,以真實數據作為研究對象,真刀實槍地嚮讀者介紹Python數據挖掘的實現方法。通過本書,讀者將邁入數據挖掘的殿堂,透徹理解數據挖掘基礎知識,掌握解決數據挖掘實際問題的傑齣實踐!

內容簡介

  本書作為數據挖掘入門讀物,介紹瞭數據挖掘的基礎知識、基本工具和實踐方法,通過循序漸進地講解算法,帶你輕鬆踏上數據挖掘之旅。本書采用理論與實踐相結閤的方式,呈現瞭如何使用決策樹和隨機森林算法預測美國職業籃球聯賽比賽結果,如何使用親和性分析方法推薦電影,如何使用樸素貝葉斯算法進行社會媒體挖掘,等等。本書也涉及神經網絡、深度學習、大數據處理等內容。
  本書麵嚮願意學習和嘗試數據挖掘的程序員。

作者簡介

  Robert Layton,計算機科學博士,網絡犯罪問題和文本分析方麵的專傢。多年來一直熱衷於Python編程,參與過scikit-learn庫等很多開源庫的開發,曾擔任2014年度“榖歌編程之夏”項目導師。他曾與全球幾大數據挖掘公司密切閤作,挖掘真實數據並研發相關應用。他的公司dataPipeline為多個行業提供數據挖掘和數據分析解決方案。

目錄

第1章 開始數據挖掘之旅 1
1.1 數據挖掘簡介 1
1.2 使用Python 和IPython Notebook 2
1.2.1 安裝Python 2
1.2.2 安裝IPython 4
1.2.3 安裝scikit-learn 庫 5
1.3 親和性分析示例 5
1.3.1 什麼是親和性分析 5
1.3.2 商品推薦 6
1.3.3 在NumPy 中加載數據集 6
1.3.4 實現簡單的排序規則 8
1.3.5 排序找齣最佳規則 10
1.4 分類問題的簡單示例 12
1.5 什麼是分類 12
1.5.1 準備數據集 13
1.5.2 實現OneR 算法 14
1.5.3 測試算法 16
1.6 小結 18
第2章 用scikit-learn 估計器分類 19
2.1 scikit-learn 估計器 19
2.1.1 近鄰算法 20
2.1.2 距離度量 20
2.1.3 加載數據集 22
2.1.4 努力實現流程標準化 24
2.1.5 運行算法 24
2.1.6 設置參數 25
2.2 流水綫在預處理中的應用 27
2.2.1 預處理示例 28
2.2.2 標準預處理 28
2.2.3 組裝起來 29
2.3 流水綫 29
2.4 小結 30
第3章 用決策樹預測獲勝球隊 31
3.1 加載數據集 31
3.1.1 采集數據 31
3.1.2 用pandas 加載數據集 32
3.1.3 數據集清洗 33
3.1.4 提取新特徵 34
3.2 決策樹 35
3.2.1 決策樹中的參數 36
3.2.2 使用決策樹 37
3.3 NBA 比賽結果預測 37
3.4 隨機森林 41
3.4.1 決策樹的集成效果如何 42
3.4.2 隨機森林算法的參數 42
3.4.3 使用隨機森林算法 43
3.4.4 創建新特徵 44
3.5 小結 45
第4章 用親和性分析方法推薦電影 46
4.1 親和性分析 46
4.1.1 親和性分析算法 47
4.1.2 選擇參數 47
4.2 電影推薦問題 48
4.2.1 獲取數據集 48
4.2.2 用pandas 加載數據 49
4.2.3 稀疏數據格式 49
4.3 Apriori 算法的實現 50
4.3.1 Apriori 算法 51
4.3.2 實現 52
4.4 抽取關聯規則 54
4.5 小結 60
第5章 用轉換器抽取特徵 62
5.1 特徵抽取 62
5.1.1 在模型中錶示事實 62
5.1.2 通用的特徵創建模式 64
5.1.3 創建好的特徵 66
5.2 特徵選擇 67
5.3 創建特徵 71
5.4 創建自己的轉換器 75
5.4.1 轉換器API 76
5.4.2 實現細節 76
5.4.3 單元測試 77
5.4.4 組裝起來 79
5.5 小結 79
第6章 使用樸素貝葉斯進行社會
媒體挖掘 80
6.1 消歧 80
6.1.1 從社交網站下載數據 81
6.1.2 加載數據集並對其分類 83
6.1.3 Twitter 數據集重建 87
6.2 文本轉換器 90
6.2.1 詞袋 . 91
6.2.2 N 元語法 92
6.2.3 其他特徵 93
6.3 樸素貝葉斯 93
6.3.1 貝葉斯定理 93
6.3.2 樸素貝葉斯算法 94
6.3.3 算法應用示例 95
6.4 應用 96
6.4.1 抽取特徵 97
6.4.2 將字典轉換為矩陣 98
6.4.3 訓練樸素貝葉斯分類器 98
6.4.4 組裝起來 98
6.4.5 用F1 值評估 99
6.4.6 從模型中獲取更多有用的
特徵 100
6.5 小結 102
第7章 用圖挖掘找到感興趣的人 104
7.1 加載數據集 104
7.1.1 用現有模型進行分類 106
7.1.2 獲取Twitter 好友信息 107
7.1.3 構建網絡 110
7.1.4 創建圖 112
7.1.5 創建用戶相似度圖 114
7.2 尋找子圖 117
7.2.1 連通分支 117
7.2.2 優化參數選取準則 119
7.3 小結 123
第8章 用神經網絡破解驗證碼 124
8.1 人工神經網絡 124
8.2 創建數據集 127
8.2.1 繪製驗證碼 127
8.2.2 將圖像切分為單個的字母 129
8.2.3 創建訓練集 130
8.2.4 根據抽取方法調整訓練數據集 131
8.3 訓練和分類 132
8.3.1 反嚮傳播算法 134
8.3.2 預測單詞 135
8.4 用詞典提升正確率 138
8.4.1 尋找最相似的單詞 138
8.4.2 組裝起來 139
8.5 小結 140
第9章 作者歸屬問題 142
9.1 為作品找作者 142
9.1.1 相關應用和使用場景 143
9.1.2 作者歸屬 143
9.1.3 獲取數據 144
9.2 功能詞 147
9.2.1 統計功能詞 148
9.2.2 用功能詞進行分類 149
9.3 支持嚮量機 150
9.3.1 用SVM 分類 .......................... 151
9.3.2 內核 151
9.4 字符N 元語法 152
9.5 使用安然公司數據集 153
9.5.1 獲取安然數據集 153
9.5.2 創建數據集加載工具 154
9.5.3 組裝起來 158
9.5.4 評估 158
9.6 小結 160
第10章 新聞語料分類 161
10.1 獲取新聞文章 161
10.1.1 使用Web API 獲取數據 162
10.1.2 數據資源寶庫reddit 164
10.1.3 獲取數據 165
10.2 從任意網站抽取文本 167
10.2.1 尋找任意網站網頁中的主要
內容 167
10.2.2 組裝起來 168
10.3 新聞語料聚類 170
10.3.1 k-means 算法 171
10.3.2 評估結果 173
10.3.3 從簇中抽取主題信息 175
10.3.4 用聚類算法做轉換器 175
10.4 聚類融閤 176
10.4.1 證據纍積 176
10.4.2 工作原理 179
10.4.3 實現 180
10.5 綫上學習 181
10.5.1 綫上學習簡介 181
10.5.2 實現 182
10.6 小結 184
第11章 用深度學習方法為圖像中的
物體進行分類 185
11.1 物體分類 185
11.2 應用場景和目標 ................................ 185
11.3 深度神經網絡 189
11.3.1 直觀感受 189
11.3.2 實現 189
11.3.3 Theano 簡介 190
11.3.4 Lasagne 簡介 191
11.3.5 用nolearn 實現神經網絡 194
11.4 GPU 優化 197
11.4.1 什麼時候使用GPU 進行
計算 198
11.4.2 用GPU 運行代碼 198
11.5 環境搭建 199
11.6 應用 201
11.6.1 獲取數據 201
11.6.2 創建神經網絡 202
11.6.3 組裝起來 204
11.7 小結 205
第12章 大數據處理 206
12.1 大數據 206
12.2 大數據應用場景和目標 207
12.3 MapReduce 208
12.3.1 直觀理解 209
12.3.2 單詞統計示例 210
12.3.3 Hadoop MapReduce 212
12.4 應用 212
12.4.1 獲取數據 213
12.4.2 樸素貝葉斯預測 215
12.5 小結 226
附錄 接下來的方嚮 227

前言/序言


《算法的世界:揭秘數據背後的邏輯》 在信息爆炸的時代,數據無處不在,它們如同浩瀚的星辰,蘊含著未知的奧秘與無限的可能。然而,這些原始的數據片段,若不經過精心的雕琢與深邃的洞察,便如散落的珍珠,難以閃耀其真正的光芒。本書《算法的世界:揭秘數據背後的邏輯》將帶領讀者踏上一段探索數據奧秘的奇妙旅程,深入理解那些驅動我們現代生活、影響決策、塑造未來的“算法”——那些隱匿在代碼背後,卻擁有強大力量的邏輯序列。 本書並非一本枯燥的技術手冊,而是一次對“數據思維”的深入解讀。我們將從最基礎的概念齣發,逐步揭示支撐海量信息運轉的底層邏輯。算法,作為解決問題的係統化步驟,是連接原始數據與有價值洞察的橋梁。理解算法,就是理解數據如何被“講述”故事,如何被轉化為可操作的見解,從而為個人、企業乃至整個社會的發展提供指引。 第一章:數據思維的啓濛:從宏觀到微觀的視角轉換 在開始任何深入的探索之前,建立正確的“數據思維”至關重要。本章將從宏觀層麵,探討數據在我們生活中的滲透,以及數據驅動決策的時代特徵。我們將思考:為什麼數據如此重要?數據如何改變著我們的認知方式?從搜索引擎的個性化推薦,到醫療領域的精準診斷,再到金融市場的風險評估,數據的力量無處不在。 隨後,我們將視角微觀化,引入“算法”這一核心概念。什麼是算法?它不僅僅是電腦程序,更是解決問題的通用方法論。我們將通過一些生活化的例子,如食譜、導航路綫、排序邏輯,來類比算法的構成要素:輸入、處理步驟和輸齣。我們將強調算法的抽象性與普適性,為後續深入理解各種具體算法打下堅實基礎。這一章的目標是培養讀者對數據的敏感度,以及對算法解決問題能力的初步認知。 第二章:數據的語言:理解數據的本質與結構 在深入算法之前,我們必須先學會“讀懂”數據。本章將聚焦於數據的本質,探討不同類型的數據,以及它們是如何被組織和存儲的。我們將區分結構化數據(如數據庫中的錶格)、半結構化數據(如JSON、XML)和非結構化數據(如文本、圖像、音頻、視頻),並分析它們的特點和處理難點。 理解數據的結構是進行有效分析的前提。我們將介紹數據的基本單位——變量,以及變量的類型(分類變量、數值變量等)。我們將探討數據的度量方式,如比例、間隔、定序等,這些都將影響我們選擇閤適的分析方法。此外,我們還會觸及數據質量的重要性,包括數據的準確性、完整性、一緻性和時效性,並初步瞭解一些數據預處理的基本思想,例如缺失值處理和異常值檢測。本章旨在讓讀者對數據的“原材料”有清晰的認識,為後續的加工和提煉做好準備。 第三章:算法的基石:搜索、排序與查找的智慧 在掌握瞭數據的語言後,我們可以開始接觸一些最基礎、最核心的算法。本章將從最易於理解的算法類型入手,展示算法如何高效地處理數據。 我們將首先探討“搜索”算法。在海量數據中快速找到所需信息,是許多應用的基礎。我們將介紹綫性搜索和二分搜索等經典方法,並通過直觀的比較,理解它們的效率差異。我們將討論在何種數據結構下,哪種搜索算法更具優勢。 接著,我們將轉嚮“排序”算法。將數據按照特定規則重新排列,是數據分析和處理的常見需求。我們將深入講解冒泡排序、選擇排序、插入排序等簡單但富有啓發性的排序算法,並進一步介紹更高效的歸並排序和快速排序。通過對這些算法的剖析,讀者將能深刻理解“時間復雜度”和“空間復雜度”的概念,這些是衡量算法優劣的關鍵指標。 最後,我們將討論“查找”算法,它與搜索算法緊密相關,但更側重於在特定數據結構中定位元素。我們將介紹哈希錶等數據結構,以及基於它們的高效查找算法。本章的目的是讓讀者對算法的基本操作和效率分析有一個直觀的認識,為理解更復雜的算法建立信心。 第四章:模式的探索:分類與聚類的奧秘 數據中蘊含著各種各樣的模式,而識彆和利用這些模式是數據分析的核心目標之一。本章將聚焦於兩大類重要的算法:分類算法和聚類算法。 “分類”算法旨在將數據劃分到預定義的類彆中。我們將介紹一些經典的分類算法,例如決策樹,它能夠以直觀的方式解釋分類規則。我們將探討邏輯迴歸,理解它如何通過概率模型進行分類。我們將初步瞭解支持嚮量機(SVM),學習它如何尋找最優的分類邊界。在本章中,我們將強調“監督學習”的概念,即算法通過帶有標簽的數據進行訓練。 “聚類”算法則是在沒有預先定義類彆的情況下,自動將相似的數據點分組。我們將深入講解K-Means聚類算法,它通過迭代尋找數據簇的中心。我們將討論層次聚類,理解它如何構建數據點的層級關係。本章將引導讀者理解“無監督學習”的魅力,以及如何從無序的數據中發現隱藏的結構。通過分類和聚類,數據將不再是孤立的點,而是被組織成有意義的群體,為進一步的洞察提供基礎。 第五章:預測的藝術:迴歸與時間序列的展望 理解數據的過去,是為瞭更好地預測未來。本章將聚焦於“迴歸”算法和“時間序列”分析,它們是預測建模的兩大重要分支。 “迴歸”算法的目標是預測一個連續的數值型輸齣。我們將詳細講解綫性迴歸,理解它如何通過擬閤直綫來描述變量之間的關係。我們將探討多元綫性迴歸,以及如何處理多個預測變量。我們還將介紹一些非綫性迴歸的方法,為處理更復雜的數據關係提供工具。 “時間序列”分析則專注於具有時間順序的數據。我們將探討時間序列數據的獨特性質,例如趨勢、季節性和周期性。我們將介紹一些基礎的時間序列模型,例如移動平均和指數平滑,理解它們如何捕捉數據的動態變化。本章將為讀者打開預測的大門,讓他們瞭解如何利用曆史數據來預測未來的趨勢和數值。 第六章:關聯的發現:關聯規則挖掘與推薦係統的秘密 在許多商業場景中,發現數據項之間的關聯性至關重要。本章將深入探討“關聯規則挖掘”,以及它如何驅動“推薦係統”的運作。 “關聯規則挖掘”旨在發現數據集中頻繁齣現的項目組閤。我們將介紹Apriori算法,理解它如何高效地找齣頻繁項集,並從中生成有用的關聯規則,例如“購買瞭啤酒的顧客,也很可能購買尿布”。我們將討論支持度、置信度和提升度等評估關聯規則強度的指標。 基於關聯規則的思想,我們將進一步探討“推薦係統”的原理。從電商平颱的商品推薦,到影音平颱的影片推薦,再到社交媒體的內容推送,推薦係統已經深刻地改變瞭我們的信息獲取方式。我們將解釋基於內容的推薦、協同過濾等主流推薦策略,並分析它們的工作機製。本章將幫助讀者理解,那些看似“懂你”的推薦背後,其實是精心設計的算法在默默工作。 第七章:算法的實踐:從理論到應用的橋梁 理論的學習終究要迴歸實踐。本章將帶領讀者將前幾章學到的算法知識,應用於實際問題。雖然本書不深入具體的編程實現,但我們將強調“模型構建”和“模型評估”的重要性。 我們將討論如何選擇閤適的算法來解決特定的業務問題。我們將介紹模型訓練、參數調優和交叉驗證等關鍵概念,理解如何避免“過擬閤”和“欠擬閤”的問題。 此外,我們將探討模型評估的常用指標,例如準確率、精確率、召迴率、F1分數(針對分類問題),以及均方誤差、R²分數(針對迴歸問題)。通過這些指標,我們可以量化模型的性能,並對其進行優化。本章的目標是讓讀者理解,算法的價值在於其能否有效地解決實際問題,並學會如何衡量和提升算法的實用性。 第八章:算法的倫理與未來:負責任的數據應用 隨著算法在社會中扮演的角色越來越重要,我們也必須關注其潛在的倫理問題。本章將引導讀者思考算法的公平性、透明度和可解釋性。 我們將討論算法偏見可能帶來的不公平後果,例如在招聘、信貸或司法領域。我們將探討如何識彆和緩解這些偏見。 我們還將討論算法的透明度和可解釋性。為什麼一個算法會做齣這樣的決定?理解其決策過程,對於建立信任和進行有效的乾預至關重要。 最後,我們將展望算法的未來發展趨勢,例如機器學習、深度學習等更高級的技術,以及它們可能帶來的機遇與挑戰。本章旨在培養讀者對算法應用的批判性思維,以及對負責任的數據科學的認知。 《算法的世界:揭秘數據背後的邏輯》是一次關於數據和算法的深度探索。它將幫助你建立強大的數據思維,理解數據工作的基本原理,並為你開啓更廣闊的數據分析和應用之路。無論你是希望提升職業技能的從業者,還是對數據世界充滿好奇的學習者,本書都將是你的理想夥伴,帶你撥開數據的迷霧,看見邏輯的本質。

用戶評價

評分

這本書的名字聽起來就讓我對它充滿瞭好奇,我一直覺得數據挖掘是個非常有趣且實用的領域,而Python又是目前最受歡迎的編程語言之一,所以“Python數據挖掘入門與實踐”這個書名簡直完美契閤瞭我的學習需求。我尤其關注的是書中是否能夠提供足夠多的實戰案例,畢竟“實踐”兩個字承諾瞭實際操作的重要性。我希望這本書能引導我從零開始,一步步理解數據挖掘的基本概念,比如數據清洗、特徵工程、模型選擇和評估等,並且能夠通過Python代碼清晰地展示每一步的實現過程。同時,我還在期待書中能夠介紹一些常用的數據挖掘算法,比如決策樹、支持嚮量機、聚類算法等,並講解它們背後的原理以及在Python中如何應用。如果書中還能包含一些關於數據可視化的小技巧,那就更棒瞭,因為我深知清晰的圖錶能夠極大地幫助我們理解數據和分析結果。我是一個零基礎的學習者,所以書中內容是否易於理解、邏輯是否清晰、語言是否通俗易懂,將是我衡量這本書價值的重要標準。總而言之,我希望這本書能夠成為我踏入數據挖掘領域的敲門磚,讓我感受到數據分析的魅力,並能初步具備獨立解決一些數據問題的能力。

評分

從書名《Python數據挖掘入門與實踐》就能感受到這本書的實用性和麵嚮初學者的定位,這正是我所急切需要的。我一直對數據背後的故事充滿好奇,並渴望能掌握用Python來挖掘這些故事的技能。我希望這本書能夠提供一條清晰的學習路徑,從Python基礎知識的簡單迴顧(如果需要的話)開始,然後迅速過渡到數據科學的核心庫,如Pandas和NumPy,以及進行建模的核心庫Scikit-learn。我非常期待書中能提供詳實的例子,詳細闡述如何使用這些庫來完成數據預處理的各個環節,比如數據加載、清理、轉換、閤並等。對於初學者來說,理解不同數據挖掘算法的原理及其適用場景至關重要,我希望書中能夠用簡潔明瞭的方式講解一些經典的算法,並展示如何在Python中實現它們。此外,我尤其看重“實踐”二字,所以我期望書中能夠包含一個或多個完整的項目案例,能夠讓我從頭到尾跟著操作,感受數據挖掘從無到有的全過程。這包括數據收集、探索性數據分析(EDA)、特徵工程、模型選擇、訓練、評估和調優。如果書中還能涉及到一些數據可視化技術,能夠幫助我更好地理解和展示分析結果,那將是極大的加分項。總的來說,我期待這本書能夠成為我進入數據挖掘領域的一本寶典,讓我能夠真正動手,解決實際問題。

評分

我對數據分析領域一直充滿濃厚的興趣,尤其是在接觸到Python之後,更是渴望能將這份興趣轉化為實際的技能。 《Python數據挖掘入門與實踐》這個書名讓我感覺這本書非常貼閤我的需求。我一直在尋找一本能夠真正帶領我深入理解數據挖掘核心概念,並通過Python進行實踐的書籍。我理想中的這本書,能夠從最基礎的數據處理開始,比如如何讀取、清洗、轉換各種格式的數據,然後逐步深入到特徵工程,讓我明白如何從原始數據中提取齣對建模有用的信息。緊接著,我希望能學習到各種常見的機器學習算法,比如分類、迴歸、聚類等,並且最好能有清晰的算法原理講解和Python代碼實現。重要的是,我希望這本書能夠提供實際的項目案例,讓我能夠跟著作者的步驟,一步步完成一個完整的數據挖掘項目,從數據理解到模型部署。我希望通過這本書,能夠掌握如何選擇閤適的算法,如何評估模型的性能,以及如何優化模型以達到更好的效果。如果書中還能包含一些數據可視化的內容,幫助我更好地展示和解釋數據分析結果,那將是錦上添花。總而言之,我希望這本書能夠幫助我構建起紮實的數據挖掘基礎,並且能夠讓我有信心去應對真實世界的數據挑戰。

評分

一直以來,我都在尋找一本能夠真正幫助我將理論知識轉化為實際技能的書籍,而《Python數據挖掘入門與實踐》這個書名讓我眼前一亮。我特彆看重的是書中“實踐”二字所代錶的動手能力培養。我希望這本書不是那種枯燥的理論堆砌,而是能夠通過大量的代碼示例和項目實戰,讓我真正地“玩轉”數據。我設想中的這本書,應該能夠覆蓋從數據獲取、數據預處理到模型構建和優化的完整流程。例如,書中能否提供一些真實世界的數據集,並帶領我完成從數據探索到提取有價值信息的全過程?我希望看到書中能夠介紹一些Python中常用的數據科學庫,比如Pandas、NumPy、Scikit-learn等,並詳細講解它們的核心功能和使用方法。對於初學者而言,能夠清晰地理解各種算法的適用場景和優缺點也非常重要。我希望書中能夠循序漸進地介紹一些經典的數據挖掘算法,並附帶Python實現代碼,讓我能夠通過實踐來加深對這些算法的理解。此外,我還希望書中能夠包含一些關於如何解釋模型結果、如何避免常見錯誤以及如何評估模型性能的指導。這本書如果能夠幫助我建立起一個係統性的數據挖掘思維框架,並讓我能夠自信地動手解決實際問題,那將是對我學習之路的巨大助力。

評分

當我看到《Python數據挖掘入門與實踐》這本書名時,我的第一反應是它能否真正幫助我這個對數據挖掘瞭解不多的新手。我最看重的是“入門”二字所承諾的易學性和“實踐”二字所代錶的動手性。我希望這本書能夠像一位耐心的老師,從最基礎的Python語法和數據科學庫的介紹開始,逐步引導我進入數據挖掘的殿堂。我期待書中能夠用通俗易懂的語言解釋那些聽起來有些晦澀的數據挖掘概念,例如什麼是特徵提取,什麼是模型評估指標,以及它們在實際應用中的意義。更重要的是,我希望這本書能夠提供大量的、可執行的代碼示例,讓我能夠邊學邊練。我希望書中能展示如何使用Python庫來完成數據的加載、清洗、轉換,以及如何應用各種算法進行預測、分類或聚類。我還希望能看到一些實際案例分析,例如如何利用數據挖掘技術來解決一些常見的業務問題,比如客戶流失預測、商品推薦等。如果書中能包含一些關於如何處理缺失值、異常值,以及如何進行特徵選擇和降維的技巧,那將對我非常有幫助。我希望通過閱讀這本書,能夠建立起對數據挖掘的基本認知,並掌握一些基本的數據挖掘工具和方法,為我未來更深入的學習打下堅實的基礎。

評分

很好!!!!!!!

評分

書不錯,就是快遞包裝太爛瞭,用紙盒包的,拿到手,紙盒直接爛掉瞭,但是這個不怪送貨員,怪京東打包的時候沒有打好或者運輸途中齣現瞭亂扔包裹的現象!

評分

書挺薄的,內容挺好。

評分

正版

評分

內容不錯,不過裏麵有些twitter的數據國內不好下。

評分

好書,淺顯易懂

評分

可以

評分

辦公室很多人用這本。不錯。

評分

還沒有開始看,不知道質量,書很薄,價格略貴。

相關圖書

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有