| 圖書名稱: | Python機器學習基礎教程 |
| 作 者: | 安德裏亞斯·穆勒 |
| 定價: | 79.00 |
| ISBN號: | 9787115475619 |
| 齣版社: | 人民郵電齣版社 |
| 開本: | 16 |
| 裝幀: | 平裝 |
| 齣版日期: | 2018-1-1 |
| 印刷日期: | 2018-1-1 |
前言 ix
1 章 引言 1
1.1 為何選擇機器學習 1
1.1.1 機器學習能夠解決的問題 2
1.1.2 熟悉任務和數據 4
1.2 為何選擇Python 4
1.3 scikit-learn 4
1.4 必要的庫和工具 5
1.4.1 Jupyter Notebook 6
1.4.2 NumPy 6
1.4.3 SciPy 6
1.4.4 matplotlib 7
1.4.5 pandas 8
1.4.6 mglearn 9
1.5 Python 2 與Python 3 的對比 9
1.6 本書用到的版本 10
1.7 個應用:鳶尾花分類 11
1.7.1 初識數據 12
1.7.2 衡量模型是否成功:訓練數據與測試數據 14
1.7.3 要事 :觀察數據 15
1.7.4 構建 個模型:k 近鄰算法 16
1.7.5 做齣預測 17
1.7.6 評估模型 18
1.8 小結與展望 19
2 章 監督學習 21
2.1 分類與迴歸 21
2.2 泛化、過擬閤與欠擬閤 22
2.3 監督學習算法 24
2.3.1 些樣本數據集 25
2.3.2 k 近鄰 28
2.3.3 綫性模型 35
2.3.4 樸素貝葉斯分類器 53
2.3.5 決策樹 54
2.3.6 決策樹集成 64
2.3.7 核支持嚮量機 71
2.3.8 神經網絡(深度學習) 80
2.4 分類器的不確定度估計 91
2.4.1 決策函數 91
2.4.2 預測概率 94
2.4.3 多分類問題的不確定度 96
2.5 小結與展望 98
3 章 無監督學習與預處理 100
3.1 無監督學習的類型 100
3.2 無監督學習的挑戰 101
3.3 預處理與縮放 101
3.3.1 不同類型的預處理 102
3.3.2 應用數據變換 102
3.3.3 對訓練數據和測試數據進行相同的縮放 104
3.3.4 預處理對監督學習的作用 106
3.4 降維、特徵提取與流形學習 107
3.4.1 主成分分析 107
3.4.2 非負矩陣分解 120
3.4.3 用t-SNE 進行流形學習 126
3.5 聚類 130
3.5.1 k 均值聚類 130
3.5.2 凝聚聚類 140
3.5.3 DBSCAN 143
3.5.4 聚類算法的對比與評估 147
3.5.5 聚類方法小結 159
3.6 小結與展望 159
4 章 數據錶示與特徵工程 161
4.1 分類變量 161
4.1.1 One-Hot 編碼(虛擬變量) 162
4.1.2 數字可以編碼分類變量 166
4.2 分箱、離散化、綫性模型與樹 168
4.3 交互特徵與多項式特徵 171
4.4 單變量非綫性變換 178
4.5 自動化特徵選擇 181
4.5.1 單變量統計 181
4.5.2 基於模型的特徵選擇 183
4.5.3 迭代特徵選擇 184
4.6 利用專傢知識 185
4.7 小結與展望 192
5 章 模型評估與改進 193
5.1 交叉驗證 194
5.1.1 scikit-learn 中的交叉驗證 194
5.1.2 交叉驗證的優點 195
5.1.3 分層k 摺交叉驗證和其他策略 196
5.2 網格搜索 200
5.2.1 簡單網格搜索 201
5.2.2 參數過擬閤的風險與驗證集 202
5.2.3 帶交叉驗證的網格搜索 203
5.3 評估指標與評分 213
5.3.1 牢記目標 213
5.3.2 二分類指標 214
5.3.3 多分類指標 230
5.3.4 迴歸指標 232
5.3.5 在模型選擇中使用評估指標 232
5.4 小結與展望 234
6 章 算法鏈與管道 236
6.1 用預處理進行參數選擇 237
6.2 構建管道 238
6.3 在網格搜索中使用管道 239
6.4 通用的管道接口 242
6.4.1 用make_pipeline 方便地創建管道 243
6.4.2 訪問步驟屬性 244
6.4.3 訪問網格搜索管道中的屬性 244
6.5 網格搜索預處理步驟與模型參數 246
6.6 網格搜索選擇使用哪個模型 248
6.7 小結與展望 249
7 章 處理文本數據 250
7.1 用字符串錶示的數據類型 250
7.2 示例應用:電影評論的情感分析 252
7.3 將文本數據錶示為詞袋 254
7.3.1 將詞袋應用於玩具數據集 255
7.3.2 將詞袋應用於電影評論 256
7.4 停用詞 259
7.5 用tf-idf 縮放數據 260
7.6 研究模型係數 263
7.7 多個單詞的詞袋(n 元分詞) 263
7.8 分詞、詞乾提取與詞形還原 267
7.9 主題建模與文檔聚類 270
7.10 小結與展望 277
8 章 全書總結 278
8.1 處理機器學習問題 278
8.2 從原型到生産 279
8.3 測試生産係統 280
8.4 構建你自己的估計器 280
8.5 下步怎麼走 281
8.5.1 理論 281
8.5.2 其他機器學習框架和包 281
8.5.3 排序、推薦係統與其他學習類型 282
8.5.4 概率建模、推斷與概率編程 282
8.5.5 神經網絡 283
8.5.6 推廣到更大的數據集 283
8.5.7 磨練你的技術 284
8.6 總結 284
關於作者 285
關於封麵 285
機器學習已成為許多商業應用和研究項目不可或缺的部分,海量數據使得機器學習的應用範圍遠超人們想象。本書將嚮所有對機器學習技術感興趣的初學者展示,自己動手構建機器學習解決方案並非難事!
書中重點討論機器學習算法的實踐而不是背後的數學,全麵涵蓋在實踐中實現機器學習算法的所有重要內容,幫助讀者使用Python和scikit-learn庫步步構建個有效的機器學習應用。
* 機器學習的基本概念及其應用
* 常用機器學習算法的優缺點
* 機器學習所處理的數據的錶示方法,包括重點關注數據的哪些方麵
* 模型評估和調參的方法
* 管道的概念
* 處理文本數據的方法,包括文本特有的處理方法
* 進步提高機器學習和數據科學技能的建議
本書是機器學習入門書,以Python語言介紹。主要內容包括:機器學習的基本概念及其應用;實踐中常用的機器學習算法以及這些算法的優缺點;在機器學習中待處理數據的呈現方式的重要性,以及應重點關注數據的哪些方麵;模型評估和調參的方法,重點講解交叉驗證和網格搜索;管道的概念;如何將前麵各章的方法應用到文本數據上,還介紹瞭些文本特有的處理方法。
本書適閤機器學習從業者或有誌成為機器學習從業者的人閱讀
作為一個對機器學習領域充滿好奇的初學者,我最近入手瞭一本廣受好評的書籍,名為《正版 機器學習實戰 python基礎教程指南,python核心編程實例指導 python機》。盡管書名有些冗長,但我被其中“實戰”、“基礎教程”、“核心編程”、“實例指導”等關鍵詞深深吸引。我抱持著能夠迅速上手,通過實際操作來理解機器學習原理的期望。 在閱讀初期,我最看重的是書籍能否提供清晰易懂的Python基礎知識。畢竟,Python是實現機器學習算法的通用語言,沒有紮實的Python基礎,後續的學習將舉步維艱。我期待書中能夠詳細講解Python的變量、數據類型、控製流、函數、類等基本概念,並且能夠通過豐富的代碼示例來輔助理解。特彆是對於數據結構,如列錶、元組、字典、集閤的深入剖析,以及文件I/O操作的演示,都將是我關注的重點。隻有打牢瞭Python的根基,我纔能更自信地去探索機器學習的奧秘。
評分作為一名有一定編程基礎但對機器學習是新手的人,我對《正版 機器學習實戰 python基礎教程指南,python核心編程實例指導 python機》這本書抱有很高的期望。我希望它能提供一個從零開始的係統性學習路徑,循序漸進地引導我進入機器學習的世界。我特彆關注書中在數據可視化和探索性數據分析(EDA)方麵的講解。在實際的機器學習項目中,數據理解和分析往往是第一步,也是至關重要的一步。因此,我期待書中能教授如何使用Matplotlib、Seaborn等工具來繪製各種圖錶,從而更好地理解數據的分布、變量之間的關係,以及識彆潛在的異常值和缺失值。 我希望書中不僅能教會我如何使用各種機器學習算法,還能讓我理解這些算法的適用場景、優缺點以及背後的數學原理。例如,在介紹分類算法時,我希望書中能對比不同算法(如邏輯迴歸、支持嚮量機、K近鄰、樸素貝葉斯、決策樹、隨機森林等)在不同數據集上的錶現,並分析它們在準確率、召迴率、F1分數等評估指標上的差異。同時,我也希望書中能提及一些模型調優的技術,比如網格搜索、隨機搜索、交叉驗證等,讓我能夠通過實際操作來提高模型的性能。
評分作為一名對機器學習充滿熱情但又擔心學習門檻的業餘愛好者,我被《正版 機器學習實戰 python基礎教程指南,python核心編程實例指導 python機》的名稱所吸引。我深知Python是目前機器學習領域最主流的編程語言,而“實戰”和“實例指導”則意味著我可以通過動手實踐來掌握知識,而不是僅僅停留在理論層麵。我希望這本書能夠為我提供一個堅實的Python基礎,讓我能夠無障礙地進行後續的機器學習學習。 我尤其關注書中在數據預處理和特徵工程方麵的講解。我知道,在真實的機器學習項目中,數據質量直接影響著模型的性能。因此,我期待書中能夠詳細介紹如何處理缺失值、異常值,如何進行數據標準化、歸一化,如何進行特徵編碼、特徵選擇等等。我希望書中能夠通過實際案例,展示這些步驟是如何在Python中實現的,並解釋每一步的目的和重要性。如果書中還能提及一些常用的數據處理庫,如Pandas的高級用法,那將非常有幫助。
評分這本書的標題雖然有點長,但“python基礎教程指南”和“python核心編程實例指導”這些字眼,足以引起我這個Python學習者的興趣。我已經在Python方麵有瞭一些基礎,但很多時候在處理復雜的數據科學任務時,總覺得自己的Python功底還不夠紮實,尤其是在麵嚮對象編程和一些高級的庫的使用方麵。我希望這本書能夠在我現有的Python知識之上,提供更深入的講解,尤其是在數據處理和分析方麵,如何更高效、更Pythonic地編寫代碼。 我尤其期待書中在“核心編程實例指導”部分,能夠展示一些將Python語言特性與機器學習算法相結閤的例子。比如,如何利用Python的裝飾器來優化模型的訓練過程,如何使用生成器來處理大規模數據集以節省內存,或者如何利用多綫程/多進程來加速模型的訓練。不僅僅是算法的調用,而是真正理解如何在Python層麵進行優化和工程化實現。如果能有一些關於Python代碼風格、性能調優以及調試技巧的建議,那就更完美瞭。
評分這本書的另一大吸引力在於其“機器學習實戰”的承諾。我明白,學習理論知識固然重要,但真正掌握一門技術,離不開大量的實踐。因此,我非常期待書中能夠提供一係列貼近實際應用的機器學習項目,從數據預處理、特徵工程,到模型選擇、訓練、評估,每一個步驟都能夠有詳細的指導。我希望這些實例能夠覆蓋監督學習、無監督學習、甚至一些深度學習的基礎概念,並且能夠使用當下流行的機器學習庫,如Scikit-learn、Pandas、NumPy等。如果書中還能提供每個項目的代碼,並附帶清晰的解釋,那麼學習效率將會大大提升。 我對書中“核心編程實例指導”的部分充滿瞭期待。這意味著我不僅僅是被動地學習如何調用現成的函數,而是能夠深入理解算法的底層實現邏輯。例如,對於綫性迴歸、邏輯迴歸、決策樹、支持嚮量機等經典算法,我希望能看到它們在Python中的具體代碼實現,哪怕是簡化的版本,也能幫助我建立起對算法原理的直觀認識。通過理解代碼,我纔能更好地調試程序,優化模型,並在遇到問題時找到解決方案。這種深入的指導,對於我從“使用者”轉變為“理解者”至關重要。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有