| Python機器學習基礎教程 | ||
| 定價 | 79.00 | |
| 齣版社 | 人民郵電齣版社 | |
| 版次 | 1 | |
| 齣版時間 | 2018年01月 | |
| 開本 | 16開 | |
| 作者 | (德)安德裏亞斯·穆勒 | |
| 裝幀 | 平裝 | |
| 頁數 | ||
| 字數 | ||
| ISBN編碼 | 9787115475619 | |
| 重量 | ||
本書是機器學習入門書,以Python語言介紹。主要內容包括:機器學習的基本概念及其應用;實踐中zui常用的機器學習算法以及這些算法的優缺點;在機器學習中待處理數據的呈現方式的重要性,以及應重點關注數據的哪些方麵;模型評估和調參的高ji方法,重點講解交叉驗證和網格搜索;管道的概念;如何將前麵各章的方法應用到文本數據上,還介紹瞭一些文本特有的處理方法。
本書適閤機器學習從業者或有誌成為機器學習從業者的人閱讀。
前言 ix
第1章 引言 1
1.1 為何選擇機器學習 1
1.1.1 機器學習能夠解決的問題 2
1.1.2 熟悉任務和數據 4
1.2 為何選擇Python 4
1.3 scikit-learn 4
1.4 必要的庫和工具 5
1.4.1 Jupyter Notebook 6
1.4.2 NumPy 6
1.4.3 SciPy 6
1.4.4 matplotlib 7
1.4.5 pandas 8
1.4.6 mglearn 9
1.5 Python 2與Python 3的對比 9
1.6 本書用到的版本 10
1.7 第壹個應用:鳶尾花分類 11
1.7.1 初識數據 12
1.7.2 衡量模型是否成功:訓練數據與測試數據 14
1.7.3 要事第壹:觀察數據 15
1.7.4 構建第壹個模型:k近鄰算法 16
1.7.5 做齣預測 17
1.7.6 評估模型 18
1.8 小結與展望 19
第2章 監督學習 21
2.1 分類與迴歸 21
2.2 泛化、過擬閤與欠擬閤 22
2.3 監督學習算法 24
2.3.1 一些樣本數據集 25
2.3.2 k 近鄰 28
2.3.3 綫性模型 35
2.3.4 樸素貝葉斯分類器 53
2.3.5 決策樹 54
2.3.6 決策樹集成 64
2.3.7 核支持嚮量機 71
2.3.8 神經網絡(深度學習) 80
2.4 分類器的不確定度估計 91
2.4.1 決策函數 91
2.4.2 預測概率 94
2.4.3 多分類問題的不確定度 96
2.5 小結與展望 98
第3章 無監督學習與預處理 100
3.1 無監督學習的類型 100
3.2 無監督學習的挑戰 101
3.3 預處理與縮放 101
3.3.1 不同類型的預處理 102
3.3.2 應用數據變換 102
3.3.3 對訓練數據和測試數據進行相同的縮放 104
3.3.4 預處理對監督學習的作用 106
3.4 降維、特徵提取與流形學習 107
3.4.1 主成分分析 107
3.4.2 非負矩陣分解 120
3.4.3 用t-SNE進行流形學習 126
3.5 聚類 130
3.5.1 k 均值聚類 130
3.5.2 凝聚聚類 140
3.5.3 DBSCAN 143
3.5.4 聚類算法的對比與評估 147
3.5.5 聚類方法小結 159
3.6 小結與展望 159
第4章 數據錶示與特徵工程 161
4.1 分類變量 161
4.1.1 One-Hot編碼(虛擬變量) 162
4.1.2 數字可以編碼分類變量 166
4.2 分箱、離散化、綫性模型與樹 168
4.3 交互特徵與多項式特徵 171
4.4 單變量非綫性變換 178
4.5 自動化特徵選擇 181
4.5.1 單變量統計 181
4.5.2 基於模型的特徵選擇 183
4.5.3 迭代特徵選擇 184
4.6 利用專傢知識 185
4.7 小結與展望 192
第5章 模型評估與改進 193
5.1 交叉驗證 194
5.1.1 scikit-learn中的交叉驗證 194
5.1.2 交叉驗證的優點 195
5.1.3 分層k 摺交叉驗證和其他策略 196
5.2 網格搜索 200
5.2.1 簡單網格搜索 201
5.2.2 參數過擬閤的風險與驗證集 202
5.2.3 帶交叉驗證的網格搜索 203
5.3 評估指標與評分 213
5.3.1 牢記zui終目標 213
5.3.2 二分類指標 214
5.3.3 多分類指標 230
5.3.4 迴歸指標 232
5.3.5 在模型選擇中使用評估指標 232
5.4 小結與展望 234
第6章 算法鏈與管道 236
6.1 用預處理進行參數選擇 237
6.2 構建管道 238
6.3 在網格搜索中使用管道 239
6.4 通用的管道接口 242
6.4.1 用make_pipeline方便地創建管道 243
6.4.2 訪問步驟屬性 244
6.4.3 訪問網格搜索管道中的屬性 244
6.5 網格搜索預處理步驟與模型參數 246
6.6 網格搜索選擇使用哪個模型 248
6.7 小結與展望 249
我剛結束瞭學習 Python 機器學習的徵程,真的太棒瞭!這本書的講解方式簡直是為初學者量身定製的,清晰明瞭,一點也不覺得枯燥。作者循序漸進地介紹瞭機器學習的基本概念,從最基礎的算法,比如綫性迴歸、邏輯迴歸,到更高級的模型,像是支持嚮量機和決策樹,都講得特彆透徹。而且,這本書非常注重實操,每講完一個概念,都會配上相應的 Python 代碼示例。我尤其喜歡的是,它並沒有直接扔給你一堆復雜的代碼,而是一步一步地解釋代碼的邏輯,讓你知道為什麼這麼寫,這樣做有什麼意義。通過這些例子,我不僅學會瞭如何運用這些算法,更重要的是理解瞭它們背後的原理。書中的數據集也都很有代錶性,涵蓋瞭分類、迴歸、聚類等常見的機器學習任務。我跟著書本一步步實踐,感覺自己真的掌握瞭將理論轉化為實際應用的能力。對於那些和我一樣,對機器學習充滿好奇,又不知道從何入手的朋友們,這本書絕對是你們的絕佳選擇。它不僅打開瞭我認識機器學習世界的大門,更讓我對未來深入學習打下瞭堅實的基礎。
評分我一直對人工智能充滿瞭嚮往,但總覺得它離我太遙遠。這本書的齣現,徹底改變瞭我的看法。它用一種非常親切、接地氣的方式,將復雜的人工智能概念分解成易於理解的模塊。我發現,原來機器學習並不是什麼高不可攀的學科,它就隱藏在我們的日常生活中,並且可以被我們掌握。書中對一些經典的機器學習算法的介紹,比如 K-Means 聚類、樸素貝葉斯等,都非常直觀。作者通過生動的類比和清晰的圖示,讓我能夠迅速理解它們的工作原理。我尤其喜歡的是書中關於如何評估模型性能的部分,它讓我明白瞭,一個好的模型不僅僅是能夠做齣預測,更重要的是它能夠做齣準確、可靠的預測。通過跟隨書中的代碼示例,我不僅學會瞭如何使用 Python 實現這些算法,更重要的是,我開始能夠自己思考如何應用這些技術來解決一些身邊的問題。這本書真的就像是一個引路人,它沒有讓我直接麵對大海,而是先帶我在岸邊戲水,讓我逐漸建立瞭信心,並讓我渴望去探索更廣闊的海洋。
評分說實話,我之前對編程和數據分析都有些畏懼,感覺自己很難學得會。但是,自從我開始閱讀這本書,我的想法完全改變瞭!作者用非常通俗易懂的語言,將 Python 編程和機器學習的入門知識串聯瞭起來。對於完全零基礎的我來說,書中的每一步都顯得格外友好。它並沒有一開始就拋齣復雜的數學公式或者晦澀的概念,而是從 Python 的基礎語法開始,逐步引導讀者上手。我跟著書中的例子,學會瞭如何安裝必要的庫,如何導入和處理數據,以及如何構建一個簡單的機器學習模型。更重要的是,這本書強調瞭“動手實踐”的重要性,每一個章節都附帶瞭實際操作的代碼,讓我可以邊學邊練。我最喜歡的是書中關於數據可視化的部分,通過圖錶直觀地展示數據和模型的結果,讓我對數據的理解更加深刻,也更能感受到機器學習的神奇之處。這本書讓我第一次體會到,原來學習編程和數據分析可以這麼有趣,這麼有成就感。它不僅教會瞭我技術,更重要的是,它點燃瞭我繼續探索數據科學世界的興趣。
評分我最近一直在關注如何將機器學習應用於實際業務場景,這本書為我提供瞭一些非常有價值的啓發。雖然書中介紹的算法和技術相對基礎,但其核心思想和解決問題的思路卻非常實用。作者通過一係列貼近實際的案例,展示瞭如何利用機器學習來解決諸如客戶流失預測、産品推薦、欺詐檢測等問題。我特彆欣賞的是書中關於特徵選擇和特徵工程的講解,它強調瞭在實際應用中,如何從原始數據中提取齣有價值的特徵,並對這些特徵進行有效的處理,這對於構建高性能的模型至關重要。書中還討論瞭模型的可解釋性問題,以及如何理解模型的預測結果,這在很多需要決策支持的場景下是不可或缺的。這本書並沒有過多地糾纏於復雜的數學推導,而是側重於如何將機器學習的工具應用到解決實際問題中。它讓我意識到,很多時候,一個簡單而有效的模型,比一個過於復雜但難以理解的模型更有價值。這本書的價值在於它能夠幫助讀者建立起一個將機器學習理念落地到業務中的思維框架,這對於那些希望利用技術提升業務效率和競爭力的從業者來說,是非常寶貴的。
評分我最近在深度學習領域鑽研,發現這本書為我提供瞭非常寶貴的視角,盡管它側重於更基礎的機器學習。這本書最大的亮點在於它對“為什麼”的解釋,而不是僅僅羅列“怎麼做”。作者深入淺齣地闡述瞭機器學習的核心思想,比如偏差-方差權衡、過擬閤與欠擬閤的根源,以及如何通過特徵工程來提升模型性能。讀這本書就像是和一位經驗豐富的導師對話,他會引導你思考問題的本質,而不是給你現成的答案。我特彆喜歡它關於模型評估的部分,講解瞭準確率、召迴率、F1分數等各種評價指標的含義、適用場景以及它們之間的權衡關係。書中關於正則化的講解也讓我茅塞頓開,理解瞭 L1 和 L2 正則化為何能有效防止過擬閤。此外,書中還介紹瞭一些經典的機器學習算法,雖然可能不是最新最前沿的,但它們卻是理解更復雜模型的基礎。通過對這些基礎算法的深入理解,我發現自己在學習深度學習的各種網絡結構時,能夠更快地抓住核心思想,並且更能理解它們之間的聯係。這本書的價值在於其深刻的理論洞察力,能夠幫助讀者建立起紮實的機器學習理論框架,這對任何想要在人工智能領域走得更遠的人來說,都是不可或缺的。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有