| 書[0名0]: | scikit-learn [1機1] 器[0學0]習:常用算[0法0]原理及編程實戰|7436499 |
| 圖書定價: | 59元 |
| 圖書作者: | 黃永昌 |
| 齣版社: | [1機1] 械工業齣版社 |
| 齣版日期: | 2018/3/1 0:00:00 |
| ISBN號: | 9787111590248 |
| 開本: | 16開 |
| 頁數: | 0 |
| 版次: | 1-1 |
| 內容簡介 |
| 本書通過通俗易懂的語言、豐富的圖示和生動的實例,撥開瞭籠罩在 [1機1] 器[0學0]習上方復雜的數[0學0]“烏雲”,讓讀者以較低的代價和門檻輕鬆入門 [1機1] 器[0學0]習。 本書共分為11章,介紹瞭在Python環境下[0學0]習scikit-learn [1機1] 器[0學0]習框架的相關[0知0]識,涵蓋的主要內容有 [1機1] 器[0學0]習概述、Python [1機1] 器[0學0]習軟件包、 [1機1] 器[0學0]習理論基礎、k-近鄰算[0法0]、綫性迴歸算[0法0]、邏輯迴歸算[0法0]、決策樹、支持嚮量 [1機1] 、樸素貝葉斯算[0法0]、PCA 算[0法0]和k-均值算[0法0]等。 本書適閤有一定編程基礎的讀者閱讀,尤其適閤想從事 [1機1] 器[0學0]習、人工智能、深度[0學0]習及 [1機1] 器人相關技術的程序員和愛好者閱讀。另外,相關院校和培訓 [1機1] 構也可以將本書作為教材使用。 scikit-learn [1機1] 器[0學0]習 常用算[0法0]原理及編程實戰 齣版發行: [1機1] 械工業齣版社(北京市西城區百萬莊[0大0]街22號 郵政編碼:100037) 責任編輯:歐振旭 李華君 責任校對:姚誌娟 印 刷:中[0國0]電影齣版社印刷廠 版 次:2018年3月[0第0]1版[0第0]1次印刷 開 本:186mm×240mm 1/16 印 張:13.75 書 號:ISBN 978-7-111-59024-8 定 價:59.00元 凡購本書,如有缺頁、倒頁、脫頁,由本社發行部調換 客服熱綫:(010)88379426 88361066 投稿熱綫:(010)88379604 購書熱綫:(010)68326294 88379649 68995259 讀者信箱:hzit@hzbook.com 版[0權0]所有·侵[0權0]必究 封底無防僞標均為盜版 本書[0法0]律顧問:北京[0大0]成律師事務所 韓光/鄒曉東 |
| 目錄 |
前言 [0第0]1章 [1機1] 器[0學0]習介紹 1 1.1 什麼是 [1機1] 器[0學0]習 1 1.2 [1機1] 器[0學0]習有什麼用 2 1.3 [1機1] 器[0學0]習的分類 3 1.4 [1機1] 器[0學0]習應用開發的典型步驟 4 1.4.1 數據采集和標記 4 1.4.2 數據清洗 5 1.4.3 特徵選擇 5 1.4.4 模型選擇 5 1.4.5 模型訓練和測試 5 1.4.6 模型性能[0評0]估和[0優0]化 5 1.4.7 模型使用 6 1.5 復習題 6 [0第0]2章 Python [1機1] 器[0學0]習軟件包 7 2.1 開發環境搭建 7 2.2 IPython簡介 8 2.2.1 IPython基礎 8 2.2.2 IPython圖形界麵 13 2.3 Numpy簡介 15 2.3.1 Numpy數組 15 2.3.2 Numpy運算 19 2.4 Pandas簡介 32 2.4.1 基本數據結構 32 2.4.2 數據排序 34 2.4.3 數據訪問 34 2.4.4 時間序列 36 2.4.5 數據可視化 36 2.4.6 文件讀寫 38 2.5 Matplotlib簡介 38 2.5.1 圖形樣式 38 2.5.2 圖形對象 40 2.5.3 畫圖操作 46 2.6 scikit-learn簡介 51 2.6.1 scikit-learn示例 51 2.6.2 scikit-learn一般性原理和通用規則 55 2.7 復習題 56 2.8 拓展[0學0]習資源 57 [0第0]3章 [1機1] 器[0學0]習理論基礎 58 3.1 過擬閤和欠擬閤 58 3.2 成本函數 59 3.3 模型準確性 60 3.3.1 模型性能的不同錶述方式 61 3.3.2 交叉驗證數據集 61 3.4 [0學0]習麯綫 62 3.4.1 實例:畫齣[0學0]習麯綫 62 3.4.2 過擬閤和欠擬閤的特徵 65 3.5 算[0法0]模型性能[0優0]化 65 3.6 查準率和召迴率 66 3.7 F1 Score 67 3.8 復習題 67 [0第0]4章 k-近鄰算[0法0] 69 4.1 算[0法0]原理 69 4.1.1 算[0法0][0優0]缺點 69 4.1.2 算[0法0]參數 70 4.1.3 算[0法0]的變種 70 4.2 示例:使用k-近鄰算[0法0]進行分類 70 4.3 示例:使用k-近鄰算[0法0]進行迴歸擬閤 72 4.4 實例:糖尿病預測 74 4.4.1 加載數據 74 4.4.2 模型比較 75 4.4.3 模型訓練及分析 77 4.4.4 特徵選擇及數據可視化 78 4.5 拓展閱讀 80 4.5.1 如何提高k-近鄰算[0法0]的運算效率 80 4.5.2 相關性測試 80 4.6 復習題 81 [0第0]5章 綫性迴歸算[0法0] 83 5.1 算[0法0]原理 83 5.1.1 預測函數 83 5.1.2 成本函數 84 5.1.3 梯度下降算[0法0] 84 5.2 多變量綫性迴歸算[0法0] 86 5.2.1 預測函數 86 5.2.2 成本函數 87 5.2.3 梯度下降算[0法0] 88 5.3 模型[0優0]化 89 5.3.1 多項式與綫性迴歸 89 5.3.2 數據歸一化 89 5.4 示例:使用綫性迴歸算[0法0]擬閤正弦函數 90 5.5 示例:測算房價 92 5.5.1 輸入特徵 92 5.5.2 模型訓練 93 5.5.3 模型[0優0]化 94 5.5.4 [0學0]習麯綫 95 5.6 拓展閱讀 96 5.6.1 梯度下降迭代公式推導 96 5.6.2 隨 [1機1] 梯度下降算[0法0] 96 5.6.3 標準方程 97 5.7 復習題 97 [0第0]6章 邏輯迴歸算[0法0] 98 6.1 算[0法0]原理 98 6.1.1 預測函數 98 6.1.2 判定邊界 99 6.1.3 成本函數 100 6.1.4 梯度下降算[0法0] 102 6.2 多元分類 102 6.3 正則化 103 6.3.1 綫性迴歸模型正則化 103 6.3.2 邏輯迴歸模型正則化 104 6.4 算[0法0]參數 104 6.5 實例:乳腺癌檢測 106 6.5.1 數據采集及特徵提取 106 6.5.2 模型訓練 108 6.5.3 模型[0優0]化 110 6.5.4 [0學0]習麯綫 111 6.6 拓展閱讀 113 6.7 復習題 114 [0第0]7章 決策樹 115 7.1 算[0法0]原理 115 7.1.1 信息增益 116 7.1.2 決策樹的創建 119 7.1.3 剪枝算[0法0] 120 7.2 算[0法0]參數 121 7.3 實例:預測泰坦尼剋號幸存者 122 7.3.1 數據分析 122 7.3.2 模型訓練 123 7.3.3 [0優0]化模型參數 124 7.3.4 模型參數選擇工具包 127 7.4 拓展閱讀 130 7.4.1 熵和條件熵 130 7.4.2 決策樹的構建算[0法0] 130 7.5 集閤算[0法0] 131 7.5.1 自助聚閤算[0法0]Bagging 131 7.5.2 正嚮激勵算[0法0]boosting 131 7.5.3 隨 [1機1] 森林 132 7.5.4 ExtraTrees算[0法0] 133 7.6 復習題 133 [0第0]8章 支持嚮量 [1機1] 134 8.1 算[0法0]原理 134 8.1.1 [0大0]間距分類算[0法0] 134 8.1.2 鬆弛係數 136 8.2 核函數 138 8.2.1 簡單的核函數 138 8.2.2 相似性函數 140 8.2.3 常用的核函數 141 8.2.4 核函數的對比 142 8.3 scikit-learn裏的SVM 144 8.4 實例:乳腺癌檢測 146 8.5 復習題 149 [0第0]9章 樸素貝葉斯算[0法0] 151 9.1 算[0法0]原理 151 9.1.1 貝葉斯定理 151 9.1.2 樸素貝葉斯分類[0法0] 152 9.2 一個簡單的例子 153 9.3 概率分布 154 9.3.1 概率統計的基本概念 154 9.3.2 多項式分布 155 9.3.3 高斯分布 158 9.4 連續值的處理 159 9.5 實例:文檔分類 160 9.5.1 獲取數據集 160 9.5.2 文檔的數[0學0]錶達 161 9.5.3 模型訓練 163 9.5.4 模型[0評0]價 165 9.6 復習題 167 [0第0]10章 PCA算[0法0] 168 10.1 算[0法0]原理 168 10.1.1 數據歸一化和縮放 169 10.1.2 計算協方差矩陣的特徵嚮量 169 10.1.3 數據降維和恢復 170 10.2 PCA 算[0法0]示例 171 10.2.1 使用Numpy模擬PCA計算過程 171 10.2.2 使用sklearn進行PCA降維運算 173 10.2.3 PCA的物理含義 174 10.3 PCA 的數據還原率及應用 175 10.3.1 數據還原率 175 10.3.2 加快監督 [1機1] 器[0學0]習算[0法0]的運算速度 176 10.4 實例:人臉識彆 176 10.4.1 加載數據集 176 10.4.2 一次失敗的嘗試 179 10.4.3 使用PCA來處理數據集 182 10.4.4 終結果 185 10.5 拓展閱讀 189 10.6 復習題 189 [0第0]11章 k-均值算[0法0] 190 11.1 算[0法0]原理 190 11.1.1 k-均值算[0法0]成本函數 191 11.1.2 隨 [1機1] 初始化聚類中心點 191 11.1.3 選擇聚類的個數 192 11.2 scikit-learn裏的k-均值算[0法0] 192 11.3 使用k-均值對文檔進行聚類分析 195 11.3.1 準備數據集 195 11.3.2 加載數據集 196 11.3.3 文本聚類分析 197 11.4 聚類算[0法0]性能[0評0]估 200 11.4.1 Adjust Rand Index 200 11.4.2 齊次性和完整性 201 11.4.3 輪廓係數 203 11.5 復習題 204 後記 205 |
這本書給我的整體感覺是“有料”。它不像市麵上很多書那樣,僅僅是簡單地羅列scikit-learn的函數,而是真正地將算法的背後原理與實際編程應用緊密地結閤起來。例如,在講解無監督學習中的降維技術時,作者不僅僅是介紹瞭PCA和t-SNE,更深入地分析瞭它們各自的數學原理,以及它們在可視化和特徵提取方麵的應用。讓我印象深刻的是,書中還討論瞭一些更高級的話題,比如模型的可解釋性,以及如何處理類彆不平衡的數據集。這些都是在實際項目開發中非常常見且重要的問題。本書的語言風格也很適閤我,既不顯得過於枯燥乏味,也不失嚴謹性。作者在穿插講解理論知識時,還會適時地引用一些經典的研究論文,這讓我感受到作者的深厚功底,同時也為我指明瞭進一步深入學習的方嚮。我真心推薦這本書給所有想要係統學習機器學習,並希望將其應用於實際編程的讀者。
評分坦白說,在我翻開這本書之前,我對“集成學習”的概念並沒有一個清晰的認識。它常常被提及,但具體的實現方式和威力卻難以捉摸。而這本書對這一塊的講解,簡直是我的福音。它從最基礎的“bagging”和“boosting”講起,通過生動的例子,讓我理解瞭為什麼將多個弱學習器組閤起來,能夠得到一個更強大的模型。特彆是對XGBoost和LightGBM這樣近年來非常流行的集成算法,書中不僅詳細講解瞭它們的原理,比如梯度下降、正則化等,更重要的是提供瞭與scikit-learn統一的接口進行調用。這讓我感到非常方便,因為我不需要再去學習一套全新的API。書中對於模型融閤的策略,比如投票法、加權平均法等,也有深入的介紹,讓我能夠根據具體場景來選擇最優的融閤方式。這種對前沿算法的深入剖析和實戰指導,讓我覺得這本書不僅僅是一本入門讀物,更是一本能夠幫助我提升實戰能力的進階指南。
評分這本書的篇幅相當可觀,厚重的手感就足以讓人感受到內容的紮實。我一直對機器學習領域充滿瞭好奇,但市麵上很多教材要麼過於理論化,要麼過於碎片化,難以形成係統性的認知。這本書恰好填補瞭我的需求。它從基礎的算法原理講起,比如綫性迴歸、邏輯迴歸,這些看似簡單但卻是理解更復雜模型的基礎。作者在解釋原理時,並沒有直接跳到公式推導,而是通過生動的比喻和清晰的邏輯,將抽象的概念具象化,讓我這種初學者也能逐漸領會其中的精髓。尤其印象深刻的是關於決策樹的部分,圖文並茂的解釋,讓我瞬間明白瞭“不純度”和“信息增益”的含義,也理解瞭它如何通過不斷劃分來構建模型。更重要的是,這本書非常注重實戰,每一章節都配有相應的Python代碼示例,並且使用的庫是scikit-learn,這個在業界非常流行的庫。我跟著書中的代碼敲瞭一遍又一遍,從數據的加載、預處理,到模型的訓練、評估,每一步都清晰可見,讓我能夠快速地將理論知識應用到實踐中。這種理論與實踐相結閤的方式,大大提升瞭我的學習效率和信心。
評分我購買這本書的初衷,是為瞭深入瞭解支撐起當下人工智能浪潮的那些核心算法。這本書在“算法原理”這個環節做得尤為齣色。它並沒有將各種算法羅列齣來,而是非常有條理地將它們歸類,比如監督學習、無監督學習等,然後層層遞進地剖析。對於像支持嚮量機(SVM)這樣在某些書中被描述得極其復雜的算法,作者通過數學的嚴謹性與直觀的幾何解釋相結閤的方式,讓我茅塞頓開。它不僅僅是給齣瞭推導公式,更重要的是解釋瞭為什麼要有這些公式,背後的思想是什麼。我特彆喜歡書中對核函數作用的講解,它不是簡單地介紹幾種核函數,而是深入探討瞭它如何將低維數據映射到高維空間,從而解決綫性不可分的問題。這種“知其然,更知其所以然”的學習過程,讓我對機器學習的理解不再停留在“調包俠”的層麵。而且,書中對於算法的優缺點、適用場景的分析也十分到位,讓我能夠更好地根據實際問題選擇閤適的模型。
評分作為一名對數據科學充滿熱情但非科班齣身的讀者,這本書無疑是我學習旅程中的一座燈塔。它在“編程實戰”部分給瞭我極大的幫助。scikit-learn作為機器學習領域的事實標準,其API設計得非常簡潔易用,而本書恰恰充分利用瞭這一點。作者精心挑選瞭多個具有代錶性的數據集,從迴歸、分類到聚類,幾乎涵蓋瞭機器學習的常見任務。對於每個任務,書中都給齣瞭詳盡的步驟,包括如何加載數據,如何進行特徵工程(比如缺失值處理、特徵縮放),如何選擇閤適的模型,如何進行參數調優,以及如何評估模型的性能。最讓我驚喜的是,書中對於一些模型,比如隨機森林和梯度提升樹,還講解瞭如何通過可視化工具(如matplotlib和seaborn)來展示模型的決策過程或者特徵重要性,這極大地增強瞭我的直觀理解。我嘗試著將書中的代碼稍作修改,用在自己收集的一些小數據集上,發現效果也相當不錯,這極大地激發瞭我進一步學習和探索的動力。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有