1 深度學習簡介 1
1.1 深度學習介紹 1
1.2 深度學習的趨勢 7
1.3 參考資料 10
2 TensorFlow係統介紹 12
2.1 TensorFlow誕生的動機 12
2.2 TensorFlow係統簡介 14
2.3 TensorFlow基礎概念 16
2.3.1 計算圖 16
2.3.2 Session會話 18
2.4 係統架構 19
2.5 源碼結構 21
2.5.1 後端執行引擎 22
2.5.2 前端語言接口 24
2.6 小結 24
2.7 參考資料 25
3 Hello TensorFlow 26
3.1 環境準備 26
3.1.1 Mac OS安裝 27
3.1.2 Linux GPU服務器安裝 28
3.1.3 常用Python庫 32
3.2 Titanic題目實戰 34
3.2.1 Kaggle平颱介紹 34
3.2.2 Titanic題目介紹 35
3.2.3 數據讀入及預處理 38
3.2.4 構建計算圖 40
3.2.5 構建訓練迭代過程 44
3.2.6 執行訓練 46
3.2.7 存儲和加載模型參數 47
3.2.8 預測測試數據結果 50
3.3 數據挖掘的技巧 51
3.3.1 數據可視化 52
3.3.2 特徵工程 54
3.3.3 多種算法模型 57
3.4 TensorBoard可視化 58
3.4.1 記錄事件數據 58
3.4.2 啓動TensorBorad服務 60
3.5 數據讀取 62
3.5.1 數據文件格式 63
3.5.2 TFRecord 63
3.6 SkFlow、TFLearn與TF-Slim 67
3.7 小結 69
3.8 參考資料 69
4 CNN“看懂”世界 71
4.1 圖像識彆的難題 72
4.2 CNNs的基本原理 74
4.2.1 捲積的數學意義 75
4.2.2 捲積濾波 77
4.2.3 CNNs中的捲積層 81
4.2.4 池化(Pooling) 83
4.2.5 ReLU 84
4.2.6 多層捲積 86
4.2.7 Dropout 86
4.3 經典CNN模型 87
4.3.1 AlexNet 88
4.3.2 VGGNets 95
4.3.3 GoogLeNet & Inception 98
4.3.4 ResNets 106
4.4 圖像風格轉換 109
4.4.1 量化的風格 109
4.4.2 風格的濾鏡 116
4.5 小結 120
4.6 參考資料 121
5 RNN“能說會道” 123
5.1 文本理解和文本生成問題 124
5.2 標準RNN模型 128
5.2.1 RNN模型介紹 128
5.2.2 BPTT算法 130
5.2.3 靈活的RNN結構 132
5.2.4 TensorFlow實現正弦序列預測 135
5.3 LSTM模型 138
5.3.1 長期依賴的難題 138
5.3.2 LSTM基本原理 139
5.3.3 TensorFlow構建LSTM模型 142
5.4 更多RNN的變體 144
5.5 語言模型 146
5.5.1 NGram語言模型 146
5.5.2 神經網絡語言模型 148
5.5.3 循環神經網絡語言模型 150
5.5.4 語言模型也能寫代碼 152
5.5.5 改進方嚮 163
5.6 對話機器人 164
5.6.1 對話機器人的發展 165
5.6.2 基於seq2seq的對話機器人 169
5.7 小結 181
5.8 參考資料 182
6 CNN+LSTM看圖說話 183
6.1 CNN+LSTM網絡模型與圖像檢測問題 184
6.1.1 OverFeat和Faster R-CNN圖像檢測算法介紹 185
6.1.2 遮擋目標圖像檢測方法 187
6.1.3 ReInspect算法實現及模塊說明 188
6.1.4 ReInspect算法的實驗數據與結論 204
6.2 CNN+LSTM網絡模型與圖像摘要問題 207
6.2.1 圖像摘要問題 208
6.2.2 NIC圖像摘要生成算法 209
6.2.3 NIC圖像摘要生成算法實現說明 214
6.2.4 NIC算法的實驗數據與結論 243
6.3 小結 249
6.4 參考資料 250
7 損失函數與優化算法 253
7.1 目標函數優化策略 254
7.1.1 梯度下降算法 254
7.1.2 RMSProp優化算法 256
7.1.3 Adam優化算法 257
7.1.4 目標函數優化算法小結 258
7.2 類彆采樣(Candidate Sampling)損失函數 259
7.2.1 softmax類彆采樣損失函數 261
7.2.2 噪聲對比估計類彆采樣損失函數 281
7.2.3 負樣本估計類彆采樣損失函數 286
7.2.4 類彆采樣logistic損失函數 286
7.3 小結 287
7.4 參考資料 288
結語 289
書名:深度學習原理與TensorFlow實踐
作者:王琛,鬍振邦,高傑 著
齣版社:電子工業齣版社
齣版時間:2017-6
版次:1
印刷時間:2017-6
印次:2
開本:16開
裝幀:平裝
頁數:288
字數:364800
ISBN:9787121312984
定價:79.00
與市麵上已有的TensorFlow書相比,《深度學習原理與TensorFlow實踐》的特色在於一是所有案例來自作者團隊工作中的親身實踐,所選案例均是深度學習的經典應用,非常具有代錶性;二是結閤瞭深度學習的關鍵原理,強化讀者對深度學習及TensorFlow架構的理解,從而能在知其然、並知其所以然的基礎上,更好地運用TensorFlow來開發各類應用。
《深度學習原理與TensorFlow實踐》所梳理齣來的清晰脈絡和關鍵知識點, 能讓讀者在內外兼修的基礎上,循序漸進地提升功力,在人工智能時代大放異彩。
《深度學習原理與TensorFlow實踐》主要介紹瞭深度學習的基礎原理和TensorFlow係統基本使用方法。TensorFlow是目前機器學習、深度學習領域優秀的計算係統之一,《深度學習原理與TensorFlow實踐》結閤實例介紹瞭使用TensorFlow開發機器學習應用的詳細方法和步驟。同時,《深度學習原理與TensorFlow實踐》著重講解瞭用於圖像識彆的捲積神經網絡和用於自然語言處理的循環神經網絡的理論知識及其TensorFlow實現方法,並結閤實際場景和例子描述瞭深度學習技術的應用範圍與效果。
《深度學習原理與TensorFlow實踐》非常適閤對機器學習、深度學習感興趣的讀者,或是對深度學習理論有所瞭解,希望嘗試更多工程實踐的讀者,抑或是對工程産品有較多經驗,希望學習深度學習理論的讀者。
喻儼,百納信息(海豚瀏覽器)研發副總裁。2007年加入微軟亞洲工程院,2011年加入百納信息負責海外業務綫,從0到1做過多個項目,現緻力於AI和大數據産品的研究與應用。
莫瑜,先後任職於微軟和海豚瀏覽器,從事搜索引擎、音樂檢索/哼唱搜索、內容分發推薦算法和對話機器人技術研發。長期以來持續關注和實踐大規模數據算法性能優化、搜索引擎、推薦係統和人工智能技術。
王琛,英國愛丁堡大學人工智能專業碩士,現為百納信息技術有限公司人工智能方嚮負責人。早年參加過信息學奧林匹剋競賽獲得河北省1名、全國三等奬,並保送進入中山大學。大學期間,在ACM競賽上也屢獲佳績。碩士畢業後就職於百度基礎架構部,參與大數據平颱研發工作,對大數據分析處理、分布式係統架構等方麵都有比較深刻的理解。2014年加入百納,負責多個項目的研發,自2016年起負責人工智能方嚮的探索。
鬍振邦,擁有博士學位,百納信息技術有限公司高級算法研究員,畢業於中國地質大學計算機學院地學信息工程專業。讀博期間,參與瞭關於遙感衛星圖像識彆分析的863項目,並且是主要的研發人員。畢業以來,一直從事圖像識彆方麵的算法研發工作,主要方嚮包括目標檢測、圖文檢索、圖像分類與驗證等,在圖像處理、計算機視覺等方麵都有深厚的積纍和經驗。
高傑,是一位1980年齣生於蘇北的“愛學習、能摺騰、有情懷”的大叔。畢業於揚州中學特招班,1998年入學華中科技大學機械係,兼修管理、會計,自學計算機,2003年考入南京大學軟件學院,曾任德國西門子內部SAP谘詢師,還在中銀國際TMT投行、金山軟件集團投資部任過職,2015年與閤夥人聯閤創立瞭圖靈科技集團,與華爾街優秀交易團隊一起緻力於量化交易、算法模型和人工智能在金融領域的應用,目前這傢公司管理著超過20億元的資産,是細分市場的 公司。
這本書的實戰部分,可以說是為我解決瞭不少燃眉之急。我們都知道,理論學得再好,如果不能落地,終究是空中樓閣。這本書的厲害之處在於,它沒有停留在“Hello World”的層麵,而是真正深入到瞭工程實踐中的那些“坑”和“技巧”。特彆是在使用TensorFlow進行模型構建和部署時,作者分享的那些“小竅門”和“最佳實踐”,簡直是血淚的結晶。比如,關於如何有效地進行數據預處理和管道構建,書中給齣的建議比官方文檔還要清晰實用。我記得有一次我嘗試用一個復雜的數據集進行訓練,遇到瞭內存爆炸的問題,翻閱這本書後,我找到瞭解決方案——通過調整數據批次大小和使用TensorFlow的`tf.data`的高級特性,問題迎刃而解。它對模型調試(Debugging)的論述也極其有價值,不僅僅是告訴你“模型不收斂瞭怎麼辦”,而是係統地分析瞭可能是學習率設置、梯度消失/爆炸、數據泄漏等哪個環節齣瞭問題,並提供瞭對應的診斷工具和方法。這種注重實戰細節的寫作風格,極大地提升瞭我的開發效率,讓我感覺這本書更像是一位隨時待命的資深工程師。
評分這本書簡直是打開瞭我對這個領域認知的一扇窗,它不僅僅是堆砌代碼和公式的教科書,更像是一位經驗豐富的導師,循循善誘地引導你穿越深度學習的迷霧。首先讓我印象深刻的是它對基礎理論的闡述,那種深入骨髓的講解,完全不是那種浮於錶麵的介紹。比如,它對反嚮傳播算法的推導,沒有急於求成,而是層層遞進,用最直觀的方式讓你理解梯度是如何一步步流動和修正網絡參數的。我記得我之前在彆的地方學的時候,總是記不住那個鏈式法則的細節,但讀完這裏的講解,那種豁然開朗的感覺真的太棒瞭。而且,它在講解這些原理的時候,總是能巧妙地聯係到實際應用場景,讓你明白每一個數學概念背後都有一個清晰的工程目標。書中對不同激活函數特性的分析也極其到位,從Sigmoid到ReLU傢族,再到近年來興起的各種變體,作者不僅告訴你“是什麼”,更重要的是解釋瞭“為什麼會這樣設計”,這種深層次的剖析,讓我在選擇模型架構時更有底氣,不再是盲目跟風,而是真正理解瞭背後的權衡與取捨。這種對基礎的夯實,為後續所有高級概念的學習都打下瞭堅實的基石,非常適閤希望構建完整知識體係的學習者。
評分坦白說,市麵上關於深度學習的書籍汗牛充棟,但大多要麼過於偏重理論而缺乏代碼實現,要麼就是一味地堆砌代碼片段而缺乏理論支撐。這本書的平衡感拿捏得非常好,達到瞭一種“剛剛好的”境界。它對各種經典網絡結構的介紹,比如經典的CNN架構(LeNet到ResNet的演變),不僅僅是畫齣結構圖,更重要的是深入探討瞭“為什麼ResNet要引入殘差連接”,這種對創新背後的動機的挖掘,是很多同類書籍所缺乏的。此外,書中對現代深度學習中幾個核心挑戰的討論也相當深入,例如對抗性攻擊(Adversarial Attacks)和模型的可解釋性(Explainability)。這些前沿話題的引入,使得這本書的知識體係不僅立足於經典,更麵嚮未來。閱讀這些章節時,我能感受到作者在努力打破理論與前沿研究之間的壁壘,確保讀者讀完後,不僅能解決眼前的問題,還能對行業未來的發展方嚮有所預判。
評分這本書在圖文結閤和排版設計上,也體現齣瞭極高的用心程度。很多技術書籍為瞭節省篇幅或降低成本,圖錶經常模糊不清或者布局混亂,導緻閱讀體驗極差。然而,這本書中的圖示非常清晰、專業,尤其是那些關於數據流嚮和權重更新的示意圖,簡潔明瞭,極大地輔助瞭抽象概念的理解。例如,在解釋注意力機製(Attention Mechanism)時,作者繪製的權重分布熱力圖,比任何文字描述都更具說服力。再者,代碼塊的格式化也做得無可挑剔,關鍵變量和函數調用都有清晰的注釋,而且代碼示例的長度和復雜度都經過瞭精心設計,確保讀者可以在不被冗餘信息乾擾的情況下,專注於核心邏輯。這種對細節的關注,體現瞭作者對讀者的尊重,也讓整個學習過程變成瞭一種享受,而不是一場與晦澀文字和粗糙圖錶的搏鬥。毫不誇張地說,它的閱讀體驗,在技術書籍中屬於第一梯隊。
評分這本書的敘事結構和邏輯推演,展現瞭作者極高的專業素養和清晰的思維脈絡。它不像某些技術書籍那樣,章節之間互相割裂,或者知識點跳躍性太大。相反,它構建瞭一個非常平滑的學習麯綫。從最基礎的神經網絡結構開始,逐步引入優化器、正則化、到後期的捲積網絡和循環網絡,每引入一個新概念,都會清晰地指齣它解決瞭前一階段的哪個痛點,或者擴展瞭哪種能力。這種“問題驅動-方案解決”的敘事方式,讓閱讀過程充滿瞭探索的樂趣。我尤其欣賞作者在處理復雜算法時的那種“庖丁解牛”般的分解能力,能將一個看似龐大的模塊拆解成幾個易於理解的小單元。閱讀過程中,我很少需要反復查閱前麵的章節來確認某個定義,因為作者總能在恰當的時機進行迴顧和串聯。這種連貫性,極大地降低瞭深度學習這種跨學科領域學習的認知負荷,讓復雜的知識體係變得井井有條,便於長期記憶和應用。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有