産品特色
編輯推薦
想深入應用手中的數據?還是想在上韆份文件上重復同樣的分析過程?沒有編程經驗的非程序員們如何能在zui短的時間內學會用當今炙手可熱的Python語言進行數據分析?
來自Facebook的數據專傢Clinton Brownley可以幫您解決上述問題。在他的這本書裏,讀者將能掌握基本Python編程方法,學會編寫齣處理電子錶格和數據庫中的數據的腳本,並瞭解使用Python模塊來解析文件、分組數據和生成統計量的方法。
- 學習基礎語法,創建並運行自己的Python腳本
- 讀取和解析CSV文件
- 讀取多個Excel工作錶和工作簿
- 執行數據庫操作
- 搜索特定記錄、分組數據和解析文本文件
- 建立統計圖並繪圖
- 生成描述性統計量並估計迴歸模型和分類模型
- 在Windows和Mac環境下按計劃自動運行腳本
內容簡介
本書展示如何用Python程序將不同格式的數據處理和分析任務規模化和自動化。主要內容包括:Python基礎知識介紹、CSV文件和Excel文件讀寫、數據庫的操作、示例程序演示、圖錶的創建,等等。
作者簡介
Clinton W. Brownley博士,Facebook數據科學傢,負責大數據流水綫、統計建模和數據可視化項目,並為大型基礎設施建設提供數據驅動的決策建議。
目錄
前言 xi
第 1 章 Python 基礎 1
1.1 創建 Python 腳本 1
1.2 運行 Python 腳本 3
1.3 與命令行進行交互的幾項技巧 6
1.4 Python 語言基礎要素 10
1.4.1 數值 10
1.4.2 字符串 12
1.4.3 正則錶達式與模式匹配 16
1.4.4 日期 19
1.4.5 列錶 21
1.4.6 元組 26
1.4.7 字典 27
1.4.8 控製流 30
1.5 讀取文本文件 35
1.5.1 創建文本文件 36
1.5.2 腳本和輸入文件在同一位置 38
1.5.3 讀取文件的新型語法 38
1.6 使用 glob 讀取多個文本文件 39
1.7 寫入文本文件 42
1.7.1 嚮 first_script.py 添加代碼 42
1.7.2 寫入 CSV 文件 45
1.8 print 語句 46
1.9 本章練習 47
第 2 章 CSV文件 48
2.1 基礎 Python 與 pandas 50
2.1.1 讀寫 CSV 文件(第 1 部分)50
2.1.2 基本字符串分析是如何失敗的 56
2.1.3 讀寫 CSV 文件(第 2 部分)57
2.2 篩選特定的行 58
2.2.1 行中的值滿足某個條件 59
2.2.2 行中的值屬於某個集閤 60
2.2.3 行中的值匹配於某個模式/ 正則錶達式 62
2.3 選取特定的列 64
2.3.1 列索引值 64
2.3.2 列標題 65
2.4 選取連續的行 67
2.5 添加標題行 69
2.6 讀取多個 CSV 文件 71
2.7 從多個文件中連接數據 75
2.8 計算每個文件中值的總和與均值 78
2.9 本章練習 81
第 3 章 Excel 文件 82
3.1 內省 Excel 工作簿 84
3.2 處理單個工作錶 88
3.2.1 讀寫 Excel 文件 88
3.2.2 篩選特定行 92
3.2.3 選取特定列 98
3.3 讀取工作簿中的所有工作錶 101
3.3.1 在所有工作錶中篩選特定行 102
3.3.2 在所有工作錶中選取特定列 104
3.4 在 Excel 工作簿中讀取一組工作錶 106
3.5 處理多個工作簿 108
3.5.1 工作錶計數以及每個工作錶中的行列計數 110
3.5.2 從多個工作簿中連接數據 111
3.5.3 為每個工作簿和工作錶計算總數和均值 113
3.6 本章練習 117
第 4 章 數據庫 118
4.1 Python 內置的 sqlite3 模塊 119
4.1.1 嚮錶中插入新記錄 124
4.1.2 更新錶中記錄 128
4.2 MySQL 數據庫 131
4.2.1 嚮錶中插入新記錄 135
4.2.2 查詢一個錶並將輸齣寫入 CSV 文件 140
4.2.3 更新錶中記錄 142
4.3 本章練習 146
第 5 章 應用程序 147
5.1 在一個大文件集閤中查找一組項目 147
5.2 為 CSV 文件中數據的任意數目分類計算統計量 158
5.3 為文本文件中數據的任意數目分類計算統計量 167
5.4 本章練習 174
第 6 章 圖與圖錶 175
6.1 matplotlib 175
6.1.1 條形圖 175
6.1.2 直方圖 177
6.1.3 摺綫圖 178
6.1.4 散點圖 180
6.1.5 箱綫圖 181
6.2 pandas 183
6.3 ggplot 184
6.4 seaborn 186
第 7 章 描述性統計與建模 192
7.1 數據集 192
7.1.1 葡萄酒質量 192
7.1.2 客戶流失 193
7.2 葡萄酒質量 194
7.2.1 描述性統計 194
7.2.2 分組、直方圖與 t 檢驗 195
7.2.3 成對變量之間的關係和相關性 196
7.2.4 使用最小二乘估計進行綫性迴歸 198
7.2.5 係數解釋 200
7.2.6 自變量標準化 200
7.2.7 預測 202
7.3 客戶流失 203
7.3.1 邏輯斯蒂迴歸 205
7.3.2 係數解釋 207
7.3.3 預測 208
第 8 章 按計劃自動運行腳本 209
8.1 任務計劃程序(Windows 係統)209
8.2 cron 工具(macOS 係統和 Unix 係統)215
8.2.1 cron 錶文件:一次性設置 216
8.2.2 嚮 cron 錶文件中添加 cron 任務 216
第 9 章 從這裏啓航 220
9.1 更多的標準庫模塊和內置函數 221
9.1.1 Python 標準庫(PSL):更多的標準模塊 221
9.1.2 內置函數 222
9.2 Python 包索引(PyPI):更多的擴展模塊 222
9.2.1 NumPy 223
9.2.2 SciPy 227
9.2.3 Scikit-Learn 230
9.2.4 更多的擴展包 232
9.3 更多的數據結構 232
9.3.1 棧 233
9.3.2 隊列 233
9.3.3 圖 233
9.3.4 樹 234
9.4 從這裏啓航 234
附錄A 下載指南 236
附錄B 練習答案 245
作者介紹 247
封麵介紹 247
Python數據分析基礎 epub pdf mobi txt 電子書 下載 2024
Python數據分析基礎 下載 epub mobi pdf txt 電子書