商品參數
書名:圖靈程序設計叢書:學習R
作者:[美] Richard,Cotton著;劉軍 譯
ISBN:9787115351708
齣版社:人民郵電齣版社
齣版時間:2014-05-01
印刷時間:2014-05-01
字數:
頁數:341頁
開本:16開
包裝:平裝
重量:
定價:69元
編輯推薦
《圖靈程序設計叢書:學習R》講解如何使用R語言及其軟件環境分析數據,即使沒有編程經驗也能看懂。通過這本實用教程,你可以輕鬆掌握如何使用必要的R工具來分析數據,同時掌握相關數據類型和通用的編程概念。
《圖靈程序設計叢書:學習R》後半部分會講到數據分析的各種實際應用,涵蓋導入數據和發布結果。另外,值得一提的是,本書每一章都會結閤所講內容提供精心編製的小測試和練習題,需要編寫R代碼完成,從而鞏固所學的知識。
內容簡介
《圖靈程序設計叢書:學習R》分為上下兩部分,旨在指導你如何使用R,並提供練習的機會。上半部分主要介紹R的技術細節和使用技巧。每章都簡要介紹瞭一組不同的數據類型(例如第4章介紹嚮量、矩陣和數組)或概念(例如第8章介紹分支和循環)。下半部分更側重實踐,展示瞭從輸入數據到發布結果這一標準的數據分析流程。
即使你沒有任何編程基礎,也能順利閱讀《學習R》。
作者簡介
Richard Cotton,是一位通曉化學安全及健康的數據科學傢,開發過很多能讓非專業用戶訪問統計模型的工具。他開發瞭很多R包,如assertive(用於檢查變量的狀態)和sig(用於確保功能具有閤理的API)。他也是The Damned Liars公司的統計學顧問。
目錄
譯者序XII
前言XIII
第1部分R語言
第1章 簡介2
1.1本章目標2
1.2R是什麼2
1.3安裝R3
1.4選擇一個IDE4
1.4.1Emacs+ESS4
1.4.2Eclipse/Architect4
1.4.3RStudio5
1.4.4Revolution-R5
1.4.5Live-R5
1.4.6其他IDE和編輯器6
1.5你的第1個程序6
1.6如何從R中獲得幫助7
1.7安裝其他相關軟件9
1.8小結9
1.9知識測試:問題10
1.10知識測試:練習10
第2章 科學計算器11
2.1本章目標11
2.2數學運算符和嚮量11
2.3變量賦值15
2.4特殊數字17
2.5邏輯嚮量18
2.6小結20
2.7知識測試:問題20
2.8知識測試:練習20
第3章 檢查變量和工作區22
3.1本章目標22
3.2類22
3.3不同類型的數字23
3.4其他通用類24
3.5檢查和更改類26
3.6檢查變量29
3.7工作區32
3.8小結33
3.9知識測試:問題33
3.10知識測試:練習34
第4章 嚮量、矩陣和數組35
4.1本章目標35
4.2嚮量35
4.2.1序列37
4.2.2長度38
4.2.3命名39
4.2.4索引嚮量39
4.2.5嚮量循環和重復41
4.3矩陣和數組43
4.3.1創建數組和矩陣43
4.3.2行、列和維度45
4.3.3行名、列名和維度名46
4.3.4索引數組47
4.3.5閤並矩陣47
4.3.6數組算術48
4.4小結50
4.5知識測試:問題50
4.6知識測試:練習51
第5章 列錶和數據框52
5.1本章目標52
5.2列錶52
5.2.1創建列錶52
5.2.2原子變量和遞歸變量54
5.2.3列錶的維度和算術運算55
5.2.4索引列錶56
5.2.5嚮量和列錶之間的轉換58
5.2.6組閤列錶60
5.3NULL61
5.4成對列錶64
5.5數據框65
5.5.1創建數據框65
5.5.2索引數據框68
5.5.3基本數據框操作69
5.6小結71
5.7知識測試:問題71
5.8知識測試:練習72
第6章 環境和函數73
6.1本章目標73
6.2環境73
6.3函數76
6.3.1創建和調用函數76
6.3.2嚮其他函數傳遞和接收函數80
6.3.3變量的作用域82
6.4小結84
6.5知識測試:問題84
6.6知識測試:練習84
第7章 字符串和因子86
7.1本章目標86
7.2字符串86
7.2.1創建和打印字符串87
7.2.2格式化數字88
7.2.3特殊字符90
7.2.4更改大小寫91
7.2.5截取字符串91
7.2.6分割字符串92
7.2.7文件路徑93
7.3因子94
7.3.1創建因子94
7.3.2更改因子水平96
7.3.3去掉因子水平96
7.3.4有序因子97
7.3.5將連續變量轉換為類彆98
7.3.6將類彆變量轉換為連續變量99
7.3.7生成因子水平100
7.3.8閤並因子100
7.4小結101
7.5知識測試:問題101
7.6知識測試:練習101
第8章 流程控製和循環103
8.1本章目標103
8.2流程控製103
8.2.1if和else103
8.2.2矢量化的if105
8.2.3多個分支106
8.3循環108
8.3.1重復循環108
8.3.2while循環110
8.3.3for循環111
8.4小結113
8.5知識測試:問題113
8.6知識測試:練習113
第9章 高*循環115
9.1本章目標115
9.2replication115
9.3遍曆列錶116
9.4遍曆數組122
9.5多個輸入的應用函數124
9.6拆分-應用-閤並(Split-Apply-Combine)126
9.7plyr包127
9.8小結130
9.9知識測驗:問題130
9.10知識測試:練習131
第10章 包133
10.1本章目標133
10.2加載包133
10.2.1搜索路徑135
10.2.2庫和已安裝的包136
10.3安裝包137
10.4維護包139
10.5小結139
10.6知識測試:問題140
10.7知識測試:練習140
第11章 日期和時間141
11.1本章目標141
11.2日期和時間類141
11.2.1POSIX日期和時間142
11.2.2Date類143
11.2.3其他日期類144
11.3日期與字符串的相互轉換144
11.3.1解析日期144
11.3.2格式化日期145
11.4時區145
11.5日期和時間的算術運算147
11.6lubridate149
11.7小結153
11.8知識測試:問題153
11.9知識測試:練習153
第二部分 數據分析工作流
第12章 獲取數據156
12.1本章目標156
12.2內置的數據集156
12.3讀取文本文件157
12.3.1CSV和製錶符分隔(Tab-Delimited)文件157
12.3.2非結構化文本文件161
12.3.3XML和HTML文件161
12.3.4JSON和YAML文件163
12.4讀取二進製文件165
12.4.1讀取Excel文件165
12.4.2讀取SAS、Stata、SPSS和MATLAB文件167
12.4.3讀取其他文件類型167
12.5Web數據168
12.5.1擁有API的網站168
12.5.2抓取網頁169
12.6訪問數據庫171
12.7小結174
12.8知識測試:問題174
12.9知識測試:練習174
第13章 數據清理和轉換175
13.1本章目標175
13.2清理字符串175
13.3操作數據框180
13.3.1添加和替換列180
13.3.2處理缺失值181
13.3.3在寬和長錶格之間進行轉換182
13.3.4使用SQL183
13.4排序184
13.5函數式編程185
13.6小結188
13.7知識測試:問題188
13.8知識測試:練習189
第14章 探索和可視化190
14.1本章目標190
14.2匯總統計190
14.3三種繪圖係統194
14.4散點圖195
14.4.1第1種方法:base繪圖法195
14.4.2第二種方法:lattice圖形係統200
14.4.3第三種方法:ggplot2圖形係統207
14.5綫圖212
14.6直方圖220
14.7箱綫圖232
14.8條形圖236
14.9其他的繪圖包和係統242
14.10小結243
14.11知識測試:問題243
14.12知識測試:練習244
第15章 分布與建模245
15.1本章目標245
15.2隨機數246
15.2.1示例函數246
15.2.2從分布中抽樣247
15.3分布248
15.4公式248
15.5第1個模型:綫性迴歸250
15.5.1比較和更新模型252
15.5.2繪圖和模型檢查257
15.6其他模型類型261
15.7小結262
15.8知識測試:問題263
15.9知識測試:練習263
第16章 程序設計264
16.1本章目標264
16.2信息、警告和錯誤264
16.3錯誤處理267
16.4調試270
16.5測試273
16.5.1RUnit273
16.5.2testthat276
16.6魔法277
16.6.1將字符串轉換成代碼277
16.6.2把代碼轉換成字符串279
16.7麵嚮對象編程280
16.7.1S3類281
16.7.2引用類282
16.8小結287
16.9知識測試:問題287
16.10知識測試:練習288
第17章 製作程序包289
17.1本章目標289
17.2為什麼要創建軟件包289
17.3先決條件289
17.4包目錄結構290
17.5你的第1個包291
17.6為包撰寫文檔293
17.7檢查和構建包296
17.8包的維護297
17.9小結298
17.10知識測試:問題299
17.11知識測試:練習299
第三部分 附錄
附錄A變量的屬性302
附錄BR中其他可做的事情305
附錄C問題答案307
附錄D練習答案315
參考文獻339
關於封麵341
前言/序言
R是一種編程語言,也是用於數據分析和統計的軟件環境。它是一個GNU項目,這意味著它是自由的開源軟件。它正在以指數*的速度不斷成長——普遍認為,它的用戶人數可能超過瞭100萬,它有4000多個由開發社區貢獻的附件包,而且每年以約25%的速度增加。在本書創作之時,它在Tiobe編程社區指數(Tiobe Programming Community Index)的開發語言流行榜上已排至第24位,大緻與SAS和MATLAB看齊。
R廣泛地應用在每一個需要統計或數據分析的領域,涵蓋瞭金融、市場營銷、醫藥、基因組學、流行病學、社會科學、教學以及許多其他較小的領域。
關於本書
因為R主要用於統計分析,所以很多關於R的書都在指導你如何計算統計或模型數據集。然而,這些書忽視瞭數據分析應用的實際情況。事實上,除非你做的是研究,否則你所用到的統計技術往往隻需用於常規任務,而且你的模型可能也不大。完整的數據分析流程更像是這樣:
(1) 取得一些數據;
(2) 清理數據;
(3) 探索和可視化數據;
(4) 數據建模並做齣預測;
(5) 展示或發布你的結果。
當然,每個階段都可能碰到一些有趣的問題,以至於你需要更多的數據,或者要以不同的方式處理現有數據,這會使你的工作倒退一步。工作流是可以迭代的,但每個步驟都不可或缺。
本書的第1部分會從頭開始教你R——你不需要任何編程語言的經驗。實際上,雖然完全沒有編程經驗也無妨,但有一些基本的編程知識會更好。例如,本書介紹瞭如何注釋代碼以及編寫for循環,但沒有作更詳細的解釋。因此,如果你想要找本真正的編程入門課本,那麼Jason R。Briggs寫的Python for Kids非常閤適!
本書的第二部分將展示R語言的完整數據分析流程,這裏需要一些基本的統計知識。例如,你應該瞭解平均值和標準差等術語,以及什麼是條形圖(bar chart)。
本書後將介紹R的一些高*主題,例如麵嚮對象編程和包的創GarrettGrolem的Data Analysis with R將會在本書的基礎上深入探討數據分析流程。
。。。。。。。。
........評分
評分
評分
評分
評分
評分
評分
評分
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有