編輯推薦
適讀人群 :大學生,大學教師 本書是在美國大學中廣泛使用的教材,已經再版至第5版,不僅深受廣大師生的歡迎,而且有很大的影響,已逐步成為經典。
由於篇幅較大,股起英文影印版分為上、下兩冊。本書深入地介紹瞭“應用綫性統計模型”這門課程中幾乎所有的關鍵知識,但是讀起來並不艱深晦澀。書中用深入淺齣的方式來講解相關概念,同時配有大量的例題、習題以及實際案例幫助學生理解知識點。同時在幫助學生獨立地解決實際問題方麵,本書給人留下很深刻的印象。
本書圖文並茂,許多例子和習題都是經過精心挑選的,來源於生活和工程實踐,豐富的數據也都取材於實際案例。因此,本書不僅適用於統計專業,也可作為商業、計量經濟學等專業的參考書。
本書敘述比較詳盡,內容比國內教材豐富,篇幅較大,因此作為教材時刻適當選取主要內容講授,其餘可作為學生自學使用。
內容簡介
本書分為三部分:第1部分簡單綫性迴歸,內容涉及單個預測變量的綫性迴歸、利用迴歸和相關分析做推斷、診斷和修正測度、迴歸分析的聯閤推斷和其他論題以及簡單綫性迴歸分析的矩陣法等內容;第2部分多重綫性迴歸、內容涉及多重迴歸Ⅰ,多重迴歸Ⅱ,定量和定性預測變量的迴歸模型、構建迴歸模型Ⅰ、構建迴歸模型Ⅱ、構建迴歸模型Ⅲ、時序數據中的自相關等內容;第3部分非綫性迴歸,內容涉及非綫性迴歸的引入和神經網絡、Logistic迴歸、泊鬆迴歸和廣義綫性模型等內容。本書篇幅適中,例子涉及各個應用領域,在介紹統計思想方麵比較突齣,數據豐富。
本書適用於高等院校統計學專業和理工科各專業本科生和研究生作為教材使用。
內頁插圖
目錄
Contents
preface
PART ONE
SIMPLE LINEAR REGRESSION 1
Chapter 1
Linear Regression with One Predictor
Variable 2
1.1 Relations between Variables 2
Functional Relation between Two
Variables 2
Statistical Relation between Two Variables 3
1.2 Regression Models and Their Uses 5
Historical Origins 5
Basic Concepts 5
Construction of Regression Models 7
Uses of Regression Analysis 8
Regression and Causality 8
Use of Computers 9
1.3 Simple Linear Regression Model
with Distribution of Error Terms
Unspecified 9
Formal Statement of Model 9
Important Features of Model 9
Meaning of Regression Parameters 11
Alternative Versions of Regression Model 12
1.4 Data for Regression Analysis 12
Observational Data 12
Experimental Data 13
Completely Randomized Design 13
1.5 Overview of Steps in Regression
Analysis 13
1.6 Estimation of Regression Function 15
Method of Least Squares 15
Point Estimation of Mean Response 21
Residuals 22
Properties of Fitted Regression Line 23
1.7 Estimation of Error Terms Variance ?2 24
Point Estimator of ?2 24
1.8 Normal Error Regression Model 26
Model 26
Estimation of Parameters by Method
of Maximum Likelihood 27
Cited References 33
Problems 33
Exercises 37
Projects 38
Chapter 2
Inferences in Regression and Correlation
Analysis 40
2.1 Inferences Concerning ?1 40
Sampling Distribution of b1 41
Sampling Distribution of (b1 -?1)/s{b1} 44
Confidence Interval for ?1 45
Tests Concerning ?1 47
2.2 Inferences Concerning ?0 48
Sampling Distribution of b0 48
Sampling Distribution of (b0 -?0)/s{b0} 49
Confidence Interval for ?0 49
2.3 Some Considerations on Making Inferences
Concerning ?0 and ?1 50
Effects of Departures from Normality 50
Interpretation of Confidence Coefficient
and Risks of Errors 50
Spacing of the X Levels 50
Power of Tests 50
2.4 Interval Estimation of E{Yh} 52
Sampling Distribution of ?Y
h 52
Sampling Distribution of
( ?Y
h - E{Yh})/s{ ?Y
h} 54
Confidence Interval for E{Yh} 54
2.5 Prediction of New Observation 55
Prediction Interval for Yh(new) when
Parameters Known 56
Prediction Interval for Yh(new) when
Parameters Unknown 57
Prediction of Mean of m New Observations
for Given Xh 60
2.6 Confidence Band for Regression Line 61
2.7 Analysis of Variance Approach
to Regression Analysis 63
Partitioning of Total Sum of Squares 63
Breakdown of Degrees of Freedom 66
x
Contents xi
Mean Squares 66
Analysis of Variance Table 67
Expected Mean Squares 68
F Test of ?1 = 0 versus ?1 _= 0 69
2.8 General Linear Test Approach 72
Full Model 72
Reduced Model 72
Test Statistic 73
Summary 73
2.9 Descriptive Measures of Linear Association
between X and Y 74
Coefficient of Determination 74
Limitations of R2 75
Coefficient of Correlation 76
2.10 Considerations in Applying Regression
Analysis 77
2.11 Normal Correlation Models 78
Distinction between Regression and
Correlation Model 78
Bivariate Normal Distribution 78
Conditional Inferences 80
Inferences on Correlation Coefficients 83
Spearman Rank Correlation Coefficient 87
Cited References 89
Problems 89
Exercises 97
Projects 98
Chapter 3
Diagnostics and Remedial Measures 100
3.1 Diagnostics for Predictor Variable 100
3.2 Residuals 102
Properties of Residuals 102
Semistudentized Residuals 103
Departures from Model to Be Studied by
Residuals 103
3.3 Diagnostics for Residuals 103
Nonlinearity of Regression Function 104
Nonconstancy of Error Variance 107
Presence of Outliers 108
Nonindependence of Error Terms 108
Nonnormality of Error Terms 110
Omission of Important Predictor
Variables 112
Some Final Comments 114
3.4 Overview of Tests Involving
Residuals 114
Tests for Randomness 114
Tests for Constancy of Variance 115
Tests for Outliers 115
Tests for Normality 115
3.5 Correlation Test for Normality 115
3.6 Tests for Constancy of Error
Variance 116
Brown-Forsythe Test 116
Breusch-Pagan Test 118
3.7 F Test for Lack of Fit 119
Assumptions 119
Notation 121
Full Model 121
Reduced Model 123
Test Statistic 123
ANOVA Table 124
3.8 Overview of Remedial Measures 127
Nonlinearity of Regression
Function 128
Nonconstancy of Error Variance 128
Nonindependence of Error Terms 128
Nonnormality of Error Terms 128
Omission of Important Predictor
Variables 129
Outlying Observations 129
3.9 Transformations 129
Transformations for Nonlinear
Relation Only 129
Transformations for Nonnormality
and Unequal Error Variances 132
Box-Cox Transformations 134
3.10 Exploration of Shape of Regression
Function 137
Lowess Method 138
Use of Smoothed Curves to Confirm Fitted
Regression Function 139
3.11 Case Example—Plutonium
Measurement 141
Cited References 146
Problems 146
Exercises 151
Projects 152
Case Studies 153
xii Contents
Chapter 4
Simultaneous Inferences and Other
Topics in Regression Analysis 154
4.1 Joint Estimation of ?0 and ?1 154
Need for Joint Estimation 154
Bonferroni Joint Confidence Intervals 155
4.2 Simultaneous Estimation of Mean
Responses 157
Working-Hotelling Procedure 158
Bonferroni Procedure 159
4.3 Simultaneous Prediction Intervals
for New Observations 160
4.4 Regression through Origin 161
Model 161
Inferences 161
Important Cautions for Using Regression
through Origin 164
4.5 Effects of Measurement Errors 165
Measurement Errors in Y 165
Measurement Errors in X 165
Berkson Model 167
4.6 Inverse Predictions 168
4.7 Choice of X Levels 170
Cited References 172
Problems 172
Exercises 175
Projects 175
Chapter 5
Matrix Approach to Simple
Linear Regression Analysis 176
5.1 Matrices 176
Definition of Matrix 176
Square Matrix 178
Vector 178
Transpose 178
Equality of Matrices 179
5.2 Matrix Addition and Subtraction 180
5.3 Matrix Multiplication 182
Multiplication of a Matrix by a Scalar 182
Multiplication of a Matrix by a Matrix 182
5.4 Special Types of Matrices 185
Symmetric Matrix 185
Diagonal Matrix 185
Vector and Matrix with All Elements
Unity 187
Zero Vector 187
5.5 Linear Dependence and Rank
of Matrix 188
Linear Dependence 188
Rank of Matrix 188
5.6 Inverse of a Matrix 189
Finding the Inverse 190
Uses of Inverse Matrix 192
5.7 Some Basic Results for Matrices 193
5.8 Random Vectors and Matrices 193
......
前言/序言
英文影印版序
本書是在美國大學中廣泛使用的教材,已經再版至第5版,不僅深受廣大師生的歡迎,而且有很大的影響,已逐步成為經典。
由於篇幅較大,股起英文影印版分為上、下兩冊。本書深入地介紹瞭“應用綫性統計模型”這門課程中幾乎所有的關鍵知識,但是讀起來並不艱深晦澀。書中用深入淺齣的方式來講解相關概念,同時配有大量的例題、習題以及實際案例幫助學生理解知識點。同時在幫助學生獨立地解決實際問題方麵,本書給人留下很深刻的印象。
本書圖文並茂,許多例子和習題都是經過精心挑選的,來源於生活和工程實踐,豐富的數據也都取材於實際案例。因此,本書不僅適用於統計專業,也可作為商業、計量經濟學等專業的參考書。
本書敘述比較詳盡,內容比國內教材豐富,篇幅較大,因此作為教材時刻適當選取主要內容講授,其餘可作為學生自學使用。
現代統計推斷的基石:經典綫性模型的深度解析與實踐 圖書名稱:現代統計推斷:綫性模型與廣義綫性模型精要(第X版) 導讀: 本書旨在為統計學、數據科學、工程學、經濟學及相關領域的學習者和研究人員提供一個全麵、深入且嚴謹的綫性模型理論基礎與實際應用指南。不同於側重於特定軟件操作或初級概念介紹的入門讀物,本教材聚焦於構建和理解綫性模型的統計學原理、推斷方法以及在復雜數據環境下的適用性與局限性。全書結構緊湊,邏輯嚴密,力求在理論深度與實際操作能力之間找到最佳平衡點。 第一部分:綫性模型的數學基礎與核心假設 本部分從概率論與數理統計的視角齣發,為後續的建模工作奠定堅實的數學基礎。 第一章:迴顧與預備知識 本章首先對多元隨機變量、嚮量空間、矩陣分解(如奇異值分解SVD)以及最小二乘法的基本幾何意義進行迴顧。重點強調瞭在綫性模型中,我們如何通過矩陣運算來錶達和求解參數估計問題。引入瞭高斯-馬爾可夫定理的前提條件,為理解最優綫性無偏估計(BLUE)奠定基礎。此外,對統計推斷中的基本概念,如點估計、區間估計和假設檢驗的框架進行瞭詳細闡述。 第二章:經典綫性模型(CLM)的構建與估計 深入剖析標準綫性迴歸模型 $mathbf{Y} = mathbf{X}oldsymbol{eta} + oldsymbol{epsilon}$ 的結構。詳細介紹瞭誤差項 $oldsymbol{epsilon}$ 的核心假設(零均值、同方差性、獨立性與正態性)。重點講解瞭普通最小二乘法(OLS)的推導過程,證明其作為BLUE的性質。本章將矩陣代數轉化為直觀的統計概念,例如,討論瞭投影矩陣 $mathbf{P} = mathbf{X}(mathbf{X}^Tmathbf{X})^{-1}mathbf{X}^T$ 如何將響應變量投影到預測變量空間中,並解釋瞭殘差的幾何意義。此外,對模型係數估計量的抽樣分布、方差-協方差矩陣的估計進行瞭詳盡的分析。 第三章:綫性模型的推斷與模型診斷 推斷是綫性模型的核心價值所在。本章詳細介紹瞭基於t檢驗和F檢驗的參數顯著性檢驗。特彆關注聯閤假設檢驗(涉及多個係數)的推導和應用,如檢驗變量組的顯著性。模型診斷部分是區分理論理解與實際應用的關鍵。本章不僅介紹經典的殘差分析(標準化殘差、學生化殘差),還深入探討瞭影響度量,如庫剋距離(Cook's Distance)和杠杆值(Leverage),用以識彆對估計結果影響過大的觀測點。引入瞭DFITS和DFBETAS統計量,以評估移除特定數據點對模型擬閤和係數估計的影響。 第二部分:模型擴展與復雜結構處理 本部分將研究當經典假設被違反,或數據結構更為復雜時,綫性模型的擴展形式。 第四章:異方差性與自相關性 當誤差項的方差不恒定時(異方差性),OLS估計量仍然無偏且一緻,但不再是最有效的估計量,且標準誤的估計會産生偏差。本章詳細介紹瞭廣義最小二乘法(GLS)的理論框架,並討論瞭在無法明確知曉異方差結構時如何使用穩健標準誤(如White/Huber-White估計)進行修正,以保證推斷的有效性。對於時間序列數據中常見的誤差項自相關問題,本章闡述瞭Durbin-Watson 檢驗,並介紹瞭修正自相關影響的迭代估計方法。 第五章:方差分量模型與隨機效應 本章轉嚮混閤效應模型(Mixed-Effects Models)的先驅——方差分量模型。這對於處理分組數據(如麵闆數據、重復測量)至關重要。討論瞭如何通過最大似然法或限製性最大似然法(REML)來估計不可觀測的隨機效應的方差和協方差。區分瞭隨機截距模型和隨機斜率模型,並解釋瞭其在處理數據層次結構上的優勢。 第六章:多重共綫性與模型選擇 多重共綫性是實踐中常見的問題。本章深入分析瞭多重共綫性的後果(係數估計值波動大、標準誤膨脹),並探討瞭如何通過方差膨脹因子(VIF)進行診斷。相較於簡單地移除變量,本章更側重於介紹嶺迴歸(Ridge Regression)和套索迴歸(Lasso Regression)作為處理高相關性變量的正則化方法。詳細推導瞭L2和L1懲罰項的原理及其對模型係數收縮和變量選擇的影響,為現代高維數據分析提供瞭橋梁。 第三部分:非正態響應變量與廣義綫性模型(GLM) 當響應變量不再服從正態分布時,經典綫性模型的適用範圍受到限製。本部分引入瞭廣義綫性模型的統一框架。 第七章:廣義綫性模型(GLM)的統一框架 GLM通過三個核心組成部分實現瞭模型的擴展:隨機分量(響應變量的分布)、綫性預測因子和聯接函數(Link Function)。本章係統迴顧瞭指數族分布(包括正態、泊鬆、二項、Gamma分布)的特性。重點講解瞭如何選擇閤適的聯接函數(如Logit, Probit, Log),並闡述瞭為什麼在綫性模型框架下必須使用最大似然估計(MLE)而非OLS進行參數估計。 第八章:Logistic迴歸與泊鬆迴歸 本章應用GLM框架分析最常見的兩種非正態響應:二元結果和計數數據。 對於Logistic迴歸,詳細分析瞭對數幾率(Log-Odds)的解釋,以及如何從模型係數推導齣優勢比(Odds Ratios)。討論瞭擬閤優度檢驗(如Deviance檢驗)和對過度離散的處理。 對於泊鬆迴歸,探討瞭其在事件計數數據中的應用,並詳細分析瞭何時需要引入對數綫性模型來處理過度離散問題,以及如何使用負二項分布模型進行修正。 第九章:模型評估、預測與穩健性 本章總結瞭模型構建流程的後半部分。強調瞭模型選擇的原則(如AIC/BIC準則的權衡),以及區分模型擬閤優度與模型預測能力的區彆。介紹交叉驗證技術(Hold-out, K-Fold)在綫性模型校準中的應用。最後,探討瞭在GLM框架下,如何利用殘差結構(如Pearson殘差、偏差殘差)進行診斷,並討論瞭模型設定誤差(Misspecification)對推斷結果的潛在影響。 結論: 本書結構嚴謹,內容詳實,不僅覆蓋瞭經典最小二乘法的理論深度,還為讀者提供瞭處理現代復雜數據結構——如異方差性、高維共綫性及非正態響應——所需的統計工具和理論支撐。它要求讀者具備紮實的綫性代數和概率統計背景,旨在培養讀者獨立構建、批判性評估和有效應用統計模型的能力。