人類學、社會學、經濟學、政治學、心理學等學科常常需要用到多元迴歸分析,通過此方法來研究變量之間的關係。廣義綫性模型是迴歸模型的一個延伸,是處理定量赫爾定性的變量分析。多元迴歸分析涵蓋瞭所有綫性模型的數據分析係統,包括處理連續變量的分析模型、處理分類變量的模型以及同時處理前兩者的模型。迴歸模型在處理不同類型的預測變量時非常靈活,因此多元廣義綫性模型在很多學科領域都得到瞭廣泛的運用。
《多元廣義綫性模型》介紹瞭廣義綫性模型的多元形式,並展示瞭多元廣義綫性模型的幾種應用。首先,作者迴顧瞭一元迴歸分析,然後介紹瞭一些示例樣本數據,並對廣義綫性模型分析的模型識彆進行瞭討論,在此基礎上,作者探討瞭模型參數估計、模型擬閤優度的評價及相應的多元檢驗統計量,以及對模型的假設檢驗,最後介紹瞭多元方法分析的綫性模型解決方法和典型相關分析。
理查德?F.哈斯(Richard F. Haase),美國紐約州立大學奧爾巴尼分校教育學院心理谘詢部榮譽教授、研究教授,以及公共衛生學院健康與環境研究所的研究員。先後在馬薩諸塞大學阿默斯特分校、得州理工大學和紐約州立大學奧爾巴尼分校教授研究方法、統計學和數據分析。研究興趣集中在研究方法、一元和多元統計學。
一元廣義綫性模型的簡介與迴顧
一元綫性模型分析迴顧
識彆一元迴歸模型
模型的參數估計
證實最小二乘估計的有效性所需要的假設
分解平方和以及定義擬閤優度的測量
全模型、限製模型以及半偏相關係數的平方
迴歸係數和判定係數的假設檢驗
廣義綫性假設檢驗
模型整體假設 β_1= β_2= β_3=0 和 ρ_(Y?X_1 X_2 X_3)^2 的檢驗
用廣義綫性檢驗方法評估X1, X2和 X3 的單獨貢獻
用廣義綫性檢驗檢驗更為復雜的假設
從一元到多元廣義綫性模型的一般化
多元廣義綫性模型的結構識彆
模型的數學識彆
定義預測變量和標準變量的實質作用
示例數據和模型識彆
廣義多元綫性模型的參數估計
例1:性格特徵與成功的工作申請
用標準得分的形式估計多元綫性模型中的參數
例2:多氯聯苯——心血管疾病的風險因素:認知功能數據
對多元綫性模型分析的電腦程序的一個說明
本章小結與迴顧
多元SSCP分解、關聯強度的測量和檢驗統計量
在多元廣義綫性模型中SSCP的分解
例1:性格與工作申請
例2:PCB 數據
SSCP 矩陣的進一步分解:全模型、限製模型以及定義Q_H
一些關聯強度的多元測度的概念定義
一個不對稱的R^2的多元測度——Hooper跡相關係數平方
例子:性格數據和PCB數據中Hooper’s r ?^2
一元和多元R^2之間的關係和它們的檢驗統計量
Pillai跡 V和相應的關聯強度測度R_V^2
Wilks’ Λ 及其關聯強度測度
Hotelling跡 Τ及其關聯強度測度R_Τ^2
Roy最大特徵根及其關聯強度度量r_(C_max)^2
通過一元迴歸模型建立Pillai跡V和Wilks’Λ
多元廣義綫性模型中的假設檢驗
多元廣義綫性檢驗
多元檢驗統計量及其近似F檢驗
對Pillai跡V的近似F檢驗
Wilks’Λ的近似F檢驗
Hotelling跡Τ的近似F檢驗
Roy最大特徵根θ的近似F檢驗
對一個或一組預測變量的廣義綫性檢驗
對一個預測變量的多元假設檢驗:性格數據
一個預測變量的多元假設檢驗:PCB數據
一組預測變量的多元假設檢驗和其他復雜假設
檢驗其他的復雜的多元假設
適用於所有多元綫性模型分析的假設
編碼設計矩陣和方差模型的多元分析
變量和嚮量的差異
用編碼嚮量來錶示一個分類變量
通過廣義綫性檢驗來檢驗MANOVA 假設
分解SSCP矩陣和MANOVA裏的假設檢驗
身材估計數據的單項MANOVA
更高階的MANOVA設計:對身材估計數據的一個2 x 3階MANOVA
關於MANOVA分析假設的備注
多元綫性模型的特徵值求解:典型相關係數和多元檢驗統計量
典型相關係數的概念定義
2 x 2相關係數矩陣的特徵值
R_((2x2) )的特徵嚮量
R_YY^(-1) R_YX R_XX^(-1) R_XY的特徵值
特徵值、典型相關係數的平方和四個多元檢驗統計量
R_YY^(-1) R_YX R_XX^(-1) R_XY的典型相關係數的平方的特徵嚮量
檢驗典型相關係數和典型係數上的進一步假設
注釋
參考文獻
譯名對照錶
在這些數據中,我們無法拒絕AxB 交互作用的H_0。我們沒有足夠的證據說明性彆差異在三個地理聚類分組中不保持恒定。在有交互作用時和沒有交互作用時分彆應該如何處理是一個很復雜的問題。目前針對於這個問題還沒有達成一個共識。很多作者 (例如, Muller & Fetterman, 2002, 第14章) 建議在復雜的ANOVA模型中,應該先檢驗並解釋交互作用,然後再討論因素的主要作用。如果交互作用顯著,我們應該忽略因素的主要作用。而且模型解釋應該主要針對交互作用。同時應該對潛在交互的簡單主要作用做進一步調查。相反,如果交互作用不顯著,我們可以把交互作用從模型中移除。然後對因素的主要作用進行重新估計和解釋。
復雜的ANOVA設計中還有一個難點就是設計單元的不平衡,也就是每個單元中的樣本數量不相等。我們這裏用的2 x 3的例子 就是這種情況。單元樣本量不相等會引起因素主要作用間存在相關性。這樣我們模型中的因素就不再相互正交,從而導緻因素的作用也不再像在平衡設計條件下相互獨立。我們可以采取以下幾種方法來解決這個問題,包括 (1)每個作用進行調整後再檢驗因素A,因素B和AxB 的交互作用。具體的調整方式是對模型中其他的主要作用和交互作用進行調整——這就是第三類平方和解法,該解法是對未加權均值進行檢驗,我們已經在這個2 x 3的例子中使用過。第三類解法中每個作用都對其他作用進行調整。 (2) 對模型中的主要作用調整(而不對任何高階項例如AxB的交互做齣調整)後,檢驗主要作用(因素A或者因素B)——這是第二類平方和解法,該方法基於加權平均值,並對單元樣本量不相等做齣瞭調整。 (3) 檢驗第一個主要作用,比方說因素A,但不對其餘模型作用做齣調整。然後對因素A調整後再檢驗下一個主要作用,比方說因素B。接著,對因素A和B都調整後再檢驗 AxB的交互作用。這個想法是按順序對模型中的因素做齣調整。每個作用都對前麵已經檢驗過的作用做齣調整—— 這是第一類平方和解法。該方法需要一個理由或者理論來決定選擇檢驗順序。我們還有第四種解法,該方法適用於在一個或多個單元為空的情況。但不被大部分作者所推薦。關於這四種非正交設計的解法之間區彆的詳細討論請參閱Green et al. (1999)和 Maxwell and Delaney (2004, 第7章)。大部分多元綫性模型分析的統計軟件都默認設置為第三類解法。但如果有必要,用戶可以選擇結果用其他解法輸齣。如果第三種解法的結果由於單元樣本容量的極度不平衡而值得懷疑,第二類解法是最有用的替代選擇。在身材估計數據(錶格6.12)的2 x 3 MANOVA 中,因素A和B的第二類分析需要對比嚮量L_A和 L_B。這兩個嚮量的建立是為瞭根據設計中六個單元不相等的n_ab ,來提供一種加權平均。 具體依據不想的單元樣本量,對對比嚮量加權來獲得第二類平方和的解的方法請參閱 Littell, Stroup and Freund (2002, pp. 198-201)。盡管我們不在這裏展示這個分析,對身材數據的第二類SSCP分析將得到與基於錶格6.12中總結的檢驗相同的結論。大部分用於MANOVA的電腦軟件在估計任意因素模型的參數時,都是用廣義逆完成。而且輸齣結果的形式是依照我們前麵章節中討論的參考單元編碼設計矩陣。用戶可以對任何問題選擇自己偏愛的分析方法(也就是SSCP矩陣的第一類到第四類分解方法)。
在社會科學、行為科學以及自然科學中,很少有數據分析技術比多元迴歸分析更為重要。在各個領域,包括人類學(Cardoso & Garcia, 2009)、經濟學(Card, Dobkin & Maestas, 2009)、政治學 (Baek, 2009)、社會學(Arthur, Van Buren & Del Campo, 2009),以及心理學的各個分支(Ellis, MacDonald, Lincoln, & Cabral, 2008; Pekrun, Elliot, & Maier, 2009)中, 都可見多元迴歸分析的示範性應用。
在以上每個領域中,研究者的目的是研究變量之間的關係。用數據擬閤迴歸模型可以使分析者能夠用一個或多個預測變量來解釋一個因變量內的變化。廣義綫性模型是迴歸模型的一個延伸,用來處理定量和定性的變量分析。 眾所周知,多元迴歸分析是一個涵蓋所有綫性模型的數據分析係統 (Cohen, 1968), 包括瞭處理連續變量的分析模型(經典迴歸分析)、處理分類變量的模型(經典方差分析),以及同時處理連續和分類預測變量的模型。
這些模型共同定義瞭廣義綫性模型。迴歸模型在處理許多不同類型的預測變量方麵是非常靈活的,包括連續變量的交互作用,分類變量的交互作用,以及連續和分類變量的交互作用。 這些組閤提供瞭在更廣泛的範圍內進行分析的可能性,這解釋瞭為什麼這項技術在所有科學領域內,包括從人類學到動物學,都有如此廣泛的運用。
本書的目的是介紹廣義綫性模型的多元形式,以及展示它的幾種應用。多元模型的特點是具有不止一個因變量,通過擬閤一個模型來同時分析這些變量。很多多元綫性模型分析的概念和統計學基礎是對一元迴歸分析的直接推廣,我們將在本章中簡單迴顧一元迴歸分析,來為之後的章節做鋪墊。第二章中,我們介紹瞭會一直用到的示例樣本數據,並對廣義綫性模型(GLM) 分析中的第一步--模型識彆--進行討論。第三、四、五章的內容涉及到瞭模型參數的估計,模型擬閤優度的評價及相應的多元檢驗統計量, 以及對模型的假設檢驗。第六章介紹瞭多元方差分析的綫性模型解決方法, 第七章用對典型相關分析的介紹來結束本書。典型相關分析涵蓋瞭之前章節介紹過的所有綫性模型。本文最重要的目的是從一個整閤的視角把所有不同的技術用一個模型框架展現齣來。
這本書的實戰操作部分,設計得極其人性化,這一點對於很多希望將理論迅速落地到工作中的讀者來說,簡直是福音。它不是那種隻停留在理論層麵的高談闊論,而是非常細緻地結閤瞭當前主流的統計軟件包(雖然我沒有看到具體的代碼示例,但文字描述的流程感非常強)。作者對模型選擇的討論,尤為精彩。他沒有簡單地推薦AIC或BIC,而是深入比較瞭在不同樣本量和模型復雜性下,這些信息準則的優劣,甚至提到瞭模型收斂性的重要性。我尤其欣賞他對“模型診斷”環節的重視,這往往是許多初級教材會忽略的“黑箱”部分。書中強調瞭對殘差的結構化分析,不僅僅是看獨立性和同方差性,更是要探究殘差是否服從預期的分布形態。這使得讀者在建立模型後,不再是盲目地相信輸齣結果,而是學會瞭像偵探一樣去審視模型的每一個角落,確保模型的可靠性和解釋力的有效性。這種嚴謹的流程,讓人在應用時信心倍增。
評分閱讀過程中,我發現作者在講解方法論的演進時,展現齣一種近乎哲學的思辨深度。他沒有簡單地羅列各種模型,比如泊鬆迴歸、負二項迴歸,然後給齣公式。相反,他花瞭大篇幅去探討“為什麼”我們需要這些模型。那種對概率分布特性的深入剖析,比如指數傢族(Exponential Family)的概念,被闡釋得非常清晰,仿佛作者在用最日常的語言,解構那些看似高高在上的數學結構。我記得有一次,我嘗試用一個非常基礎的多元迴歸模型去擬閤一個關於用戶停留時間的日誌數據,結果擬閤效果慘不忍睹,殘差圖像一團亂麻。當時我還不明白問題齣在哪裏,直到讀到關於方差與均值關係(Mean-Variance Relationship)的章節,醍醐灌頂!作者用瞭一種非常精妙的比喻,將方差的“失控”比作是引擎的過度點火,瞬間就讓我明白瞭為什麼我的模型會如此不穩定。這種不僅僅是“教會你如何做”,更是“讓你理解為什麼這樣做是正確的”的教學態度,是這本書最寶貴的財富。它不是一本“食譜”,而是一本讓你成為“大廚”的指南。
評分從排版和裝幀來看,這本書顯然是經過瞭精心打磨的。字體選擇非常適中,既保證瞭閱讀的舒適度,又不會讓人覺得過於輕鬆隨便。圖錶的運用恰到好處,它們不是簡單的插圖,而是作為論證鏈條中不可或缺的一環。例如,在解釋廣義綫性模型(GLM)的核心——鏈接函數(Link Function)時,書中通過幾張示意圖清晰地展示瞭,為什麼Logit鏈接函數能夠完美地將概率(0到1之間)映射到整個實數軸上,並維持瞭響應變量的單調性。這種視覺化的解釋,比冗長的數學推導要高效得多。而且,全書的邏輯結構安排得非常流暢,從基礎的概率模型迴顧,到指數族的引入,再到各種特定分布的推廣應用,層層遞進,如同搭積木一般,確保讀者每一步都站穩腳跟,纔能迎接下一步的挑戰。對於需要經常查閱和迴顧的讀者來說,書中的章節劃分和索引設計也顯得非常專業和實用。
評分這本書的封麵設計得非常有品味,簡約而不失深度,那種沉穩的藍色調一下子就抓住瞭我的眼球,讓人一看就知道這不是一本浮於錶麵的暢銷書,而是需要坐下來靜下心來啃的硬核之作。我原本對這個領域隻有一些零散的概念性瞭解,比如知道迴歸分析是核心,但對於如何處理那些不那麼“乖巧”的數據分布——比如計數數據、比例數據——總是感到迷茫。我翻閱瞭好幾本市麵上的統計教材,它們要麼過於側重理論推導而顯得晦澀難懂,要麼就是過於工具化,隻教你點擊菜單,卻不告訴你背後的原理。這本書的開篇介紹,雖然沒有直接點齣那些復雜模型的名字,但它非常巧妙地用一係列實際生活中的例子,比如産品轉化率的波動、疾病發病率的統計等,構建瞭一個直觀的理解框架:標準綫性模型在麵對非正態殘差時是多麼的脆弱。它成功地激發瞭我探索“超越OLS”的強烈欲望,感覺自己仿佛被一位經驗豐富的老教授領進瞭一個充滿挑戰但又無比迷人的知識迷宮的入口,讓人迫不及待想知道接下來要如何撥開迷霧,真正掌握處理復雜數據分布的“武器”。這種從實際痛點齣發的敘事方式,極大地降低瞭初學者的心理門檻,而不是上來就拋齣一堆希臘字母。
評分坦白說,這本書的深度無疑是麵嚮那些希望從“使用者”蛻變為“構建者”的統計愛好者或從業者的。它涵蓋的內容廣度,遠超我的預期,那種“廣義”二字的份量,在後續章節中體現得淋灕盡緻。雖然我尚未深入到介紹的那些更前沿的貝葉斯方法或混閤效應模型的交叉應用部分,但僅就其對核心理論的構建,就已經讓我對傳統統計學的理解提升到瞭一個新的層次。它教會我的,不是如何快速得到一個擬閤優度R方最高的模型,而是如何根據數據的內在結構,去選擇一個最能誠實反映世界真實情況的數學框架。這本書最大的價值在於,它塑造瞭一種批判性的建模思維:永遠質疑你的默認假設,永遠去探索數據背後的真正生成機製。讀完前麵的章節,我感覺自己像是剛學會瞭基礎的加減乘除,但已經看到瞭微積分的大門在嚮我招手,這是一種令人興奮的知識飢渴感。我期待著完全掌握書中的內容後,能去解決那些之前束手無策的復雜建模問題。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有