《理解回归假设》的目的是描述回归假设,并在某种程度上帮助读者理解如何考察假设是否能够与一个具体的研究相适应。《理解回归假设》以对标准多元回归假设的回顾作为开头,因为这些知识通常会出现在计量经济学或者回归分析的课本中。然后,本书引入了一个贯穿本书的具体案例——一个关于体重的决定因素的模型。最后,本书回到回归假设,考察了每一个假设的实际意义,并强调了研究者如何评估每一个假设是否符合实际研究的需要。
威廉·D.贝里(William D.Berry),曾于美国佛罗里达州立大学和肯塔基大学讲授统计学和研究方法,现为佛罗里达州立大学政治科学系教授。其主要研究领域是公共政策和美国政策。他已经在学术期刊上发表了大量论文,还参与撰写了《理解美国政府的成长:对战后时期的经验研究》(Praeger,1987)以及《实用多元回归》(Sage,1985),同时也是《非递归因果模型》(Nonrecursive Causal Models)(Sage,1984)一书的作者。
序
第1章 简介
第2章 回归假设的正式描述
第1节 回归分析概述
第2节 误差项的作用
第3节 其他回归假设
第3章 “体重”的案例
第4章 如何得到满意的回归假设结果
第5章 回归假设的实质意义
第1节 从横截面回归中得出动态的解释
第2节 假设:缺乏完全多重共线性
第3节 假设:误差项与每个自变量都没有相关关系
第4节 设定误差:使用错误的自变量
第5节 均值的误差项为零的假设
第6节 对于测量层次的假设
第7节 无测量误差的假设
第8节 线性和可叠加性的假设
第9节 同方差和缺乏自相关假设
第6章 结论
注释
参考文献
译名对照表
在任何回归分析被运用到社会科学研究中的时候,无数的假设总是被要么明确,要么含蓄地提出 。社会科学的定量研究已经非常流行,以至于几乎所有的二年级研究生都能够背诵一长串标准回归假设。然而尽管学生们经常死记硬背这些假设,却不能够理解其中“真正的含义”。多年来,我常常与研究生们针对他们的研究交换意见。而下文中所出现的屡见不鲜的场景正是让我决定撰写本书的原因:
教授:在你的模型中,你对异方差性这个概念还有问题吗(或者对任何其他的概念——设定残差、测量误差、自相关、非线性等等)?
学生:我不知道。
教授: 那么,异方差性指的是什么?
学生(自信地):误差项的变化不是恒定的。
教授:好的。你的因变量是个人在慈善事业上的支出(或者任何其他变量)。你考虑了以下的自变量……在你的案例里面,如何解释误差项是异方差的?
学生(有点不自信了):对于不同的观测值,误差项的变异会有不同的取值。
教授:告诉我这对于你的模型而言实质上意味着什么。你怎么解释慈善支出,你的模型中的自变量,其他影响慈善支出但没有包含在你的模型中的因素,以及所有这些变量是如何联系起来的?
学生(意识到自己知识上的一些漏洞被发现了): 我真的不知道。
因此,尽管很多社会科学家能够自信地“不费吹灰之力地快速说出”一长串多元回归分析的假设 (没有设定残差,没有测量误差,缺乏自相关等等)。也许他们能够说出这些回归假设的标准定义,但是常常缺乏对这些假设实质含义的深刻理解。如果我们对这些假设的理解仅仅局限于对定义的死记硬背,我们就无法把这些假设运用到具体问题的分析中了,这就相当于我们根本没有完全理解这些假设一样。
写作这本专题论著的目的是描述回归假设,并在某种程度上鼓励学生们从死记硬背中解脱出来,转而去理解如何考察假设是否能够与一个具体的研究相适应。我们的讨论仅限于回归方法,因为回归在社会科学方法论中占据了主导的地位,尽管也可以对其他的经验研究技术写作出类似的著作。如果社会科学家们能够去仔细地考虑回归假设是否真正符合实际应用中的案例,而不是遇见什么问题都用回归方法来解决,那么当运用其他研究技术的时候,他们能够更加自如地把握。
我以对标准多元回归假设的回顾作为开头,因为这些知识通常会出现在计量经济学或者回归分析的课本中 。如果你不能理解这些假设的意义和重要性,不要担心 。(如果你确实能够全部理解所有这些假设,那么你其实没有必要阅读本书!)接下来,我会引入一个贯穿本书的具体案例,具体而言,这是一个关于体重的决定因素的模型。我选取这个案例是因为这里所涉及到的人体的体重是与我们所有人都有关的话题——如果不考虑我们各自的兴趣——这样我们对此会有合理的直觉。最后,我回到回归假设,考察每一个假设的实际意义,并强调研究者如何评估每一个假设是否符合实际研究的需要。
……
回归分析是社会科学研究中最基本的工具,至少对于非经验主义者而言是这样的。然而,尽管它是一件最常用的工具,它同样有可能是最容易被滥用的。每位一年级的研究生都会快速地学习构造最基本的多元回归模型、我们假设政治学家Betty Brown利用如下最小二乘估计模型(OLS)估计美国50个州的福利花费情况。
Brown教授可能会总结到,民主党的议席每增加1%,福利花费的期望值就会增加87.10美元(当城市化水平保持恒定时)。那么这一对X1效果的估计到底有多好呢?更确切的说,这是最好的线性无偏估计(BLUE)吗?如果答案是肯定的,那么这一估计模型就能够与真实的世界联系起来。否则,这一估计模型只是那些留连在铅笔和草稿纸上的平面。
显然,我们应该去寻找能够达到最佳无偏估计(BLUE)标准的估计模型。这是我们学习回归假设的原因。Berry教授非常严谨地定义了每一个假设,并且阐述了它们的实质意义。这种优美的文字描述搭配精选的图形和通俗易懂的证明使得那些难懂的问题,比如测量、设定、多重共线性、异方差性以及自相关,都变得平易近人。而本书中的案例和数据也安排得很有条理,模型中的一个变量更能广泛地吸引人们的兴趣——体重。
理解回归假设可以让研究人员看到自己的弱点,同时也能够使他们更好地驾驭回归分析以得到更有效的估计。当然,没有这种理解,就无法迈开通往构建模型的步伐。尽管目前在丛书中已经有多本著作涉及到回归分析这一话题(《应用回归》,Lewis-Beck著,第22册;《回归分析的解释和应用》,Achen著,第29册;《实用多元回归》,Berry和Feldman合著,第50册;《随机参数回归模型》,Newbold和Bos合著,第51册;《理解回归分析》,Sjoquist和Stephan合著,第57册;《多元回归中的交互影响》,Turisi和Wan合著,第72册;《回归诊断》,Fox著,第79册),但是还没有人专门研究回归假设。那么Berry教授的贡献恰好能填补这一空白。
读完这本书后,我体验到一种近乎醍醐灌顶的清爽感,尤其是在那些关于多重共线性和异方差性的章节。过去,我总觉得这些概念是统计软件跑出来的一堆警报,需要机械地去处理,但这本书却赋予了它们生命和意义。作者的笔触极其细腻,他没有直接给出“如何修正”的万能公式,而是花了大量篇幅去描绘这些问题在真实数据中“是如何诞生”的,比如,在分析气候变化数据时,时间序列本身的内在相关性是如何潜移默化地侵蚀模型的有效性的。他用一种非常散文化的语言,将那些枯燥的统计术语,转化成了关于系统反馈和信息冗余的生动故事。我印象最深的是关于模型设定误差的讨论,作者似乎在暗示,我们对世界的认知越复杂,我们构建的模型就越有可能错过那个最根本的驱动力。这种从工程学思维到人文关怀的过渡,让这本书的厚度远远超过了它的页码。它成功地将一个技术性的主题,提升到了哲学和方法论的高度,让人在合上书本后,还会反复咀嚼那些关于“选择”与“局限”的深刻见解。
评分这本《理解回归假设》的导读,初读起来像是一次深入的智力探险,作者的叙事方式极具煽动性,总能在我以为自己抓住了某个核心概念时,又巧妙地将视角拉向更深层次的哲学思辨。它不是那种教科书式的平铺直叙,更像是与一位饱学之士在壁炉边进行的对话。例如,书中对于“误差项的独立同分布”的探讨,并没有仅仅停留在数学公式的推导上,而是花了大量的篇幅去剖析,在现实世界的复杂系统中,我们如何定义和衡量这种“纯粹的随机性”。作者甚至引入了大量的经济学案例,去论证当模型假设被轻微违反时,那些看似微不足道的偏差是如何在长期预测中累积成灾难性的后果。我特别欣赏作者那种不满足于表象的态度,他似乎在挑战读者去质疑统计学本身作为一门科学的局限性,迫使我们去思考,我们所建立的模型,究竟是在描述世界,还是仅仅在用我们能理解的语言去“驯服”世界。整本书读下来,我感觉自己对“理解”这个词汇有了全新的认识,它不再是简单的知识获取,而是一种持续的、带有批判性的审视过程。这种对细节的执着和对宏观视野的把控,使得这本书的阅读体验充满了层次感,每次翻阅都能发现新的光亮。
评分这本书的魅力在于它对“不确定性”的处理方式,它没有试图将世界简化成一个可以被完美预测的机器,而是将不确定性本身视为研究对象。我特别欣赏作者在讨论模型稳健性时的那种近乎苛刻的要求,他不断地追问:“如果数据源稍微变动,如果某个极端值被纳入或排除,我们的结论还能站得住脚吗?”这种“压力测试”的方法,极大地提升了我对任何统计结果的警惕性。书中对异方差问题的论述,不是简单地介绍加权最小二乘法,而是探讨了异方差性如何反映了现实系统中不同观测值所承载的信息量和可靠性的本质差异。读完后,我感觉自己不再是那个被统计结果牵着鼻子走的初学者,而更像是一个对数据保持健康怀疑态度的“数据侦探”。这本书的深度,在于它成功地将那些晦涩难懂的统计术语,还原成了对世界运行规律的深刻洞察,每一次重读,都能从中汲取到新的批判性思维的养分。
评分这本书对于我这个习惯于快速得出结论的研究者来说,无疑是一种挑战,但也是一种宝贵的“慢阅读”体验。它的结构非常独特,前半部分似乎在为读者搭建一个坚固的、逻辑自洽的理论框架,而一旦框架搭建完毕,作者就开始系统地、近乎残忍地去拆解这个框架的薄弱环节。我特别喜欢作者对“因果推断”的讨论,他并未直接声称回归模型可以实现因果推断,而是通过一系列精心设计的思想实验,展示了当我们在缺乏随机对照实验(RCT)的理想环境下,如何通过谨慎地满足各种假设,来无限逼近我们渴望的因果理解。这种谦逊而审慎的态度,与当前很多领域追求“快速出结果”的浮躁风气形成了鲜明对比。每一次对残差图的解读,都像是一次对自身偏见的深度剖析,作者总能引导你看到那些你原本不想承认的、模型中隐藏的“丑陋真相”。总而言之,这本书的价值在于,它让你学会了如何在已知信息不足的情况下,做出最有依据的、最负责任的判断,而不是沉迷于那些看起来完美的R-squared值。
评分这本书的语言风格是极其富有张力的,它既有严谨的学术腔调,又时不时地流露出一种文学家的洞察力。我之所以如此推崇它,是因为它成功地处理了统计学领域一个长期存在的难题:如何平衡模型的“简洁性”与“现实的复杂性”。作者在解释“正态性假设”时,并未满足于“大数定律”的敷衍解释,而是深入挖掘了人类认知本身对“均值回归”的天然偏好,并将其与统计学上的正态分布做了精妙的类比。这种跨学科的融会贯通,让阅读过程充满了惊喜。此外,书中对样本选择偏差的探讨尤其发人深省,它不像其他书籍那样将之视为一个技术性错误,而是将其提升到伦理层面,质问我们是否有权选择性地观察世界,然后用这个有偏见的观察结果去指导未来的决策。这本书更像是一本关于“如何负责任地观察世界”的指南,而非单纯的统计手册,它教会我,在每一次运行回归模型之前,都需要进行一场深刻的自我反思。
评分这个系列一直在收集当中
评分好
评分双十一囤货,同学推荐看格致方法系列的书。
评分一书一问题,这个系列值得珍藏。
评分哈哈哈哈哈哈哈哈呵呵呵呵哈哈哈不要不要的
评分价格公道,实用,包装好。非常满意。
评分价格公道,实用,包装好。非常满意。
评分好
评分很好,对京东很满意
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有