什么是合并时间序列?正如字面上所表达的,时间序列(在一个分析单位下规律出现的具有时间性的观测值)由横截面数据(在单独时间点上一个分析单位下的观测值)组成的一个数据集。这些分析单位可以是学校、健康组织、商业交易、城市、国家等。为什么需要进行“合并分析”呢?其中一个原因在于,当下研究者可以获得越来越多的相关横截面数据与时间序列数据。另外一个原因在于,将时间序列数据与横截面数据合并可以显著地扩大样本量,这使之前显得棘手的分析问题变为可能。
洛伊斯·塞耶斯(Lois W. Sayrs),爱荷华大学政治学助理教授。她从西北大学获得政治学博士学位。她现在的研究兴趣包括国际冲突过程的离散选择模型以及国际政治经济学。
温方琪,纽约大学社会学系博士研究生。她先后于中山大学和香港科技大学获得学士与硕士学位。她的主要研究领域包括社会人口学、社会分层与不平等以及量化研究方法。她尤其感兴趣的是对社会现象进行因果识别并探究其背后的机制。
本书讨论使用同时包含横截面与时间序列的数据的回归分析。一个时间序列是一组数列,就一组变量X_t与X_(t+1)而言,观测值之间的距离是恒定且固定的(Ostrom, 1978)。一个横截面则是一个分析单位在特定时间点上所存在的一组变量(X_i … X_n)的全部观测值。当变量在一定时间跨度内在一定数量的不同横截面上被反复观测到时,我们可将这样产生的数据矩阵称为一个合并时间序列(pooled time series)。
归纳合并时间序列矩阵的特征有许多种方法。标准的方法是首先归纳横截面上的特征,然后再归纳时间序列上的特征。矩阵的形式被设定,这对于一个横截面内部随时间发生的变化较不同横截面之间产生的变化而言是次要的。
将横截面与时间序列用这样的方式组合在一起的主要好处是可以捕捉到不同单位在空间上的变化以及同一单位随时间产生的变化。因此,我们可以对结果以及产生结果的过程进行描述、分析以及假设检验。当时间序列的长度被缩减且/或横截面的样本量较小时,合并数据是应用性研究中一个特别有用的方法。通常来说,单变量时间序列对于常规时间序列技术而言显得太短了。许多时间序列方法要求至少30个时间点,而其它的一些方法要求更多。
本书的主要目的是向已具备有关线性模型、回归方法和单变量时间序列估计基本知识的读者介绍合并时间序列设计。首先,我们会检验合并时间序列的回归模型,然后再检验各种不同的回归估计技术。本书会穿插对合并时间序列设计进行应用的不同例子,这些例子来自社会科学和行为科学。本书的叙述形式将结合对合并时间序列问题的理论展示与具体应用。为了方便阅读与课堂教学,所有的章节将用大写字母(A、B、C)来表明困难程度。
……
什么是合并时间序列(pooled time series)?正如字面上所表达的,时间序列(在一个分析单位下规律出现的具有时间性的观测值)由横截面数据(cross-sections)(在单独时间点上一个分析单位下的观测值)组成的一个数据集。这些分析单位可以是学校、健康组织、商业交易、城市、国家等。为什么需要进行“合并分析”呢?其中一个原因在于,当下研究者可以获得越来越多的相关横截面数据与时间序列数据。另外一个原因在于,将时间序列数据与横截面数据合并可以显著地扩大样本量,这使之前显得棘手的分析问题变为可能。
举一个简单的例子。布鲁姆(Broom)教授希望使用一个包含20个美国城市的数据来解释财产犯罪率的变化情况。她提出下面的模型:
C = α + b_1 U+ b_2 L+ b_3 R+e
其中C = 城市财产犯罪率,U=失业率,R=区域位置,所有的变量都包含15年中每一年的观测值。假设经典回归的假设都被满足,那么布鲁姆可对以上等式进行15次最小二乘(OLS)估计(每一年的横截面数据一次)。然后,她可以再运用20次OLS(每一个城市的时间序列一次)。或者,假设所有的参数(α、b_1、b_2和b_3)都在时间与空间上恒定,她便可以简单地将所有观测值合并进而仅仅只计算一个回归。这个简洁的步骤可以将样本量N增加至300,同时也可以在很大程度上提高估计的统计有效性。
这种对OLS的应用与塞耶斯(Sayrs)博士所命名的合并分析的恒定系数模型(constant coefficients model)是一致的。此处最大的困难在于恒定参数的假设难以被满足。假设较易满足的一个模型是最小二乘虚拟变量模型(least squares dummy variable model)[有时它也被称作协方差模型(covariance model)]。该模型允许截距随时间以及横截面变化。同样地,这里的虚拟变量不具备实质性意义,它们极大地减少了自由度以及与此对应的统计解释力。一个可能的替代是误差成分模型(error components model)[塞耶斯教授也将其称为随机系数模型(random coefficient model)]。这个模型明确地将横截面上的与时间序列上的误差都考虑了进去。然而,在滞后因变量(lagged dependent variable)在等式右侧或者是等式嵌套在一个更大的联立方程组(simultaneous-equation system)的情况下,不可以这里所需要的加权最小二乘类型的估计(weighted least squares type-estimation)。此外,当严重的时间序列相关存在时,误差假设往往被极大地削弱。为了超越误差成分模型的局限性,塞耶斯教授提出了一个结构方程模型(structural equation model)。她以对合并时间序列分析下的估计函数稳健性的评论总结全书。
迈克尔·S.刘易斯-贝克
《现代金融计量学:基于Python的量化分析实践》这本书的视角非常新颖,它成功地将金融市场波动性的理论模型与现代编程工具结合了起来。我过去一直觉得金融计量太依赖于传统的Eviews或Matlab,但这本书完全展示了Python在处理高频金融数据和复杂时间序列模型方面的巨大潜力。对GARCH族模型(如EGARCH, GJR-GARCH)的介绍非常到位,并且每种模型的介绍后都紧跟着一个使用Pandas和Statsmodels库进行实证分析的完整代码块。最让我惊喜的是关于跳跃扩散模型(Jump-Diffusion Models)的应用实例,它帮助我更好地理解了金融危机中瞬时价格冲击的建模思路。这本书的实践性强到让人几乎可以把作者的电脑搬回家,对于想从金融理论研究转向量化策略开发的专业人士,这本书无疑是打开新世界的一把钥匙。
评分这本《数据驱动的决策艺术》绝对是数据分析领域的宝藏!我之前总是觉得统计学知识和实际业务场景之间有一道鸿沟,很多书讲的理论很扎实,但就是不知道怎么落地。这本书不一样,它简直就像一本实战手册,从最基础的数据清洗、探索性分析,一直讲到如何构建复杂的预测模型,每一步都配有清晰的案例和代码示例。作者似乎非常理解初学者和中级分析师的痛点,没有过多纠缠晦涩的数学证明,而是聚焦于“如何用数据解决问题”。特别是关于A/B测试的设计与解读那一部分,我感觉自己终于搞明白了那些p值和置信区间背后的真正含义,而不是只会套用公式。读完之后,我立刻尝试用书中学到的特征工程技巧去优化我手头上的一个客户流失预测项目,效果立竿见影。这本书的叙述风格非常亲切,仿佛有一位经验丰富的导师在旁边手把手教你,让人在学习复杂概念时一点也不觉得枯燥,强力推荐给所有希望提升数据分析实战能力的朋友。
评分《商业智能与数据可视化实战指南》这本书,简直是为我们这些经常要做汇报的运营人员量身定制的。我们部门的数据散落在好几个系统里,平时想快速做出一个有说服力的仪表盘简直是噩梦。这本书没有讲那些高深的算法,而是聚焦于“沟通”——如何用图表把复杂的数据故事讲清楚。它详细对比了不同图表类型(柱状图、散点图、热力图等)在传达不同信息时的优劣,这一点对我启发极大。我以前总喜欢用堆积条形图来展示季度增长,看了这本书后才知道那种图表有多容易误导观众,现在我改用组合图表和上下文标注,效果好多了。此外,关于数据叙事和受众心理的分析也非常到位,真正做到了从“做图”到“讲好数据故事”的升华。如果你对如何设计一个高效、美观且不失真数据的BI报告感到困惑,这本书绝对能提供立竿见影的解决方案。
评分我不得不说,《深度学习:从感知机到Transformer》这本书的广度和深度都令人印象深刻。作为一名机器学习工程师,我原以为自己对深度学习的脉络已经有了比较清晰的认识,但阅读此书后才发现自己知识体系中的许多空白。它没有停留在展示SOTA模型的结果上,而是深入剖析了激活函数、优化器、正则化技术等底层机制是如何协同作用,驱动网络学习的。书中对卷积网络和循环网络结构的演变历史梳理得极其清晰,但最让我震撼的是关于Attention机制及其在自然语言处理中引发的革命的论述。作者的逻辑推理能力极强,能够将复杂的数学公式转化为直观的几何或信息流动的概念。唯一的小遗憾是,由于篇幅所限,某些前沿的图生成模型或强化学习与深度学习的结合案例介绍得略显简略,不过瑕不掩瑜,这本书无疑是构建坚实深度学习基础的权威参考书。
评分翻开《计算统计学原理与R语言实现》,我立刻感受到了一种严谨、学术的气息。这本书的定位显然不是给纯粹的业务分析师看的,它更像是面向研究人员或希望深入理解统计模型内部运作机制的进阶读者的。作者对概率论和数理统计的假设前提进行了非常细致的回顾,这对于理解诸如最大似然估计、贝叶斯推断等核心概念至关重要。书中对蒙特卡洛模拟和MCMC方法的讲解非常详尽,特别是如何用R语言高效地实现这些迭代过程,提供了大量可供参考的代码框架。虽然阅读过程中需要保持高度的专注力,偶尔还会翻回去查阅一些微积分知识点,但这本“硬核”的著作极大地巩固了我对统计推断基础的掌握。对于那些不满足于仅仅调用库函数,而渴望探究“为什么这个方法有效”的读者来说,这是一份不可多得的珍贵资料。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有