合并时间序列分析

合并时间序列分析 pdf epub mobi txt 电子书 下载 2025

[美] 洛伊斯·塞耶斯 著,温方琪 译,范新光 校
图书标签:
  • 时间序列分析
  • 计量经济学
  • 数据分析
  • 统计学
  • 金融
  • 预测
  • 建模
  • Python
  • R
  • 机器学习
想要找书就要到 静思书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 格致出版社 , 上海人民出版社
ISBN:9787543216082
版次:1
商品编码:12026819
包装:平装
丛书名: 格致方法·定量研究系列
开本:32开
出版时间:2016-12-01
用纸:轻型纸
页数:123
字数:74000
正文语种:中文

具体描述

编辑推荐

  随着时间序列数据与横截面数据变得越来越容易获得,如何更加有效地对它们进行分析逐渐成为研究者需要面对的问题。《合并时间序列分析》一书提供了同时分析这两种数据形式的方法,并且也探讨了如何能够改进对研究群体的估计。除此之外,随着相关数据不断被获得,该方法也能分析更大的样本,并最终帮助研究者进行更有效的研究。

内容简介

  什么是合并时间序列?正如字面上所表达的,时间序列(在一个分析单位下规律出现的具有时间性的观测值)由横截面数据(在单独时间点上一个分析单位下的观测值)组成的一个数据集。这些分析单位可以是学校、健康组织、商业交易、城市、国家等。为什么需要进行“合并分析”呢?其中一个原因在于,当下研究者可以获得越来越多的相关横截面数据与时间序列数据。另外一个原因在于,将时间序列数据与横截面数据合并可以显著地扩大样本量,这使之前显得棘手的分析问题变为可能。

作者简介

  洛伊斯·塞耶斯(Lois W. Sayrs),爱荷华大学政治学助理教授。她从西北大学获得政治学博士学位。她现在的研究兴趣包括国际冲突过程的离散选择模型以及国际政治经济学。

  温方琪,纽约大学社会学系博士研究生。她先后于中山大学和香港科技大学获得学士与硕士学位。她的主要研究领域包括社会人口学、社会分层与不平等以及量化研究方法。她尤其感兴趣的是对社会现象进行因果识别并探究其背后的机制。

目录

序第1章 导言第2章 合并时间序列模型的理论推导第1节 在应用中的合并第2节 合并线性回归模型第3节 四种合并模型第4节 初步诊断与残差分析第3章 恒定系数模型第1节 估计恒定系数模型第2节 纠正自相关第3节 异方差性第4节 恒定系数模型的局限性第4章 LSDV模型第1节 异方差性与单位效应第2节 估计LSDV模型第5章 随机系数模型第1节 估计随机系数模型:GLS方法第2节 GLS模型的一个ARMA变异第3节 GLS模型的一个看似不相关回归第4节 Swamy随机系数模型第5节 Hsiao随机系数模型第6节 转换模型第7节 ARCH模型第8节 随机系数模型的总结第6章 结构方程模型第1节 两步估计第2节 最大似然估计第3节 LOGIT与PROBIT设定第4节 最大似然法的总结第7章 稳健性检验:这些估计值有多好?第1节 稳健性估计函数第2节 异方差性与稳健性第8章 合并时间序列分析的总结注释参考文献译名对照表

精彩书摘

  本书讨论使用同时包含横截面与时间序列的数据的回归分析。一个时间序列是一组数列,就一组变量X_t与X_(t+1)而言,观测值之间的距离是恒定且固定的(Ostrom, 1978)。一个横截面则是一个分析单位在特定时间点上所存在的一组变量(X_i … X_n)的全部观测值。当变量在一定时间跨度内在一定数量的不同横截面上被反复观测到时,我们可将这样产生的数据矩阵称为一个合并时间序列(pooled time series)。

  归纳合并时间序列矩阵的特征有许多种方法。标准的方法是首先归纳横截面上的特征,然后再归纳时间序列上的特征。矩阵的形式被设定,这对于一个横截面内部随时间发生的变化较不同横截面之间产生的变化而言是次要的。

  将横截面与时间序列用这样的方式组合在一起的主要好处是可以捕捉到不同单位在空间上的变化以及同一单位随时间产生的变化。因此,我们可以对结果以及产生结果的过程进行描述、分析以及假设检验。当时间序列的长度被缩减且/或横截面的样本量较小时,合并数据是应用性研究中一个特别有用的方法。通常来说,单变量时间序列对于常规时间序列技术而言显得太短了。许多时间序列方法要求至少30个时间点,而其它的一些方法要求更多。

  本书的主要目的是向已具备有关线性模型、回归方法和单变量时间序列估计基本知识的读者介绍合并时间序列设计。首先,我们会检验合并时间序列的回归模型,然后再检验各种不同的回归估计技术。本书会穿插对合并时间序列设计进行应用的不同例子,这些例子来自社会科学和行为科学。本书的叙述形式将结合对合并时间序列问题的理论展示与具体应用。为了方便阅读与课堂教学,所有的章节将用大写字母(A、B、C)来表明困难程度。

  ……

前言/序言

  什么是合并时间序列(pooled time series)?正如字面上所表达的,时间序列(在一个分析单位下规律出现的具有时间性的观测值)由横截面数据(cross-sections)(在单独时间点上一个分析单位下的观测值)组成的一个数据集。这些分析单位可以是学校、健康组织、商业交易、城市、国家等。为什么需要进行“合并分析”呢?其中一个原因在于,当下研究者可以获得越来越多的相关横截面数据与时间序列数据。另外一个原因在于,将时间序列数据与横截面数据合并可以显著地扩大样本量,这使之前显得棘手的分析问题变为可能。

  举一个简单的例子。布鲁姆(Broom)教授希望使用一个包含20个美国城市的数据来解释财产犯罪率的变化情况。她提出下面的模型:

  C = α + b_1 U+ b_2 L+ b_3 R+e

  其中C = 城市财产犯罪率,U=失业率,R=区域位置,所有的变量都包含15年中每一年的观测值。假设经典回归的假设都被满足,那么布鲁姆可对以上等式进行15次最小二乘(OLS)估计(每一年的横截面数据一次)。然后,她可以再运用20次OLS(每一个城市的时间序列一次)。或者,假设所有的参数(α、b_1、b_2和b_3)都在时间与空间上恒定,她便可以简单地将所有观测值合并进而仅仅只计算一个回归。这个简洁的步骤可以将样本量N增加至300,同时也可以在很大程度上提高估计的统计有效性。

  这种对OLS的应用与塞耶斯(Sayrs)博士所命名的合并分析的恒定系数模型(constant coefficients model)是一致的。此处最大的困难在于恒定参数的假设难以被满足。假设较易满足的一个模型是最小二乘虚拟变量模型(least squares dummy variable model)[有时它也被称作协方差模型(covariance model)]。该模型允许截距随时间以及横截面变化。同样地,这里的虚拟变量不具备实质性意义,它们极大地减少了自由度以及与此对应的统计解释力。一个可能的替代是误差成分模型(error components model)[塞耶斯教授也将其称为随机系数模型(random coefficient model)]。这个模型明确地将横截面上的与时间序列上的误差都考虑了进去。然而,在滞后因变量(lagged dependent variable)在等式右侧或者是等式嵌套在一个更大的联立方程组(simultaneous-equation system)的情况下,不可以这里所需要的加权最小二乘类型的估计(weighted least squares type-estimation)。此外,当严重的时间序列相关存在时,误差假设往往被极大地削弱。为了超越误差成分模型的局限性,塞耶斯教授提出了一个结构方程模型(structural equation model)。她以对合并时间序列分析下的估计函数稳健性的评论总结全书。

  迈克尔·S.刘易斯-贝克


《时空回响:数据编织与模式洞察》 内容简介 在这个信息爆炸的时代,数据如同潮汐般涌来,蕴含着无数关于过去、现在乃至未来的蛛丝马迹。然而,数据的价值并非仅仅在于其量大,更在于我们如何从看似杂乱无章的数字洪流中,精准地捕捉那些隐藏的关联,洞察事物发展的内在规律,并以此为基石,预见并塑造未来的走向。《时空回响:数据编织与模式洞察》并非一本枯燥的技术手册,而是一次深入数据世界的探险之旅,它旨在揭示如何将分散在时间维度上的信息点,如同一颗颗珍珠,精心地串联起来,编织成一幅清晰而富有洞察力的图景。 本书的核心在于“编织”——一种将不同来源、不同粒度、不同时间跨度的数据,通过系统性的方法进行整合、梳理与连接的艺术。我们并非简单地堆砌数据,而是追求一种深层次的融合,让原本孤立的片段信息,在时间的长河中相互映照,产生新的意义。想象一下,历史事件的记录、经济波动的曲线、生态环境的变化、社会心理的变迁,它们各自讲述着自己的故事,但当我们将这些故事放置在同一张时间画布上时,奇异的共鸣便会产生。是环境的变化催生了迁徙的浪潮?是技术的革新引领了经济的腾飞?是社会思潮的演进塑造了政治格局?这些深层的问题,正是本书希望引导读者去探索和解答的。 “模式洞察”则是编织后的必然成果。数据本身是静态的,但其背后蕴含的动态规律却是活的。本书将带领读者穿越纷繁的数据表象,识别那些反复出现的趋势、周期性的波动、异常值的信号,以及不同变量之间错综复杂的关系。我们关注的不仅是“发生了什么”,更是“为什么会发生”,以及“接下来可能发生什么”。这涉及到对数据背后逻辑的理解,对因果关系的辨析,以及对模型构建的严谨。本书将深入探讨一系列能够帮助我们实现这一目标的方法论,从经典的统计学模型,到现代的机器学习算法,再到一些跨学科的分析视角,都将一一呈现。 本书旨在为那些渴望从数据中获得更深层次理解的读者提供一套系统性的思考框架和实践指导。 无论是金融分析师、市场研究员、政策制定者、科研工作者,还是任何对数据驱动的决策和洞察感兴趣的个人,《时空回响》都将是您不可或缺的智识伙伴。 第一部分: 数据编织的基石——理解时间的脉络 在信息的世界里,时间是永恒的主线。本部分将从根本上探讨时间序列数据的特性,以及理解其内在时间脉络的重要性。 时间序列的本质: 我们将深入剖析时间序列数据的定义、类型(如离散时间序列、连续时间序列)及其核心属性。这包括但不限于数据的顺序性、自相关性、趋势性、季节性以及随机性。理解这些基本属性是进行任何有效分析的前提。 数据源的多样性与整合挑战: 现实世界中的时间序列数据来源极其广泛,可能来自于传感器、日志文件、交易记录、调查问卷、公开数据集等。本章将讨论如何识别、评估和整合来自不同源头、不同格式、不同精度的数据。我们将聚焦于数据清洗、缺失值处理、异常值检测与平滑等关键技术,确保数据的质量与一致性。 时间粒度的适配与统一: 数据往往以不同的时间粒度存在,例如日数据、周数据、月数据、年数据。如何根据分析目标,对不同粒度的数据进行升采样(聚合)或降采样(插值),以及在分析中保持时间粒度的统一性,是实现有效整合的关键。本章将探讨相关的技术和策略。 时间戳的规范与时区管理: 在全球化的背景下,精确的时间戳和正确处理时区差异对于跨地域、跨系统的时序数据分析至关重要。我们将详细介绍标准化的时间戳格式,以及如何应对夏令时、时区转换等复杂情况,避免因时间信息错误导致分析结果的偏差。 探索性数据分析(EDA)在时间序列中的应用: 在正式建模之前,深入的EDA是必不可少的。本章将介绍如何利用可视化技术(如折线图、散点图、自相关图、偏自相关图)来初步识别时间序列的趋势、周期、季节性以及潜在的异常。通过直观的图形,我们可以形成对数据初步的理解,并为后续建模提供方向。 第二部分: 模式的识别与洞察——方法论的深度解析 一旦我们有了高质量、经过整合的时间序列数据,接下来的挑战是如何从中提取有意义的模式。本部分将系统介绍一系列强大的分析方法。 趋势与周期性分解: 许多时间序列可以被分解为长期趋势、周期性波动(如季节性)和残差。本章将介绍经典的分解方法(如加法模型、乘法模型),以及如何利用移动平均、指数平滑等技术来平滑数据并识别趋势。 平稳性检验与差分: 许多时间序列模型要求数据是平稳的,即数据的统计特性(如均值、方差)不随时间变化。本章将介绍如何检验序列的平稳性(如ADF检验、PP检验),以及如何通过差分等方法将非平稳序列转化为平稳序列,为后续建模做好准备。 自回归(AR)与移动平均(MA)模型: 了解时间序列内部的依赖关系是理解其动态演变的关键。本章将深入讲解AR模型、MA模型以及它们的结合——ARMA模型。我们将讨论模型的阶数选择、参数估计和模型诊断,以及如何利用这些模型进行短期预测。 整合移动平均自回归(ARIMA)模型: ARIMA模型是经典的时间序列预测模型,它有效地整合了AR、I(差分)、MA三个部分。本章将详细阐述ARIMA模型的构建过程,包括差分阶数的确定、AR和MA阶数的选择(利用ACF和PACF图),以及模型参数的估计和检验。 季节性ARIMA(SARIMA)模型: 许多现实世界的时间序列具有明显的季节性。SARIMA模型在ARIMA的基础上引入了季节性成分,能够更有效地捕捉和预测具有季节性模式的数据。本章将介绍SARIMA模型的结构、参数选择和应用场景。 状态空间模型与卡尔曼滤波: 对于更复杂的时间序列,特别是那些涉及潜变量或状态的模型,状态空间模型提供了一个灵活而强大的框架。本章将介绍状态空间模型的概念、如何构建状态空间方程,以及如何利用卡尔曼滤波等算法来估计隐藏的状态并进行预测。 协整与因果关系检验: 在分析多个相关时间序列时,协整关系揭示了它们之间长期稳定的均衡关系。本章将介绍协整的概念、检验方法(如Engle-Granger检验、Johansen检验),以及如何利用向量自回归(VAR)模型来分析多个时间序列之间的动态相互作用和潜在的因果关系。 非线性时间序列模型简介: 现实世界中的时间序列往往呈现非线性特征,例如波动率聚集(ARCH/GARCH模型)。本章将简要介绍非线性时间序列模型的概念,以及在特定应用场景下的意义。 第三部分: 模式的深化与应用——实践的拓展与前瞻 掌握了基础的分析工具,本部分将引导读者将这些知识应用于更广泛的领域,并探索一些更高级和前沿的分析方向。 异常检测与事件驱动分析: 在海量数据中,识别出偏离正常模式的异常值,往往能揭示关键的事件或潜在的风险。本章将介绍多种异常检测技术,并探讨如何将异常检测与事件驱动的分析相结合,例如分析特定事件(如政策发布、市场冲击)对时间序列数据的影响。 时间序列的预测精度评估: 任何预测模型都需要对其预测精度进行科学的评估。本章将介绍常用的预测精度评价指标(如MAE、MSE、RMSE、MAPE),并探讨如何进行交叉验证和模型比较,选择最优的模型。 多元时间序列分析的应用: 现实问题往往涉及多个相互影响的时间序列。本章将聚焦于多元时间序列分析的实际应用,例如宏观经济指标之间的联动分析、股票市场多个资产价格之间的关系研究、供应链中的物流与需求预测等。 贝叶斯时间序列分析的魅力: 贝叶斯方法为时间序列分析提供了另一种视角,它允许将先验知识融入模型,并通过后验分布来更新信念。本章将介绍贝叶斯时间序列模型的基本思想,以及在不确定性量化和模型比较方面的优势。 机器学习在时间序列分析中的角色: 随着机器学习技术的发展,诸如循环神经网络(RNN)、长短期记忆网络(LSTM)、Transformer等深度学习模型在时间序列预测和模式识别领域展现出强大的能力。本章将介绍这些模型如何被应用于时间序列分析,以及它们在处理复杂非线性模式方面的优势。 时间序列分析在不同领域的应用案例: 为了加深理解,本章将穿插介绍时间序列分析在各个领域的典型应用案例。例如: 金融领域: 股票价格预测、风险管理、欺诈检测。 经济领域: GDP预测、通货膨胀预测、就业率分析。 环境科学: 气候变化预测、污染物监测、自然灾害预警。 医疗健康: 疾病传播预测、生理信号分析、药物疗效评估。 工业制造: 设备故障预测、生产过程优化、需求预测。 交通运输: 交通流量预测、出行需求分析、拥堵预测。 伦理考量与未来展望: 在利用时间序列数据进行分析和预测的同时,我们也需要关注数据隐私、算法偏见等伦理问题。本章将对时间序列分析的未来发展趋势进行展望,包括自动化建模、因果推断的深化、以及与其他数据科学技术的融合。 《时空回响:数据编织与模式洞察》不仅是一本关于如何分析时间序列数据的书,更是一本关于如何倾听数据、理解世界、洞察未来的书。它鼓励读者以一种批判性、系统性的思维方式,去拥抱数据带来的可能性,在时间和数据的交织中,发现那些隐藏的智慧,驱动更有价值的决策。

用户评价

评分

我不得不说,《深度学习:从感知机到Transformer》这本书的广度和深度都令人印象深刻。作为一名机器学习工程师,我原以为自己对深度学习的脉络已经有了比较清晰的认识,但阅读此书后才发现自己知识体系中的许多空白。它没有停留在展示SOTA模型的结果上,而是深入剖析了激活函数、优化器、正则化技术等底层机制是如何协同作用,驱动网络学习的。书中对卷积网络和循环网络结构的演变历史梳理得极其清晰,但最让我震撼的是关于Attention机制及其在自然语言处理中引发的革命的论述。作者的逻辑推理能力极强,能够将复杂的数学公式转化为直观的几何或信息流动的概念。唯一的小遗憾是,由于篇幅所限,某些前沿的图生成模型或强化学习与深度学习的结合案例介绍得略显简略,不过瑕不掩瑜,这本书无疑是构建坚实深度学习基础的权威参考书。

评分

翻开《计算统计学原理与R语言实现》,我立刻感受到了一种严谨、学术的气息。这本书的定位显然不是给纯粹的业务分析师看的,它更像是面向研究人员或希望深入理解统计模型内部运作机制的进阶读者的。作者对概率论和数理统计的假设前提进行了非常细致的回顾,这对于理解诸如最大似然估计、贝叶斯推断等核心概念至关重要。书中对蒙特卡洛模拟和MCMC方法的讲解非常详尽,特别是如何用R语言高效地实现这些迭代过程,提供了大量可供参考的代码框架。虽然阅读过程中需要保持高度的专注力,偶尔还会翻回去查阅一些微积分知识点,但这本“硬核”的著作极大地巩固了我对统计推断基础的掌握。对于那些不满足于仅仅调用库函数,而渴望探究“为什么这个方法有效”的读者来说,这是一份不可多得的珍贵资料。

评分

《现代金融计量学:基于Python的量化分析实践》这本书的视角非常新颖,它成功地将金融市场波动性的理论模型与现代编程工具结合了起来。我过去一直觉得金融计量太依赖于传统的Eviews或Matlab,但这本书完全展示了Python在处理高频金融数据和复杂时间序列模型方面的巨大潜力。对GARCH族模型(如EGARCH, GJR-GARCH)的介绍非常到位,并且每种模型的介绍后都紧跟着一个使用Pandas和Statsmodels库进行实证分析的完整代码块。最让我惊喜的是关于跳跃扩散模型(Jump-Diffusion Models)的应用实例,它帮助我更好地理解了金融危机中瞬时价格冲击的建模思路。这本书的实践性强到让人几乎可以把作者的电脑搬回家,对于想从金融理论研究转向量化策略开发的专业人士,这本书无疑是打开新世界的一把钥匙。

评分

这本《数据驱动的决策艺术》绝对是数据分析领域的宝藏!我之前总是觉得统计学知识和实际业务场景之间有一道鸿沟,很多书讲的理论很扎实,但就是不知道怎么落地。这本书不一样,它简直就像一本实战手册,从最基础的数据清洗、探索性分析,一直讲到如何构建复杂的预测模型,每一步都配有清晰的案例和代码示例。作者似乎非常理解初学者和中级分析师的痛点,没有过多纠缠晦涩的数学证明,而是聚焦于“如何用数据解决问题”。特别是关于A/B测试的设计与解读那一部分,我感觉自己终于搞明白了那些p值和置信区间背后的真正含义,而不是只会套用公式。读完之后,我立刻尝试用书中学到的特征工程技巧去优化我手头上的一个客户流失预测项目,效果立竿见影。这本书的叙述风格非常亲切,仿佛有一位经验丰富的导师在旁边手把手教你,让人在学习复杂概念时一点也不觉得枯燥,强力推荐给所有希望提升数据分析实战能力的朋友。

评分

《商业智能与数据可视化实战指南》这本书,简直是为我们这些经常要做汇报的运营人员量身定制的。我们部门的数据散落在好几个系统里,平时想快速做出一个有说服力的仪表盘简直是噩梦。这本书没有讲那些高深的算法,而是聚焦于“沟通”——如何用图表把复杂的数据故事讲清楚。它详细对比了不同图表类型(柱状图、散点图、热力图等)在传达不同信息时的优劣,这一点对我启发极大。我以前总喜欢用堆积条形图来展示季度增长,看了这本书后才知道那种图表有多容易误导观众,现在我改用组合图表和上下文标注,效果好多了。此外,关于数据叙事和受众心理的分析也非常到位,真正做到了从“做图”到“讲好数据故事”的升华。如果你对如何设计一个高效、美观且不失真数据的BI报告感到困惑,这本书绝对能提供立竿见影的解决方案。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有