基本信息
书名:属性数据分析
原价:26.50元
作者:王静龙
出版社:高等教育出版社
出版日期:2013-07-01
ISBN:9787040376210
字数:
页码:252
版次:1
装帧:平装
开本:16
商品重量:0.4kg
编辑推荐
王静龙、梁小筠、王黎明编著的《属性数据分析》共分九章,第一章介绍属性数据的描述性统计分析方法。第二章介绍单一属性分类数据的统计推断方法。第三、四和五章介绍交叉分类数据,即列联表的统计推断方法。第六章介绍逻辑斯谛线性回归模型。第七章介绍对数线性回归模型。第八章介绍对应分析。第九章介绍属性数据的贝叶斯统计推断。本书在选材时,注重统计软件的应用,例如:Excel、Minitab、SPSS和SAS等。书中收集了大量可反映属性数据应用问题的例题,也可作为各种统计方法如何运用的示范。本书将正文中的部分理论证明放在附录中,教学时间紧,或只求了解统计方法应用的读者可以跳过去。
内容提要
王静龙、梁小筠、王黎明编著的《属性数据分析》共九章,主要内容包括属性数据,单一属性分类数据,四格表,二维列联表,高维列联表,逻辑斯谛回归模型,对数线性模型,列联表的对应分析,属性数据的贝叶斯统计推断。附录中对教材的部分理论证明做了补充。全书结合统计软件Excel、Minitab、SPSS和SAS,注重统计方法的应用。本书还配有大量的例题,有助于学生巩固所学的属性数据统计分析的方法及应用。
《属性数据分析》可作为高等学校统计学专业本科生和研究生的教学用书,也可作为社会学、心理学、人口学、市场学和医学等领域从事理论研究和应用的统计工作者的参考用书。
目录
第一章 属性数据
§1.1 数据
§1.2 属性数据的描述性统计
§1.2.1 表格法
§1.2.2 图示法
§1.2.3 数值法
§1.3 属性数据的概率分布
§1.3.1 (0-1)分布
§1.3.2 二项分布
§1.3.3 多项分布
§1.3.4 泊松分布
§1.3.5 负二项分布
习题一
第二章 单一属性分类数据
§2.1 分类数据的检验
§2.1.1 分类数据的x2检验
§2.1.2 分类数据的似然比检验
§2.2 带参数的分类数据的检验
§2.2.1 带参数的分类数据的x2检验
§2.2.2 带参数的分类数据的似然比检验
习题二
第三章 四格表
§3.1 四格表
§3.1.1 四格表的抽样方式
§3.1.2 独立与不相关
§3.2 四格表的检验问题
§3.2.1 四格表检验问题的解
§3.2.2 连续性修正
§3.2.3 四格表独立性检验问题的似然比检验
§3.2.4 总的样本容量给定时四格表的检验问题
§3.2.5 完全随机时四格表的检验问题
§3.3 四格表的费希尔检验
§3.3.1 费希尔精确检验
§3.3.2 Mantel Haenszel x2检验
§3.4 四格表的优比检验法
§3.5 边缘齐性检验
习题三
第四章 二维列联表
§4.1 二维列联表
§4.2 二维列联表的检验问题
§4.2.1 二维列联表的x2检验
§4.2.2 二维列联表的似然比检验
§4.3 相合性的度量和检验
§4.3.1 Kendall-r系数
§4.3.2 Gamma系数
§4.3.3 Somers d系数
§4.3.4 相合性检验
§4.4 方表一致性的度量和检验
§4.4.1 一致性的度量
§4.4.2 一致性的检验
§4.5 不完备列联表
§4.5.1 列联表的独立性
§4.5.2 不完备列联表的拟独立性
§4.5.3 拟独立的不完备列联表的极大似然估计
§4.5.4 不完备列联表拟独立性的检验问题
习题四
第五章 高维列联表
§5.1 高维列联表的压缩和分层
§5.1.1 列联表的压缩
§5.1.2 列联表的分层
§5.2 高维列联表的条件独立性检验
§5.3 高维列联表的独立性检验
§5.4 Cochran-Mantel-Haenszel和Breslow-Day检验
§5.4.1 条件相合性的检验
§5.4.2 Breslow-Day x2检验
§5.5 有偏比较
§5.5.1 抽样调查数据的分析
§5.5.2 实验数据的分析
§5.5.3 观察数据的分析
§5.6 高维列联表的独立性和相关性
§5.6.1 三维列联表的独立性
§5.6.2 三维列联表的相关性
§5.7 不完备高维列联表
习题五
第六章 逻辑斯谛回归模型
§6.1 逻辑斯谛回归模型
§6.1.1 逻辑斯谛变换
§6.1.2 逻辑斯谛线性回归模型
§6.2 含有名义数据的逻辑斯谛回归模型
§6.2.1 名义数据的赋值
§6.2.2 含有名义数据的逻辑斯谛回归模型
§6.3 含有有序数据的逻辑斯谛回归模型
§6.4 逻辑斯谛判别分析
§6.5 多项逻辑斯谛回归模型
习题六
第七章 对数线性模型
§7.1 引言
§7.2 广义线性模型
§7.3 二维列联表的对数线性模型
§7.4 高维列联表的对数线性模型
§7.5 不完备列联表的对数线性模型
习题七
第八章 列联表的对应分析
§8.1 二维列联表的对应分析
§8.2 高维列联表的对应分析
习题八
第九章 属性数据的贝叶斯统计推断
§9.1 贝叶斯统计推断概要
§9.2 二项分布的贝叶斯统计推断
§9.2.1 二项分布6(n,p)的未知参数p的先验分布
§9.2.2 后验分布
§9.2.3 贝叶斯推断
§9.2.4 贝塔-二项分布
§9.3 泊松分布的贝叶斯统计推断
习题九
附录
附录1 帕雷托原则
附录2 GS指数和熵的最大值
附录3 Pearson x2定理的证明
附录4 -2In(A)与x2统计量有相同的渐近x2(r-1)分布的证明
附录5 第三章的(3.2.3)式的渐近正态性的证明
附录6 似然比检验统计量的可分解性
附录7 优比
附录8 第四章的(4.4.2)、(4.4.3)和(4.4.5)等三式的证明
附录9 三维列联表条件独立性检验问题
附录10 三维列联表的独立性检验问题似然比检验统计量的可分解性
附录11 第五章的(5.4.5)式的证明
附录12 Simpson悖论
附录13 Probit变换和双对数变换
附录14 估计In(p/(1-p))
参考文献
作者介绍
文摘
序言
这本书的封面设计真是充满了古典与现代交织的韵味,那种深邃的靛蓝色背景上,用烫金字体勾勒出的标题,透露出一种不容置疑的专业感。我记得我是在一家老旧的独立书店里偶然发现它的,当时被它厚重的质感所吸引,拿在手里沉甸甸的,仿佛承载了无数知识的重量。一翻开内页,那种纸张特有的微涩的触感和淡淡的油墨香气立刻占据了我的感官。我本来对技术类的书籍有些畏惧,总觉得它们晦涩难懂,但这本书的排版却出乎意料地清爽、留白得当,使得即使是复杂的公式和图表,也能被清晰地组织起来。虽然我尚未深入阅读核心章节,但光是前言和目录的梳理,就让我对作者构建知识体系的严谨性有了深刻的印象,它似乎在向读者保证:这是一趟有组织、有导引的知识探险,而不是一场盲目的信息洪流。从这些初步的接触来看,这本书在装帧和视觉传达上,已经为读者搭建了一个非常舒适的阅读入口。
评分这本书带给我一种强烈的“沉浸感”,仿佛作者本人就坐在我的对面,用一种循循善诱的语气在进行一对一的辅导。我翻到关于“模型解释性”(Explainability)的部分时,感受尤其深刻。现在市面上充斥着大量关于深度学习和复杂模型的应用指南,但往往只教你如何调参,如何让准确率数字更高。然而,这本书似乎将重点放在了“为什么模型会给出这个答案”上,它详细介绍了LIME和SHAP等方法的应用边界和局限性,并且深入探讨了在监管严格的行业中,如何构建可信赖的决策依据。这种对“负责任的AI”的关注,让我感到非常振奋。它不再仅仅是工具的堆砌,而是上升到了伦理和治理的高度,让我开始思考,作为分析师,我们肩负的责任远不止于交付一个报表那么简单。这本书提供的是一种思维框架,指导我们如何更负责任地使用数据和模型的力量。
评分从结构上看,这本书的章节划分逻辑性极强,仿佛一位经验丰富的向导,每走一步都能清晰地预示下一步将要面对的景观。我注意到作者似乎非常注重概念的递进和层级关系的建立,从基础概念的界定,到复杂模型的构建,再到最终的解释和可视化呈现,每一步都像是为前一步做了坚实的铺垫。我个人最欣赏的是,它没有将复杂的统计学知识包装成深不可测的黑箱,而是用非常清晰的类比和图示来解释那些抽象的数学原理。举个例子,关于置信区间的讲解,作者没有直接抛出公式,而是用一个日常生活中“射箭”的比喻来阐释概率的分布范围,这种教学方式极大地降低了初学者的入门门槛,同时又确保了理解的深度不会被削弱。这种兼顾严谨性与易读性的平衡感,在同类书籍中是极其罕见的。
评分我认识的一位资深数据科学家向我力荐这本书,他提到这本书的理论深度在业界是数一数二的,尤其是在方法论的构建上,展现了作者多年实践经验的沉淀。他着重强调了书中对于“为何如此”的探讨,而非仅仅停留在“如何操作”的层面。我的这位朋友,他通常对市面上那些肤浅的工具书嗤之以鼻,但唯独对这本书赞不绝口,他说它不像很多快餐式的指南那样,只教你几个招式,而是深入剖析了底层逻辑和思维模型的形成过程。他特意举了一个关于异常值处理的章节给我做例子,说作者没有直接给出标准答案,而是引导读者去理解不同业务场景下,对“异常”的定义是如何发生根本性转变的,这种辩证和批判性的思维训练,才是真正有价值的东西。光听他这么描述,我就能感受到这本书的学术价值和实用价值是高度统一的,它似乎在培养一种“数据哲学家的素养”。
评分最近我正在尝试将我的一个小型项目的数据分析流程进行升级,原先的工具和方法已经显得有些力不从心,我迫切需要一个能提供更精细化、更具前瞻性的指导。我在网上浏览了大量的书评,其中有一条评论特别吸引我,那条评论的作者提到,这本书在处理“缺失值”那一节的内容,彻底颠覆了他过去十年对数据清洗的认知。他描述说,以前他总觉得这是个机械性的步骤,但这本书展示了缺失值背后的业务含义和信息熵损失,并且提供了一套评估不同插补策略优劣的量化指标体系。这位评论者语气非常激动,他表示读完这一章后,他回去重新审视了自己的项目,发现此前犯了一个根本性的错误,而这个错误如果早点被发现,可以为项目节省大量的返工时间。这让我意识到,这本书可能不仅仅是理论的汇编,更像是一套精密的“诊断工具箱”,能够帮助我们识别和修正那些隐藏在日常分析中的系统性偏差。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有