内容简介
近年,很多研究集中到诊断试验的设计方法和诊断准确度分析方法方面。《诊断医学中的统计学方法》(第二版)继续提供这个领域更为深入的设计和分析方法,帮助读者全面理解这类研究,以及将研究结果推广到患老人群的实际应用中。
本书作者对于如何衡量诊断试验准确度以及设计问题做了基本介绍,很好地定义了不同的诊断准确度评价指标,描述了设计诊断准确度研究的策略,并且给出了估计和比较诊断准确度的重要的统计学方法。第二版新的内容包括:
●用于检验和定位病灶的诊断试验方法
●推荐协变量调整方法
●估计和比较诊断试验预测值以及样本爨估计的方法
●证实性偏倚和不完善金标准的校正方法
●当存在预试验数据时,多名阅片者研究的样本量估计方法
●嵌入随机效应的meta分析方法
书中三个实例全面地反映出了诊断试验中存在的设计和统计学问题,并在附录中提供了所有实例的数据,同时在网站中提供了使用FOR下RAN、SAS和R语言编制的软件包,以便读者能够自己实现分析。
《诊断医学中的统计学方法》(第二版)可以作为研究生阶段生物统计学课程极好的补充材料,同时能够为临床工作者和医学、流行病学及生物统计学的研究老提供有价值的参考依据。
作者简介
周晓华,博士,美国华盛顿大学生物统计系教授,美国联邦政府退伍人事务部生物统计部主任、美国生物统计学会会员,发表超过100篇有关诊断医学和因果推断的学术论文。
内页插图
目录
第一部分 基本概念和方法
第一章 绪论
1.1 诊断试验准确度研究
1.2 实例介绍
1.2.1 实例1:甲状旁腺疾病
1.2.2 实例2:结肠癌诊断
1.2.3 实例3:颈动脉狭窄
1.3 软件
1.4 本书没有包含的主题
第二章 诊断准确度评价指标
2.1 灵敏度与特异度
2.1.1 衡量诊断试验准确度的基本指标:实例2
2.1.2 具有连续型检查结果的诊断试验:人工心脏瓣膜实例
2.1.3 具有等级型检查结果的诊断试验:实例1
2.1.4 疾病患病率与疾病谱对灵敏度和特异度的影响
2.1.5 FPR和FNR与α和β的类比
2.2 灵敏度与特异度的综合指标
2.2.1 两个及以上诊断试验准确度比较时存在的问题:实例1
2.2.2 诊断试验结果的正确率
2.2.3 优势比和Youden指数
2.3 受试者工作特征曲线(ROC)
2.3.1 ROC曲线:人造心脏瓣膜和实例1
2.3.2 关于ROC曲线的假定
2.3.3 拟合的光滑ROC曲线
2.3.4 ROC曲线的优点
2.4 ROC曲线下面积
2.4.1 ROC曲线下面积的解释
2.4.2 ROC曲线下面积的大小
2.4.3 ROC曲线下面积:实例1
2.4.4 ROC曲线下面积的误解
2.5 固定FPR的灵敏度
2.6 部分ROC曲线下面积
2.7 似然比
2.7.1 关于似然比的三个实例
2.7.2 似然比的缺点
2.7.3 常规与非常规ROC曲线
2.8 真实诊断结果不是二分类情况的ROC分析
2.9 比较预测模型的c统计量和其他指标
2.10 多个病灶的检测与定位
2.11 阳性和阴性预测值、贝叶斯定理及实例2
2.11.1 贝叶斯定理
2.12 ROC曲线的最佳决策阈值
2.12.1 最大化分类的最优阈值
2.12.2 最小化成本的最优阈值
2.12.3 最佳决策阈值:以快速眼动为抑郁症生物标识的实例
2.13 多项试验的结果解释
2.13.1 平行联合诊断
2.13.2 序贯诊断试验
第三章 诊断准确度的研究设计
3.1 确定研究目标
3.2 识别目标患者总体
3.3 选择患者抽样计划
3.3.1 第一阶段:探索研究
3.3.2 第二阶段:挑战研究
3.3.3 第三阶段:临床研究
……
第四章 单一样本的参数估计与假设检验
第五章 两种诊断试验准确度的比较
第六章 样本量的估计
第七章 诊断准确度研究中的meta分析
……
第二部分 高级方法
第八章 独立数据的ROC回归分析
第九章 多位阅片者多项诊断试验的分析与评价研究
第十章 校正证实性偏倚的方法
第十一章 校正非完美金标准偏倚的方法
第十二章 Meta分析中的统计学分析方法
附录A 实例介绍以及第八章数据
附录B 估计方差和置信区间的刀切法及bootstrap方法
参考文献
索引
前言/序言
诊断试验经常用于确定病人是否需要接受额外的诊断、治疗以及干预,而这将影响病人的最终结局,所以诊断试验研究在医学中起到非常重要的作用。因此,临床医生给出的诊断试验结果对于诊断试验准确度的评价就显得非常重要,为了确保正确地评价诊断试验的准确度,需要临床医生能够较好地设计诊断试验,并理解这些方法如何正确地应用到病人身上进行诊断,本书主要有两个目的:一是提供合适的方法正确地设计诊断试验和分析诊断试验的准确度;二是帮助临床医生更好地理解这些诊断试验的结果,并能够应用到实际,
新版书中根据新发表的诊断试验评价方法,更新了每章的内容。更新的内容包括:用于检测和定位病变部位的诊断试验评价方法(第二章、第三章和第九章);诊断试验中需要调整的协变量类型(第三章),以及相应的协变量调整方法(第八章);估计和比较诊断试验预测值的方法(第四章和第五章);使用预测值作为诊断试验准确度评价标准的样本量估计方法(第六章);具有预试验结果数据时,多位阅片者研究设计类型的样本量估计方法(第六章);具有连续型结果指标的诊断试验存在证实性偏倚时,ROC曲线估计值新的校正方法(第十章);具有等级型或者连续型结果指标的诊断试验存在非完美金标准情况时,ROC曲线估计值的校正方法(第十一章)。
本版书中还增加了三个实例:正电子发射断层扫描(PET)用于比较检测患病的甲状旁腺准确性的研究;计算机辅助检测结肠息肉准确性的研究;磁共振成像(MRI)用于诊断动脉狭窄准确性的研究(第一章)。这三个实例用于阐述本书中介绍的统计学方法,具体数据详见附录,
本书的整体结构如下:
第二章和第三章分别介绍了有关诊断试验准确度评价的一些基本的衡量指标以及研究设计类型,同时讲解了用于评价诊断试验准确度的统计学方法,并通过实例阐述了如何正确应用这些统计学方法。第四章和第五章分别阐述了准确度的估计方法,并比较了不同设计情况下诊断试验的准确度。第六章介绍了诊断试验样本量的估算方法。第七章和第十二章集中介绍了如何进行诊断试验准确度的meta分析及相应的统计学方法。第八章和第九章分别介绍了多种病人情况及多位阅片者设计的诊断试验准确度评价模型。第十章及第十一章分别介绍了诊断试验研究中存在证实性偏倚及非完美金标准时,诊断试验准确度估计值的校正方法。第一章到第三章介绍了诊断试验中基本的统计学概念以及医学术语,第四章到第七章的内容为生物统计专业人员介绍了基本的数据分析方法,第八章到第十二章介绍了高级的统计学内容,同时也提供了更为详细的统计学方法。
疾病诊断的智慧之光:统计学在现代医学中的应用 在疾病诊断的漫长而复杂的研究过程中,精准与可靠是永恒的追求。从最初的症状观察到最终的诊断结论,每一步都凝聚着医学工作者的智慧与经验。然而,随着医学科学的飞速发展,数据量的爆炸式增长,以及疾病谱的不断变化,仅仅依靠直觉和经验已经不足以应对日益严峻的挑战。在这个关键时刻,统计学这门古老而充满活力的学科,以其强大的数据分析能力和严谨的逻辑思维,逐渐成为现代医学诊断不可或缺的“智慧之光”。 本书并非一本详尽介绍具体医学诊断技术或疾病治疗方案的临床手册,它更专注于揭示隐藏在疾病诊断流程背后的数学语言——统计学。我们将深入探讨,如何运用统计学的方法,将纷繁复杂的医学数据转化为具有深刻洞察力的诊断依据,从而提升诊断的准确性、效率和可信度。本书的目光聚焦于统计学在整个诊断医学体系中的核心地位,从基础概念的梳理,到高级应用的展现,旨在为医学研究者、临床医生以及相关领域的学生提供一个全面而深入的视角。 数据的力量:从原始信息到诊断洞察 医学诊断的基石是数据。这些数据来源广泛,包括患者的病史、体格检查结果、实验室检测指标(如血常规、生化、影像学检查)、基因组学信息,甚至来自可穿戴设备和远程监测的生理信号。然而,原始数据本身往往杂乱无章,其中蕴含的真正信息需要经过精心的提炼和解读。统计学恰恰提供了这一能力。 本书将首先带领读者认识不同类型医学数据的特征,例如分类数据(如疾病是否存在)、计数数据(如特定细胞的数量)、测量数据(如血压、血糖值)等。理解数据的类型是选择合适统计分析方法的前提。在此基础上,我们将介绍描述性统计学的基本工具,如均值、中位数、标准差、频率分布等,它们能够帮助我们概括和展示数据的基本特征,形成对疾病状况的初步认识。例如,通过计算某项血液指标的均值和标准差,我们可以了解该指标在一组健康人群中的正常范围,从而为判断个体患者的异常值提供基准。 然而,描述性统计仅仅是起点。真正的挑战在于如何从样本数据推断出更广泛的人群规律,以及如何量化不确定性。这正是推断性统计学大显身手之处。本书将重点阐述抽样分布、置信区间和假设检验等核心概念。理解这些概念,我们就能科学地评估基于样本数据得出的诊断结论在多大程度上可以推广到更广阔的患者群体,以及我们对这一结论的信心程度。例如,一项新的诊断方法的准确性是基于有限数量的患者样本评估得出的,通过置信区间,我们可以知道这个准确性评估值可能存在的范围,从而更客观地判断该方法的可靠性。假设检验则帮助我们科学地回答“这个新方法的诊断准确性是否显著高于现有方法?”这类问题,避免主观臆断。 衡量诊断的“标尺”:敏感性、特异性与预测值 在疾病诊断的实践中,我们最关心的莫过于一个诊断工具(如一种检测方法、一个影像学特征)的“好坏”。然而,“好坏”并非一个模糊的概念,它需要精确的量化。统计学提供了量化诊断工具性能的“标尺”。 本书将深入解析几个至关重要的诊断评价指标:敏感性(Sensitivity)、特异性(Specificity)、阳性预测值(Positive Predictive Value, PPV)和阴性预测值(Negative Predictive Value, NPV)。我们会详细探讨它们的定义、计算方法及其在临床决策中的意义。例如,敏感性衡量的是诊断工具正确识别出所有真实患病个体的能力,即“不漏诊”的程度;特异性则衡量的是诊断工具正确识别出所有健康个体的能力,即“不误诊”的程度。当一个患者的检测结果呈阳性时,阳性预测值告诉我们他真正患病的概率有多大;而阴性预测值则在患者检测结果呈阴性时,告诉我们他真正健康的概率有多大。 理解这些指标的局限性也同样重要。例如,PPV和NPV会受到疾病在人群中的患病率(prevalence)的影响。本书将通过图表和实际案例,深入浅出地解释这些概念,让读者能够清晰地理解如何评估和选择最适合特定临床场景的诊断工具,并能准确解读其检测结果。 揭示关联:风险因素、相关性与预测模型 疾病的发生往往不是单一因素作用的结果,而是多种因素相互作用的体现。统计学能够帮助我们揭示这些潜在的关联,识别疾病的风险因素,并构建预测模型,从而更早地、更准确地识别高危人群,或预测疾病的发展趋势。 本书将介绍相关性分析,帮助我们理解两个或多个变量之间是否存在线性或非线性关系,以及这种关系的强度和方向。例如,我们可能想知道吸烟是否与肺癌的发病风险显著相关。然而,相关性不等于因果性。因此,本书也将重点探讨因果推断的统计学方法,尽管这是一个复杂而前沿的领域,我们将从基本原理出发,介绍如何通过观察性研究的设计和分析,尽可能地推断出因果关系。 更进一步,我们将深入探讨回归分析,这是构建预测模型的核心工具。无论是在线性回归中预测一个连续的健康指标(如血压),还是在逻辑回归中预测一个二元的疾病发生概率(如是否患上某种心脏病),回归模型都提供了强大的预测能力。本书将详细介绍不同类型的回归模型,包括它们的应用场景、模型假设、参数估计以及模型评估的方法。例如,通过构建一个包含年龄、性别、家族史、胆固醇水平等多个变量的逻辑回归模型,我们可以为每个个体计算其未来罹患心血管疾病的概率,从而实现精准的风险分层和早期干预。 把握不确定性:生存分析与时间序列分析 在临床实践中,我们不仅关心疾病的诊断,还关心疾病的预后和治疗效果。生存分析是一种专门用于分析“事件发生时间”数据的统计学方法,它在肿瘤学、流行病学等领域具有极其重要的应用。本书将介绍生存函数的概念,Kaplan-Meier曲线的绘制和解释,以及Log-rank检验的应用,帮助读者理解如何评估治疗方法的有效性,比较不同组别患者的生存结局,以及预测患者的生存时间。 此外,对于需要监测病情变化和评估治疗动态的场景,时间序列分析也提供了有力的工具。本书将介绍时间序列数据的基本特征,如何进行趋势和季节性分析,以及常用的时间序列模型,如ARIMA模型,用于预测未来的病情发展。例如,通过对患者体温、血压等生理指标进行时间序列分析,我们可以及时发现病情恶化的迹象,并调整治疗方案。 从理论到实践:统计软件与研究设计 统计学的应用离不开强大的统计软件。本书虽然不直接教授某一款软件的操作,但会提及在医学统计分析中常用的软件工具,并强调理解统计学原理的重要性,因为只有理解了原理,才能正确有效地使用这些工具。 最后,本书还将触及统计学在医学研究设计中的关键作用。一个严谨的研究设计是获得可靠数据和得出有效结论的前提。我们将探讨随机对照试验(RCT)、队列研究、病例对照研究等不同研究设计的特点、优缺点以及它们对统计分析选择的影响。理解研究设计的原则,能够帮助研究者避免潜在的偏倚,提高研究的科学性和说服力。 结语:统计学,为诊断医学注入科学的力量 本书旨在提供一个关于统计学在诊断医学中应用的全面而深入的视角。我们相信,通过掌握和运用统计学的方法,医学工作者能够更有效地解读复杂的医学数据,做出更精准的诊断决策,更科学地评估诊断工具的性能,更深入地理解疾病的发生机制,并最终为患者提供更优质的医疗服务。统计学,正以其严谨的逻辑和量化的力量,为诊断医学注入源源不断的科学活力,引领我们走向一个更加精确、高效和智能的未来。