内容简介
《现代物理基础丛书·典藏版:实验数据多元统计分析》介绍实验或测量数据的多元统计分析方法,内容包括:贝叶斯决策、线性判别方法、决策树判别、人工神经网络、近邻法、概率密度估计量法、H矩阵判别、函数判别分析、支持向量机法等,以及不同判别方法的比较。此外,还简要介绍了将多种多元统计分析方法的计算机程序汇集在一起的程序包TMVA(toolkit for multivariate data analysis),并分析了粒子物理实验数据分析中应用多元统计分析方法的一些实例。
《现代物理基础丛书·典藏版:实验数据多元统计分析》可供实验物理工作者和大专院校相关专业师生、理论物理研究人员、工程技术人员及从事自然科学和社会科学的数据测量和分析研究人员参考。
内页插图
目录
前言
第一章 绪论
1.1 模式和模式识别
1.2 模式识别系统
1.2.1 原始数据获取
1.2.2 原始数据的预处理
1.2.3 特征提取和选择
1.2.4 分类决策
1.3 数据矩阵与样本空间
1.3.1 数据矩阵与样本空间
1.3.2 模式的相似性度量
1.3.3 样本点的权重和特征向量数据的预处理
1.4 主成分分析
1.4.1 主成分分析的基本思想
1.4.2 主成分分析算法
1.4.3 降维处理及信息损失
第二章 贝叶斯决策
2.1 基于最小错误率的贝叶斯决策
2.1.1 决策规则
2.1.2 错误率
2.1.3 分类器设计
2.2 Neyman-Pearson决策
2.3 正态分布时的贝叶斯决策
2.4 分类器的效率和错误率
2.4.1 分类器的效率、错误率和判选率矩阵
2.4.2 错误率的上界
2.4.3 利用检验样本集估计判选率矩阵和错误率
2.4.4 训练样本集和检验样本集的划分
2.4.5 利用判选率矩阵估计各类“真实”样本数
2.4.6 分类器判定的“信号”样本中错判事例的扣除
2.5 讨论
第三章 线性判别方法
3.1 线性判别函数
3.1.1 线性判别函数的基本概念
3.1.2 广义线性判别函数
3.1.3 线性分类器的设计
3.2 Fisher线性判别
3.3 感知准则函数
3.3.1 几个基本概念
3.3.2 感知准则函数
3.4 最小错分样本数准则函数
3.5 最小平方误差准则函数
3.5.1 平方误差准则函数及其MSE解
3.5.2 MSE准则函数的梯度下降算法
3.5.3 随机MSE准则函数及其随机逼近算法
3.6 多类问题
第四章 决策树判别
4.1 超长方体分割法
4.1.1 超长方体分割法的基本思想
4.1.2 超长方体分割法中阐值的确定
4.1.3 超长方体分割法的优缺点及其改进
4.1.4 超长方体分割法用于高能物理实验分析
4.2 决策树法
4.2.1 决策树法的基本思想
4.2.2 信号/本底二元决策树的构建
4.2.3 决策树的修剪
4.3 决策树林法
4.3.1 决策树林的构建
4.3.2 决策树林对输入事例的分类
4.3.3 重抽样法构建决策树林
第五章 人工神经网络
5.1 概述
5.1.1 生物神经元和人工神经元
5.1.2 人工神经网络的构成和学习规则
5.2 感知器
5.2.1 单输出单元感知器
5.2.2 多输出单元感知器
5.3 多层前向神经网络和误差逆传播算法
5.3.1 BP网络学习算法
5.3.2 BP网络学习算法的改进
5.4 Hopfield神经网络
5.4.1 离散Hopfield网络
5.4.2 连续Hopfield网络
5.4.3 Hopfield网络在优化计算中的应用
5.5 随机神经网络
5.5.1 随机神经网络的基本思想
5.5.2 模拟退火算法
5.5.3 Boltzmann机及其工作规则
5.5.4 Boltzmann机学习规则
5.5.5 随机神经网络小结
5.6 神经网络用于粒子鉴别
5.6.1 用于带电粒子鉴别的特征变量
5.6.2 带电粒子鉴别的神经网络的架构
5.6.3 网络的训练和粒子鉴别效果
第六章 近邻法
6.1 最近邻法
6.2 k近邻法
6.3 剪辑近邻法
6.3.1 两分剪辑近邻法
6.3.2 重复剪辑近邻法
6.4 可作拒绝决策的近邻法
6.4.1 具有拒绝决策的k近邻法
6.4.2 具有拒绝决策的剪辑近邻法
第七章 其他非线性判别方法
7.1 概率密度估计量方法
7.1.1 基本思想
7.1.2 总体概率密度的非参数估计
7.1.3 投影似然比估计
7.1.4 多维概率密度估计
7.1.5 近邻体积中样本数的确定
7.1.6 概率密度估计法与神经网络的性能对比
7.2 H矩阵判别
7.3 函数判别分析
7.4 支持向量机
7.4.1 最优分类面
7.4.2 广义最优分类面
7.4.3 支持向量机
第八章 不同判别方法的比较
8.1 不同判别方法的特点
8.2 多元统计分析程序包TMVA简介
参考文献
前言/序言
复杂大系统的科学研究往往都需要收集和处理大量反映系统特征和运行状态的数据信息,这类原始数据集合由于样本数量巨大,刻画系统特征的指标变量众多,并且带有随机性质,以致于形成了规模宏大、复杂难辨的数据海洋。利用统计学和数学方法对多维复杂数据集合进行科学的分析,挖掘出隐藏在复杂海量数据中的规律和信息,就是多元统计分析研究的基本内容。
大型高能物理实验就是典型的复杂大系统的科学研究工作。20世纪80年代末北京正负电子对撞机(BEPC)和北京谱仪(BES)的建成,是中国高能加速器实验物理的真正开端。在北京谱仪上进行实验工作的研究组是以谱仪的名称(Beijing Spectrometer)命名的,简称BES合作组,它是由多国物理学家组成的国际合作研究组,我国物理学家在其中占有主导性的地位。北京谱仪成功地运行到2004年,获取了τ-粲能区海量的高能物理实验数据。在此基础上,应用多元统计分析方法对实验数据进行分析,获得了大量居于当时世界领先水平的物理成果。其中,τ轻子质量的精确测量、2-5GeV能区R值的精确测量、共振态X(1835)的实验观察、α粒子的实验确定,‘更是引起当时国际高能物理界广泛瞩目的重大成就。
为了保持和发展我国在高能物理τ粲能区实验研究的领先地位,我国政府又拨巨资对北京正负电子对撞机和北京谱仪进行升级改进,称为BEPCII和BESIII。BEPCII的设计指标是产生粒子反应的强度约为原对撞机的100倍,BESIII的性能则比原北京谱仪有大幅度的提高。目前,BEPCII和BESIII已经完成安装,并在2008年开始实验取数。有理由期望,利用升级改进后的BESIII,可以获得比原北京谱仪更多、更精细、更重要的物理成果。为了达到这一目标,应用比原北京谱仪数据分析更为精细、更为有效的多元统计分析方法成为一个十分重要和急迫的任务。事实上,多元统计分析方法应用于高能物理实验数据分析近年来已经成为国际高能物理界的一种普遍趋势。
本书对于实验数据分析中,特别是高能物理实验数据分析中涉及的多元统计分析方法作一概略的介绍。重点讨论统计识别的基本原理以及进行统计识别的具体方法;对于复杂的数学理论,只介绍其结果,而不作深奥的证明。目的是希望读者能够通过本书掌握多元统计分析的方法并将其付诸实施,特别是能在BESIII的数据
现代物理基础丛书·典藏版:实验数据多元统计分析 epub pdf mobi txt 电子书 下载 2024
现代物理基础丛书·典藏版:实验数据多元统计分析 下载 epub mobi pdf txt 电子书 2024