内容简介
《眼动跟踪技术:原理与应用(原书第二版)》是一本全面论述眼动跟踪原理与应用的专著。眼动跟踪技术近年来取得了飞速发展,技术创新层出不穷,应用领域日新月异。为此,作者在前一版的基础上,修订而成此书。《眼动跟踪技术:原理与应用(原书第二版)》共四部分,用20章的篇幅全面、系统地阐述了眼动的生理心理机制、眼动跟踪系统开发原理、眼动跟踪方法论以及典型眼动跟踪应用。《眼动跟踪技术:原理与应用(原书第二版)》特色鲜明,内容新颖,图文并茂,理论和实用性强,是一本不可多得的有关眼动跟踪的专著。
目录
译者序
第二版 前言
第一版 前言
第一部分 人类视觉系统介绍
第1章 视觉注意力
1.1 视觉注意力:历史回顾
1.1.1 Von Helmholtz的“哪里”假设
1.1.2 James的“什么”假设
1.1.3 Gibson的“怎么”假设
1.1.4 Broadbent的“选择性滤波”理论
1.1.5 Deutsch J A和Deutsch D的“重要权重”理论
1.1.6 Yarbus、Noton和Stark的“扫描”路径理论
1.1.7 Posner的“聚光灯”理论
1.1.8 Treisman的“整合”理论
1.1.9 Kosslyn的“窗口”理论
1.2 视觉注意力和眼动跟踪
1.3 总结和导读
第2章 人类视觉系统的神经底质
2.1 眼睛
2.2 视网膜
2.2.1 外层
2.2.2 内核层
2.2.3 神经节细胞层
2.3 视束和M/P视觉通路
2.4 枕叶皮质及以上区域
2.5 总结和导读
第3章 视觉心理物理学
3.1 空间视觉
3.2 时间视觉
3.2.1 周边视觉的运动感知
3.2.2 在视觉边缘检测运动的灵敏度
3.3 色彩视觉
3.4 视觉显示注意力设计的启示
3.5 总结与扩展阅读
第4章 眼动的分类与模型
4.1 眼外肌与眼动系统
4.2 跳视
4.3 平滑尾随
4.4 注视
4.5 眼球震颤
4.6 眼动分析的意义
4.7 总结与进一步阅读
第二部分 眼动跟踪系统
第5章 眼动跟踪技术
5.1 眼电图法
5.2 巩膜接触镜/搜索线圈法
5.3 眼图照片或眼图录像法
5.4 基于视频的瞳孔/角膜反射法
5.5 视线跟踪与动作捕捉
5.6 总结与进一步阅读
第6章 头戴式系统的硬件安装
6.1 集成的关键和要求
6.2 系统安装
6.3 克莱姆森大学系统安装中的经验教训
6.4 总结与进一步阅读
第7章 头戴式系统软件开发
7.1 眼动仪系统屏幕坐标系的映射
7.1.1 将屏幕坐标系映射到三维视锥
7.1.2 屏幕坐标系到二维图像的映射
7.1.3 测量眼动仪系统屏幕坐标系范围
7.2 鸟群跟踪器坐标映射
7.2.1 获得变换的视线矢量
7.2.2 获取变换的向上矢量
7.2.3 任意矢量变换
7.3 3D注视点计算
7.3.1 注视方向的参数化射线表示
7.4 虚拟的视线交点坐标
7.4.1 线与平面的交点
7.4.2 点在多边形内问题
7.5 数据表示与存储
7.6 总结与进一步阅读
第8章 头戴式系统的标定
8.1 软件实现
8.2 辅助标定程序
8.2.1 内部二维标定
8.2.2 内部三维标定
8.3 总结及进一步阅读
第9章 桌面式系统硬件安装
9.1 集成问题及需求
9.2 系统安装
9.3 从克莱姆森硬件安装中学到的课程
9.4 总结和进一步阅读
第10章 桌面式系统软件开发
10.1 Linux Tobii 客户端应用程序界面
10.1.1 Tet_Init
10.1.2 Tet_Connect和Tet_Disconnect
10.1.3 Tet_Start, Tet_Stop
10.1.4 函数 Tet_CalibClear、Tet_CalibLoadFromFile、Tet_CalibSaveToFile、Tet_CalibAddPoint、Tet_CalibRemovePoints、Tet_CalibGetResult、Tet_CalibCalculateAndSet
10.1.5 Tet_SynchronizeTime和Tet_PerformSystemCheck
10.1.6 Tet_GetSerialNumber、Tet_GetLastError和Tet_GetLastErrorAsext
10.1.7 Tet_CallbackFunction
10.2 一个OpenGL/GLUT图形用户界面的简单样例
10.3 警告
10.4 结论和进一步阅读
第11章 桌面式系统标定
11.1 软件实现
11.2 总结和进一步阅读
第12章 眼动分析
12.1 信号去噪
12.2 基于停留时间的注视点检测
12.3 基于速度的扫视检测
12.4 三维眼动分析
12.4.1 参数估计
12.4.2 注视分组
12.4.3 眼动数据镜像
12.5 总结与进一步阅读
第三部分 眼动跟踪方法论
第13章 实验设计
13.1 形成假说
13.2 查询形式
13.2.1 实验对观察研究
13.2.2 实验室对现场研究
13.2.3 特殊规律研究对一般规律研究
13.2.4 样本人群对单例实验对案例研究
13.2.5 个体自我设计与受试间设计
13.2.6 样例设计
13.3 测量值与分析
13.4 总结与进一步阅读
第14章 建议的实验指南
14.1 评估计划
14.1.1 数据收集
14.1.2 系统识别
14.1.3 约束
14.1.4 用户选择
14.1.5 现场评估
14.1.6 任务选择
14.2 实践建议
14.3 考虑动态刺激
14.4 总结与进一步阅读
第15章 案例学习
15.1 头戴式VR诊断:视觉检测
15.1.1 案例研究便笺
15.2 头戴式VR诊断:三维迷宫导航
15.2.1 案例研究便笺
15.3 桌面VR诊断:驾驶模拟器
15.3.1 案例研究便笺
15.4 桌面诊断:可用性
15.5 桌面交互:注视跟随鱼眼镜头
15.6 总结与进一步阅读
第四部分 眼动跟踪的应用
第16章 眼动跟踪技术应用的多样性和种类
16.1 总结与进一步阅读
第17章 神经科学与心理学
17.1 错觉等高线的神经生理学研究
17.2 注意神经科学
17.3 眼动与脑成像
17.4 阅读
17.5 场景感知
17.5.1 艺术感知
17.5.2 电影感知
17.6 视觉搜索
17.7 自然任务
17.8 在其他信息处理任务中的眼动
17.9 总结与进一步阅读
第18章 工业工程与人因工程
18.1 航空
18.2 驾驶
18.3 视觉检测
18.4 总结和进一步阅读
第19章 营销与广告
19.1 广告文案测试
19.2 印刷广告
19.3 广告位置
19.4 电视增强
19.5 网页
19.6 商品标签设计
19.7 总结与进一步阅读
第20章 计算机科学
20.1 人机交互与协同系统
20.1.1 经典的基于眼睛的交互
20.1.2 认知建模
20.1.3 全局易用性
20.1.4 间接的基于眼睛的交互
20.1.5 注意力用户界面
20.1.6 可用性
20.1.7 协同系统
20.2 注视跟随显示
20.2.1 基于屏幕的显示
20.2.2 基于模型的图形显示
20.3 总结和进一步阅读
总结
参考文献
精彩书摘
《眼动跟踪技术:原理与应用(原书第二版)》:
第1章 视觉注意力
在论述眼动跟踪技术之前,首先需要考虑记录人类眼动的动机。就是说,为什么眼动跟踪非常重要?简单地说,我们会移动眼球,将视场中某一部分移动到高分辨区域,以便看清楚注视中心方向更多的细节。通常情况下,我们会同时将意识集中于此点,以便集中注意力于感兴趣物体或者区域这里假设非常短暂的瞬间。于是可以设想,如果我们可以跟踪一个人的眼动,便可以了解观察者注意力移动的轨迹。这可以了解观察者是如何发现感兴趣区域的,也就是说,是什么决定着他们的注意力,并且可能为研究感知生理学提供一个线索,揭示人是如何感知所看到的物体的。
通过研究视觉认知中的注意力和神经机理,本书前两章从两个视角描述了眼动研究的动机,即心理学观点,研究注意力行为以及注意力行为的研究历史(本章作了简要介绍);生理学观点,即驱动注意力行为的神经反应机理(在第2章论述)。总的来说,这两章建立了眼动研究的心理学和生理学基础。
为了开始系统阐述和理解人类注意力,首先要建立一个基本的或者至少是直观的感觉,那就是注意力是什么,眼动是否确实能表明内部认知过程,即视觉注意力。
视觉注意力已被研究100多年了。心理学家James给出了一个较好的关于视觉注意力的定性定义:
每个人都知道注意是什么。注意是由意识决定的,它使心理以清晰和鲜明的形式从几个同时显现的可能目标或一系列思想中拥有一个。知觉的指向性和集中性是注意的两个基本特性,它指出意识选择了某个对象而忽略了其余对象 当对象被感官感觉时,只有少数对象会在瞬间被注意。
Pluribus intentus,minor est ad singular sensue.
—James(1981)James
所说的这句拉丁语大意为“从大部分注视中筛选出少数用于感知”,这里注意力起着筛选的作用。
人的能力是有限的,无法在瞬间注意所有的东西。一般情况下,人们总是将注意力集中于要被感知的对象,这样,意识就可以成功捕获感兴趣的刺激。人处理信息的能力是有限的,大脑通过专注于所有感官输入中的特殊部分来处理感官输入,这样感兴趣的图像、声音、气味以及类似的信息,可能比次要的刺激获得更多的注意力。在视觉方面更是如此,视觉场景审视是渐进的,不是完整的。也就是说,人类视觉是一个依赖于小区域的感知集成构造一个连续表达的离散过程。 本章从历史的角度沿着Heijden(1992)的讲述,叙述了注意力的概念。讨论集中于视觉中的注意力机理,重点是两类主要的视觉注意力,即“什么”和“哪里”。
1.1视觉注意力:历史回顾人类研究视觉注意力已经有100多年了。早期注意力的研究局限于简单的光学观察和自我测试。之后,该领域增长为包括心理物理学、认知神经科学和计算机科学的交叉学科。本节描述视觉注意力研究的历史背景。
1.1.1Von Helmholtz的“哪里”假设19世纪下半叶,Von Helmholtz(1925)假设视觉注意力是视觉感知的主要机理。他在专著Treatise on Physiological Optics中指出:“我们使眼睛在场景中不断扫视,因为这是我们唯一可能清楚地了解场景中所有单独部分的途径。”注意力只涉及空间中一个很小的区域,Von Helmholtz观察了视觉注意力慢慢移向新事物的自然趋势。他同时指出,注意力可以被意识和自主的活动控制,人可以在不移动眼球注视次要目标的情况下,注意到这个次要的目标。Von Helmholtz主要专注于眼动与空间位置的关系,或者说视觉在注意“哪里”。本质上,尽管视觉注意力可以被意识控制指向次要目标,眼动仍然反映了详细查看这些目标的意愿。在这个意义上,眼动提供了视觉注意力的明显证据。
1.1.2James的“什么”假设与Von Helmholtz的想法不同,James(1981)相信注意力是一个内在的较为隐秘的机制,类似于想象力、预知力,或者更一般的,如思想。James主要从“什么”的角度来定义注意力,或者说是与注意焦点相关的特性、意义、期望的角度。James偏向于注意力主动的、自愿的方面。他同时关注了注意力被动、反向、非自愿以及轻松的特性。
注意力的这两个方面并不互相排斥,它们对于视觉注意力均具有重要意义。视觉注意力的“什么”和“哪里”分别与中央凹(James)和中央凹周围(Von Helmholtz)的视觉注意力相关。这两个关于视觉的不同视角相应于视觉注意力自底向上或特征驱动的解释。也就是说,当考虑一个图像刺激时,我们可能认为图像中的某个区域将吸引我们的注意。这些区域可能首先被中央凹周围视觉所感知,之后由中央凹视觉感知更详细的内容。从这个意义上说,图像的外围特征可能驱动注意力的“哪里”方面观看其他部分,以便人们可以识别在这些区域中呈现了“什么”细节。视觉由“什么”和“哪里”双特征驱动的观点是对视觉注意力一个有用的简单隐喻。事实上,这形成了构造视觉注意力模型的基础,该模型用于模拟低层或者自下而上的视觉特征。然而,关于注意力的这个观点太简单了。这里必须强调,更为复杂的视觉注意力模型涉及高层视觉和认知方程。也就是说,视觉注意力不能被简单地通过单独的视觉特征来解释,而必须包括高层意识因素(如驱动注意力的自发、预先感知因素)。
1.1.3Gibson的“怎么”假设20世纪40年代,Gibson(1941)以人的意图为中心,提出了视觉注意力的第三个因素。Gibson的假设专注于观察者预先的准备,诸如是否反应,如果反应会怎样反应,以及伴随哪种类型的反应。而且解释了当人持续注视某一固定刺激物时,应对人意图变化的反应能力,相应的,当人陷入对某一固定刺激物的思考时,应对人对刺激物预期变化的能力。设计模糊刺激的实验引起了这些反应。例如,如果受试者希望用词描述动物,那么错误的输入sael会被读成seal。如果希望用词描述轮船或者船,那么会被读成sail。Gibson所说的不同注意力的反应本质指出,“怎么做”或者“怎么反应”行为基于受试者的预感知或者看法。这种视觉注意力的变化与实验的设计相关。考虑受试者对刺激物的感知期待是很重要的,并被实验者的指令所影响。
1.1.4Broadbent的“选择性滤波”理论注意力,从某种意义上说,可以看作负责调节感知信息到容量有限的感知通道的“选择滤波器”。在20世纪50年代,Broadbent(1958)做了一个听觉实验,用于演示声音注意力的选择性质。在这个实验中,从两个不同的信道向受试者发出同时抵达的声音,例如,向左耳说数字{7,2,3},向右耳说数字{9,4,5}。Broadbent记录了受试者的复述数字为{7,2,3,9,4,5}或者{9,4,5,7,2,3},受试者所获得的信息没有互相交织(相间信道干扰)。Broadbent总结为信息虽然平行进入,但是其选择性地滤波到感知信道。
1.1.5Deutsch J A和Deutsch D的“重要权重”理论不同于选择性滤波,Deutsch J A和Deutsch D(1963)提出,所有的感知信息在最高层次上被感知性地加以分析,排除了选择性滤波的需要。Deutsch J A和Deutsch D拒绝了注意力选择性滤波和有限容量系统理论。他们解释说,滤波至少需要与有限容量系统本身一样复杂。相应地,他们提出预先设置的“重要性权值”的中心结构的存在,这个结构负责选择。Deutsch J A和Deutsch D辩论道,是重要性权值而不是注意力本身,在注意力中扮演了起因的角色。也就是说,注意力效果是重要性或者相关性与信息交互的结果。
有趣的是,Broadbent的选择性滤波理论与Von Helmholtz的“哪里”假设在一般意义上来说是一致的,而Deutsch J A和Deutsch D的重要权值理论与James的期待假设或者说“什么”假说是一致的。20世纪60年代(尽管直到1971年,仍然未被充分意识到),这些类似对立的观点被Treisman合并为一个统一的视觉注意力理论。Treisman通过指出注意力的两个组成部分,将Broadbent与Deutsch J A和Deutsch D的注意力模型统一起来:并称为“词典单元”的后续(中心)结构的衰减滤波。衰减滤波的方程是感知信息的选择,在这个方面,衰减滤波类似于Broadbent的选择性滤波。不同于选择性滤波,它并不完全阻塞不希望的信息,而只衰减它们。后续阶段词典单元处理弱化的或者没有弱化的信息,这些单元包括不同的阈值,这些阈值转向重要、相关和上下文。Treisman因此将注意力单元或者选择滤波(“哪里”)以及期望(“什么”)的互补模型组织在一起。
在这之前,虽然Treisman提供了一个令人信服的视觉注意力理论,但是遗留了一个关键问题,即场景融合问题。场景融合问题形成了下面这些问题:虽然我们可以通过类似于选择性滤波的东西看到视场范围内的视觉景色,但是,我们是怎样将整个视场中相当连贯的场景在头脑中拼凑在一起的?例如,当我们看一间房子中的一群人(如教室或者聚会)时,虽然不可能在同一时间看清楚每个人的面貌,然而我们可以拼合出一幅人位于房间中哪个位置的心理图像。我们的大脑具有拼合这个心理图片的能力,尽管视觉的选择性滤波从物理上阻止我们仅用一眼就实现这个功能。另一个广为人知的有关场景合成问题的例子是卡尼莎(Kanizsa,1976)错觉,如图1.1所示,它以发明者名命名。观察图1.1,会看到一个三角形的边缘,即使这个三角形仅由一个圆盘切痕构成。我们还不是很清楚大脑是如何形成这个三角形的。也就是说,尽管通过眼动数据证实了我们的认知,即场景是逐个被观察的,但是仍然不清楚在人的大脑中一幅完整的图片是如何形成的,这正是场景融合问题的症结所在。由格式塔心理学家提供的一个观点是,假设整个场景的识别是由一个并行的单步过程完成的。为了检验这个假设,将一个人观察一幅图片(或者其他图片)的方式形象化会非常有用,这就是记录并可视化一个观察者眼动的动机。即使早在1907年就有对于眼动的研究,但是直到1967年才有了对于眼动确切的定义(参考第5章中对于眼动跟踪技术的综述)。这种后面讨论的早期眼动的形象化表示,说明了记录眼动的重要性不仅仅在于它在描述一个人的视觉扫描特征方面所表现出的强大的作用,还在于它对视觉注意和观察理论的形成产生了重要影响。
……
前言/序言
眼动跟踪技术:原理与应用(原书第二版) [Eye Tracking Methodology Theory and Parctice Second Edition] epub pdf mobi txt 电子书 下载 2024
眼动跟踪技术:原理与应用(原书第二版) [Eye Tracking Methodology Theory and Parctice Second Edition] 下载 epub mobi pdf txt 电子书 2024
眼动跟踪技术:原理与应用(原书第二版) [Eye Tracking Methodology Theory and Parctice Second Edition] mobi pdf epub txt 电子书 下载 2024
眼动跟踪技术:原理与应用(原书第二版) [Eye Tracking Methodology Theory and Parctice Second Edition] epub pdf mobi txt 电子书 下载 2024