本书涵盖了近30年视频跟踪技术的发展,介绍了视频目标检测跟踪及其应用的新研究成果和动态,全面系统地介绍了当今世界视频跟踪技术的新研究进展,重点介绍了预处理技术、图像目标检测、视频目标检测、均值移位跟踪方法、基于粒子滤波的跟踪方法等方面的技术和应用。本书内容全面、 新颖,写作风格上深入浅出、思路清晰、通俗易懂。为了让读者更好地掌握算法,书中还提供了一些重要的框图和简单算法的实现代码。
本书不仅具有极高的学术价值,对工程实践也具有指导作用。
作者简介
Emilio Maggio是动作捕捉市场的领导者——英国Vicon公司的计算机视觉科学家,他的研究方向是目标跟踪和分类、贝叶斯滤波、图像稀疏以及视频编码等。在2003年和2007年,他分别在瑞士联邦技术学院(EPFL)的信号处理研究所和三菱研究实验室(MERL)做访问学者,在2005年和2007年曾先后两次获得了IEEE ICASSP优秀论文奖,并曾在2002年赢得过IEEE计算机学会国际设计竞赛。
Andrea Cavallaro是伦敦玛丽女王大学多媒体信号处理的教授。他的研究方向是目标跟踪和多传感器系统的多模内容分析。他获得了2004年美国电信实验室研究奖学金;2007年获得了皇家学院的工程教学奖;2005年、 2007和2009年三篇论文分别在IEEE ICASSP获奖;2009获得了IEEE AVSS优秀论文奖。他是《IEEE信号处理杂志》、《IEEE多媒体汇刊》、《IEEE信号处理汇刊》的副编辑。
主要译者简介:
马东玺,生于1980年,男,博士,陆军某研究所工程师,本硕博毕业于国防科技大学,长期从事光电装备科研工作。获军内科技进步一等奖1项,二等奖1项,三等奖3项。主持国家自然科学基金1项,军内科研多项。
译序
图像识别与跟踪是人工智能领域的一个重要分支。基于图像识别跟踪技术,我们有了无人驾驶汽车、无人机、机器人,为我们带来方便;有了先进的安防设施、精确制导武器,为我们带来安全;有了医疗图像的自动判读和处理,为我们带来健康;还有目前风生水起的增强现实(AR)技术,打通了虚拟与现实的边界,为我们带来快乐。通过图像跟踪技术,我们可以制作逼真的动画,让无人机穿梭树林、精确悬停……正是由于这些技术的发展,我们的世界才更加精彩,更加有趣。
译者长期从事武器装备科研,与视频跟踪技术始终难舍难分。译者所从事的工作中,从导弹导引头到无人机侦察吊舱,从武器站的光电火控到排爆机器人抓取规划,均离不开视频跟踪技术。
在科研工作中,译者感觉缺少一本关于视频跟踪技术的针对性的参考书籍,直到看到英国Vicon公司的EmilioMaggio博士和伦敦玛丽女王大学的AndreaCavallaro教授合著的《视频跟踪:理论与实践》一书。两位作者分别是具有丰富实践经验的一线公司的计算机视觉科学家和著名大学的教授,在目标跟踪和分类、贝叶斯滤波、图像稀疏、视频编码以及多传感器系统的多模内容分析等方面具有丰富的实践经验和扎实的理论基础。他们合作的这本书涵盖了近30年视频跟踪技术的发展,介绍了视频目标检测跟踪及其应用的最新研究成果和动态,全面系统地介绍了当今世界视频跟踪技术的最新研究进展,重点介绍了预处理技术、图像目标检测、视频目标检测、均值移位跟踪方法、基于粒子滤波的跟踪方法等方面的技术和应用。该书内容全面、新颖,写作风格上深入浅出、思路清晰、通俗易懂。为了让读者更好地掌握算法,本书中还提供了一些重要的框图和简单算法的实现代码。本书不仅具有极高的学术价值,对工程实践也具有指导作用。
在工作之余,我们将该书翻译成中文,供读者学习参考。由于译者水平有限,疏漏之处可能在所难免,还请读者批评指正。
感谢国家自然科学基金(51305455)的支持。感谢国防科技大学ATR实验室的孙刚博士校稿。感谢军械技术研究所张勇高工,国防科技大学曹玉君讲师、李欣工程师,第四军医大学的张超博士,大家共同努力,让本书得以成形。感谢西安电子科技大学出版社雷鸿俊编辑和刘小莉编辑的辛勤工作,让本书顺利出版。
译者
2017年1月
于石家庄
序
我很荣幸为AndreaCavallaro教授、EmilioMaggio博士的著作《视频跟踪:理论与实践》作序。该书内容全面、及时,写作极为用心,在视频跟踪领域具有重要的参考价值。说它内容全面,因为它涵盖了发展于20世纪60年代初期的主要应用于航天活动中的点目标跟踪以及用于计算机视觉和图像处理的扩展目标跟踪理论和方法。说它及时,因为它涵盖了近15年来大量的视频跟踪方面的文献,为学习视频跟踪技术的发展提供了一站式的资源。此书深入浅出,思路清晰,能够帮助学生、研究人员以及工程师们很快地了解在视频跟踪这一重要领域已经做了什么,还有什么需要去做。很多计算机科学家和电子工程师都热衷于计算机视觉的研究,但是他们对随机过程、检测和估计理论的熟悉程度有很大差异。该书充分考虑到这一点,即使没有全部学过随机过程研究生课程的计算机科学家们也很容易接受,同时对于了解相关理论但不太了解应用的电子工程师而言也能够有足够兴趣。
最初的视频跟踪主要研究的是用于军事领域的红外点目标跟踪。早期的α-β跟踪器很快被神奇的卡尔曼滤波器(离散和连续)及其变体所取代。毫不夸张地说,现在大多数的视频跟踪系统都是在卡尔曼滤波的基础上建立的。基于卡尔曼滤波的跟踪器的讨论,在很多书籍中都有涉及,如Anderson、Moore、Bar�睸halom、Gelb、Blackman、Popli等人的著作。Jaswinski所著的一本经典的跟踪书籍,描述了跟踪器设计的基础知识。线性卡尔曼滤波有效地解决了含有高斯噪声的线性跟踪问题,但是却很难解决非线性或者非高斯跟踪问题。而扩展卡尔曼滤波器、迭代扩展卡尔曼滤波器和非线性连续跟踪器的出现为解决非线性/非高斯跟踪开辟了新的途径。
从简单的点目标跟踪发展到人脸、人体和车辆等扩展目标跟踪,给视频跟踪领域带来了新的挑战,例如几何参数(姿态、清晰度)和光度参数(光照、景象)变化带来的复杂性。在设计跟踪器时需明确在这些变量中哪些是变化的参数,哪些是不变的参数。基于蒙特卡罗马尔可夫链技术结合几何和光度的变化可以设计先进的跟踪器,现在比较普遍的粒子滤波跟踪器就是其中一员。近来,很多文献中都涉及了粒子滤波视频跟踪的理论和应用的研究,这些内容将在此书的后几章进行描述。
本书第1章介绍了视频跟踪理论和鲁棒视频跟踪器的设计要求,给出了章节概要、相关的数学符号,以及单目标和多目标跟踪器的相关公式,并阐述了视频跟踪研究具有的重要的应用价值。第2章介绍了视频跟踪在娱乐、医疗、监控和机器人上的应用,详细说明了无人平台目标跟踪新技术的发展。第3章总结了影响视频跟踪的一些因素,如亮度、色彩、梯度、兴趣区域和目标模型,分析了视频跟踪器对以上因素的鲁棒性,同时本章还介绍了图像预处理以及背景差的算法。
本书第4章总结了跟踪模型的形状、变形和外观,并且给出了处理这些表象变化的方法。在卡尔曼滤波的设计中定义状态和量测公式或者在粒子滤波中导出概率模型时,跟踪目标的外观和移动等表象是十分重要的。第5章主要讲述了此书的最重要部分即单目标的跟踪算法,而且对卡尔曼滤波和粒子滤波的理论与实现描述得深入浅出、通俗易懂,很受读者欢迎。
多特征融合技术能够提高跟踪性能,一直以来备受学者的关注。融合运动和物体的强度特征有助于在复杂背景、混乱环境下跟踪模糊的目标。第6章提出了融合方法,针对目标的形状、运动、行为等其他特征,设计了鲁棒跟踪器。当实现多目标跟踪时,使它们关联起来便成为一个至关重要的问题。早在20多年前出现的数据关联概率的方法,随着现代图论技术的发展越来越受到人们的关注,第7章对该方法进行了论述。因为当多目标跟踪或者跟踪一个多特征的运动目标时,一些特征将会消失,取而代之的将会是一些新的特征,所以在本章中提出了如何处理特征的“新生和死亡”,而这点对长时间跟踪问题是非常重要的。本章详细介绍了此难点问题。
20世纪90年代早期,计算机视觉的研究者们将目标检测、识别、跟踪技术和上下文结合起来。第8章讨论了上下文在提高视频跟踪性能中的作用,并且提出了如何把确定目标可能存在位置的上下文信息融合在视频跟踪器中。跟踪器的设计实用方面之一是能为跟踪系统的工作提供性能界限。许多组织研讨会意识到用指标和通用数据库评价跟踪器的性能是一个繁琐但很重要的问题。虽然离散理论分析已经应用在评价跟踪器性能上,但是大部分现有的经验方法都是基于地面实况数据的。第9章介绍了跟踪器评估的发展历程和应用。
最后,本书简要地介绍了未来需要解决的问题,对比了此书论述的几种跟踪器的性能,以及对深度阅读此书的一些建议。
我很喜欢这本书,因为在本书中涵盖了近30年视频跟踪技术的发展,其中不仅有大多数研究员创造的科学学术价值,而且还强调科学、技巧和技术在视频跟踪领域的应用,充分考虑了图像处理和计算机视觉阅读群体的背景和需求,所以此书可以帮助学生、研究人员和工程师们入门并深入了解视频跟踪这一重要领域。
RamaChellappa
马里兰州帕克大学
前言
视频跟踪就是在图像序列中估算目标位置随时间变化的技术。本书首次为视频跟踪这个新兴的领域提供了全面的知识构架,介绍了基本算法的发展及其应用,介绍并讨论、验证了最新的视频跟踪算法。
本书首先介绍基本问题的定义,介绍了以往和现在视频跟踪的主要应用,列举了目前比较流行的视频跟踪器,例如基于相关度和梯度下降最小的跟踪器。书中应用实例,图文并茂地说明了运用确定性方法设计跟踪器的优势和局限性。本书提出了更加准确有效的视频跟踪算法,并讨论了基于贝叶斯递归结构近代算法在真实情景跟踪中的应用。由于把基本的数学模型转化为有效真实模型时方案的选择是非常重要的,所以接下来本书讨论了该方案的设计选择和实现。为了让读者更好地掌握算法,本书中还提供了一些重要的框图和简单算法的实现代码。
本书第1章首先介绍了视频跟踪问题,并把此问题划分为五个主要的逻辑任务。然后提供了视频跟踪中问题的描述,最后讨论了视频跟踪的难点。第2章介绍了一些当代视频跟踪的应用,涉及的主要应用领域有媒体制作、医学数据处理、监视系统、智能商业、机器人、远程协作、互动游戏和艺术。第3章进一步综述了图像获取过程并指出了描述目标特点的相关术语。第4章讨论了多种形状近似策略和外观建模技术。第5章对定位算法进行了分类,并且比较了单假设和多假设策略。第6章讨论了多特征融合目标跟踪,从跟踪级和特征级两个方面说明了融合技术的优点与缺点,并且提出了在融合中如何量化特征可靠性的优先级。第7章把本书前面几章的内容延伸到数量可变的目标跟踪。为了更好地说明该方法,本章重点叙述了多假设数据关联算法在视频监控中的应用,并讨论和评估了一个基于有限集统计的多目标视频跟踪器。以该跟踪器为例,第8章讨论了如何构造场景模型以改善视频跟踪器的性能,并指出了如何运用主动式和交互式的策略对图像中感兴趣的部分进行学习。第9章介绍了评估视频跟踪器及其效果的协议,并为读者提供了跟踪器全面的工作指标和大量的评价数据集。最后,在附录中讨论了本书所选择的跟踪算法的对比结果,在后记中简要介绍了视频跟踪的当前发展方向和未来的挑战,并为读者提供了深入阅读书籍的列表。
本书主要针对的群体有研究生、研究员和工作者。而工作者主要从事多种视觉的解释应用、智能环境、行为建模、机器人、视频标注等方面的研究,或者为监控、运动获取、虚拟现实和医学图像分析的程序开发人员。
我们创建了本书的支持网站www.videotracking.org为读者提供本书的辅助材料。该网站为视频跟踪研究者提供了全面的软件算法列表,为教师提供了与本书知识点相关的课堂讲解演示文稿。
EmilioMaggio
AndreaCavallaro
于英国伦敦
坦白说,最初拿到《视频跟踪:理论与实践》这本书时,我对其并没有抱有太高的期待,毕竟市面上关于视频跟踪的书籍并不少见,但很多都过于偏重理论,缺乏实践指导。然而,这本书彻底颠覆了我的看法。它以一种非常“接地气”的方式,将复杂的理论娓娓道来,并且贯穿了大量的实例和代码示例,让我深切感受到理论与实践之间的紧密联系。 我特别喜欢书中关于“如何选择合适的跟踪算法”这一章节。作者并没有简单地列举各种算法的优劣,而是根据不同的应用场景,例如行人跟踪、车辆跟踪、无人机跟踪等,给出了详细的选型建议。这让我能够根据自己的具体需求,快速找到最适合的算法,而不是盲目地尝试。此外,书中还提供了许多关于调试和排错的技巧,这对于我这样经常需要处理各种疑难杂症的开发者来说,是极其宝贵的财富。
评分读完《视频跟踪:理论与实践》这本书,我最大的感受就是它完美地平衡了理论的深度和实践的可行性。对于我这样希望将视频跟踪技术应用于实际项目中的工程师来说,这本书简直是一本“宝典”。书中并没有回避那些令人头疼的工程实现细节,反而深入浅出地介绍了如何将各种算法集成到实际的系统中。从数据的预处理、特征提取,到算法的选择、参数调优,再到后期的结果评估和优化,书中都给出了非常具体和实用的指导。 我尤其赞赏书中对于实时性要求的讨论。在很多实际应用场景下,视频跟踪算法必须在有限的时间内完成,否则就失去了意义。书中针对实时性进行了深入的分析,并提供了一些优化方法,例如使用更高效的特征描述符、采用并行计算等。这对于我开发高性能的视频监控系统非常有帮助。另外,书中还提到了数据集的选择和构建,以及性能评估的标准,这些都是在实际项目中不可或缺的部分,让我避免了走弯路。
评分作为一名对计算机视觉领域初学者来说,这本书就像是一盏明灯,照亮了我前行的道路。在接触视频跟踪之前,我曾被各种复杂的算法和晦涩的数学公式吓倒,感觉无从下手。而《视频跟踪:理论与实践》则以一种循序渐进的方式,将原本令人生畏的理论知识变得触手可及。作者并没有一开始就抛出高深的数学模型,而是从最基本的概念讲起,例如什么是目标、什么是跟踪,以及为什么需要跟踪。这些看似简单的铺垫,却为我构建了一个坚实的理解基础。 接着,书中开始深入探讨各种经典的跟踪算法,例如卡尔曼滤波器、粒子滤波器等等。我特别欣赏作者对每种算法的讲解方式,他不仅详细阐述了算法的原理,还用形象的比喻和清晰的图示来帮助读者理解。例如,在讲解卡尔曼滤波器时,作者将其比作一个能够不断预测和修正自身状态的“智能机器人”,让我一下子就抓住了核心思想。而且,书中还提供了相应的伪代码和一些简单的实现思路,这对于我这样动手能力较强的人来说,无疑是巨大的福音。我尝试着根据书中的提示,用Python实现了一些简单的跟踪示例,虽然过程中遇到了不少困难,但每一次解决问题都让我对视频跟踪的理解更加深刻。
评分对于我这样在视频分析领域摸爬滚打多年的研究人员而言,《视频跟踪:理论与实践》一书的价值更体现在其对前沿技术和最新研究动态的深入剖析。书中对于一些近年来涌现出的深度学习驱动的跟踪方法,例如 Siamese 网络、Transformer 在跟踪领域的应用等,都有着详尽的介绍。作者不仅梳理了这些方法的演进脉络,还对其核心思想、优缺点以及适用场景进行了客观的评价。我尤其对书中关于“端到端”跟踪方法的讨论印象深刻,它打破了传统跟踪方法中“检测-跟踪”的分离模式,实现了更高效、更鲁棒的跟踪效果。 此外,书中还涉及了一些在实际工程中至关重要的议题,如遮挡处理、尺度变化、光照变化以及目标形变等。这些都是视频跟踪过程中常见的挑战,也是影响跟踪性能的关键因素。作者针对这些问题,提供了多种行之有效的解决方案,并结合了大量的案例分析,让我得以窥见这些理论在实际应用中的魅力。例如,书中对于不同遮挡场景下的鲁棒性提升策略,以及如何利用多模态信息(如颜色、纹理、深度等)来增强跟踪精度,都给我带来了新的启发。
评分作为一名对计算机视觉领域充满好奇心的学生,《视频跟踪:理论与实践》这本书为我打开了一扇全新的大门。在接触这本书之前,我只对视频跟踪有一个模糊的概念,知道它是用来追踪物体在视频中的运动的。但这本书让我对其有了更深刻、更系统的认识。作者从最基础的原理讲起,逐步深入到各种复杂的算法和技术,让我逐渐理解了视频跟踪的“前世今生”。 书中对于视觉跟踪中遇到的各种挑战,例如目标的大小变化、姿态变化、遮挡以及背景干扰等,都有着非常清晰的解释和相应的解决策略。我尤其喜欢书中通过图示来解释抽象的概念,例如在讲解目标模型更新时,作者用不同形状的方框表示目标在不同帧中的位置和大小,让我一目了然。而且,书中还列举了一些经典的跟踪数据集和评估指标,这对于我进行相关的学术研究和实验非常有指导意义。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有