产品特色
内容简介
《C++并发编程实战》是一本基于C++11新标准的并发和多线程编程深度指南。内容包括从std::thread、std::mutex、std::future和std::async等基础类的使用,到内存模型和原子操作、基于锁和锁数据结构的构建,再扩展到并行算法、线程管理,最后还介绍了多线程代码的测试工作。本书的附录部分还对C++11新语言特性中与多线程相关的项目进行了简要的介绍,并提供了C++11线程库的完整参考。
《C++并发编程实战》适合于需要深入了解C++多线程开发的读者,以及使用C++进行各类软件开发的开发人员、测试人员。对于使用第三方线程库的读者,也可以从本书后面的章节中了解到相关的指引和技巧。同时,本书还可以作为C++11线程库的参考工具书。
作者简介
周全,软件工程师,毕业于中国科学技术大学信息学院,现任职于中国人民银行合肥中心支行科技处。从事.NET开发多年,有较为丰富的系统集成和运维经验,对虚拟化也有较深入的研究。可以通过email与他联系。
宋真真,网络工程师,2008年毕业于合肥工业大学计算机与信息学院,现任职于中国人民银行合肥中心支行科技处,参与软件开发、项目管理等工作,爱好数据库、编程等研究。可以通过email与她联系。
梁娟娟,2010年毕业于中国科学技术大学信息技术学院,现就职于中国人民银行合肥中心支行。
许敏,软件工程师,2005年获得软件测试工程师证书。现任职于中国人民银行合肥中心支行科技处,负责项目管理工作。可以通过Email与她联系。
内页插图
目录
第1章 你好,C++并发世界 1
1.1 什么是并发 2
1.1.1 计算机系统中的并发 2
1.1.2 并发的途径 3
1.2 为什么使用并发 5
1.2.1 为了划分关注点而使用
并发 5
1.2.2 为了性能而使用并发 6
1.2.3 什么时候不使用并发 7
1.3 在C++中使用并发和
多线程 8
1.3.1 C++多线程历程 8
1.3.2 新标准中的并发支持 9
1.3.3 C++线程库的效率 9
1.3.4 平台相关的工具 10
1.4 开始入门 11
1.5 小结 12
第2章 管理线程 13
2.1 基本线程管理 13
2.1.1 启动线程 14
2.1.2 等待线程完成 16
2.1.3 在异常环境下的等待 17
2.1.4 在后台运行线程 19
2.2 传递参数给线程函数 20
2.3 转移线程的所有权 23
2.4 在运行时选择线程
数量 26
2.5 标识线程 28
2.6 小结 29
第3章 在线程间共享数据 31
3.1 线程之间共享数据的
问题 32
3.1.1 竞争条件 33
3.1.2 避免有问题的竞争
条件 34
3.2 用互斥元保护共享
数据 35
3.2.1 使用C++中的互斥元 35
3.2.2 为保护共享数据精心组织
代码 36
3.2.3 发现接口中固有的竞争
条件 38
3.2.4 死锁:问题和解决方案 44
3.2.5 避免死锁的进一步
指南 46
3.2.6 用std::unique_lock灵活
锁定 51
3.2.7 在作用域之间转移锁的
所有权 52
3.2.8 锁定在恰当的粒度 54
3.3 用于共享数据保护的替代工具 56
3.3.1 在初始化时保护共享
数据 56
3.3.2 保护很少更新的数据
结构 59
3.3.3 递归锁 61
3.4 小结 62
第4章 同步并发操作 63
4.1 等待事件或其他条件 63
4.1.1 用条件变量等待条件 65
4.1.2 使用条件变量建立一个
线程安全队列 67
4.2 使用future等待一次性
事件 71
4.2.1 从后台任务中返回值 72
4.2.2 将任务与future相关联 74
4.2.3 生成(std::)promise 77
4.2.4 为future保存异常 79
4.2.5 等待自多个线程 80
4.3 有时间限制的等待 82
4.3.1 时钟 83
4.3.2 时间段 84
4.3.3 时间点 85
4.3.4 接受超时的函数 86
4.4 使用操作同步来简化
代码 88
4.4.1 带有future的函数式
编程 88
4.4.2 具有消息传递的同步
操作 92
4.5 小结 96
第5章 C++内存模型和原子
类型上操作 97
5.1 内存模型基础 98
5.1.1 对象和内存位置 98
5.1.2 对象、内存位置以及
并发 99
5.1.3 修改顺序 100
5.2 C++中的原子操作及
类型 100
5.2.1 标准原子类型 101
5.2.2 std::atomic_flag上的
操作 103
5.2.3 基于std::atomic的
操作 105
5.2.4 std::atomic上的操作:指针算术运算 107
5.2.5 标准原子整型的
操作 108
5.2.6 std::atomic<>初级类
模板 109
5.2.7 原子操作的自由函数 111
5.3 同步操作和强制
顺序 112
5.3.1 synchronizes-with
关系 114
5.3.2 happens-before关系 114
5.3.3 原子操作的内存
顺序 116
5.3.4 释放序列和
synchronizes-with 133
5.3.5 屏障 135
5.3.6 用原子操作排序非原子
操作 137
5.4 小结 138
第6章 设计基于锁的并发
数据结构 140
6.1 为并发设计的含义是
什么 141
6.2 基于锁的并发数据
结构 142
6.2.1 使用锁的线程
安全栈 142
6.2.2 使用锁和条件变量的线程
安全队列 145
6.2.3 使用细粒度锁和条件变量的线程安全队列 149
6.3 设计更复杂的基于锁的
数据结构 160
6.3.1 编写一个使用锁的线程
安全查找表 160
6.3.2 编写一个使用锁的线程
安全链表 165
6.4 小结 169
第7章 设计锁的并发数据
结构 170
7.1 定义和结果 171
7.1.1 非阻塞数据结构的
类型 171
7.1.2 锁数据结构 172
7.1.3 等待的数据结构 172
7.1.4 锁数据结构的优点与
缺点 172
7.2 锁数据结构的
例子 173
7.2.1 编写不用锁的线程
安全栈 174
7.2.2 停止恼人的泄漏:在锁数据结构中管理内存 178
7.2.3 用风险指针检测不能被
回收的结点 182
7.2.4 使用引用计数检测
结点 189
7.2.5 将内存模型应用至
锁栈 194
7.2.6 编写不用锁的线程安全
队列 198
7.3 编写锁数据结构的
准则 209
7.3.1 准则:使用std::memory_order_
seq_cst作为原型 210
7.3.2 准则:使用锁内存回收
模式 210
7.3.3 准则:当心ABA问题 210
7.3.4 准则:识别忙于等待的循环以及辅助其他线程 211
7.4 小结 211
第8章 设计并发代码 213
8.1 在线程间划分工作的
技术 214
8.1.1 处理开始前在线程间划分
数据 214
8.1.2 递归地划分数据 215
8.1.3 以任务类型划分
工作 219
8.2 影响并发代码性能的
因素 222
8.2.1 有多少个处理器 222
8.2.2 数据竞争和乒乓
缓存 223
8.2.3 假共享 225
8.2.4 数据应该多紧密 225
8.2.5 过度订阅和过多的任务
切换 226
8.3 为多线程性能设计数据
结构 226
8.3.1 为复杂操作划分数组
元素 227
8.3.2 其他数据结构中的数据
访问方式 228
8.4 为并发设计时的额外
考虑 230
8.4.1 并行算法中的异常
安全 230
8.4.2 可扩展性和阿姆达尔
定律 237
8.4.3 用多线程隐藏延迟 238
8.4.4 用并发提高响应性 239
8.5 在实践中设计并发
代码 241
8.5.1 std::for_each的并行
实现 241
8.5.2 std::find的并行实现 243
8.5.3 std::partial_sum的并行
实现 248
8.6 总结 256
第9章 高级线程管理 258
9.1 线程池 259
9.1.1 最简单的线程池 259
9.1.2 等待提交给线程池的
任务 261
9.1.3 等待其他任务的
任务 265
9.1.4 避免工作队列上的
竞争 267
9.1.5 工作窃取 269
9.2 中断线程 273
9.2.1 启动和中断另一个
线程 274
9.2.2 检测一个线程是否被
中断 275
9.2.3 中断等待条件变量 276
9.2.4 中断在std::condition_variable_ any上的等待 279
9.2.5 中断其他阻塞调用 281
9.2.6 处理中断 281
9.2.7 在应用退出时中断后台
任务 282
9.3 总结 284
第10章 多线程应用的测试与
调试 285
10.1 并发相关错误的
类型 285
10.1.1 不必要的阻塞 286
10.1.2 竞争条件 286
10.2 定位并发相关的错误的
技巧 288
10.2.1 审阅代码以定位潜在的
错误 288
10.2.2 通过测试定位并发相关的
错误 290
10.2.3 可测试性设计 291
10.2.4 多线程测试技术 292
10.2.5 构建多线程的测试
代码 295
10.2.6 测试多线程代码的
性能 297
10.3 总结 298
附录A 附录A C++11部分
语言特性简明
参考 299
附录B 并发类库
前言/序言
《C++并发编程实战》 概述 在当今多核处理器日益普及的时代,编写能够充分利用硬件并行能力的程序,已成为软件开发的一项核心挑战。无论是提升应用程序的响应速度,还是处理海量数据,抑或是构建高吞吐量的服务,并发编程都扮演着至关重要的角色。本书将深入探讨C++中实现并发和并行编程的各种技术、模式与最佳实践,旨在帮助读者构建健壮、高效且易于维护的并发系统。 本书并非对C++标准库中已有的并发特性的简单罗列,而是着眼于如何将这些工具融入实际的开发流程,解决真实世界中遇到的并发难题。我们将从并发的基本概念出发,逐步深入到操作系统层面的线程管理,再到C++标准库提供的各种抽象,最终触及到更高级的并发设计模式和性能调优。 核心内容 第一部分:并发基础与线程模型 理解并发与并行: 区分概念上的并发(同时处理多个任务)与物理上的并行(在多个处理器上同时执行任务)。探讨多核架构对软件设计的影响,以及为何并发编程在现代计算中不可或缺。 操作系统线程模型: 介绍用户级线程与内核级线程的区别,以及它们在Windows、Linux等主流操作系统中的实现方式。理解线程的创建、销毁、调度机制,以及线程上下文切换的开销。 C++标准线程库 (`
`): 创建与管理线程: 学习如何使用`std::thread`对象创建和启动线程。理解线程的生命周期,包括joinable状态、detach状态以及如何正确地等待线程结束(`join()`)或让线程独立运行(`detach()`)。 线程参数传递: 探讨线程函数参数的传递方式,包括值传递、引用传递以及如何避免数据竞争。 线程同步原语: 介绍实现线程间协作与互斥的关键工具,包括: 互斥量 (`std::mutex`): 学习如何使用互斥量保护共享数据,防止多个线程同时访问导致的状态不一致。理解RAII(资源获取即初始化)原则在管理互斥锁中的应用,如`std::lock_guard`和`std::unique_lock`。 条件变量 (`std::condition_variable`): 掌握如何使用条件变量实现线程间的等待与通知机制。在生产者-消费者模型等场景下,条件变量是必不可少的工具。 信号量 (`std::counting_semaphore` / `std::binary_semaphore`): (C++20及以后)学习如何使用信号量来限制对资源的访问数量,实现更精细的并发控制。 屏障 (`std::barrier`): (C++20及以后)了解屏障如何让一组线程在达到某个同步点之前相互等待。 第二部分:共享数据与数据竞争 数据竞争的产生与危害: 深入分析数据竞争的根源——多个线程访问同一个内存位置,其中至少有一个是写操作,且没有同步机制。阐述数据竞争可能导致的不可预测行为、程序崩溃以及难以调试的bug。 原子操作 (``): 基本概念: 理解原子操作的定义——不可中断的操作。介绍C++标准库提供的原子类型,如`std::atomic`。 常用原子操作: 学习加载(load)、存储(store)、交换(exchange)、比较并交换(compare-exchange)等基本原子操作。 内存序(Memory Order): 这是一个至关重要的概念。深入讲解不同内存序(`memory_order_relaxed`, `memory_order_consume`, `memory_order_acquire`, `memory_order_release`, `memory_order_acq_rel`, `memory_order_seq_cst`)的含义、作用以及它们如何影响并发程序的正确性和性能。通过具体示例说明,内存序的选择直接关系到程序的可见性与一致性。 避免数据竞争的策略: 无锁数据结构: 探索设计和使用无锁数据结构的可能性,它们通过原子操作和特定的算法避免对共享数据的显式锁定,从而提高性能并减少死锁风险。 线程局部存储 (`thread_local`): 学习如何使用`thread_local`关键字为每个线程提供独立的变量副本,避免共享和同步开销。 第三部分:并发设计模式与高级主题 任务分解与并行算法: 并行STL算法: (C++17及以后)介绍`std::execution`命名空间下的并行执行策略,如何使用`std::par`、`std::seq`等策略来并行执行标准库算法,如`std::for_each`, `std::transform`, `std::sort`等。 任务窃取(Task Stealing): 探讨任务窃取的工作原理,以及它在实现高效并行执行中的作用。 Futures与Promises (``): 异步操作: 学习如何使用`std::async`来方便地启动异步任务,并获取其执行结果。 `std::future`和`std::promise`: 深入理解`std::future`作为异步操作结果的占位符,以及`std::promise`如何用于在一个线程中设置结果,并在另一个线程中检索。 `std::packaged_task`: 了解`std::packaged_task`如何将可调用对象包装起来,使其可以异步执行并返回一个`std::future`。 并发容器: 线程安全的容器: 介绍如`tbb::concurrent_hash_map`(Intel TBB库)或Boost.Lockfree库提供的线程安全容器,它们在多线程环境下提供高效且安全的访问。 构建自定义并发容器: 学习如何基于基础同步原语,设计和实现自己的线程安全容器。 死锁、活锁与饥饿: 识别与避免: 深入分析死锁(多个线程相互等待对方释放资源)、活锁(线程不断尝试但无法取得进展)和饥饿(某个线程长期无法获得所需资源)的产生条件。 死锁检测与预防策略: 介绍各种预防死锁的技术,如按序加锁、超时机制、资源预分配等。 线程池: 设计与实现: 探讨线程池的设计原则,如何有效地管理一组工作线程,以重用线程、减少创建和销毁线程的开销,并提高吞吐量。 任务调度: 了解线程池中的任务调度策略,如何将工作分配给空闲线程。 并发调试与性能分析: 调试工具: 介绍常用的并发调试工具,如GDB、Valgrind(Helgrind, DRD)、ThreadSanitizer等,帮助定位数据竞争、死锁等问题。 性能分析工具: 推荐使用perf、VTune等工具,分析线程的CPU使用率、锁的竞争情况、上下文切换次数,以找出性能瓶颈。 性能调优技巧: 提供针对并发程序的性能优化建议,包括减少锁粒度、使用更细粒度的同步机制、优化内存访问模式、选择合适的并行算法等。 第四部分:实际应用与案例分析 多线程Web服务器: 构建一个简单的多线程Web服务器,学习如何处理并发的网络请求,每个请求分配一个线程处理。 生产者-消费者模型: 实现经典的生产者-消费者场景,使用队列和条件变量来管理数据的流动,展示并发协作的威力。 图像处理并行化: 将图像处理任务分解成多个小块,使用多线程并行处理,加速图像的渲染或分析过程。 数据库访问并发控制: 探讨在多线程环境下安全地访问数据库的策略,如何避免并发写入导致的数据不一致。 并行计算任务: 演示如何利用C++并发特性来加速科学计算、数据分析等CPU密集型任务。 本书特色 理论与实践相结合: 不仅讲解抽象的概念,更通过大量的实际代码示例,展示如何在C++中落地这些技术。 循序渐进的学习路径: 从基础的线程模型到复杂的并发设计模式,内容组织清晰,适合不同程度的读者。 强调最佳实践: 关注代码的健壮性、可读性和可维护性,提供实用的编码建议。 涵盖现代C++特性: 充分利用C++11、C++14、C++17、C++20等标准引入的并发相关特性。 面向真实世界的问题: 聚焦于在实际项目中遇到的典型并发挑战,并提供有效的解决方案。 适合读者 希望深入理解C++并发编程机制的初学者。 有一定C++基础,希望提升程序性能和响应速度的开发者。 需要构建高吞吐量、高并发系统的软件工程师。 对操作系统原理、多核计算感兴趣的研究人员。 希望掌握现代C++并发编程技术的程序员。 通过阅读本书,读者将能够构建出更强大、更具响应能力、更能充分发挥硬件潜力的C++应用程序。您将掌握驾驭并发世界的强大工具,并能够自信地解决现代软件开发中最具挑战性的问题之一。