多线程执行与数据竞争 (C++11 起)

来自cppreference.com
< cpp‎ | language


 
 
C++ 语言
 
 

执行线程 是程序中的控制流,它从某个特定的顶层函数调用(通过 std::thread::threadstd::async 或其他方式进行)开始,并递归地包含由此线程后续执行的所有函数调用。

  • 当一个线程创建另一个线程时,对新线程的顶层函数的初始调用,是由新线程而非创建线程执行的。

任何线程都能潜在地访问程序中的任何对象和函数:

  • 拥有自动或线程局部存储期的对象仍然可以被另一线程通过指针或引用访问。
  • 宿主实现下,C++ 程序可以有多个线程同时执行。每个线程的执行按本页的余下部分定义的方式进行。整个程序的执行包含该程序的所有线程的执行。
  • 独立实现下,由实现定义程序是否可以有多个线程。

对于并非作为 std::raise 的调用结果而执行的信号处理函数,未指定该信号处理函数的调用包含在哪个执行线程中。

数据竞争

不同的执行线程始终可以同时访问(读和写)不同的内存位置,不需要干涉或同步的任何要求。

当某个表达式的求值写入某个内存位置,而另一求值读或修改同一内存位置时,称这些表达式冲突。拥有两个冲突的求值的程序就有数据竞争,除非

  • 两个求值都在同一线程上,或者在同一信号处理函数中执行,或
  • 两个冲突的求值都是原子操作(见 std::atomic),或
  • 一个冲突的求值发生早于 另一个(见 std::memory_order)。

如果出现数据竞争,那么程序的行为未定义。

(特别是,std::mutex 的释放同步于,从而发生早于 另一线程对同一互斥体的获取,这使得互斥锁可以用来防止数据竞争。)

int cnt = 0;
auto f = [&]{cnt++;};
std::thread t1{f}, t2{f}, t3{f}; // 未定义行为
std::atomic<int> cnt{0};
auto f = [&]{cnt++;};
std::thread t1{f}, t2{f}, t3{f}; // OK

内存顺序

当线程从某个内存位置读取值时,它可能看到初值,同一线程所写入的值,或另一线程所写入的值。有关线程所作的写入操作对其他线程变为可见的顺序上的细节,见 std::memory_order

向前进展

免妨碍

当只有一个未在标准库函数中阻塞的线程执行某个免锁的原子函数时,保证该执行将会完成(所有标准库免锁操作均为免妨碍的)。

免锁

当一或多个免锁原子函数同时运行时,保证其中至少一个将会完成(所有标准库免锁操作均为免锁的——确保其他线程不能不确定地活锁它们(例如以连续窃取缓存线的方式),是实现的工作)。

进展保证

合法的 C++ 程序中,每个线程最终要做下列之一:

  • 终止。
  • 调用 std::this_thread::yield
  • 调用库的某个输入/输出库函数。
  • 通过 volatile 泛左值进行访问。
  • 进行原子操作或同步操作。
  • 继续执行平凡的无限循环(见下文)。

如果线程执行了上述步骤之一,在标准库函数中阻塞,或调用由于某个未阻塞的并发线程而未能完成的原子免锁函数,那么称它取得进展

这允许编译器移除、合并或重排所有无可观察行为的循环,而不必证明他们终将终止。因为实现可以假定没有线程能在不做任何这些可观察行为的情况下永远执行。平凡的无限循环具有可供性,从而不会被移除或重排。

平凡的无限循环

平凡的空循环语句 是匹配以下格式之一的循环语句:

while ( 条件 ) ; (1)
while ( 条件 ) { } (2)
do ; while ( 条件 ) ; (3)
do { } while ( 条件 ) ; (4)
for ( 初始化语句 条件 (可选) ; ) ; (5)
for ( 初始化语句 条件 (可选) ; ) { } (6)
1) 循环体是空简单语句的 while 语句
2) 循环体是空复合语句的 while 语句
3) 循环体是空简单语句的 do-while 语句
4) 循环体是空复合语句的 do-while 语句
5) 循环体是空简单语句,并且没有迭代表达式 的 for 语句
6) 循环体是空复合语句,并且没有迭代表达式 的 for 语句

平凡的空循环语句的控制表达式 是:

1-4) 条件
5,6) 条件,未提供时是 true

平凡的无限循环 是控制表达式在明显常量求值的情况下是常量表达式并且求值为 true 的平凡的空循环语句。

平凡的无限循环的循环体会被替换成对函数 std::this_thread::yield 的调用。独立实现中是否会进行该替换由实现定义。

for (;;); // 平凡的无限循环,P2809 起为良好定义的
for (;;) { int x; } // 未定义行为

并发向前进展

如果线程提供并发向前进展保证,那么只要它尚未终止,就将在有限量的时间内取得进展(定义如上),无关乎其他线程(如果存在)是否取得进展。

标准鼓励但不要求主线程和 std::thread 所启动的线程提供并发向前进展保证。

并行向前进展

如果线程提供并行向前进展保证,那么只要线程尚未执行任何执行步骤(输入/输出、volatile、原子或同步操作),就不要求实现保证该线程终将取得进展,但一旦此线程开始执行步骤,那么它提供并发向前进展 保证(此规则描述线程池中以任意顺序执行任务的线程)。

弱并行向前进展

如果线程提供弱并行向前进展保证,那么不保证它终将取得进展,无关乎其他线程是否取得进展。

此类线程仍然能通过以向前进展保证委托进行阻塞来保证取得进展:如果线程 P 以此方式阻塞于线程集合 S 的完成,那么 S 中至少有一个线程将提供等于或强于 P 的向前进展保证。一旦该线程完成,就会类似地强化 S 中的另一线程。一旦该集合为空,就会解除 P 的阻塞。

来自 C++ 标准库的并行算法,均以向前保证委托阻塞于某个标准库所管理的线程的未指明集合的完成上。

(C++17 起)

缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

缺陷报告 应用于 出版时的行为 正确行为
P2809R3 C++11 执行“平凡的”[1]无限循环的行为未定义 为“平凡的无限循环”提供合适定义,并使行为具有良好定义
  1. “平凡”在这里表示执行无限循环不会有任何进展。