7.2 线程与并发

线程（Thread）是CPU调度的基本单位，是进程中的一个执行流。多线程技术让一个进程可以同时执行多个任务，充分利用多核CPU的性能，是现代并发编程的基础。

为什么需要线程

早期的操作系统只有进程的概念，每个进程有独立的地址空间，进程之间切换开销很大。随着多核CPU的出现，人们需要一种更轻量的执行单元，能够在同一个进程内并发执行，共享进程的资源，减少切换开销，线程就应运而生了。

相比多进程，多线程有以下优势：

线程是进程中的一个执行流，是CPU调度和分派的基本单位。

特性	进程	线程
资源分配	资源分配的基本单位，有独立的地址空间和资源	CPU调度的基本单位，共享进程的资源，只有少量独立资源（栈、寄存器等）
切换开销	大，需要切换地址空间、页表、缓存等	小，只需要切换栈和寄存器
通信	需要进程间通信机制（管道、共享内存等）	可以直接通过全局变量、堆内存通信，需要注意同步问题
安全性	高，进程之间地址空间隔离，一个进程崩溃不会影响其他进程	低，线程之间共享地址空间，一个线程崩溃可能导致整个进程崩溃
并发性	较低，切换开销大	较高，切换开销小，适合高并发场景

例子：你打开一个浏览器进程，浏览器会有多个线程：一个线程渲染页面，一个线程处理用户输入，一个线程下载资源，多个线程同时工作，提升用户体验。如果每个任务都开一个进程，开销会非常大。

线程的实现有三种模型：用户级线程、内核级线程、混合型线程。

用户级线程完全在用户态实现，由用户态的线程库管理，操作系统内核感知不到线程的存在。

优点：
- 线程切换不需要内核参与，开销极小，速度快
- 调度可以由应用程序自己控制，更灵活
- 不需要内核支持，可以在不支持线程的操作系统上实现
缺点：
- 内核不知道线程的存在，如果一个线程发起阻塞的系统调用（比如read文件），整个进程都会被阻塞，其他线程也无法执行
- 无法真正利用多核CPU，操作系统调度的单位是进程，同一个进程的多个线程只能在同一个核心上交替执行
现在纯用户级线程已经很少使用了，早期的协程就是用户级线程的一种。

内核级线程由操作系统内核管理，内核负责线程的调度和切换。

优点：
- 线程的调度由内核负责，如果一个线程阻塞，其他线程还可以继续执行
- 可以真正利用多核CPU，同一个进程的多个线程可以同时在不同的核心上并行执行
- 内核提供完整的线程功能，支持复杂的调度策略
缺点：
- 线程切换需要内核参与，开销比用户级线程大
- 频繁的线程切换会消耗大量CPU资源
现在主流操作系统的线程实现都是内核级线程，比如Linux的pthread，Windows的线程。