6.1 内存硬件原理

我们常说的内存（Memory，也叫主存、随机存取存储器RAM）是计算机中临时存储数据的地方，CPU可以直接读写内存中的数据，速度比硬盘快几个数量级。理解内存的硬件原理，有助于我们理解程序的性能特性，写出更高效的代码。

内存的基本概念

内存是一种随机存取存储器，特点是可以按地址随机访问任意位置的数据，访问速度和数据所在的位置无关。与之相对的是顺序存取存储器（比如磁带），访问数据需要顺序查找，速度很慢。

RAM分为两种：

我们主要讨论DRAM内存。

DRAM的基本存储单元是一个电容和一个晶体管：

容量：内存能存储的最大数据量，常见的有8GB、16GB、32GB、64GB等
频率：内存的工作频率，单位是MHz或MT/s（百万次传输每秒），频率越高速度越快，常见的有DDR4 2666、DDR4 3200、DDR5 4800、DDR5 5600等
带宽：单位时间内存能传输的数据量，计算公式是 频率 × 位宽 / 8，单通道DDR4 3200的带宽是3200MT/s × 64bit / 8 = 25.6GB/s
时序（CL值）：内存的延迟参数，CL（CAS Latency）是列地址选通延迟，单位是时钟周期，CL值越小延迟越低。同样频率下，CL值越小性能越好。
- 例如DDR4 3200 CL16的实际延迟是 16 / 3200MHz = 5ns，比DDR4 3600 CL18（18/3600=5ns）的延迟差不多

我们平时用的内存条是把多个DRAM芯片焊接在PCB板上组成的：

DDR（双倍数据速率）内存是目前的主流，在一个时钟周期的上升沿和下降沿都传输数据，相当于频率翻倍：

世代	典型频率	单通道带宽	工作电压	发布时间
DDR3	1333/1600MT/s	10.6/12.8GB/s	1.5V	2007年
DDR4	2666/3200MT/s	21.3/25.6GB/s	1.2V	2014年
DDR5	4800/5600MT/s	38.4/44.8GB/s	1.1V	2020年

每一代DDR内存的带宽更高，电压更低，功耗更小，但互不兼容，插槽也不同，不能混用。

CPU访问内存的流程：

为了提升内存性能，内存控制器会把连续的地址分散到不同的Channel、Rank、Bank中，这样连续访问可以并行操作多个Bank，提升吞吐量。

多通道技术可以成倍提升内存带宽，对于内存带宽瓶颈的场景（比如核显、大数据处理、虚拟机）性能提升非常明显。

如果你的主板支持双通道，一定要插两根内存组成双通道，比单通道性能提升很多，特别是集成显卡的平台，性能差距可达30%以上。

内存的性能主要从两个方面影响系统：

容量：内存容量不够的话，系统会使用交换分区（Swap），把不常用的内存页放到硬盘上，硬盘速度比内存慢很多，会导致系统非常卡顿。
- 普通办公：8GB足够
- 开发/游戏：16GB是标配
- 大数据/虚拟机/视频处理：32GB以上
带宽和延迟：如果内存带宽不够或者延迟太高，CPU需要等待内存数据，会导致CPU利用率上不去，程序性能下降。
- 普通场景：DDR4 3200足够
- 游戏、高性能计算：高频率低延迟的内存能提升性能
- 核显平台：高带宽内存对性能影响很大