伪共享

什么是伪共享

伪共享不是多个线程在写同一个变量，而是不同线程写不同变量，但这些变量刚好落在同一条 Cache Line 里。

因为 CPU 维护一致性的单位是 Cache Line，不是单个变量，所以只要其中一个变量被某个核心修改，这整条 Cache Line 的状态都会变化，其他核心里对应的副本也会受到影响。

假设两个核心分别运行两个线程：

这样虽然 A 和 B 逻辑上互不相关，但只要一方写入，另一方那边这条 Cache Line 就可能失效。两个核心持续交替修改时，这条 Cache Line 会在核心之间反复失效、回写、重新加载。

所以伪共享慢，不是因为业务数据冲突，而是因为一致性协议把同一条 Cache Line 当成了一个整体。

把它放到 MESI 里看就很直观：

于是两个核心虽然改的是不同变量，却会因为落在同一条 Cache Line 而互相拖慢。

核心思路只有一句话：让高频写入的不同变量不要落在同一条 Cache Line。

常见做法：

Linux 内核里常见做法是用 __cacheline_aligned_in_smp 这类宏，让变量按 Cache Line 对齐。应用层常见做法是 padding，本质上都是用空间换时间。

如果满足下面这些条件，就该想到它：

这时就要怀疑：问题不是锁，也不是算法，而是这些变量可能挤在了同一条 Cache Line。