在Linux内核中如何实现percpu指针？

小编典典

在Linux内核中如何实现percpu指针？

linux

在多处理器上，每个内核可以有自己的变量。我以为它们是在不同地址中的不同变量，尽管它们在同一过程中并且具有相同的名称。

但是我想知道，内核如何实现呢？它是否分配了一块内存来存放所有的percpu指针，并且每次它通过shift或其他方式将指针重定向到某个地址时？

阅读 587

2020-06-07

共1个答案

小编典典

普通全局变量不是每个CPU的。自动变量位于堆栈中，并且不同的CPU使用不同的堆栈，因此自然会得到单独的变量。

我猜您指的是Linux的每CPU变量基础结构。
大部分魔力在这里（asm-generic/percpu.h）：

extern unsigned long __per_cpu_offset[NR_CPUS];

#define per_cpu_offset(x) (__per_cpu_offset[x])

/* Separate out the type, so (int[3], foo) works. */
#define DEFINE_PER_CPU(type, name) \
    __attribute__((__section__(".data.percpu"))) __typeof__(type) per_cpu__##name

/* var is in discarded region: offset to particular copy we want */
#define per_cpu(var, cpu) (*RELOC_HIDE(&per_cpu__##var, __per_cpu_offset[cpu]))
#define __get_cpu_var(var) per_cpu(var, smp_processor_id())

宏RELOC_HIDE(ptr, offset)仅以ptr字节为单位偏移给定的偏移量（无论指针类型如何）。

它有什么作用？

定义时DEFINE_PER_CPU(int, x)，将__per_cpu_x在特殊.data.percpu部分中创建一个整数。
加载内核后，此部分将被加载多次-每个CPU一次（魔术的这一部分不在上面的代码中）。
该__per_cpu_offset阵列填充有副本之间的距离。假设每个cpu数据使用1000字节，则__per_cpu_offset[n]包含1000*n。
per_cpu__x在加载期间，该符号将重定位到CPU 0的per_cpu__x。
__get_cpu_var(x)在CPU 3上运行时，将转换为*RELOC_HIDE(&per_cpu__x, __per_cpu_offset[3])。从CPU 0开始，x在CPU 0的数据和CPU 3的数据之间增加偏移量，最后取消对结果指针的引用。

2020-06-07