翻译-C程序员所应该知道的内存

原文章 What a C programmer should know about memory
提示: 本篇文章的图片都是直接使用原文中的图片的地址,如果无法显示,请挂代理


2007年,Ulrich Drepper写了一篇”每个程序员都应该知道的内存“.是的,虽然这篇文章又细又长,但做到了它所应做到的.很多年后,虚拟内存的概念对于很多人来说仍然难以琢磨,仿佛是某种魔法.我无法抗拒的引用一下.很多年后甚至原始文章的有效性也被质疑,到底发生了什么事?

北桥,这是什么东西?那不是巷战.

我尝试从”学习锁的基本原理”去传达实用的一面(比如:你能做什么)和更多有趣的东西.可以看待这是一个胶水在原始文章和你每天使用的东西之间.例子将使用linux上的C99,但是更多主题将是普遍的.
编辑: 虽然我对Windows不了解,但我很乐意联系文章去解释.我会尽全力去提起什么函数是平台特有的,但是再一次我只是一个人.如果你发现出入,请让我知道.
事不宜迟,倒一杯咖啡,让我们开始吧。

译者注:

1
2
3
4
5
6
7
8
9
10
11
12
worth one's salt:
good or competent at the job or profession specified.
ig:"any astrologer worth her salt would have predicted this"

what gives?
是在英语对话中常用的一句口语
通常用它的时候只有两层意思
一个是What's happening?发生了什么事?
另一个是What is the news?有什么消息?

the practical side
实用的一面

理解虚拟内存 - 复杂且神秘

除非你要处理一些嵌入系统或内核空间的代码,否则你应该在保护模式下进行.这太棒了,你的程序一定拥有它自己的[虚拟]地址空间.”虚拟”在这里很重要.这意味着,除了其他事情外,你不会被可使用的内存限制,但是也无权获得任何.为了使用这些空间,你不得向操作系统要一些真东西来作后援,这被叫做映射.后援可能是物理内存,也可能是持久性存储.前者也被叫做”匿名映射”.但是,稍安勿躁.
虚拟内存分配(virtual memory allocator=VMA)可以给你所不存在的内存,他只能徒劳的希望你不要去使用它,就像现在的银行.这是过量使用(overcommiting),并且也存在有需求的程序(稀疏数组),这也意味着内存分配不能简单的说”不”.

1
2
3
4
char *block = malloc(1024 * sizeof(char));
if (block == NULL) {
truereturn -ENOMEM; /* Sad :( */
}

检查NULL是一个很好的做法,但也没有曾经那么强大.因为过量使用(overcommiting)的存在,操作系统可能给你的内存分配器分配一个有效的内存指针,但当你去访问时-dang*.这里的dang是有平台差异的,但普遍情况下oom(out-of-memory) killer将结束你的程序.

这里过于简单,as timbatron noted,并且将在解释按需分页节解释.但是我想要在研究细节之前先过一遍更普遍的知识.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
the plot thickens
said to mean that a complicated situation or series of events starts to become even more complicated or mysterious
At this point the plot thickened further. A link emerged between the attempt to kill the Pope and the kidnapping of the American.

guaranteed 美 [ˌɡerənˈtid] 英 [ˌɡærənˈtiːd]
adj. 必定的,肯定的

bounded 美 ['baundid] 英 [ˈbaʊndɪd]
有界限的, 有限制的

entitled 美 [ɛnˈtaɪtəld; ɪnˈtaɪtəld] 英 [ɪnˈtaɪtəld]
adj. 有资格的

hold your horses

used to tell someone to stop and consider carefully their decision or opinion about something:
Just hold your horses, Bill! Let's think about this for a moment.
停下來想想,且慢… 稍安勿躁

vain 美 [veɪn] 英 [veɪn]
adj. 徒劳的

a good practice 一个很好的做法

绕道 - 内存布局

进程内存的布局已经很好的在Gustavo Duarte所著的剖析程序内存中中进行解释,所以我将引用并参考原始文章,我希望这是合理的使用.我只有一点想要吹毛求疵一下,那就是他只讲到了x86-32的内存布局,但是幸运的是在x86-64中并没有多大的变化,只是进程可以使用更多的空间 - 在linux中高达 48 bits.

linux内存布局

Source: Linux address space layout by Gustavo Duarte

这也展示了内存映射段(memory mapping segment=MMS)是向下增长的,但是并非总是如此.内存映射段通常开始与(x86/mm/mmap.c:113arch/mm/mmap.c:1953)一个栈底的随机地址.但也可以开始于栈之上或向栈之上增长当且仅当栈很大或栈无限大,或者兼容布局是被允许的.这重要吗?不,但是这将帮助你理解自由地址范围.
看那个图表,你可以看到三个不同的变量存放位置:进程数据段(静态存储或堆分配),内存映射段,和栈.让我们从这个开始

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
anatomy 美 [əˈnætəmi] 英 [əˈnætəmɪ]
n. 解剖学;结构;身体;剖析

quibble 美 [ˈkwɪbəl] 英 [ˈkwɪbəl]
vi /ˈkwɪbəl/
1.(尤指为搪塞)吹毛求疵,诡辩
2.用双关语;说俏皮话
n /ˈkwɪbəl/
1.(尤指为搪塞)吹毛求疵,抱怨
2.双关语

fair 美 [fɛr] 英 [fɛə]
合理的

iff [if]
abbr. (= if and only if) 当且仅当

了解栈分配

实用腰带(译者注:此处为直译,原文为Utility belt):

栈易于理解,所有人都知道如何在栈中创建一个变量,不是吗?
这里有两个例子:

1
2
int stairway = 2;
int heaven[] = { 6, 5, 4 };

变量的有效性被范围所限制.在C语言中,这意味着:{}.所以每次出现右花括号时就意味着一个变量的结束.然后这里有alloca(),允许在当前的栈帧中动态分配内存.栈帧与内存框架(memory frame)(也被叫做物理页(physical page))不同,这是一个简单的可以被放入栈中的数据组(函数,参数,变量…).每当我们在栈顶时,我们可以使用剩余的内存直到达到栈的大小限制.
这就是可变长数组(variable-length arrays=VLA),以及alloca()的工作方式,但是有一个不同-可变长的数组的有效性被范围限制,alloca将保留内存直到函数返回(或被释放).这不是单纯的语法警察(译者注:原文language lawyering,这节下面有详细翻译),这确实是一个问题如果你在循环中使用alloca,因为你没有任何手段去释放它.

1
2
3
4
5
6
7
void laugh(void) {
truefor (unsigned i = 0; i < megatron; ++i) {
true char *res = alloca(2);
true memcpy(res, "ha", 2);
true char vla[2] = {'h','a'}
true} /* vla dies, res lives */
} /* all allocas die */

可变长数组和alloca都不适合大分配,因为你几乎没有控制可用的栈内存并且超过栈限制的分配将导致栈溢出.这里有两种方法,但都不实用.
第一个方法就是使用sigaltstack()去抓获SIGSEGV并处理.然而这仅仅是让你抓获到栈溢出.
另一个方法是以split-stacks进行编译,顾名思义,这真的就是把单片栈分为较小的栈链表也被叫做stacklets.就我所知,GCC和clang都支持-fsplit-stack选项.理论上这也改善了内存的消耗量并且降低了创建线程的成本 - 因为栈一开始就很小并且按需增长.实际上,预期可能会有兼容性问题,因为他需要一个split-stack链表感知器(译者注:原文aware linker)(如:gold)与split-stack unaware库配合使用,而且还有性能问题(Agis Anastasopoulos的”hot split”在Go中是个很好的解释)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Stack Frame 栈帧
digest [ˈdaɪˌdʒɛst]
理解

a variable dies 变量的结束

aka = also-known-as

this is how 这就是...

means [mēnz]
名词 手段; 方法; 工具; 办法; 径; 繇; 款

grow on demand 按需增长

play nice with 配合

scope 美 [skoʊp] 英 [skəʊp]
n. 范围,领域;

remaining 其余

language lawyer from What does Stroustrup mean by ‘language lawyers’? He’s said it more than a few times.
A language lawyer is generally someone that is familiar enough with the details of the standard that they can quote it chapter and verse in order to answer a question, solve a problem, prove a point, etc. The standard is the ultimate authority on what is and isn’t valid C++, and much like the law it’s written in very technical and precise language that requires some effort to really unpack, so there are several parallels to the field of law.
It can have both positive and negative connotations. The idea is that you shouldn’t need to be a language lawyer to be able to learn and use the language. At the same time, having a single document that precisely defines the semantics of the language is a significant advantage that many other languages lack, so the fact that it’s possible to be a language lawyer is not an automatic negative. In order to have compatible implementations it’s necessary to define all the edge conditions and dark corners of the language, even if it results in some truly out there passages of the standard.

了解堆分配

Utility belt:

堆分配可以简单的看作是移动堆段的结束位置(program break)和声明内存在旧位置和新位置之间。到了这一点,堆分配和栈分配一样快(没有分页,假设栈已锁定在内存中)。但是有一只猫(cat),我的意思是捕获(catch),该死的(dammit)。

1
char *block = sbrk(1024 * sizeof(char));

(1)我们不能重新声明未使用的内存块,(2)不是线程安全的,因为堆在线程之间共享,(3)接口很难移植,库不能接触到中断

man 3 sbrk — Various systems use various types for the argument of sbrk(). Common are int, ssize_t, ptrdiff_t, intptr_t.

由于这些原因,libc实现了用于内存分配的集中式接口。实现方式各不相同,但是它支持线程安全的任意大小的内存分配…但有代价。代价是延迟,因为这里还涉及锁,数据结构保留有关已用/可用块的信息以及额外的内存开销。堆也不是唯一使用的,因为内存映射段也经常应用于大内存块。

man 3 malloc — Normally, malloc() allocates memory from the heap, … when allocating blocks of memory larger than
MMAP_THRESHOLD, the glibc malloc() implementation allocates the memory as a private anonymous mapping.

因为从start_brkbrk堆总是连续的,所以你不能精确钻取漏洞穿过它并减少数据段大小。想象以下情节:

1
2
3
char *truck = malloc(1024 * 1024 * sizeof(char));
char *bike = malloc(sizeof(char));
free(truck);

堆[分配器]移动brktruck腾出空间。同样为bike也进行相同的操作。但是在truck释放后,brk也无法降级(向下移),因为bike占据最高段地址。结论就是你的程序可以重用之前truck的内存,但是不会被交回系统直到bike被释放。
假设truck被映射,它将不能处于堆段,并且不能影响程序中断(program break)。不过,这种技巧并不能阻止因小分配(另一种说法也叫“碎片化”)而造成的漏洞。
注意free()不总是尝试去缩小数据段,因为这是一个潜在的昂贵操作。这对于长时间运行的程序来说是一个问题,如守护程序。一个GNU的拓展,被叫做malloc_trim(),用于从堆顶部释放内存,但可能会很慢。它对很多小对象的伤害很大,因此应谨慎使用。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
sans [sænz]
__没有__,在外,外部

portable [ˈpɔːtəbəl]
可移植的

The cost
代价

utilised
adj. 被利用的

exclusively [iks'klu:sivli]
adv. 独占地,专门地,完全地

contiguous [kənˈtɪgjuəs]
adj. 邻近的;__连续的__

scenario [səˈnɛriˌoʊ]
n. __情节__;剧本;方案

reuse [riˈjuz]
n. 再用,重新使用
v. 再用,重新使用

fragmentation [frægmən'teiʃən]
碎片

sparingly [ˈspeərɪŋlɪ]
adv. 拘谨地;朴实地;节俭地

未完待续-不定时接着翻译

1
2
conquering [ˈkɒŋkərɪŋ]
adj /ˈkɒŋkərɪŋ/ 进行征服的