[转帖]操作系统的内存究竟是怎么一回事？

摘要：操作系统的内存究竟是怎么一回事？带你完整复习一遍《操作系统》一书中有关内存的所有知识点

本文分享自华为云社区《操作系统的内存究竟是怎么一回事？带你完整复习一遍《操作系统》一书中有关内存的所有知识点》，作者：breakDawn 。

1 内存管理的概念

内存管理指操作系统对内存的划分和动态分配

地址空间：
逻辑地址空间：相对地址，从 0 开始编址
物理地址空间：地址转换的最终地址

程序运行时：
编译：把源代码编译成目标模块
链接：把目标模块、库函数链接成 1 个装入模块
链接属于形成进程逻辑地址的过程

装入：
绝对装入：编译时就确定了装入地址
可重定位装入：根据内存情况，把程序装到适当位置
运行时动态装入：运行前才真正把程序装起来（前面 2 个都是先分配，再装，再运行）

2 内存防溢出机制

即怎么防止内存越界

设置上下限寄存器：
存放内存中该进程的上下限地址
每次访问时，判断是否越界

重定位 + 界地址：
重定位寄存器 —— 存放物理地址的最小地址
界地址寄存器 —— 存放逻辑地址的最大值

先把访问地址（相对地址）与界地址比较是否越界
再加到重定位寄存器上，作为物理地址

min + x，且 x <max，这样保证地址在 min 到 min+max 之内

3 内存分配机制

3.1 连续分配内存

连续分配指为用户程序分配的内存空间一定是连续的

3.1.1 单一连续：

内存分为系统区和用户区 2 个区
每次用户区只能放 1 个程序，这样可确保不会越界

3.1.2 固定分区分配

用户区分成若干个大小的分区，每个分区只能装一个作业。
程序如果大了会装不下
程序小了则有内存碎片

3.1.3 动态分区分配

程序装入内存时，按照所需大小动态生成 1 个分区。有多少碎片空间就给多少

可能会存在碎片，比如中间的进程结束了，于是中间就空出来一个内存碎片，而可能因为太小，其他进程帆布进来。

动态分配策略：

首次适应：从上往下找第一个满足的分区 —— 最简单也最好
最佳适应：找一个大小差距最小的分区 —— 最烂，碎片最多
最坏适应：直接找最大的分区转入
邻近适应：从上次查找位置开始找，而不是从第一个碎片位置开始找。—— 末尾碎片会很多

3.2 非连续内存分配

非连续指进程内存可以分成不同地址存放，不一定全部集中在一起。

3.2.1 分页

把内存划分成固定大小的块，进程以块为单位申请多个不同位置的块作为空间。

页表：
每个进程 PCB 中会有一个页面寄存器 PRT，告知页表的起始位置和起始长度
找到页表后，页面中会告知你所持有的页号和偏移。
通过页号 * 块大小 + 偏移，可知道这段内存的起始位置。

进程每次想通过虚拟地址去定位物理地址时，都需要先去页表中找到虚拟地址对应的页，然后再得到物理地址。

快表 TBL（Translation Lookaside Buffer )）：
为了避免每次都取页表换算地址，快表会缓存虚拟地址 -> 物理地址的直接映射，加快速度

多级页表
地址空间超级大， 1 页装不下怎么办？
用多级
一级页表指明二级页表的地址
二级页表再去实际地址
这样就可以有多页了。

3.2.2 分段

分页的话，页的长度是固定的，所以偏移量的最大值是固定的

分段的话不限制偏移量最大值，即可以很长一段。

分段属于二维地址空间，因为他除了给出逻辑地址，还得给出段长

有利于做动态链接：程序动态修改

3.2.3 段页结合

作业先分成若干段，再把段分页，每个段可以找到一个也变

段号 S 页号 P 页内偏移

Q: 遍历二维数组的时候，行遍历优先和列遍历优先的效率差别，为什么会这样

A: 按行遍历比按列遍历的效率高体现在这些方面：

CPU 高速缓存
CPU 缓存从内存中抓取一般都是整个数据块，所以它的物理内存是连续的，几乎都是同行不同列的，而如果内循环以列的方式进行遍历的话，将会使整个缓存块无法被利用，而不得不从内存中读取数据，而从内存读取速度是远远小于从缓存中读取数据的。随着数组元素越来越多，按列读取速度也会越来越慢。

4 虚拟内存

4.1 概念

虚拟地址可以让进程获得比实际内存要大的内存

特征：

多次性 —— 作业可分多次装入内存
对换性 —— 可在运行时对内存做兑换处理
虚拟性 —— 逻辑上可充分扩充容量

要求：

必须使用非连续分配方式 —— 分页、分段、段页
硬件需要支持页表、中断、地址变换机构

理论依据：

时间局部性 —— 指令和数据总是会在一段时间内被连续访问
空间局部性 —— 某单元被访问，那么他附件的单元也很大概率会被访问

4.2 请求分页机制

再分页的基础上，增加了 2 个功能：

请求调页 —— 当页面不在内存中时，从外村申请调入
页面置换 —— 把暂时不用的内存换出去，给其他需要进来的页腾出空间

页表项：
页号、物理块号
状态位 P：是否已经调入内存
访问字段 A：记录访问次数或者访问标记，用于置换策略判断
修改维 M：记录是否被修改过
外村地址 —— 当页被换出去时，指明这个页在外存的何处

缺页中断机构：当页面不存在时，负责产生缺页中断，进行页面置换操作。

缺页只能高端和系统中断不同，属于指令中的操作，在执行期产生多次

地址变换机构：
1. 先检索块表，如果能找到，则直接修改页表项的访问位。
2. 块表中没有，则去再检索内存中的页表，通过状态为 P 确认是否在内存中
如果不在，则产生缺页中断。

4.3 工作集概念

驻留集：指系统给每个进程分配的内存中实际页面集合
但是可能分配了 10 个，却只有 5 个经常在用

工作集：某时间段内，这个进程访问和使用的页面集合

通过工作集，系统可以评估这个驻留集是否需要做删减，以及哪些页应该持续保留。
这样可以减少抖动，即减少内外村之间频繁的交换页

4.4 页面置换算法

最佳置换算法：
选未来最长时间不会被用到的页
这个要基于预测，比较难
先进先出 FIFO
可能引发 bleady 异常：

较早调入的页往往是经常被访问的页，这些页在 FIFO 算法下被反复调入和调出，并且有 Belady 现象。所谓 Belady 现象是指：采用 FIFO 算法时，如果对一个进程未分配它所要求的全部页面，有时就会出现分配的页面数增多但缺页率反而提高的异常现象。

最近最久未使用（LRU）
选之前最长时间没访问的，引入优先队列（最大堆）
需要设置访问时间字段
简单时钟 clock（最近未使用 NRU）
每个页有个标记。
刚换入内存或者被访问时，都会置 1

如果需要换页时，步骤如下：

扫描围成换的页链表
如果标记为 1，则改成 0，继续往下扫
如果位 0，则替换，并让指针指向下一页。

改进的 clock
把标记为改成访问位 u 和修改维 m

1 类 (A =0, M = 0)：表示该页面最近既未被访问，又未被修改，是最佳淘汰页。
2 类 (A =0, M = 1)：表示该页面最近未被访问，但已被修改，并不是很好的淘汰页。
3 类 (A =1, M = 0)：表示该页面最近已被访问，但未被修改，该页有可能再被访问。
4 类 (A =1, M = 1)：表示该页最近已被访问且被修改，该页可能再被访问。

先优先找 u=0 和 m=0 的页，有就直接替换
没有，则找 u = 0 且 m=1 的页（没访问的最优先替换），做替换
如果中间遇到 U=1 的，则都会置 0，如果 m=1 的也会置 0
如果一圈都没有，则下一圈肯定有 01 或者 00 的。

4.5 页面分配量策略

固定分配，局部替换
每个进程分配固定的物理块，且只能自己的块之间做替换
可变分配，全局替换
缺页时，可以从全局队列的页替换
可变分配，局部置换
自己替换自己，但是不够的时候可以加块

分配来源：
对换区：频繁切换的区
文件区：补怎么会变动和修改的

点击关注，第一时间了解华为云新鲜技术～