Linux的内存分页管理

  • 时间:
  • 浏览:10
  • 来源:极速快3_快3新平台_极速快3新平台

作者:Vamei 出处:http://www.cnblogs.com/vamei 严禁转载

内存是计算机的主存储器。内存为系统守护进程开辟出系统守护进程空间,让系统守护进程在其中保存数据。我将从内存的物理价值形式出发,深入到内存管理的细节,不何如是了解虚拟内存和内存分页的概念。

内存

简单地说,内存已经 已经 一有四个数据货架。内存有一有四个最小的存储单位,大多数都不 一有四个字节。内存用内存地址(memory address)来为每个字节的数据顺序编号。已经 ,内存地址说明了数据在内存中的位置。内存地址从0日后日后刚结束,每次增加1。你你这一线性增加的存储器地址称为线性地址(linear address)。为了方便,大伙 用十六进制数来表示内存地址,比如0x00000003、0x1A010CB0。这里的“0x”用来表示十六进制。“0x”中间跟着的,已经 已经 作为内存地址的十六进制数。

内存地址的编号有上限。地址空间的范围和地址总线(address bus)的位数直接相关。CPU通过地址总线来向内存说明已经 存取数据的地址。以英特尔32位的80386型CPU为例,这款CPU有3一有四个针脚里能 不能传输地址信息。每个针脚对应了一位。将会针脚上是高电压,没人 你你这一位是1。将会是低电压,没人 你你这一位是0。32位的电压高低信息通过地址总线传到内存的3一有四个针脚,内存就能把电压高低信息转加在32位的二进制数,从而知道CPU已经 的是哪个位置的数据。用十六进制表示,32位地址空间已经 已经 从0x00000000 到0xFFFFFFFF。

内存的存储单元采用了随机读取存储器(RAM, Random Access Memory)。所谓的“随机读取”,是指存储器的读取时间和数据所在位置无关。与之相对,已经 已经 存储器的读取时间和数据所在位置有关。就拿磁带来说,大伙 想听其中的一首歌,前要转动带子。将会那首歌是第一首,没人 立即就里能 不能播放。将会那首歌恰巧是最后一首,大伙 快进到里能 不能播放的位置就前要花很长时间。大伙 将会知道,系统守护进程前要调用内存中不同位置的数据。将会数据读取时间和位置相关励志的话 ,计算机就不难 把控系统守护进程的运行时间。已经 ,随机读取的价值形式是内存成为主存储器的关键因素。

内存提供的存储空间,除了能满足内核的运行需求,还通常能支持运行中的系统守护进程。即使系统守护进程所需空间超过内存空间,内存空间有有助于不里能 通过一定量拓展来弥补。换句话说,内存的存储能力,和计算机运行清况 的数据总量相当。内存的缺点是不里能 持久地保存数据。一旦断电,内存中的数据就会消失。已经 ,计算机即使有了内存那我一有四个主存储器,还是前要硬盘那我的内外部存储器来提供持久的储存空间。

虚拟内存

内存的一项主要任务,已经 已经 存储系统守护进程的相关数据。大伙 日后将会看一遍过系统守护进程空间的系统守护进程段、全局数据、栈和堆,以及你你这一你你这一存储价值形式在系统守护进程运行中所起到的关键作用。有趣的是,尽管系统守护进程和内存的关系没人 紧密,但系统守护进程不须能直接访问内存。在Linux下,系统守护进程不里能 直接读写内存中地址为0x1位置的数据。系统守护进程中能访问的地址,不里能 是虚拟内存地址(virtual memory address)。操作系统会把虚拟内存地址翻译成真实的内存地址。你你这一内存管理土方法,称为虚拟内存(virtual memory)。

每个系统守护进程都不 当事人的一套虚拟内存地址,用来给当事人的系统守护进程空间编号。系统守护进程空间的数据同样以字节为单位,依次增加。从功能上说,虚拟内存地址和物理内存地址相似,都不 为数据提供位置索引。系统守护进程的虚拟内存地址相互独立。已经 ,一有四个系统守护进程空间里能 不能有相同的虚拟内存地址,如0x800800。虚拟内存地址和物理内存地址又有一定的对应关系,如图1所示。对系统守护进程某个虚拟内存地址的操作,会被CPU翻译成对某个具体内存地址的操作。

图1 虚拟内存地址和物理内存地址的对应

应用系统守护进程来说对物理内存地址一无所知。它只将会通过虚拟内存地址来进行数据读写。系统守护进程中表达的内存地址,已经 已经 是虚拟内存地址。系统守护进程对虚拟内存地址的操作,会被操作系统翻译成对某个物理内存地址的操作。将会翻译的过程由操作系统全权负责,已经 已经 应用系统守护进程里能 不能在全过程中对物理内存地址一无所知。已经 ,C系统守护进程中表达的内存地址,都不 虚拟内存地址。比如在C语言中,里能 不能用下面指令来打印变量地址:

int v = 0;
printf("%p", (void*)&v);

本质上说,虚拟内存地址剥夺了应用系统守护进程自由访问物理内存地址的权利。系统守护进程对物理内存的访问,前要经过操作系统的审查。已经 ,掌握着内存对应关系的操作系统,也掌握了应用系统守护进程访问内存的闸门。借助虚拟内存地址,操作系统里能 不能保障系统守护进程空间的独立性。假使 操作系统把一有四个系统守护进程的系统守护进程空间对应到不同的内存区域,已经 一有四个系统守护进程空间成为“老死不相往来”的一有四个小王国。一有四个系统守护进程就不将会相互篡改对方的数据,系统守护进程出错的将会性就大为减少。

当事人面,有了虚拟内存地址,内存共享也变得简单。操作系统里能 不能把同一物理内存区域对应到多个系统守护进程空间。那我,不前要任何的数据基因重组,多个系统守护进程就里能 不能看一遍相同的数据。内核和共享库的映射,已经 已经 通过你你这一土方法进行的。每个系统守护进程空间中,最初一帕累托图的虚拟内存地址,都对应到物理内存中预留给内核的空间。那我,所有的系统守护进程就里能 不能共享同一套内核数据。共享库的清况 也是相似。对于任何一有四个共享库,计算机只前要往物理内存中加载一次,就里能 不能通过操纵对应关系,来让多个系统守护进程一齐使用。IPO中的共享内存,都不 赖于虚拟内存地址。

内存分页

虚拟内存地址和物理内存地址的分离,给系统守护进程带来便利性和安全性。但虚拟内存地址和物理内存地址的翻译,又会额外耗费计算机资源。在多任务的现代计算机中,虚拟内存地址将会成为必备的设计。没人 ,操作系统前要要考虑清楚,何如能高效地翻译虚拟内存地址。

记录对应关系最简单的土方法,已经 已经 把对应关系记录在一张表中。为了让翻译下行速率 足够地快,你你这一表前要加载在内存中。不过,你你这一记录土方法惊人地浪费。将会树莓派1GB物理内存的每个字节都不 一有四个对应记录励志的话 ,没人 光是对应关系就要远远超过内存的空间。将会对应关系的条目众多,搜索到一有四个对应关系所需的时间也很长。那我励志的话 ,会让树莓派陷入瘫痪。

已经 ,Linux采用了分页(paging)的土方法来记录对应关系。所谓的分页,已经 已经 以更大尺寸的单位页(page)来管理内存。在Linux中,通常每页大小为4KB。将会已经 获取当前树莓派的内存页大小,里能 不能使用命令:

得到结果,即内存分页的字节数:

4096

返回的4096代表每个内存页里能 不能存放4096个字节,即4KB。Linux把物理内存和系统守护进程空间都分割成页。

内存分页,里能 不能极大地减少所要记录的内存对应关系。大伙 将会看一遍,以字节为单位的对应记录随便说说没人 来太多。将会把物理内存和系统守护进程空间的地址都分成页,内核只前要记录页的对应关系,相关的工作量就会大为减少。将会每页的大小是每个字节的800倍。已经 ,内存中的总页数已经 已经 总字节数的四千分之一。对应关系也缩减为原始策略的四千分之一。分页让虚拟内存地址的设计有了实现的将会。

无论是虚拟页,还是物理页,一页之内的地址都不 连续的。那我励志的话 ,一有四个虚拟页和一有四个物理页对应起来,页内的数据就里能 不能按顺序一一对应。这原因分析分析,虚拟内存地址和物理内存地址的末尾帕累托图应该删剪相同。大多数清况 下,每一页有4096个字节。将会4096是2的12次方,已经 已经 地址最后12位的对应关系火山岩石石成立。大伙 把地址的你你这一帕累托图称为偏移量(offset)。偏移量实际上表达了该字节在页内的位置。地址的前一帕累托图则是页编号。操作系统只前要记录页编号的对应关系。



图2 地址翻译过程

多级分页表

内存分页制度的关键,在于管理系统守护进程空间页和物理页的对应关系。操作系统把对应关系记录在分页表(page table)中。你你这一对应关系让上层的抽象内存和下层的物理内存分离,从而让Linux能灵活地进行内存管理。将会每个系统守护进程会有一套虚拟内存地址,没人 每个系统守护进程前会 有一有四个分页表。为了保证查询下行速率 ,分页表也会保所处内存中。分页表有已经 已经 种实现土方法,最简单的四种 分页表已经 已经 把所有的对应关系记录到同一有四个线性列表中,即如图2中的“对应关系”帕累托图所示。

你你这一单一的连续分页表,前要给每一有四个虚拟页预留第一根记录的位置。但对于任何一有四个应用系统守护进程,其系统守护进程空间真正用到的地址都相当有限。大伙 还记得,系统守护进程空间会有栈和堆。系统守护进程空间为栈和堆的增长预留了地址,但栈和堆很少会占满系统守护进程空间。这原因分析分析,将会使用连续分页表,已经 已经 条目都没人 真正用到。已经 ,Linux中的分页表,采用了多层的数据价值形式。多层的分页表有有助于减少所需的空间。

大伙 来看一有四个繁杂的分页设计,用以说明Linux的多层分页表。大伙 把地址分为了页编号和偏移量两帕累托图,用单层的分页表记录页编号帕累托图的对应关系。对于多层分页表来说,会进一步分割页编号为一有四个或更多的帕累托图,已经 用两层或更多层的分页表来记录其对应关系,如图3所示。



图3 多层分页表



在图3的例子中,页编号分成了两级。第一级对应了前8位页编号,用一有四个十六进制数字表示。第二级对应了后12位页编号,用八个十六进制编号。二级表记录有对应的物理页,即保存了真正的分页记录。二级表有已经 已经 张,每个二级表分页记录对应的虚拟地址前8位都相同。比如二级表0x00,中间记录的前8位都不 0x00。翻译地址的过程要跨越两级。大伙 先取地址的前8位,在一级表中找到对应记录。该记录会别问大伙 ,目标二级表在内存中的位置。大伙 再在二级表中,通过虚拟地址的后12位,找到分页记录,从而最终找到物理地址。

多层分页表就好像把删剪的电话号码分成区号。大伙 把同一地区的电话号码以及对应的人名记录同通一有四个小本子上。再用一有四个上级本子记录区号和各个小本子的对应关系。将会某个区号没人 使用,没人 大伙 只前要在上级本子上把该区号标记为空。同样,一级分页表中0x01记录为空,说明了以0x01开头的虚拟地址段没人 使用,相应的二级表就不前要所处。正是通过你你这一手段,多层分页表所处的空间要比单层分页表少了已经 已经 。

多层分页表还有那我优势。单层分页表前要所处于连续的内存空间。而多层分页表的二级表,里能 不能散步于内存的不同位置。那我励志的话 ,操作系统就里能 不能利用零碎空间来存储分页表。还前要注意的是,这里繁杂了多层分页表的已经 已经 细节。最新Linux系统中的分页表多达3层,管理的内存地址也比本章介绍的长已经 已经 。不过,多层分页表的基本原理都不 相同。

综上,大伙 了解了内存以页为单位的管理土方法。在分页的基础上,虚拟内存和物理内存实现了分离,从而让内核宽度参与和监督内存分配。应用系统守护进程的安全性和稳定性已经 大为提高。

欢迎阅读“骑着企鹅采树莓”系列文章