Linux 内存管理 | 虚拟内存管理:虚拟内存空间、虚拟内存分配

文章目录

  • 虚拟内存空间

    • 用户空间
      • 内核空间
  • 用户空间内存分配

    • malloc
  • 内核空间内存分配

    • kmalloc
      • vmalloc


Linux 内存管理 | 物理内存管理:内存碎片、伙伴系统、slab分配器
在上一篇博客中我介绍了Linux中对于物理内存的管理方式,这次再来介绍一下Linux对虚拟内存的管理方式

虚拟内存空间

即使是在现代,内存依旧是一项宝贵的资源,并且内存的管理以及访问控制向来都是难题。如果直接使用物理内存,通常都会面临以下几种问题

  • 内存缺乏访问控制,安全性不足
  • 各进程同时访问物理内存,可能会互相产生影响,没有独立性
  • 物理内存极小,而并发执行进程所需又大,容易导致内存不足
  • 进程所需空间不一,容易导致内存碎片化问题。

基于以上几种原因,Linux通过mm_struct结构体来描述了一个虚拟的,连续的,独立的地址空间,也就是我们所说的 虚拟地址空间

在建立了虚拟地址空间后,并没有分配实际的物理内存,而当进程需要实际访问内存资源的时候就会由内核的 请求分页机制产生 缺页中断,这时才会建立虚拟地址和物理地址的映射,调入物理内存页。通过这种方法,就能够保证我们的物理内存只在实际使用时才进行分配,避免了内存浪费的问题。

下图则为Linux下的虚拟地址空间
在Linux中,虚拟内存空间的内部又被划分为 用户空间内核空间


用户空间

用户空间即进程在用户态下能够访问的虚拟地址空间,每个进程都有自己独立的用户空间,在32位系统下总容量为3G
在这里插入图片描述
用户空间由以下部分组成

  • :栈用来存放程序中临时创建的局部变量,如函数的参数、内部变量等。每当一个函数被调用时,就会将参数压入进程调用栈中,调用结束后返回值也会被放回栈中。同时,每调用一次函数就会创建一个新的栈,所以在递归较深时容易导致栈溢出。栈内存的申请和释放由编译器自动完成,并且栈容量由系统预先定义。栈从高地址向低地址增长
  • 文件映射段:也叫共享区,文件映射段中主要包括共享内存、动态链接库等共享资源,从低地址向高地址增长。
  • :堆用来存放动态分配的内存。堆内存由用户申请分配和释放,从低地址向高地址增长。
  • BSS段:BSS段用来存放程序中未初始化的全局变量和静态变量

数据段:数据段用来存放程序中已初始化全局变量与静态变量

  • 代码段:代码段用来存放程序执行代码,也可能包含一些只读的常量。这块区域的大小在程序运行时就已经确定,并且为了防止代码和常量遭到修改,代码段被设置为只读。

内核空间

内核空间即进程陷入内核态后才能够访问的空间。虽然每个进程都具有自己独立的虚拟地址空间,但是这些虚拟地址空间中的内核空间 ,其实都 关联的是同一块物理内存,如下图。
在这里插入图片描述
通过这种方法,保证了进程在切换至内核态后能够快速的访问内核空间。

在32位系统中,内核空间的大小为1G,从0xC0000000到0xFFFFFFFF。
在这里插入图片描述

如上图,内核空间主要分为 直接映射区高端内存映射区两部分

直接映射区

从内核空间起始位置开始,从低地址往高地址增长,最大为896M的区域即为直接映射区。

直接映射区的896M的虚拟地址与物理地址的前896M进行直接映射,所以虚拟地址和分配的物理地址都是 连续的。

那么它们是如何转换的呢?其实它们之间存在着一个偏移量PAGE_OFFSET,偏移量的大小即为0xC0000000。

所以虚拟地址 = PAGE_OFFSET + 物理地址

高端内存映射区

在上面也提到了,内核空间利用直接映射区来将896M的内存直接映射到物理内存中,但是我们的物理内存远远不止这么点, 那么对于剩下的物理内存的寻址工作,就交给了高端内存映射区

由于我们的内核空间只有1G,而直接映射区又占据了896M,因此我们将剩下的128M空间划分成了三个高端内存的映射区,从上往下分别是 固定内存映射区,永久内存映射区,动态内存映射区

  • 动态内存映射区

该区域的特点是虚拟地址连续,但是其对应的物理地址并不一定连续。该区域使用内核函数vmalloc进行分配,分配的虚拟地址的物理页可能会处于低端内存,也可能处于高端内存

  • 永久内存映射区

该区域可以访问高端内存。使用alloc_page(_GFP_HIGHMEM)分配高端内存页,或者使用kmap将分配的高端内存映射到该区域

  • 固定内存映射区

该区域的每个地址项都服务于特定的用途,如ACPI_BASE


用户空间内存分配

malloc

了解C语言的同学都应该知道,在C语言中我们可以使用malloc来在用户空间中动态的分配内存,而malloc作为库函数,其本质就是对系统调用进行了一层封装,因此在不同的系统下其实现不同。

在Linux中,当我们申请的内存小于128K时,malloc会使用sbrk或者brk在 区分配内存。而当我们申请大于128K的大块空间时,会使用mmap在 映射区进行分配。

但是由于上述的brk/sbrk/mmap都属于系统调用,因此当我们每次调用它们时,就会从用户态切换至内核态,在内核态完成内存分配后再返回用户态。

倘若每次申请内存都要因为系统调用而产生大量的CPU开销,那么性能会大打折扣。并且从上面的图我们也可以看出来,堆是从低地址往高地址增长,如果低地址的内存没有被释放,则高地址的内存就不能被回收,就会产生 内存碎片的问题。

malloc是如何实现解决这个问题的呢?

为了减少内存碎片和系统调用的开销,malloc在底层采用了 内存池来解决这个问题。

它会先申请大块内存作为堆区,然后将这块内存拆分为多个不同大小的内存块,以 作为内存管理的基本单位。同时,会 使用隐式链表来连接所有的内存块,包括已分配块和未分配块。为了方便内存空闲块的管理,malloc采用 显式链表来管理所有的空闲块

当我们调用malloc进行内存分配时,就会去搜索空闲链表,找到满足需求的内存块,如果内存块过大,则会将内存块拆分为两部分,即一部分用来分配,另一部分则变为新的空闲块。

同理,当我们释放内存块时,会通过遍历隐式链表,判断释放块前后内存块是否空闲,来决定是否需要合并内存块


内核空间内存分配

在内核空间中,通过与malloc类似的两个系统调用来进行内存的分配,它们 分别是kmalloc和vmalloc

kmalloc

kmalloc与上面介绍的用户空间的malloc函数非常类似,其用于为内核空间的 直接内存映射区分配内存。

kmalloc以字节为分配单位,通常用于分配小块内存,并且kmalloc确保分配的页在 物理地址上是连续的(虚拟地址也必然连续)。并且kmalloc为了防止内存碎片的问题,其底层页面分配算法是基于 slab分配器实现的。

vmalloc

vmalloc用于为内核空间中的动态内存映射区进行内存分配。

vmalloc的工作方式与kmalloc类似,不同的地方在于vmalloc分配的内存只保证了 虚拟地址是连续的,而物理地址不一定连续。它通过分配非连续的物理内存块,再通过 修正页表的映射关系,把内存映射到虚拟地址空间的连续区域,就能够做到这一点。

在这里插入图片描述
如上图,就是内核空间中进行内存分配的具体流程

代码交流 2021