竞赛时对操作系统启动过程产生了些疑问,于是问题导向地浅浅探究了下GRUB和initramfs相关机制,相关笔记先放在这里了。

内核启动流程

在传统的BIOS系统中,计算机具体的启动流程如下:

  1. 电源启动:当计算机的电源打开时,电源供电给计算机的硬件设备。
  2. BIOS自检:计算机的BIOS固件会自检硬件设备,包括RAM、处理器、硬盘等,以确保它们正常工作。
  3. 引导设备选择:BIOS会根据预先定义的启动顺序(通常是硬盘、光驱、USB等)选择一个启动设备。
  4. MBR(Master Boot Record)加载:如果选择的启动设备是硬盘,BIOS会加载该硬盘的MBR,其中包含了引导加载程序。
  5. GRUB加载:MBR中的引导加载程序通常是GRUB(或其他引导加载程序)。GRUB会被加载到计算机的内存中,并开始执行。
  6. GRUB菜单:GRUB会显示一个菜单,列出可供选择的操作系统或内核。
  7. 操作系统加载:用户选择操作系统后,GRUB会加载相应的操作系统或内核,并将控制权交给它。

在本次内核编译配置过程中,最主要探究的是文件系统的装载过程,也即介于6-7之间的部分。

概述

文件系统在启动流程中的发展历程可以分为以下三个部分:

  1. GRUB文件系统

    由 GRUB 自身通过 BIOS 提供的服务加载

  2. initramfs

    由GRUB加载,用于挂载真正的文件系统

  3. 真正的根文件系统

下面,将介绍1和2两个流程。

GRUB

GRUB(GNU GRand Unified Bootloader)是一种常用的引导加载程序,用于在计算机启动时加载操作系统。

GRUB的主要功能是在计算机启动时提供一个菜单,让用户选择要启动的操作系统或内核。它支持多个操作系统,包括各种版本的Linux、Windows、BSD等。通过GRUB,用户可以在多个操作系统之间轻松切换。

除了操作系统选择,GRUB还提供了一些高级功能,例如引导参数的设置、内存检测、系统恢复等。它还支持在启动过程中加载内核模块和初始化RAM磁盘映像(initrd或initramfs)。

GRUB具有高度可配置性,允许用户自定义引导菜单、设置默认启动项、编辑内核参数等。它还支持引导加载程序间的链式引导,可以引导其他引导加载程序,如Windows的NTLDR。

GRUB的基本作用流程为:

  1. BIOS加载MBR,MBR加载GRUB,开始执行GRUB程序
  2. GRUB程序会读取grub.cfg配置文件
  3. GRUB程序依据配置文件,进行内核的加载、根文件系统的挂载等操作,最后将主导权转交给内核

grub.cfg

内核启动时,GRUB程序会读取/boot/grub/目录下的GRUB配置文件grub.cfg,其中记录了所有GRUB菜单可供选择的内核选项(menuentry)及其对应的启动依赖参数。以6.4.0内核选项为例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# menuentry标识着GRUB菜单中的一个内核选项
menuentry 'Ubuntu' --class ubuntu --class gnu-linux --class gnu --class os $menuentry_id_option 'gnulinux-simple-XXX' {
recordfail # 记录上次启动是否失败,用于处理启动失败的情况
load_video # 加载视频驱动模块,用于在启动过程中显示图形界面
gfxmode $linux_gfx_mode # 设置图形模式
insmod gzio # 加载gzio模块,提供对GZIP压缩和解压缩功能的支持
# 如果是在Xen虚拟化平台上,则加载xzio和lzopio模块
if [ x$grub_platform = xxen ]; then insmod xzio; insmod lzopio; fi

insmod part_gpt # 加载part_gpt模块,支持GUID分区表(GPT)
insmod ext2 # 加载ext2模块,支持ext2文件系统

# 设置文件系统的根分区
set root='hd0,gpt3'
if [ x$feature_platform_search_hint = xy ]; then
search --no-floppy --fs-uuid --set=root --hint-bios=hd0,gpt3 --hint-efi=hd0,gpt3 --hint-baremetal=ahci0,gpt3 XXX
else
search --no-floppy --fs-uuid --set=root XXX
fi

linux /boot/vmlinuz-6.4.0-rc3+ root=UUID=XXX ro text # 指定内核映像的路径和启动参数
initrd /boot/initrd.img-6.4.0-rc3+ # 指定initramfs映像的路径
}

可以看到,grub.cfg主要记录了一些该内核启动需要的依赖module,以及内核映像和initramfs映像的路径

menuentry的代码中,有以下几个要点值得注意:

  1. insmod gzio

    由于加载gzio模块,提供对GZIP压缩和解压缩功能的支持。

    看到这里我第一反应是觉得有点割裂,为啥这看着比较无关紧要的解压缩功能要在内核启动之前就需要有呢?于是我想起来在配置内核时,有一个选项是这样的:

    image-20230616143835953

    在配置选项中,我们选择了对initramfs的支持,并且勾选了Support initial ramdisk/ramfs compressed using gzip ,也即在编译时通过gzip压缩initramfs的大小以节省空间。

    所以说,我们在内核启动之前,持有的initramfs处于被压缩的状态。故而,我们自然需要在内核启动之前安装gzio模块,从而支持之后对initramfs的解压缩了。

  2. insmod ext2

    这句代码说明,GRUB的临时文件系统为ext2类型,这句代码事实上是在安装GRUB建立临时文件的必要依赖包,从而GRUB程序之后才能建立其临时文件系统、从/boot/initrd.img获取initramfs映像。

  3. linux /boot/vmlinuz-6.4.0-rc3+ root=UUID=XXX ro text

    指定了启动参数,也即将根文件系统以只读(ro)的方式挂载在root=UUID=XXX对应的块设备上,并且默认以text方式(也即非图形化的Shell界面)启动内核。

    此处的启动参数可在下一个部分介绍的grub文件中个性化。

grub.cfg的生成与修改

实际运用中,很多时候需要对启动参数进行一些修改。下面介绍两种修改grub.cfg的方法。

/etc/default/grub

可以看到,grub.cfg其实格式较为固定(也即由一系列内容也比较相似的menuentry构成)。因而,实际上我们是通过grub.d生成grub.cfg的(6.S081实验中事实上也涉及了这一点),而/etc/default/grub则是GRUB程序以及grub.cfg生成的配置文件。下面介绍下该文件主要有哪些配置选项。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# If you change this file, run 'update-grub' afterwards to update
# /boot/grub/grub.cfg.
# For full documentation of the options in this file, see:
# info -f grub -n 'Simple configuration'

# 开机时GRUB界面的持续时间,此处设置为30s
GRUB_TIMEOUT=30
GRUB_CMDLINE_LINUX=""

# 不使用图形化界面
#GRUB_TERMINAL=console
# 图形化界面的大小
#GRUB_GFXMODE=640x480
# 不使用UUID
#GRUB_DISABLE_LINUX_UUID=true

# 隐藏recovery mode
#GRUB_DISABLE_RECOVERY="true"

重点看下这几个参数:

  1. GRUB_CMDLINE_LINUX

    表示最终生成的grub.cfg中的每一个menuentry中的linux那一行需要附加什么参数。

    例如说,如果设置为:

    1
    2
    # 表示initramfs在挂载真正的根文件系统之前,需要等待120s,用于防止磁盘没准备好导致的挂载失败
    GRUB_CMDLINE_LINUX="rootdelay=120"

    那么,最终在menuentry中的启动参数就为:

    1
    linux   /boot/vmlinuz-6.4.0-rc3+ root=UUID=XXX ro rootdelay=120 text

    其他一些常见的选项:

    1
    2
    3
    4
    # 直接以路径来标识块设备而非使用UUID。此为old option,建议尽量使用UUID
    GRUB_CMDLINE_LINUX="root=/dev/sda3"
    # 标明init进程(启动后第一个进程)的具体路径。此处指明为`/bin/sh`
    GRUB_CMDLINE_LINUX="init=/bin/sh"
  2. GRUB_DEFAULT

    参考 可以用来指定重启时的内核选项。如GRUB_DEFAULT="1> 0"表示选择第一个菜单界面的第2栏(Advanced for Ubuntu)和第二个菜单的第1个内核。

在修改完grub文件之后,我们需要执行sudo update-grub,来重新生成grub.cfg文件供下次启动使用。

在GRUB界面直接修改

image-20230616151055620

我们可以在GRUB界面选中所需内核,按下e键:

image-20230616151122738

然后就可以对启动参数进行修改,^X退出。

值得注意的是,此修改仅对本次启动有效。如果需要长期修改,建议还是通过第一种方法去修改。

initramfs

GRUB程序会通过initrd.img启动initramfs,从而进行真正的根文件系统挂载。

initrd.img是一个Linux系统中的初始化内存盘(initial RAM disk)的映像文件。它是一个压缩的文件系统映像,通常在引导过程中加载到内存中,并提供了一种临时的根文件系统,以便在正式的根文件系统(通常位于硬盘上)可用之前提供必要的功能和模块。

我们可以通过unmkinitramfs /boot/initrd.img-6.4.0-rc3+ /tmp/initrd/命令解压initrd,探究里面到底有什么玩意。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
├── bin -> usr/bin
├── conf
├── etc
├── init
├── lib -> usr/lib
├── lib32 -> usr/lib32
├── lib64 -> usr/lib64
├── libx32 -> usr/libx32
├── run
├── sbin -> usr/sbin
├── scripts
├── usr
└── var
init

可以看到,这实际上就是一个小型的文件系统,也即initramfs。它有自己的built-in Shell(BusyBox):

image-20230616151938951

有一些较少的Shell命令(bin和sbin目录下),以及用来挂载真正的根文件系统的代码逻辑(存储在scripts目录下)。【我猜】在正常情况下,系统会执行scripts下的脚本代码挂载真正的文件系统。当挂载出现异常时,系统就会将控制权交给initramfs内置的Shell BusyBox,由用户自己探究出了什么问题。

我们接下来可以追踪下initramfs的script目录下的文件系统挂载流程。

挂载真正文件系统的主要函数为local_mount_root

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# 仅展示主要流程代码
local_mount_root()
{
# 预处理,获取参数等(也即上面grub.cfg配置的root=UUID)
local_top
if [ -z "${ROOT}" ]; then
panic "No root device specified. Boot arguments must include a root= parameter."
fi

# 根据UUID获取对应的块设备
local_device_setup "${ROOT}" "root file system"
ROOT="${DEV}"

# 挂载前的预处理
local_premount

# 挂载
mount ${roflag} ${FSTYPE:+-t "${FSTYPE}"} ${ROOTFLAGS} "${ROOT}" "${rootmnt?}"
}

由于研究这个是错误驱动(乐),因而我只主要看了下local_device_setup

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
# $1=device ID to mount设备ID
# $2=optionname (for root and etc)要挂载的是什么玩意,此处应为root file system
# $3=panic if device is missing (true or false, default: true)
# Sets $DEV to the resolved device node $DEV是最终获取到的块设备
local_device_setup()
{
local dev_id="$1"
local name="$2"
local may_panic="${3:-true}"
local real_dev
local time_elapsed
local count

# 获取grub.cfg的rootdelay参数的设备等待时间。如果没有该参数,默认是30秒
local slumber=30
if [ "${ROOTDELAY:-0}" -gt $slumber ]; then
slumber=$ROOTDELAY
fi

# 等待设备
case "$dev_id" in
UUID=*|LABEL=*|PARTUUID=*|/dev/*)
FSTYPE=$( wait-for-root "$dev_id" "$slumber" )
;;
*)
wait_for_udev 10
;;
esac

# 等待结束了。如果条件为真,说明还是获取不到对应的设备,那就只能说明这个设备死了
# 所以我们就得把问题告诉用户,让用户自己解决,并且进入BusyBox Shell
# We've given up, but we'll let the user fix matters if they can
while ! real_dev=$(resolve_device "${dev_id}") ||
! get_fstype "${real_dev}" >/dev/null; do
if ! $may_panic; then
echo "Gave up waiting for ${name}"
return 1
fi
echo "Gave up waiting for ${name} device. Common problems:"
echo " - Boot args (cat /proc/cmdline)"
echo " - Check rootdelay= (did the system wait long enough?)"
if [ "${name}" = root ]; then
echo " - Check root= (did the system wait for the right device?)"
fi
echo " - Missing modules (cat /proc/modules; ls /dev)"
panic "ALERT! ${dev_id} does not exist. Dropping to a shell!"
done

DEV="${real_dev}"
}

可以看到,这里如果进入错误状态,最终就是这样的效果2333:

image-20230616153420011