------------------------------------------
本文系本站原創(chuàng),歡迎轉(zhuǎn)載!
轉(zhuǎn)載請注明出處:http://ericxiao./
------------------------------------------
一:前言
前段時間在編譯kernel的時候發(fā)現(xiàn)rootfs掛載不上,。相同的root選項設置舊版的image卻可以。為了徹底解決這個問題,。研究了一下rootfs的掛載過程,。特總結(jié)如下,希望能給這部份知識點比較迷茫的朋友一點幫助。
二:rootfs的種類
總的來說,,rootfs分為兩種:虛擬rootfs和真實rootfs.現(xiàn)在kernel的發(fā)展趨勢是將更多的功能放到用戶空間完成,。以保持內(nèi)核的精簡。虛擬rootfs也是各linux發(fā)行廠商普遍采用的一種方式,??梢詫⒁徊糠莸某跏蓟ぷ鞣旁谔摂M的rootfs里完成。然后切換到真實的文件系統(tǒng).
在虛擬rootfs的發(fā)展過程中,。又有以下幾個版本:
initramfs:
Initramfs是在 kernel 2.5中引入的技術(shù),,實際上它的含義就是:在內(nèi)核鏡像中附加一個cpio包,這個cpio包中包含了一個小型的文件系統(tǒng),,當內(nèi)核啟動時,,內(nèi)核將這個cpio包解開,并且將其中包含的文件系統(tǒng)釋放到rootfs中,,內(nèi)核中的一部分初始化代碼會放到這個文件系統(tǒng)中,,作為用戶層進程來執(zhí)行。這樣帶來的明顯的好處是精簡了內(nèi)核的初始化代碼,,而且使得內(nèi)核的初始化過程更容易定制,。這種這種方式的rootfs是包含在kernel image之中的.
cpio-initrd: cpio格式的rootfs image-initrd:傳統(tǒng)格式的rootfs
關(guān)于這兩種虛擬文件系統(tǒng)的制作請自行參閱其它資料
三:rootfs文件系統(tǒng)的掛載過程
這里說的rootfs不同于上面分析的rootfs。這里指的是系統(tǒng)初始化時的根結(jié)點,。即/結(jié)點,。它是其于內(nèi)存的rootfs文件系統(tǒng)。這部份之前在<< linux啟動過程分析>>和文件系統(tǒng)中已經(jīng)分析過,。為了知識的連貫性這里再重復一次,。
Start_kernel()àmnt_init():
void __init mnt_init(void) {
……
……
init_rootfs();
init_mount_tree();
}
Init_rootfs的代碼如下:
int __init init_rootfs(void) {
int err;
err = bdi_init(&ramfs_backing_dev_info); if (err)
return err;
err = register_filesystem(&rootfs_fs_type);
if (err)
bdi_destroy(&ramfs_backing_dev_info);
return err;
}
這個函數(shù)很簡單。就是注冊了rootfs的文件系統(tǒng).
init_mount_tree()代碼如下:
static void __init init_mount_tree(void) {
struct vfsmount *mnt;
struct mnt_namespace *ns;
struct path root;
mnt = do_kern_mount("rootfs", 0, "rootfs", NULL); if (IS_ERR(mnt))
panic("Can't create rootfs"); ns = kmalloc(sizeof(*ns), GFP_KERNEL);
if (!ns)
panic("Can't allocate initial namespace"); atomic_set(&ns->count, 1);
INIT_LIST_HEAD(&ns->list);
init_waitqueue_head(&ns->poll);
ns->event = 0;
list_add(&mnt->mnt_list, &ns->list); ns->root = mnt;
mnt->mnt_ns = ns;
init_task.nsproxy->mnt_ns = ns;
get_mnt_ns(ns);
root.mnt = ns->root;
root.dentry = ns->root->mnt_root;
set_fs_pwd(current->fs, &root);
set_fs_root(current->fs, &root);
}
在這里,將rootfs文件系統(tǒng)掛載,。它的掛載點默認為”/”.最后切換進程的根目錄和當前目錄為”/”.這也就是根目錄的由來,。不過這里只是初始化。等掛載完具體的文件系統(tǒng)之后,,一般都會將根目錄切換到具體的文件系統(tǒng),。所以在系統(tǒng)啟動之后,用mount命令是看不到rootfs的掛載信息的.
四:虛擬文件系統(tǒng)的掛載
根目錄已經(jīng)掛上去了,,可以掛載具體的文件系統(tǒng)了.
在start_kernel()àrest_init()àkernel_init():
static int __init kernel_init(void * unused) {
……
……
do_basic_setup();
if (!ramdisk_execute_command) ramdisk_execute_command = "/init"; if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) { ramdisk_execute_command = NULL; prepare_namespace();
}
/*
* Ok, we have completed the initial bootup, and * we're essentially up and running. Get rid of the * initmem segments and start the user-mode stuff.. */
init_post();
return 0;
}
do_basic_setup()是一個很關(guān)鍵的函數(shù),,所有直接編譯在kernel中的模塊都是由它啟動的。代碼片段如下:
static void __init do_basic_setup(void) {
/* drivers will send hotplug events */
init_workqueues();
usermodehelper_init();
driver_init();
init_irq_proc();
do_initcalls();
}
Do_initcalls()用來啟動所有在__initcall_start和__initcall_end段的函數(shù),,而靜態(tài)編譯進內(nèi)核的modules也會將其入口放置在這段區(qū)間里,。
跟根文件系統(tǒng)相關(guān)的初始化函數(shù)都會由rootfs_initcall()所引用。注意到有以下初始化函數(shù):
rootfs_initcall(populate_rootfs);
也就是說會在系統(tǒng)初始化的時候會調(diào)用populate_rootfs進行初始化,。代碼如下:
static int __init populate_rootfs(void) {
char *err = unpack_to_rootfs(__initramfs_start,
__initramfs_end - __initramfs_start, 0);
if (err)
panic(err);
if (initrd_start) {
#ifdef CONFIG_BLK_DEV_RAM int fd;
printk(KERN_INFO "checking if image is initramfs..."); err = unpack_to_rootfs((char *)initrd_start, initrd_end - initrd_start, 1); if (!err) {
printk(" it is\n"); unpack_to_rootfs((char *)initrd_start, initrd_end - initrd_start, 0); free_initrd();
return 0;
}
printk("it isn't (%s); looks like an initrd\n", err); fd = sys_open("/initrd.image", O_WRONLY|O_CREAT, 0700); if (fd >= 0) {
sys_write(fd, (char *)initrd_start, initrd_end - initrd_start); sys_close(fd);
free_initrd();
}
#else
printk(KERN_INFO "Unpacking initramfs..."); err = unpack_to_rootfs((char *)initrd_start, initrd_end - initrd_start, 0); if (err)
panic(err);
printk(" done\n");
free_initrd();
#endif
}
return 0;
}
unpack_to_rootfs:顧名思義就是解壓包,并將其釋放至rootfs,。它實際上有兩個功能,,一個是釋放包,一個是查看包,,看其是否屬于cpio結(jié)構(gòu)的包,。功能選擇是根據(jù)最后的一個參數(shù)來區(qū)分的.
在這個函數(shù)里,對應我們之前分析的三種虛擬根文件系統(tǒng)的情況,。一種是跟kernel融為一體的initramfs.在編譯kernel的時候,,通過鏈接腳本將其存放在__initramfs_start至__initramfs_end的區(qū)域。這種情況下,,直接調(diào)用unpack_to_rootfs將其釋放到根目錄.如果不是屬于這種形式的,。也就是__initramfs_start和__initramfs_end的值相等,長度為零,。不會做任何處理,。退出.
對應后兩種情況。從代碼中看到,,必須要配制CONFIG_BLK_DEV_RAM才會支持image-initrd,。否則全當成cpio-initrd的形式處理。
對于是cpio-initrd的情況,。直接將其釋放到根目錄,。對于是image-initrd的情況。將其釋放到/initrd.image.最后將initrd內(nèi)存區(qū)域歸入伙伴系統(tǒng),。這段內(nèi)存就可以由操作系統(tǒng)來做其它的用途了,。
接下來,內(nèi)核對這幾種情況又是怎么處理的呢,?不要著急,。往下看:
回到kernel_init()這個函數(shù):
static int __init kernel_init(void * unused) {
…….
…….
do_basic_setup();
/*
* check if there is an early userspace init. If yes, let it do all * the work
*/
if (!ramdisk_execute_command)
ramdisk_execute_command = "/init"; if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) { ramdisk_execute_command = NULL; prepare_namespace();
}
/*
* Ok, we have completed the initial bootup, and * we're essentially up and running. Get rid of the * initmem segments and start the user-mode stuff.. */
init_post();
return 0;
}
ramdisk_execute_command:在kernel解析引導參數(shù)的時候使用,。如果用戶指定了init文件路徑,即使用了“init=”,,就會將這個參數(shù)值存放到這里,。
如果沒有指定init文件路徑。默認為/init
對應于前面一段的分析,,我們知道,,對于initramdisk和cpio-initrd的情況,都會將虛擬根文件系統(tǒng)釋放到根目錄,。如果這些虛擬文件系統(tǒng)里有/init這個文件,。就會轉(zhuǎn)入到init_post()。
Init_post()代碼如下:
static int noinline init_post(void) {
free_initmem();
unlock_kernel();
mark_rodata_ro();
system_state = SYSTEM_RUNNING;
numa_default_policy();
if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0) printk(KERN_WARNING "Warning: unable to open an initial console.\n"); (void) sys_dup(0);
(void) sys_dup(0);
if (ramdisk_execute_command) {
run_init_process(ramdisk_execute_command);
printk(KERN_WARNING "Failed to execute %s\n", ramdisk_execute_command);
}
/*
* We try each of these until one succeeds.
*
* The Bourne shell can be used instead of init if we are * trying to recover a really broken machine.
*/
if (execute_command) {
run_init_process(execute_command);
printk(KERN_WARNING "Failed to execute %s. Attempting " "defaults...\n", execute_command); }
run_init_process("/sbin/init");
run_init_process("/etc/init");
run_init_process("/bin/init");
run_init_process("/bin/sh");
panic("No init found. Try passing init= option to kernel.");
}
從代碼中可以看中,,會依次執(zhí)行指定的init文件,,如果失敗,就會執(zhí)行/sbin/init, /etc/init,, /bin/init,/bin/sh
注意的是,,run_init_process在調(diào)用相應程序運行的時候,,用的是kernel_execve。也就是說調(diào)用進程會替換當前進程,。只要上述任意一個文件調(diào)用成功,,就不會返回到這個函數(shù)。如果上面幾個文件都無法執(zhí)行,。打印出沒有找到init文件的錯誤,。
對于image-hdr或者是虛擬文件系統(tǒng)中沒有包含 /init的情況,會由prepare_namespace()處理,。代碼如下:
void __init prepare_namespace(void) {
int is_floppy;
if (root_delay) {
printk(KERN_INFO "Waiting %dsec before mounting root device...\n", root_delay);
ssleep(root_delay);
}
/* wait for the known devices to complete their probing */ while (driver_probe_done() != 0)
msleep(100);
//mtd的處理
md_run_setup();
if (saved_root_name[0]) {
root_device_name = saved_root_name; if (!strncmp(root_device_name, "mtd", 3)) { mount_block_root(root_device_name, root_mountflags); goto out;
}
ROOT_DEV = name_to_dev_t(root_device_name); if (strncmp(root_device_name, "/dev/", 5) == 0) root_device_name += 5; }
if (initrd_load())
goto out;
/* wait for any asynchronous scanning to complete */ if ((ROOT_DEV == 0) && root_wait) { printk(KERN_INFO "Waiting for root device %s...\n", saved_root_name);
while (driver_probe_done() != 0 || (ROOT_DEV = name_to_dev_t(saved_root_name)) == 0) msleep(100);
}
is_floppy = MAJOR(ROOT_DEV) == FLOPPY_MAJOR; if (is_floppy && rd_doload && rd_load_disk(0)) ROOT_DEV = Root_RAM0;
mount_root();
out:
sys_mount(".", "/", NULL, MS_MOVE, NULL); sys_chroot(".");
}
這里有幾個比較有意思的處理,,首先用戶可以用root=來指定根文件系統(tǒng)。它的值保存在saved_root_name中,。如果用戶指定了以mtd開始的字串做為它的根文件系統(tǒng),。就會直接去掛載。這個文件是mtdblock的設備文件,。
否則將設備結(jié)點文件轉(zhuǎn)換為ROOT_DEV即設備節(jié)點號
然后,,轉(zhuǎn)向initrd_load()執(zhí)行initrd預處理后,再將具體的根文件系統(tǒng)掛載,。
注意到,,在這個函數(shù)末尾。會調(diào)用sys_mount()來移動當前文件系統(tǒng)掛載點到”/”目錄下,。然后將根目錄切換到當前目錄,。這樣,根文件系統(tǒng)的掛載點就成為了我們在用戶空間所看到的”/”了.
對于其它根文件系統(tǒng)的情況,會先經(jīng)過initrd的處理,。即
int __init initrd_load(void) {
if (mount_initrd) {
create_dev("/dev/ram", Root_RAM0); /*
* Load the initrd data into /dev/ram0. Execute it as initrd * unless /dev/ram0 is supposed to be our actual root device, * in that case the ram disk is just set up here, and gets * mounted in the normal path.
*/
if (rd_load_image("/initrd.image") && ROOT_DEV != Root_RAM0) { sys_unlink("/initrd.image");
handle_initrd();
return 1;
}
}
sys_unlink("/initrd.image");
return 0;
}
建立一個ROOT_RAM)的設備節(jié)點,,并將/initrd/.image釋放到這個節(jié)點中,/initrd.image的內(nèi)容,,就是我們之前分析的image-initrd,。
如果根文件設備號不是ROOT_RAM0( 用戶指定的根文件系統(tǒng)不是/dev/ram0就會轉(zhuǎn)入到handle_initrd()
如果當前根文件系統(tǒng)是/dev/ram0.將其直接掛載就好了。
handle_initrd()代碼如下:
static void __init handle_initrd(void) {
int error;
int pid;
real_root_dev = new_encode_dev(ROOT_DEV); create_dev("/dev/root.old", Root_RAM0);
/* mount initrd on rootfs' /root */ mount_block_root("/dev/root.old", root_mountflags & ~MS_RDONLY); sys_mkdir("/old", 0700);
root_fd = sys_open("/", 0, 0); old_fd = sys_open("/old", 0, 0); /* move initrd over / and chdir/chroot in initrd root */ sys_chdir("/root");
sys_mount(".", "/", NULL, MS_MOVE, NULL); sys_chroot(".");
/*
* In case that a resume from disk is carried out by linuxrc or one of * its children, we need to tell the freezer not to wait for us. */
current->flags |= PF_FREEZER_SKIP;
pid = kernel_thread(do_linuxrc, "/linuxrc", SIGCHLD); if (pid > 0)
while (pid != sys_wait4(-1, NULL, 0, NULL)) yield();
current->flags &= ~PF_FREEZER_SKIP; /* move initrd to rootfs' /old */
sys_fchdir(old_fd);
sys_mount("/", ".", NULL, MS_MOVE, NULL); /* switch root and cwd back to / of rootfs */ sys_fchdir(root_fd);
sys_chroot(".");
sys_close(old_fd);
sys_close(root_fd);
if (new_decode_dev(real_root_dev) == Root_RAM0) { sys_chdir("/old");
return;
}
ROOT_DEV = new_decode_dev(real_root_dev);
mount_root();
printk(KERN_NOTICE "Trying to move old root to /initrd ... "); error = sys_mount("/old", "/root/initrd", NULL, MS_MOVE, NULL); if (!error)
printk("okay\n");
else {
int fd = sys_open("/dev/root.old", O_RDWR, 0); if (error == -ENOENT)
printk("/initrd does not exist. Ignored.\n"); else
printk("failed\n");
printk(KERN_NOTICE "Unmounting old root\n"); sys_umount("/old", MNT_DETACH); printk(KERN_NOTICE "Trying to free ramdisk memory ... "); if (fd < 0) {
error = fd;
} else {
error = sys_ioctl(fd, BLKFLSBUF, 0); sys_close(fd);
}
printk(!error ? "okay\n" : "failed\n"); }
}
先將/dev/ram0掛載,,而后執(zhí)行/linuxrc.等其執(zhí)行完后,。切換根目錄,再掛載具體的根文件系統(tǒng).
到這里,。文件系統(tǒng)掛載的全部內(nèi)容就分析完了.
五:小結(jié)
在本小節(jié)里,。分析了根文件系統(tǒng)的掛載流程。并對幾個虛擬根文件系統(tǒng)的情況做了詳細的分析,。理解這部份,,對我們構(gòu)建linux嵌入式開發(fā)系統(tǒng)是很有幫助的.
PS:參考資料:ibm技術(shù)論壇的<<Linux2.6 內(nèi)核的 Initrd 機制解析>>
附根文件系統(tǒng)掛載流程圖
我的更多文章
|
|