xv6学习笔记

Jason Li 收录于 Review

2024-06-16 约 4300 字预计阅读 9 分钟

前言

标题所指的xv6是MIT的计算机操作系统课程S.081

Q: 为什么没有代码，只有解析？

A: 网上有本课程的代码解析，而且作者很懒，这点很重要！

LEC 1: util

环境部署

上来就在环境部署上遇到了点小问题，虽然别人不太可能遇到，但仍记录在此，仅作参考。

我用的是Gentoo Linux，通过crossdev编译出的riscv64-unkown-linux-gnu是不可用的，个人猜测是因为它链接了Linux的一些库，而xv6是裸二进制的elf环境。（对于toolchain并不熟悉，欢迎指正）。

Gentoo官方配置编译出的qemu对于xv6也是不可用的状态,没有任何输出（QEMU_SOFTMMU_TARGETS=“riscv64”），可能是版本太高了导致不兼容…

2024.7.4更新：

关于qemu没有输出的问题，可以换用2023版的xv6(git clone git://g.csail.mit.edu/xv6-labs-2023)。

二者的解决方案是一样的，就是按照课程的教程下载编译安装对应的软件。安装位置可以选在/opt,最后在.[zsh,bash]rc里加上:export PATH="/opt/qemu/bin:/opt/riscv-gcc/bin:%PATH"

xargs.c

一开使有一个小问题没注意到，xv6要求的xargs是将每一行的输入都与argv单独合并。

比如，假设xv6的echo支持转义符，echo "hello\nworld" | xargs echo print:，应该打印出两行两个print:，而非两行一个print:

所以最后执行exec的时候，应该维护一个*xargv[],将argv[1:]与stdin的一行输入进行合并。

同时，应该注意到read()读取到\n的时候应该在字符串末尾写入\0而非\n。

primes.c

这个程序难就难在debug环节上，很难仅靠程序本身打印log的方式纠错。我的解决方案是替换掉头文件(unistd.h)然后在本地环境下编译调试。

需要注意到如果在父进程中关闭了管道(pipe)，管道里的缓存会被同时清空。所以父进程可以在输出完后再写入一个0(EOF)，并交由子进程关闭管道。

在编写的时候不宜过早优化，可以在确定算法正确性后再优化管道数使用的问题。可以用一个栈(stack)来管理可用的管道，至于要不要给栈上锁，我觉得在这个例子里是不需要的：唯一的问题就是栈可能为空。

LEC 2: syscall

trace

这题本身不难，只要想到用类似p->mask & 1 << num来判定flag，就解决了一半。

依照“没有困难，创造困难也要上”的最高指示，所有的编译环境是部署在Thinkpad T61上——一个年过15的老同志上。它来处理一个虚拟内存只有128M的虚拟机是绰绰有余的，但是问题出在这道题的测试样例上:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
// user/usertests.c:917

void
forkforkfork(char *s)
{
    ...
    while(1){
      int fd = open("stopforking", 0);
      if(fd >= 0){
        exit(0);
      }
      if(fork() < 0){
        close(open("stopforking", O_CREATE|O_RDWR));
      }
    }
    ...
    wait(0);
    ...
}

由于fork()本身的特性，它的返回时间依赖它的所有子进程。所以在通过了所有其他测试样例的大前提下，这个测试却没有任何输出：

大概是这样

在继约半小时撸码后的两个小时debug时间里，一度怀疑人生。最后发现bug在电脑上，所有fork()执行完需要5min，而测试的时限是30s…

换成7900x跑了一下只要1.3s…

LEC 4: pgtbl

这里的三道题都要求你看懂与其相关的大部分函数，也或多或少都是可以通过魔改现有函数来解题的。比如copyin里，要在exec()里将对进程页表的修改同时也映射到私有的内核页表里。直接修改uvmalloc()应该也是可行的，但是也可以借鉴一下uvmcopy()来一次性的映射所有内存。

题目有的指示比较隐晦，比如You’ll need a way to free a page table without also freeing the leaf physical memory pages 看上去似乎要找出什么小trick，但实际上只要看一眼freewalk()的代码就明白了。

LEC 8 lazy:

题目相对比较简单，也是因为主要思路和代码已经在课上给出。

但还有一些小坑：第三问第四小条—— Handle the case in which a process passes a valid address from sbrk() to a system call such as read or write, but the memory for that address has not yet been allocated. 简单阅读源代码后可以定位到syscall.c里的argaddr()函数，简单的复制trap.c里的修改是通过不了validatetest的。首先需要调用walkaddr函数验证*ip是否已经分配过了。然后很重要的一点来了：如果地址不合法，p->killed = 1并不会像在usertrap()里那样使进程正确的退出，应直接return -1交由对应的SYS_*函数处理。

LEC 10 COW:

这个lab是我目前花时间最多的一个，比pgtbl还多。原因有几个，题目给的提示比较少，至少相对于它的难度而言；再有我个人的问题，前期急于验证程序的正确性而到处添加修改，存有侥幸心理，忽略了这题可以将函数解耦从而简化调试。

一开始开了一个ref_count[PHYSTOP/PGSIZE]的大数组用来引用计数，然后想着全部初始化为0会方便一些，结果有些页总是会被提前释放。之后改成了初始化为1，父进程的引用也算一次，逻辑上也更说得通。

最麻烦的是要通过usertests，很多组测试都会在memmove上触发kerneltrap。用gdb看了一下，参数src，和dst都会出现为0的情况，说明复制COW页面的时候缺少了检查pa和va的步骤。这些条件在usertrap()和copyout()里都要用到。

这里也发现了一个使用gdb调试的小技巧——要想跳转到memmove在内核崩溃前的最后一次（接近）执行，可以先加载用户程序的符号，在测试函数那里断下。再加载内核符号，在memmove断下，这样就不用一步一步跳转了。

LEC 11 thread:

这一个lab比较简单，唯一一个卡住的点在第一题。在thread_create()里忘记了栈是向上增长的，把寄存器sp直接指向了t->stack。这里导致了一个很有意思的结果，uthread只会运行c的循环，输出类似于：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
$ uthread
thread_a started
thread_b started
thread_c started
thread_c 0
thread_c 1
thread_c 2
...
thread_c 99
thread_c: exit after 100
thread_schedule: no runnable threads
$ 

这是因为stack在向下生长的时候把内存里相邻的上一个thread结构体改写了，其中的state如果被改写成别的，那么thread_schedule就可能永远不会切换到它。

LEC 13 lock:

又是一个比较难的lab，但运气很好，没怎么调试就过了——GDB无启动通关（逃。这个实验的描述很长，给的hints也不是按线索一条一条的，所以并没有一步一步边写边调试地推进；而是在脑子里构思好后直接一步到位。

bcache这里可以参考一下2023年的提示，相比于2020年，并没有要求使用ticks来选择buf。我在删去有关ticks的所有判断后，从之前的循环700+直接降到稳定50+ 个人认为这是一个取巧妥协的解法，只判断refcnt == 0肯定会释放掉一些最近使用的缓存。但这只是没有profiling的一些猜测

至于hash table的实现，我借用了上一个lab里ph.c的实现，开了13个bucket，都初始化为空的链配上一个锁。 bget()如果在哈希表里搜不到就会直接去buf里找refcnt == 0，buf就是原本的bcache结构体里的buf[NBUF]。这样实现可以直接复用buf结构体里的链表，比较简单。

LEC 15 FS:

两个lab标定的难度都是中等，看文档的难度却是困难：几层封装下来十几个重要的函数加上“若隐若现”的locks可以说是隐藏难度的巅峰之作了。

第一个：支持大文件，报错panic: virtio_disk_intr status，查了半天发现是inode结构体没改，导致addrs大小变成12了。但想了半天也没明白为什么会是在这里panic

第二个：软连接，提示说把target存到一个地方，可以是“inode’s data blocks”，我理解成在inode结构体里加一个字符串存储。又专门写了个函数去递归找原始文件。写的时候才发现还有这么个函数writei，才明白“data blocks”就是字面意思……

总之就是多看看文档，关注一下关键函数。

LEC 17 mmap:

大杂烩lab，文件系统、页表和中断都涉及到了。工程量比较大，但难度不大。

实现完mmap后遇到一个问题：mmaptest在test1报错读不到0。看了一下test1的代码，它只往文件里写了3/2个PGSIZE（6144）的’A’，所以触发page fault后惰性分配的时候要把页初始化成0。

还有个问题就是filewrite函数会导致调用sched，所以不能在持有锁的情况下调用它。以及一些vm.c里的函数会检查PTE_V，都可以忽略掉，因为我们是lazy allocation，会出现这种情况。

LEC 20 net:

终于来到最后一个lab了，但是上来就是一头雾水：410页的pdf，一堆没有注释的结构体、宏定义，还好老师给我们圈了一个范围，虽然是整个黑板。。。仔细看了一眼e1000_init()，大概弄明白了结构体里每一个值的作用，直接秒杀了e1000_transmit()。

然而在e1000_recv()出了问题，panic: acquire，很明显是e1000_lock有问题。gdb看了一眼，发现net_rx()对于某些包又会调用e1000_transmit()来应答，再次要持有同一个锁，然后就“内核恐慌”了。这里有两个办法，一个是在调用net_rx()前释放掉锁，或者就直接上锁了。考虑到我可能在我不知道的情况下“维护”着某些不变量，所以用的是前者。

又在multi-process pings卡死了，我一开以为是遇到了题目中所说的溢出了的情况(At some point the total number of packets that have ever arrived will exceed the ring size (16))。又是一番debug发现是因为之前e1000_transmit()上锁的时候一下子发了10个包，也至少收到了一个，但是我的e1000_recv()一次只处理了一个包，其他的中断信号在上锁的时候被忽略了，改成一个while循环就好了。

总结

在xv6这门课上断断续续花了正好3个月(Apr 27-Jul 27)，期间有近一个月在备考。跨度之大，让我在5台不同的电脑上安装了qemu。这门可的难度对于只是完成lab作业来说要求并不是很高，但是自问对于每一个小细节的思考和理解我认为自己还有远有不足：对于进程的理解有些含糊、最后的几篇paper看的也比较不走心。但是总的来说收获很大，绝对称得上是我对计算机理解的一个突破。同时，这对于即将到来的大学学习必定也有着巨大的帮助，让我更加清楚自己的研究方向，也给了我信心去研究其他操作系统的代码。

故事并没有完结，这篇文章还会被翻译成英文发布，所有“附加题”也都还没有被探索呢！

Xv6学习笔记

前言