我目前正在学习fork(),execv()并且对组合的效率存在疑问。
fork()
execv()
向我显示了以下标准代码:
pid = fork(); if(pid < 0){ //handle fork error } else if (pid == 0){ execv("son_prog", argv_son); //do father code
我知道这会fork()克隆整个过程(复制整个堆等),并execv()用新程序替换当前地址空间。考虑到这一点,使用该组合是否会导致效率低下?我们正在复制进程的整个地址空间,然后立即覆盖它。
所以我的问题是: 即使我们浪费了,使用此组合(而不是其他解决方案)有什么好处呢?
使用此组合(而不是其他解决方案)有什么好处,即使我们有浪费,该组合仍然可以使人们继续使用它?
您必须以某种方式创建一个新流程。用户空间程序很少有实现此目的的方法。POSIX曾经有vfork()alognside fork(),并且某些系统可能具有自己的机制,例如特定于Linux的机制clone(),但是自2008年以来,POSIX仅指定fork()和posix_spawn()系列。该fork+ exec路线是比较传统的,是很好理解的,并且有一些缺点(见下文)。该posix_spawn系列专为 特殊用途的 替代品的使用环境中,对于目前的困难fork(); 您可以在其规格的 “ 规格 ”部分中找到详细信息。
vfork()
clone()
posix_spawn()
fork
exec
posix_spawn
Linux手册页中的以下摘录vfork()可能很有启发性:
在Linux下,fork(2)是使用写时复制页面实现的,因此fork(2)唯一的代价就是复制父级的页表并为子级创建唯一的任务结构所需的时间和内存。但是,在过去的糟糕日子中,fork(2)通常需要不必要地制作呼叫者数据空间的完整副本,因为通常在此之后立即exec完成(3)。因此,为了提高效率,BSD引入了vfork()系统调用,该系统调用没有完全复制父进程的地址空间,而是借用了父进程的内存和控制线程,直到发生对execve(2)的调用或退出。当孩子使用其资源时,父进程被暂停。指某东西的用途vfork()很棘手:例如,在父进程中不修改数据取决于知道哪些变量保存在寄存器中。
vfork
execve
(已强调)
因此,您对浪费的担忧在现代系统(不限于Linux)中没有充分的根据,但是从历史上看确实是一个问题,并且确实有一些机制可以避免这种情况。如今,这些机制大多数已过时。