0xdde Aug 7 2014 at 17:56

fork() vs. vfork()

15 min

40K

Embox corporate blogSystem Programming*C*

From sandbox

+68

Comments 29

datacompboy Aug 7 2014 at 20:44

Сильное решение, объёмный труд. Молодцы!
А зачем без MMU и без их эмуляции?

abondarev Aug 8 2014 at 11:07

Автор написал, что он занимается встроенными системами, а для них зачастую используют процы без MMU, например, cortex-Mx.

rafuck Aug 7 2014 at 22:01

Интересно, какая мотивация использовать vfork вместо потока?

rafuck Aug 7 2014 at 22:19

Вообще, сейчас полчаса мучительно вспоминал, где читал про vfork. И вспомнил. «Linux. Системное программирование», Р. Лав. Там, в частности говорится, что в современных ядрах Linux fork «ленивый», в том смысле, что реальное копирование виртуальных страниц осуществляется лишь при изменении оных (насколько помню, в BSD это не так). Осмелюсь привести выдержку из книги, посвященную vfork.

Скрытый текст

До внедрения страниц, поддерживающих копирование при записи, разработчики UNIX были вынуждены реализовывать бесполезное копирование адресного про странства в течение ветвления, сразу за которым следовало выполнение exec. В связи с этим разработчики BSD представили в 3.0 BSD системный вызов, который называется vfork:
#include <sys/types.h>
#include <unistd.h>
pid_t vfork (void);
Успешное исполнение vfork() работает так же, как и fork(), кроме того, что дочерний процесс должен немедленно успешно вызвать одну из функций exec или завершиться, вызвав _exit() (будет рассмотрен в следующем разделе). Система vfork() не выполняет копирования адресного пространства и таблиц страниц, от носящихся к родительскому процессу, пока дочерний не завершится или не вы полнит новый двоичный образ. Между этим родительский и дочерний процессы совместно используют — без семантики копирования при записи — свое адресное пространство и страницы с табличными записями. Фактически единственная работа, выполняемая vfork(), — дублирование внутренней структуры данных ядра. Следовательно, дочерний процесс не должен модифицировать никаких данных в памяти адресного пространства.
Системный вызов vfork() является архаизмом и не должен реализовываться в Linux, хотя, надо отдать должное, даже с учетом копирования при записи vfork() работает быстрее fork(), так как отпадает необходимость в самом копировании страниц. В любом случае появление страниц с поддержкой копирования при записи, любые аргументы в пользу альтернатив fork() утрачивают силу. Действительно, до появления ядра Linux 2.2.0 vfork() был просто оболочкой для fork(). Требования для vfork() менее строгие, чем для fork(), поэтому данная реализация вполне осуществима.
Строго говоря, ни одно внедрение vfork() не застраховано от ошибок. Представьте, что вызов exec завершился сбоем: родительский процесс будет находиться в за блокированном состоянии, пока дочерний процесс не найдет способа разрешить эту ситуацию или не завершится. В программах лучше использовать fork() напрямую.

abondarev Aug 8 2014 at 11:25

Возможно fork и ленивый, действительно таблицы помещаются флагом copy-on-write, что кстати в статье указано, Но тогда не понятно, зачем же в Linux добавили clone, если могли бы использовать fork. Вот ссылка на википедию, статья fork

khim Apr 20 2015 at 19:45

Вы задаёте неправильный вопрос и потому никак не можете на него получить правильный ответ :-)

asm-generic/unistd.h

…
#define __NR_clone 220
…
#define __NR_vfork 1071
…
#define __NR_fork 1079
…

Догадываетесь о чём я? Подсказка: номера сисколлам выдаются более-менее в порядке их появления в ядре :-)

abondarev Apr 21 2015 at 13:29

Хорошо. Перефразирую:

Почему же сначала добавили clone, а не полноценную поддержку fork.

Так лучше?:)

khim Apr 21 2015 at 14:41

Не совсем. Тут уже начинает работать принцип: зачем задавать вопрос, ответ на который вы знаете? Или действительно не знаете? Не верю.

Чисто для справки, чтобы не было ненужных споров (это из исходников ядра):

SYSCALL_DEFINE5(clone, unsigned long, clone_flags, unsigned long, newsp,
		 int __user *, parent_tidptr,
		 int __user *, child_tidptr,
		 int, tls_val)
{
	return do_fork(clone_flags, newsp, 0, parent_tidptr, child_tidptr);
}
SYSCALL_DEFINE0(fork)
{
	return do_fork(SIGCHLD, 0, 0, NULL, NULL);
}
SYSCALL_DEFINE0(vfork)
{
	return do_fork(CLONE_VFORK | CLONE_VM | SIGCHLD, 0,
			0, NULL, NULL);
}

rafuck Aug 7 2014 at 22:32

Извиняюсь, читал большей частью код, а текст — по диагонали, потому абзац про pthreads пропустил. Вопрос снимается

-1

jcmvbkbc Aug 7 2014 at 22:33

vfork — это всегда новый процесс, с новым исполняемым кодом. Идея замены его потоком не подходит никак.

rafuck Aug 7 2014 at 22:42

Мы же про Linux говорим, так? С точки зрения ядра там поток и процесс практически идентичны. В данном контексте vfork от pthread будет отличаться процессом-родителем, файловыми дескрипторами, ну и обработчики сигналов. Я к тому, что если требуется наличие общего адресного пространства с процессом-родителем, то это pthread. Если нужен клон процесса с отдельным адресным пространством, то это fork. А зачем vfork?

jcmvbkbc Aug 7 2014 at 22:46

vfork — это оптимизированный fork, на тот случай, когда дочерний процесс сразу вызывает exec.

rafuck Aug 8 2014 at 00:28

Fork — это копия процесса. Vfork — то же самое, но без адресного пространства. Можете называть это «оптимизацией». Также можно pthread_create называть «оптимизацией» vfork. Но оптимизация подразумевает, что делается то же самое, но меньшей ценой. Тут это не так. Вот нынешний «ленивый» fork в Linux — это оптимизация.

jcmvbkbc Aug 8 2014 at 03:10

можно pthread_create называть «оптимизацией» vfork

Нельзя, потому что pthread всегда запускается на новом стеке, в то время как vfork получает все регистры от родителя и гадит прямо на стек родителя.

оптимизация подразумевает, что делается то же самое, но меньшей ценой

В рамках дополнительных ограничений наложенных на него, vfork делает именно это.

rafuck Aug 8 2014 at 03:52

vfork не делает того же, что форк. (точка) Это не оптимизация. Про треды вы могли не уточнять.

jcmvbkbc Aug 8 2014 at 04:12

Вот вам ещё немного точек: [..........], не нервничайте так, всё будет хорошо.

-1

khim Apr 20 2015 at 19:49

Нельзя, потому что pthread всегда запускается на новом стеке, в то время как vfork получает все регистры от родителя и гадит прямо на стек родителя.

Куда там запускается pthread никого не волнует. Системный вызов возвращается в обоих процессах в одну и ту же точку. И да, изначально в Linux и fork(2) и vfork(2) были реализованы поверх clone(2). Отдельные системные вызовы появились относительно недавно (ну как недавно… лет десять назад) для того, чтобы полностью поддержать какие-то тонкие моменты из спецификации POSIX, связанные с сигналами.

jcmvbkbc Apr 20 2015 at 20:29

Вы это просто так сказали, или в поддержку какого-то тезиса?

Системный вызов возвращается в обоих процессах в одну и ту же точку.

Только в разном состоянии. И в случае vfork родитель не продолжит выполнения до тех пор, пока потомок не вызовет exec.

khim Apr 20 2015 at 21:34

Вы это просто так сказали, или в поддержку какого-то тезиса?

Системный вызов возвращается в обоих процессах в одну и ту же точку.

Это в ответ на ваше утверждение про то, что pthread всегда запускается на новом стеке. Нет, он не запускается на новом стеке, у двух процессов в момент возврата из сисколла стек общий. Переключение на другой стек делает уже библиотека pthreads, но её обёртку, как бы, использовать не обязательно.

jcmvbkbc Apr 20 2015 at 22:33

Нет, он не запускается на новом стеке

Интересно, где это так?
Вот я читаю uClibc/libpthread/nptl/pthread_create.c и почти первой строчкой в функции __pthread_create_2_1 стоит

  int err = ALLOCATE_STACK (iattr, &pd);

Читаю glibc — почти то же самое.

khim Apr 21 2015 at 01:44

Oops. Почему-то решил, что обсуждаются clone(2) и fork(2), а не pthread_create(3) и fork(2) — просто как-то не приходило в голову никогда сравнивать системные вызовы и библиотечные функции, они у меня в голове как-то немного в разных местах живут. Извиняюсь за дезинформацию. Да, разумеется, pthread_create(2) — это не «оптимизация»…

monah_tuk Aug 8 2014 at 07:30

Если мне не изменяет память, то как раз наоброт. Изначально fork в Linux был простым и ленивым, и необходимости в vfork не было. Затем появлялись новые граничные условия, fork усложнялся, в результате от ленивости пришлось уйти. И тогда возникла необходимость в vfork. Чёрт, вот не могу найти статью по этому поводу, буквально два месяца назад поднимал.

abondarev Aug 8 2014 at 11:20

Я читал, что vfork появился в BSD, когда они сказали, что не хотят каждый раз создавать адресное пространство. Потом это внесли в POSIX, а Linux долго использовал vfork как обертку над fork.

monah_tuk Aug 8 2014 at 15:11

Да, что гадать, я считаю ман первоисточником, а там именно твоя точка зрения рассказана. Т.е. или статья гнала или я не так понял.

Единственно, что до ядра 2.2.0-pre6 vfork и fork были синонимами. После vfork стал тем, кем он есть. Ну а по сути своей в Linux они сводятся в системному вызову clone() с разными флагами. В BSD схожая картина была.

Ну и для информации разработчикам: POSIX.1-2008 removes the specification of vfork().

abusalimov Aug 8 2014 at 01:43

Если нужен клон процесса с отдельным адресным пространством, то это fork. А зачем vfork?

vfork — это если нужен процесс с отдельным адресным пространством, но не полноценный клон, а достаточный лишь для выполнения вызова exec(), который очень часто следует за fork'ом. И в таком смысле vfork можно назвать оптимизацией.

В общем же смысле это конечно не оптимизация, какой-нибудь андроидовый zygote можно реализовать только fork'ом.

Я бы назвал vfork костылём, но пришедшимся, видимо, очень кстати, поскольку он покрывает очень частый сценарий использования fork в связке с exec, достигая того же самого, но меньшей кровью.

rafuck Aug 8 2014 at 04:06

Полностью согласен. Но замечу, что в том варианте, когда за fork следует exec, «оптимизация» при помощи vfork не является краеугольным камнем производительности системы.

abondarev Aug 8 2014 at 11:17

Не соглашусь. В статье приводится сравнительная таблица, Из нее следует, что в некоторых случаях получается приличный выигрышь в производительности. Могу привести один случай. Создавалась встроенная система, ATM коммутатор, в ней использовался синтезируемый процессор Microblaze, в этом процессоре нет полноценной MMU поддержки, а есть только TLB. Для управления устройством решили использовать готовые решения ну и обернуть все это в скрипты. Обнаружились жуткие тормоза, окозалось что вот этот самый fork выполняется десятки-сотни милисекунд. То есть это была самая жрущая операция, которую стоило оптимизировать. Может это и редкий пример, но он реальный. Поэтому когда оптимизация дается таким простым образом, мне кажется это надо использовать.

monah_tuk Aug 8 2014 at 07:26

Не всегда доступен posix_spawn, а для exec нужен именно процесс, т.к. при exec текущий замещается новым. Если это будет поток, у тебя всё приложение заместится.

JIghtuse Aug 9 2014 at 10:53

Мощная статья, спасибо.

Рекомендую вместо странного сайта linuxmanpages использовать online-страницы мэйнтэйнера manpages, man7.org. Там всегда самые свежие версии манов. vfork (2).

Немного смутил неконсистентный порядок констант и переменных в if:

if (-1 == pid) {
        /* ... */
}
if (pid == 0) {
        /* ... */
}

if (0 > child_pid) {
        /* ... */
}
/* ... */

if (res < 0) {
        /* ... */
}