Anonym 15 дек 2011 в 07:59

Демоны на PHP

4 мин

75K

PHP*

Из песочницы

+146

125

Комментарии 125

Chvanikoff 15 дек 2011 в 08:34

Можно было бы воспользоваться деструктором и обойтись без stopServer — на мой взгляд, это было бы красивее.

Anonym 15 дек 2011 в 08:38

Объясните пожалуйста подробнее, что вы имели ввиду. При использовании флага демон дождется завершения дочерних процессов и корректно завершится сам, что будет при использовании деструктора?

Chvanikoff 15 дек 2011 в 08:48

Я имел в виду, что предпочел бы вместо

$this->stop_server = true;

использовать

exit(1);

который вызывает метод __destruct(), где можно завершить все, что нужно
Ну и вместо

while (!$this->stop_server)

использовать

while(TRUE)

P.S.: про деструктор — это я на всякий случай написал, суть комментария была в том, что можно бы и без флага обойтись. В конкретно Вашем случае деструктор и не нужен — никакой «работы по очистке» не выполняется, но если бы она понадобилась, и стояла бы у Вас после while(! $this->stop_server) {...}, то, ее можно было бы вынести в деструктор.

Anonym 15 дек 2011 в 08:52

А разве exit(1); дождется завершения очередного такта цикла?

Chvanikoff 15 дек 2011 в 08:59

Не дождется, я был неправ. Извиняюсь за свою невнимательность — пойду-ка посплю… :)

AxisPod 15 дек 2011 в 09:17

Последовательность выполнения деструкторов не определена. Надеяться на деструктор нельзя, сам огребал с этим много непонятных багов. Просто подобные вещи делаются методами, а не свойствами.

Psih 15 дек 2011 в 11:28

Подтверждаю, делал для одного проекта кастомный скелет приложения, там решил сделать деинициализацию по деструкторам. Огрёб по голове, почитал, подумал, реализовал в виде ручного вызова деструктора у ядра, которое все модули правильно по зависимостям убивало тоже вызовом деструкторов и не зацикливалось.
В общем-то сделать это не проблема, но нужно предусматривать это сразу.

smarteq 15 дек 2011 в 09:43

Спасибо Вам, добрый человек)

Начинающие экзорцисты довольны)

Все доступно и понятно новичку, который хотел попробовать написать демона, но не решался потому что не понимал как это сделать!

Anonym 15 дек 2011 в 09:54

Я старался донести основную мысль как можно более просто и понятно, т.к. сам с трудом разобрался в этой теме. Найденные мной статьи не отражали в полной мере основ, поэтому пришлось собирать информацию по кусочкам.
Возможно более опытные экзорцисты просто не находят здесь ничего сложного ))

440hz 15 дек 2011 в 09:54

с вводом/выводом прикольно. не знал. спасибо.

остальное в прошлом. проблемы будут когда демон будет работать. а просто запустить несколько дочерних процессов не фокус. фокус как обработку по деткам раскидать и асинхронно ввод/вывод обработать на libevent. вот тут бубнов и танцов много.

в свое время писали игрового демона с Вадимом Крючковым, который HTTP запросы обрабатывает и с БД работает и других демонов дергает. много интересного поимел. дитя было одно. асинхронное. демонов было много. был весело.

440hz 15 дек 2011 в 09:57

где то тут на хабре был исходник демки (отвечал в тему phpDaemon), которую представляли на phpconf. там как раз все это разжевано было.

но автору большое спасибо. +1. понастальгироавл.

Irker 15 дек 2011 в 10:09

Не подскажите какую-нибудь хорошую статью про обмен данными между процессами? Всегда возникали проблемы именно с этим. С демонами и libevent обычно все просто.

Anonym 15 дек 2011 в 10:21

Статью, к сожалению, не подскажу. Копать в сторону пайпов и сокетов.

Irker 15 дек 2011 в 10:29

В родительском процессе создавать слушающий сокет, а всех дочерних подключать к нему? Думал на эту тему. Но как-то смущает. Насчет пайпов покурю. Еще смотрел в сторону общей памяти, симофоров и тд. Вот и хотелось бы посмотреть на чужой опыт, может уже есть достаточно хорошее решение.

Anonym 15 дек 2011 в 10:31

Напишите пожалуйста, если найдете хороший пример использования.

seriyPS 15 дек 2011 в 15:30

ИМХО можно stdin/stdout обойтись и не плодить тыщу лишних сокетов/пайпов.

Treg 16 дек 2011 в 01:59

www.php.net/manual/en/function.socket-create-pair.php
Смотрите Example #2

ukko 15 дек 2011 в 17:50

Я как-то начинал описывать работу с демонами в своём блоге, может эти заметки покажутся вам полезными

Irker 15 дек 2011 в 18:10

Спасибо. Все верно написано. Но я извиняюсь — уточню в чем у меня были еще проблемы. Было желание, чтобы процессы могли уведомлять друг друга о том, что новые данные появились. Тут как раз выигрывали сокеты, тк. все равно использовался libevent. С shared memory, я как понимаю такое можно организовать только запрашивая данные по таймеру.

ukko 15 дек 2011 в 18:17

Вы могли бы построить свою схему на очередях, где можно было бы присылать даже какие-то данные, или же можно было бы слать сигналы.

Irker 15 дек 2011 в 18:30

Судя по вашему примеру в статье проверка очереди заблокирует выполнение программы (у меня libevent же используется), или же придется опять использовать таймеры. Вот насчет сигналов — надо проверить. Поидее должно сработать.

Anonym 15 дек 2011 в 10:22

Ну это ведь статья для «начинающих экзорцистов» )

AxisPod 15 дек 2011 в 10:57

Писал на сях, не сильно огребал, boost::asio хорошо помог в этом) А вот писать сложные демоны на php это все же некое извращение.

akalend 15 дек 2011 в 23:14

тоже стараюсь все демоны писать на сях, но вот выпал случай реализовать демона на пхп

zyaleniyeg 15 дек 2011 в 10:43

всегда интересовал вопрос практического применения демонов на PHP? кто нить юзает их именно на PHP и с какой целью? :)

Anonym 15 дек 2011 в 10:49

А какая разница на чем писать демона, на php или, к примеру на perl?

-1

НЛО прилетело и опубликовало эту надпись здесь

440hz 15 дек 2011 в 13:38

это мы и были. ниче не пухло. работало на продакшене. демоны были прослойками объектов между фронтом и БД. т.е. вся логика, обсчет персов, бои работала в демонах. фронт тупо туда лазил.

прикольно было организовать таймеры в демоне (на libevent). когда вызывался нужный метод через определенное время. например для сброса меченных данных в БД.

так же демон общался по HTTP/REST. транспортом летел JSON.

в общем было хорошо, интересно и ново.

в эту нашу разработку как раз Тони и пофиксил баги в php_libevent.

akalend 15 дек 2011 в 23:23

мои демоны пухли, но как оказалось — это текла либа xCache (после выхода APC под 5.3 перешли сразу на АРС)
мы их рестартовали, как процесс набирал память до 400М.
Был написан специальный скрипт-монитор, который по крону следил:
— не упал ли демон (и сразу поднимал его)
— не превысила ли очередь критической метки
— не превысил ли объем процесса выделяемую квоту

xadminx 15 дек 2011 в 18:51

я киляю чилды после того, как они выполнят определенное количество задач (типа настройки MaxRequestsPerChild у апача).

НЛО прилетело и опубликовало эту надпись здесь

Psih 15 дек 2011 в 14:04

Вы класс задачь перепутали, на PHP никто в здравом уме не будет это делать, в общем-то как и на perl или ruby.
Python/Java/.NET/Mono

НЛО прилетело и опубликовало эту надпись здесь

Psih 15 дек 2011 в 15:32

Вы крайне плохо читали презентации и слушали доклады — PHP у них это шаблонизатор и сборщик данных из бекенд сервисов — собрал данные, связал, собрал из этого HTML и отдал — никаких демонов, вычислений и прочего он не производит. Демонов они на PHP они не пишут — сервисы у них на C/Haskell/Python/Java прочих, но никак не на PHP.
PHP хоть и быстрый среди скриптовых языков, но он имеет внушительное потребление памяти и хранить в нём компактные структуры не получится — для этого нужны или строго/слабо типизированные языки, у которых данные мапятся на память без наклодных расходов на контейнеры и.т.д.
Каждая переменная в PHP — это zval структура, которая занимает 24/48 байт на 32/64 bit архитектурах. Любая другая структура типа массива или объекта даёт ещё больший оверхед, что в итоге даже на миллионе-полтора элементов в массиве простейших значений сожрёт 100-130 мегов памяти. Объекты жрут ещё больше. Вот скажите, кто в здравом в Facebook/Yahoo/Badoo с их нагрузками и их колличеством данных будет делать хоть один демон на PHP?

НЛО прилетело и опубликовало эту надпись здесь

Psih 15 дек 2011 в 16:44

В вашем случае логику работы нужно перенести в сервис и вообще выкинуть её из PHP части. Кормите в сервис данные, читаете из него данные, а он реализует всю логику. А PHP занимается тем, что он делает лучше всего — рендерит страницы и прочую легковесную не бекенд работу. Если у вас что-то сложное, да ещё и с интенсивными вычислениями и большим кол-вом памяти — то PHP стадия это прототип для отладки алгоритмов, логики и архитектуры. А потом прототип переносят уже на что-то более подходящее и гораздо быстрее, нежели программировать с нуля.

Вы не путайте — я люблю PHP и в ближайшее время никуда перелазить не собираюсь с него, но я прекрасно понимаю его ограничения и границу, когда с него нужно слезть даже если придётся пустить себе крови, иначе в последствии настанет армагедон, за который поимеют верхи поимеют во все дырки — в лучшем случае уволят, в худшем придётся работать по 16 часов в сутки с пониженной зарплатой и/или должностью что бы всё исправить.

Что до модных штук — вы это зря — .NET/Java/Python далеко не модные — это конкретные инструменты, которые использует очень много людей для не разработок и посерьёзнее вашей. Модно — это Ruby.

И да, я прекрасно знаю о том, что такое переделать проект. И что нужно сделать для этого, что бы верхи согласились на это. Это не решается за пару недель — такие мысли надо внедрять начальству зарание, нужно объяснять что «вот эту фитчу мы конечно можем и запихаем, но нам надо бы на будущее подумать об обновлении продукта, т.к. имеются следующие сложности в разработке и они накапливаются, могу предложить вот такие варианты для обдумывания». Однажды вам либо дадут добро, либо продукт просто сдохнет. Или загнётся от нагрузок, клиенты придут в ярость и вас просто уволят (вы сами написали, что у вас всё очень сильно нагруженно). Думать на будущее тоже надо.

440hz 15 дек 2011 в 17:35

мы тоже на php прототип писали. думали на С потом демонов переписывать, но померили скорость отдачи и скорость обработки данных и она устроила более чем, а уж скорость разработки на php в разы превосходит C.

так вот и остались на php-демонах с ангельскими крылышками.

а так да… искренне верили, что это прототип, что это не на всегда.
=)

Psih 15 дек 2011 в 18:29

Ну так у вас и задачка другая совсем была — у вас игровая логика основная нагрузка, а не ворочание данных. Да и у вас ограничена нагрузка на один демон была, т.к. демонов у вас было много, к тому же они ещё и по задачам делились. Так что у вас изначально всё горизонтально масштабировалось и отдельные части игры обрабатывали отдельные по функционалу демоны :)

Согласись, это немного другое нежели конкретный сервис :)

tony2001 16 дек 2011 в 02:13

Badoo пишет демоны на C/C++.
«Я гарантирую это» (с), как один из людей, которые эти демоны пишет.

tony2001 16 дек 2011 в 02:14

Вы совершенно, на 100% правы, но поставть ++ несколько раз не могу.

p0is0n 15 дек 2011 в 15:12

На ассемблере, наверно?

Psih 15 дек 2011 в 15:18

Иммелось ввиду что нужно писать на Python/Java/…
Там символ точки после ruby :)

VolCh 15 дек 2011 в 17:45

В процессе развития приложения от простого CRUD к чему-нить навороченному и, в частности, асинхронному (websockets например) понимаешь, что нужен демон. Или просто хочется нормального FastCGI, а не того, что предлагает PHP, хотя бы чтоб конфиги при каждом запросе из базы не читать. Опыта написания демонов нет, опыта серьёзной работы (кроме хелловорлдов, максимум «бложиков») с другими языками нет, особенно с компилируемыми. Как нет и опыта разворачивания чего-то кроме «LAMP» на продакшене. Надо выбирать или писать демона на PHP, изучая только написание демонов, или писать на более подходящем языке, изучая не только написание демонов, но и сам язык, и его инфраструктуру, да ещё думать о том, чтобы с существующей «LAMP» она не конфликтовала. Критический фактор, как всегда, время и деньги — если на несколько месяцев забить или сильно снизить темпы развития основной функциональности приложения, то лояльные пользователи станут нелояльными и перестанут приносить доход. Чтобы вы выбрали? «Аутсорсинг» не предлагать :)

DjOnline 24 июн 2013 в 18:14

Кстати, я всегда удивляюсь, когда вижу конфиги в .ini, в базе, где угодно, но не в php в виде массива. Сам facebook это советовал ещё в 2008 — используется L1 кэш в виде php globals arrays, который загружается через простой include, и который не надо парсить каждый раз благодоря APC (или другому кэшеру опкода).
В самом деле, это же так просто — file_put_contents(«configinclude.php», "< ?".$GLOBALS['siteconfig']=var_export ($config,true)."?>",LOCK_EX)

VolCh 24 июн 2013 в 22:29

Ну так это же кэш, а откуда-то надо взять значения, чтоб закэшировать. И желательно в более-менее понятном человеку виде.

DjOnline 25 июн 2013 в 00:40

Что значит «откуда»? Отсюда и взять. Что там непонятного человеку, или в чём сложность переделать админку конфига на сохранение в этот файл с помощью строчки выше?

VolCh 25 июн 2013 в 05:11

Само слово «кэш» подразумевает, что хранится копия данных, обеспечивающая быстрый доступ, но оригинал хранится в другом месте. Ну и заставлять пользователей («веб-мастеров») писать конфиги в PHP тоже не хорошо, имхо.

DjOnline 25 июн 2013 в 10:11

Я не вижу никакой разницы между хранением конфига в .ini/базе и хранением сериализованного конфига в php-инклуде.
Вообще никакой. Особенно если управление конфигом идёт через админку. Объясни, в чём видишь разницу?

VolCh 29 июн 2013 в 22:45

Доступ на запись к файловой системе как минимум. Его может просто не быть.

akalend 15 дек 2011 в 23:17

Демоны нужны для обсчета большого количества данных или сложных расчетов в бэдграунде
или для реализации распределенных вычислений, например при организации сбора и обработки данных на шардинг-архитектуре.

-1

okopok 15 дек 2011 в 10:44

АааААааа!!! Демоны!!! (с) Иван Васильевич меняет профессию

EuroElessar 15 дек 2011 в 11:37

зомби на вас нет!

Psih 15 дек 2011 в 11:34

Знаете в чём минус практически всех статей по демонам на хабре, особенно тех что про PHP?
Показали как продить процессы и на этом всё, а о дальнейших граблях ни слова, ни примеров, вообще ничего.

Может написать свою статью не о теории как выше и скелете, а о практическом применении с граблями, танцами и бубнами? Правда у меня yiiframework, но опыт в прочем приминим к любому варианту.

Anonym 15 дек 2011 в 11:37

Возможно напишу продолжение, когда закончу работу над своим демоном.

Psih 15 дек 2011 в 11:41

Продолжение то продолжение, будет весьма не скоро как показывает практика. А смысл в том, что точно таких же статей как эта тут на хабре я видел наверно уже с десяток — различается разве что стиль, оформление и грамматика. Должен признать — у вас оформленно лучше всех, и читается легко + бонус про STDIN, STDOUT и STDERR.

Anonym 15 дек 2011 в 11:48

Видимо я плохо искал. На хабре нашел только одну более-менее годную статью, ссылку на неё я привел в конце топика.

Psih 15 дек 2011 в 11:59

Ну авторы могли убрать в черновики, прописать странные теги и.т.д.
В любом случае людям статья полезна, критиковать вас в подаче материала невозможно — вам бы к нас в школу веб технологий преподавателем :)

Anonym 15 дек 2011 в 12:05

Жаль, что вы из Латвии… )

Psih 15 дек 2011 в 12:09

Что-ж поделать то, вот так и живём. Правда преподавателей какраз латышей не хватает — мало их настолько, что даже выбрать не с кого не смотря на хорошую зарплату — всё рускоязычные веб девелоперы и дизайнеры у нас больше.

marapper 15 дек 2011 в 18:30

Пишите, даже не спрашивайте.

pel 15 дек 2011 в 19:07

> Может написать свою статью не о теории как выше и скелете,
> а о практическом применении с граблями, танцами и бубнами?

Напишите, пожалуйста.

vovs 15 дек 2011 в 12:16

Отличная статья. Мне очень понравилось! Спасибо!

charon 15 дек 2011 в 12:43

отличная статья, спасибо. Как раз вчера зашла на работе тема о демонах на РНР. Я читал о демонах на Си, но на РНР не знал точно, как сделать, а у вас раскрыто практически всё, что надо.

MarcusAurelius 15 дек 2011 в 13:02

Добавьте кроссплатформенности, иногда php-демоны нужны и на винде, не виндовым же скедьюлером пользоваться для их запуска.

$Flag = 'daemon.flag';
$Self = daemon.php;
if (!file_exists($Flag))
	if (strtoupper(substr(PHP_OS,0,3)) === 'WIN') {
		touch($Flag);
		$fp = popen('start /B php -f '.$Self,'r');
		if ($fp!==false) pclose($fp);
		unlink($Flag);
	}
} else {
	// Child process code
}

Но тут есть засада, этот метод отличается от форка, для того, чтобы по кругу не начать запускаться много раз, мы привлекаем еще файловый флаг 'daemon.flag'. Писал код прямо в хабраредакторе не проверяя, так что пользоваться осторожно.

Anonym 15 дек 2011 в 13:12

Спасибо за толковый комментарий.
К сожалению (или к счастью), у меня даже в мыслях не было запускать php под виндой, и уж тем более делать для винды демона на php. Ну и в топике я показал только основы, остальные нюансы каждый скорректирует под свои задачи.

Psih 15 дек 2011 в 13:41

Хм, а моё внимание вот не привлекло отсуствие PID файла у вас. А для нормальной работы он вообще нужен, да :)

В общем решено — пишу свою статью, думаю на выходных будет :)

Anonym 15 дек 2011 в 13:44

Объясните пожалуйста, зачем нужен PID файл, кроме как для получения PID демона чтобы его завершить и для проверки запущенности демона?

Psih 15 дек 2011 в 14:01

Как минимум что-бы сделать в системе обычный init скрипт и запускать/останавливать/перегружать по сигналам, а там можно и обновление конфигурации дописать, ротацию логов и прочее.
Чёрт, да тот же автостарт при перезагрузке добавить, то же слежение за запущенными процессами через систему мониторинга.
Ну и предотвращение дубликаций запуска тоже не последнее дело.

Это только кажется мелочью, а когда демон переодически обновляется, то возможность его рестартнуть одной коммандой ./daemonname.php args вместо

ps -AF

kill -9 PID

php /path/to/script

Anonym 15 дек 2011 в 14:03

Ну в общем то, я правильно понял его предназначение. О том, что про PID файл я не забыл, я написал в комментарии ниже.

haskel 17 дек 2011 в 13:31

или чтоб всех сразу завалить:
user=`whoami`
daemon_name='daemonname.php'
ps aux | awk '/^'`$user`'(.*)'$daemon_name'$/{print$2}' | xargs kill -9

потому что без PID-файла легко может быть запущено несколько демонов, когда вам нужен только один.

Anonym 15 дек 2011 в 13:45

Ctrl+Enter — зло.
PID файл создается на этапе запрета запуска нескольких копий демона. Ссылка на статью указана в конце топика.

MarcusAurelius 15 дек 2011 в 13:52

Да, ну и демону еще ж нужно общаться с другими демонами и получать запросы от обычных процессов, запущенных через вебсервер. Обязательно раскройте сигнальную систему: через базу, через файлы, через сокеты. Ну и нужно нацеливаться на множественность демонов, т.е. каждый под свою задачу, один базу чистит, другой мыло шлет, третий файлы лопатит. Внешнее API нужно (вызываемое из обычного процесса) для запуска, терминации, паузы, обмена информацией с каждым процессом демона, идентифицированного по имени. А есть вообще иногда необходимость запустить и несколько копий одинакового демона, например, если многоядерный сервер или нужно что-то параллельно делать, кравлить/парсить там… но с ограничениями, например не более 5 инстансов демона. Так что, задача обширная, удачи!

440hz 15 дек 2011 в 13:54

наши наружу HTTP торчали, а гоняли JSON. оказалось очень удобно.

MarcusAurelius 15 дек 2011 в 13:55

Хе, я тоже так делаю, даже для локального с ними общения межпроцессового (в рамках локалхоста имею в виду).

Psih 15 дек 2011 в 14:10

Скажем так, для такой сложности разработки это вам с вопросами к 440hz, в моём случае я работаю с базой и очередью в ней, у меня параноидальная обработка ошибок (для PHP, но не для демонов как таковых) на исключениях и есть работа с внешними сайтами через proxy и без proxy. Основной критерий — стабильность любой ценой, ибо работаю с платёжными системами, соотвественно вылеты, некоректная работа и.т.д. как правило ведёт за собой потерю средств.

В общем написать есть что, но задачка у меня попроще чем вы описали и до многопоточности я не добирался ещё — времени на разработку пока нет, да и нагрузка у меня минимальная.

MarcusAurelius 15 дек 2011 в 14:25

Ну может YAAP опубликует наши с ним разработки, но их нужно рефакторить и описать хорошо, подход более универсальный, но сейчас уже хочется все причесать, а то разрослось и запуталось. Тем ни менее, все перечисленное имеется.

TEHEK 16 дек 2011 в 05:00

www.php.net/manual/en/pcntl.installation.php

использование pcntl_fork сразу отсекает возможность использования на винде. Смысла нет.

С другой стороны, я бы добавил us.php.net/clearstatcache

Это не обязательно для всех, но если ваш демон проверяет даты файлов, права и т.д. и при этом они могут меняться, clearstatcache необходим, чтобы сбросить кэш.

TEHEK 16 дек 2011 в 05:03

Бзз… закройте глаза на первые две строки. Вы их не видите :)

MarcusAurelius 16 дек 2011 в 05:16

а про clearstatcache согласен

radist2s 15 дек 2011 в 13:06

На PHP у меня написан демон, который ходит по трекерам, и смотрит обновления в раздачах. Если есть обновление, то в rss-фид добавляется обновленная раздача.
За время тестов обнаружил, что память действительно утекает, как писали выше. То есть за неделю работы демона он мог съедать порядка 40Мб памяти, а при старте демон забирал в районе 5Мб. Решается само собой очень просто — после n циклов демон себя убивает, а крон его подымает обратно. Наверное для серьезных серверных реализаций это очень некрасиво, но для таких частных штуковин вполне подходит.

Psih 15 дек 2011 в 13:38

Или просто нужно найти где память утекает. У меня демон без рестарта работает по 2-3 месяца и потребление памяти стабилизируется на ~35MB и не мегабайтом больше!

radist2s 15 дек 2011 в 13:40

Все верно, но я же написал, что аптайм не критичен. Кстати, как например можно дебажить и искать что течет?

Psih 15 дек 2011 в 13:50

Элементарно — вставляете запись в лог потребление памяти и смотрите в каких местах она увеличивается, но не освобождается. И да, если у вас объект содержит в себе в properties ссылки на другие объекты — нужно обязательно их удалять в ручную хотя-бы через деструктор, а вообще за собой нужно подчищать с помощью unset'ов — это вас избавит от 99% проблем с памятью.

Ну и PHP 5.3 имеет garbage collector, переодически запускайте его:

<?php 
// Somewhere before the endless loop

$last_gc_cycle = time() - (24 * 3600);
// Some more code

while (true) {
	// The main code here
	
	if (function_exists('gc_collect_cycles')) {
		$time = time(); 
		if ($time - $last_gc_cycle > 300) {
			$last_gc_cycle = $time;
			gc_collect_cycles();
		}
	}
}

440hz 15 дек 2011 в 13:52

согласен. деструкторы + освобождение ссылкок + unset() спасут от утекания.

мы тоже изрядно повозились, что бы не текло.

440hz 15 дек 2011 в 13:42

наши демоны отжирали по 1-2Гб, храня текущих персов + была подкачка когда не хватало места.

k0ldbl00d 15 дек 2011 в 13:19

Демоны!

Интересная статья, даже не думал что в PHP это так просто делается.

Irker 15 дек 2011 в 14:07

Насчет трюка с STD*: насколько мне известно это недокументированная особенность, которую в любой момент могут прикрыть.
Магия тут в том, что файловые дескрипторы выдаются по порядку. И закрыв STD*, а затем в том же порядке открыв файлы, мы получаем, что они имеют FD такие же как и STD*.
PHP разработчики вполне могут в любой момент сделать ограничение с FD>2.
Как альтернативу, пусть и похуже, зато документированную, можно предложить использование ob_* функций.

Anonym 15 дек 2011 в 14:20

Мне приятнее считать, что «это не баг, а фича».
Если поискать, то можно найти баги, связанные с закрытием STD*, которые уже пофиксили. А раз пофиксили, значит решили, что так делать можно.

p0is0n 15 дек 2011 в 15:25

Как это не документирована www.php.net/manual/en/features.commandline.io-streams.php?

Irker 15 дек 2011 в 15:29

Где вы видите там описание того, что можно подменять файловые дескрипторы STDIN, STDOUT и STDERROR?
Про предопределенные константы я прекрасно знаю.

p0is0n 15 дек 2011 в 15:59

Вечер, работа, туплю:) Тогда только так www.php.net/manual/en/function.eio-dup2.php — например.

patt 15 дек 2011 в 16:51

когда нужно по быстрому запустить скрипт как демон делаю так:
nohup script.php > log

Dlussky 15 дек 2011 в 19:13

// Без этой директивы PHP не будет перехватывать сигналы
declare(ticks=1);

Не лучшее решение.

For PHP >= 5.3.0, instead of declare(ticks = 1), you should now use pcntl_signal_dispatch().

Anonym 16 дек 2011 в 06:50

Спасибо, не знал. Изучу этот вопрос.

Nail 15 дек 2011 в 21:12

В статье не хватает информации о том, зачем вообще нужен демон. Чем демон лучше обычных скриптов?

Смотрим «что умеет делать демон» из статьи:

1. «Запускаться из консоли и отвязываться от неё» — nohup script.php &
2. «Всю информацию писать в логи, ничего не выводить в консоль» — nohup script.php 1>> out.log 2>>err.log &
3. «Уметь плодить дочерние процессы и контролировать их» — а зачем оно надо? В крайнем случае можно сделать бесконечный цикл с вызовом php-скрипта
4. «Выполнять поставленную задачу» — а чем обычный скрипт хуже?
5. «Корректно завершать работу» — в скрипте прописывается что-то вроде такого:
declare(ticks = 1);
pcntl_signal(SIGTERM, "_shutdown");

Вобщем все то же самое, только намного проще.

Единственное что может быть — это realtime обработка большого количества поступающих сигналов. И в большинстве случаев это можно заменить redis BLPOP.
Для background задач вроде обработки очередей — не вижу смысла в демонах.

dVaffection 15 дек 2011 в 23:13

Вот тут мой вопрос :)

Anonym 16 дек 2011 в 06:58

Ну если вы сделаете, всё, о чем написали, у вас и получится демон =)

VolCh 15 дек 2011 в 22:54

>«Уметь плодить дочерние процессы и контролировать их» — а зачем оно надо? В крайнем случае можно сделать бесконечный цикл с вызовом php-скрипта

Пускай у нас бесконечный цикл с вызовом скрипта — одновременно он может отработать только один запрос. Попадается тяжелый (большая нагрузка на ЦПУ) или долгий (обращение к внешнему серверу, например) — все его ждут. Может быть очень долго ждут. Если на каждый запрос мы форкаем отдельный обработчик, то тяжелый запрос будет выполняться «параллельно» с остальными, пускай он сам дольше, и другие тормозить будут, но все они будут выполняться. Если же он долгий, то пока он будет ждать ответа от удаленного сервера, остальные будут обрабатываться практически вообще без замедления.

Nail 15 дек 2011 в 23:43

Но и скриптов можно запустить несколько.
И будут они все брать задачи из очереди в Redis, например.
И даже можно сделать отдельный скрипт, который будет динамически менять количество скриптов в зависимости от размера очереди, почти как php-fpm.

Но тут я зайду уже с другой стороны.
Допустим, мы пишем игру и у нас много realtime сигналов.
Для их обработки люди создают php-демонов, делают им HTTP-интерфейсы на JSON.

Вопрос, зачем вместо этого не использовать php-fpm + nginx? Сильный получается выигрыш в скорости? За счет чего?

VolCh 16 дек 2011 в 00:34

Вот этот отдельный скрипт и будет демоном, плодящим дочерние процессы и контролирующий их :)

Надеюсь, что будет сильный за счет того, что не нужно каждый раз инициализировать всё приложение, читать конфиги даже из мемкэша, не говоря о БД. Ведь по сути php-fpm только формально является FastCGI, а само приложение об этом не знает, идет полная инициализация при каждом запросе.

Nail 16 дек 2011 в 00:58

Да ну, все эти расходы на инициализацию, это мелочь.
Независимость каждого запроса — это скорее плюс, а не минус.

Вобщем сам задал вопрос, сам отвечаю.

Суть демонов в том, что они являются серверами, которые держат сразу много коннекшенов. То есть один процесс обрабатывает много запросов «одновременно», и не нужно делать форк на каждый запрос.

При запуске демон вешает себя на сокет (порт), и на события на этом порту вешаются на php-функции, созданные нами.
События — это входящее соединение от нового клиента, получение данных от клиента, отключение клиента и ошибка.
Разработчик демона пишет функции, обрабатывающие эти события, и специальная библиотека libevent вызывает эти функции в нужные моменты.

В этом в кратце вся суть.

VolCh 16 дек 2011 в 01:41

Как-то у вас всё в одну кучу. И демоны, и сервера, и сокеты с коннекшенами, и отсутствие форков, и либевент. Начнём с того, что не каждый демон это сервер, а форки для демонов допустимы. По идее, как раз в ответ на событие от libevent колбэк должен создавать или вызывать форк (коль скоро потоков в PHP нет) и забывать о нём, возвращая управление в libevent, как раз чтобы была «параллельная» работа, а не очередной запрос обрабатывался только когда, когда предыдущий будет обработан колбэком.

Nail 16 дек 2011 в 02:05

Честно говоря, не вижу смысла в демонах, которые не являются серверами.

Насчет форков для длительных задач, я думаю, что долгие задачи на php-серверах лучше не выполнять. По причине того, что можно слишком нагрузить сервер при этом.
Их лучше складывать в очередь и выполнять отдельно. Кстати, для этого специально есть такая штука как Gearman, организует очередь задач, можно выполнять на нескольких физических серверах.

Задачи необязательно выполнять параллельно. Например, Redis все выполняет последовательно (ну кроме скидывания состояния на диск).

VolCh 16 дек 2011 в 02:13

Демон, по сути, это лишь программа, которая не имеет UI. Она может быть как клиентом, так и сервером. Например, демон мониторинга серверов, который пингует сервера из списка и пишет в лог результаты. Зачем ему порты, сокеты и прочие серверные причиндалы, достаточно реагировать на несколько сигналов и то не обязательно. А вот многопоточность или многопроцессность не повредили бы такому демону, чтобы не застревала проверка всех серверов из-за того, что какой-то сервер лег и пинг ждет таймаута.

Nail 16 дек 2011 в 02:31

Если в контексте php, то я не вижу смысла такого демона городить.
У меня примерно то, что вы описали, только вместо пингов http-запросы.
Через nohup в background'е запускаются шелл-скрипты («многопроцессность»), которые в бесконечном цикле вызывают php-скрипт. В этих php асинхронно выполняются http-запросы — почти «многопоточность».
Все хорошо работает без всяких демонов.

VolCh 16 дек 2011 в 03:16

Тогда получается, что вы ту часть, которая может быть реализована на php, реализовали на баше с привлечением nohup. Имхо, оба подхода имеют право на жизнь.

MarcusAurelius 16 дек 2011 в 01:45

Когда для каждого клиента нужно построить структуру в памяти (модель) на 10мб, то инициализация становится очень даже заметной. Сокеты позволяют держать эту модель в памяти не убивая и не создавая ее каждый раз, но есть другая особенность сокетов — проход по клиентским сокетам на сервере — это все же цикл, и значит, что пока одного клиента обрабатываем, то все ждут, я еще не встречал возможности писать на PHP серверы многопоточные на одном серверном сокете, а привлекать сюда C# очень не хочется, другаяплатформа все же, C++ немного лучше, но разработка усложняется и затягивается, Delphi — умер, Node.js — тоже проходит всех клиентов по очереди в цикле, даже не знаю что тут придумать можно кроме как открывать в PHP много демонов, распределять клиентов на них равномерно, чтобы проход в цикле был не долгим.

MarcusAurelius 16 дек 2011 в 00:54

Это я Вам скажу, на php-fpm + nginx при большом количестве постоянно идущих запросов случается столько форков, что весь CPU идет на переключение контекстов, да и памяти уходит много. На сокетах в сотни раз меньше и нет переключения контекстов, можно поднять 10 сокетных серверов, например, для 16 ядерного сервера и это выдержит 10.000 событий в секунду, а php-fpm + nginx ляжет.

Nail 16 дек 2011 в 01:05

Ага, опередили меня.

А кто-нибудь копал в сторону Facebook HipHop compiler? Он из PHP-кода делает веб-сервер, какое у него там устройство внутри?

MarcusAurelius 16 дек 2011 в 01:47

Я лично не копал, но вообще стоит поинтересоваться, оно в открытом коде? Есть статьи? описание, примеры?

Nail 16 дек 2011 в 01:56

Да, он open source: github.com/facebook/hiphop-php
Насчет статей, про их веб-сервер я пока не встречал.

VolCh 16 дек 2011 в 01:42

А что вы имеете в виду под «на сокетах»?

MarcusAurelius 16 дек 2011 в 01:55

Имеется в виду PHP + socket_select / socket_accept / socket_recv / socket_write

dVaffection 15 дек 2011 в 23:11

Для background задач вроде обработки очередей — не вижу смысла в демонах.

Я нача лработать с очередями используя Zend_Queue. По крону достаю заданное кол-во сообщений, у них проставляется timeout (время в течении кот они не должны доставаться другой крон-задачей). Но если это время меньше, чем время обработки этих сообщений, получается, что другая крон задача также заберет эти сообщения (какую-то чась из них) и обработает их. Получается, что сообщения могут быть обработаны несколько раз.
Если же использовать демон, то он может проверять через заданный интервал наличие новых сообщений в очереди и обрабатывать их последовательно. Такми образом можно избежать обработку идного и того же сообщения несколько раз наверняка.

А как вы решаете задачу?

VolCh 15 дек 2011 в 23:32

Через msg_*. Демону даже не нужно ждать интервала, клиент кладет сообщение в очередь (возможно с id внешнего ресурса типа имени временного файла или id записи в бд), и оно тут же поступает демону (если он не занят обработкой предыдущего). Если скрестить со «скелетом» из топика, то не сложно, наверное, сделать и параллельную обработку нескольких задач, если это имеет смысл.

dVaffection 15 дек 2011 в 23:42

То ли я не тула нажимаю, то ли Хабо глючит, вот мой ответ.

Nail 15 дек 2011 в 23:48

> Но если это время меньше, чем время обработки этих сообщений, получается, что другая крон задача также заберет эти сообщения (какую-то чась из них) и обработает их.

Если таймаут слишком мал (меньше времени обработки этих сообщений), значит надо повысить таймаут.

dVaffection 15 дек 2011 в 23:54

В том то и дело, что нельзя наверняка знать время обработки сообщенийю
Вот, например, я рассылаю емэйлы. STMP сервер может не отвечать по каким-лбо причинам в течении некоторого времени и получается, что мои эмейлы разошлются несколько раз :(
Я хочу чтобы срипт заупскался каждую минуту и рассылал по 50 сообщений. Если коннект с SMTP сервером ок, то все работаеткак часы, если сервер тупит хотя бы минуту — у меня дубрируются емэйлы.

Что делать, как знать?

Nail 16 дек 2011 в 00:02

Почта должна уходить через SMTP асинхронно.
То есть SMTP-сервер должен почти моментально добавлять сообщение в Mail Queue, а дальше уже «тупить» с этой своей очередью сколько угодно.
Короче говоря, надо по-нормальному настроить SMTP-сервер.

dVaffection 16 дек 2011 в 00:08

Ок, это просто пример был. Видимо неудачный.
Я это все говорил к тому, что иной раз невозможно знать наверняка скорость обработки сообщений и из-за этого мне этот механизм кажется не самм лучшим в отличие от использования демона.

Nail 16 дек 2011 в 00:14

Ну допустим, демон взял сообщение и что-то очень долго с ним делает — то ли завис, то ли помер, то ли сервер, на котором этот демон работает, перезагрузился.

И при этом непонятно, обработалось сообщение или нет.

Как при этом гарантировать обработку?

dVaffection 16 дек 2011 в 00:21

Вы правы.
Для сообшений, обрабатываемых по крону, стоит просто увеличить таймаут и запускать очередную задачу чаще чем этот таймаут. Думаю это решит задачу с большего.

Какой вы видите выход?

dVaffection 15 дек 2011 в 23:40

Через msg_*.

Не понял вас, если честно.

Если скрестить со «скелетом» из топика, то не сложно, наверное, сделать и параллельную обработку нескольких задач, если это имеет смысл.

Я думаю имеет смысл, только нужно котролировать кол-во дочерних процессов, чтобы он не было over 9000.

А вообще, конечно, хотелось бы услышать ответ по поводу разбора сообщений с помощью крон-задач, если у кого есть опыт

VolCh 16 дек 2011 в 01:13

Есть процесс (условно демон) с главным циклом типа:

$queue = msg_get_queue(12345);
$message = NULL;
$msgtype = NULL;
while (msg_recieve($queue, 0, $msgtype, 256, $message)) {
  dispatchMessage($msgtype, $message); // обрабатываем сообщение
}

и есть клиенты, которые при обработке пользовательских запросов вызывают что-то вроде

$message = 'I have a task for daemon.';
$queue = msg_get_queue(12345);
msg_send($queue, $msgtype, $message);

Демон постоянно (до ошибки) вызывает msg_recieve, она либо возвращает первое сообщение из очереди, либо ждет пока оно не появится и только тогда возвращает.

По хрону когда-то делал так:
клиенты складывают задачи в базу
скрипт по хрону считывает пачку, ставит флаг «в работе», свой pid и время начала работы
после успешной обработки удаляет задачи из базы
если не фатальный сбой, то сбрасывает флаг в работе

другой скрипт, также запускается по хрону, но реже и проверяет чтоб не было задач с флагом и слишком давно в работе, если есть и видит, что процесса с данным pid нет, то сбрасывает флаг «в работе» и ставит флаг «повторно», если он не стоит, если стоит то ставит флаг «ошибка» и задание больше не обрабатывается. Если же процесс с данным pid есть, то убивает процесс, сбрасывает флаг «в работе» и ставит флаг «возможно повис», если при следующем запуске будут задачи с этим флагом, то установит флаг «ошибка».

В итоге будем иметь:
— каждая задача запускается минимум один раз
— если задача крашит скрипт обработки или обрабатывается очень долго, то делается попытка запустить её второй раз (и только второй, чтоб некорректная задача не ставилась раз за разом)
— задачи, которые за 2 попытки так и не смогли выполниться не удаляются, а висят в базе для ручного разбора причин.

В принципе можно это сделать и в одном скрипте, но с двумя удобнее, имхо, у каждого своя задача — один обрабатывает, другой обрабатывает ошибки и зависания первого.

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время