Pull to refresh

Comments 30

Интересно, однако считаю что ошибочно брать как аксиому изначально то, что события случайны и на основе этой модели делать расчеты. Самое интересное — проанализировать реальные судьбы и события и смотреть на факты и анализ с этой стороны. Очень вероятно что откроется масса интересных вещей. Например, нумерология для кого-то псевдонаука, однако она способна очень точно показать связи между событиями и явлениями математическими расчетами, а также обнаружить цикличность там, где она никогда не была замечена. Если ее не отрицать заведомо.

Вы правы, но это уже будет другая книжка. Мне интересно появление закономерностей и структур из хаоса и случайностей, из минимума предположений и параметров. Конечно, мы системы открытые и испытываем влияние внешних ритмов (астрономических, фенологических и культурных), но увеличение количества деталей и частностей затрудняет демонстрацию того, чему посвящена эта работа — простым и любопытным выводам теории вероятности и математической статистики.

Интересно будет решить 2 задачки, используя выводы из этой книги, что бы проверить их.


  1. Как время ожидания в очередях с одинаковым количеством покупателей зависит от количества покупок?
    Судя по книге (либо угадал, либо нет) на корзины можно не смотреть.
  2. Сдвинется ли и как мой рабочий график, если я буду ждать автобуса время, равное разности длительности ходьбы и длительности поездки?
1) А при чем тут книга, — что в модель заложим, то и выйдет. Модель, описанная тут, пренебрегает количеством покупок, значит, приняв ее, не будет зависеть. В реальном мире, понятно, что зависит (чтобы понять, насколько, лучше всего получить доступ к реальной базе данных супермаркета с историей чеков).
2) Задачи типа 2 (в случае, если принимаем допущения модели) решаются методом монте-карло на любом языке программирования очень быстро;)
Получается, что в данном смысле книга не имеет практической пользы. А я думал, автор про реальную жизнь пишет.
Не все очереди за разным количеством товара. К очередям для оплаты проезда, которые упомянуты в статье, вполне подходит.
В очереди в билетных кассах бывает так:
Первый покупатель: Мне билет на 18:35 поезд №123 до Челябинска!
Второй: Мне нужно 7 билетов подешевле до Новокочерыжкина примерно на 4-7 сентября, главное подешевле. А через Северозалессск с пересадкой на электричку не будет ли выгоднее? А теперь еще обратные, недели через две. Ой нет, обратных нужно только два, а остальные на тридцатое.
В статье же про оплату проезда по автомагистрали.
Да, собственно, и вариант с жд и автобусными кассами подходит — количество людей в очереди, желающих что-то необычное (не один билет) вполне себе случайная величина.
Но если бы покупатели не смотрели на количество покупок, то образовались бы свободные и забиты кассы. Но этого не происходит. Покупатели смотрят, и получается, что, в среднем, количество покупок в каждой очереди одинаково. Тогда очередной покупатель, согласно книге, может встать в любую очередь. Какой-то парадокс получается.
Можно посмотреть, и встать за мной (у меня в руках только бутылка колы). А потом я попрошу блок сигарет и продавщица удалится в подсобку минут на 5. ;)
И что совсем обидно — то сколько времени вы уже провели на остановке никак не влияет на вероятность того, что автобус вот-вот подойдёт. Это работает такое свойство экспоненциального распределения, как отсутствие памяти, связанное с независимостью пуассоновских событий.

Моделировать автобусы экспоненциальным распределением, и при этом подразумевать сходство с реальной жизнью, при всем уважении к автору, просто невежественно. В подобных системах есть несколько режимов (система работает, как надо, на линии необходимое количество автобусов, и их движение описывается необходимым распределением; N автобусов сломалось — они не приедут, но следующий за ними приедет согласно модели; вся система не работает — водители объявили забастовку), каждый режим имеет свою вероятность, согласно априорному распределению. И тогда, желая построить распределение времени ожидания автобуса с учетом уже потраченного на ожидание времени, сначала рассчитывается вероятность каждого режима, и распределение строится с учетом всех режимов и их вероятностей (если, к примеру, МО = 5 минут, а автобуса нет уже час, то вероятность дождаться его в следующие 5 минут намного ниже, чем если автобуса нет всего минуту).
Кстати, и в примере с очередями этот принцип тоже работает. Чем дольше длится систематический обгон одной очереди другими, тем выше становится вероятность, что это не просто случайные равновероятные события, а касса объективно имеет пропускную способность ниже остальных (продавец — неумелый стажер, или всю ночь провел на музыкальном фестивале).

Это всё верно, что вы пишите. Но как на такой непростой модели продемонстрировать источник простых наблюдений? Коректнее всего, конечно, рассказывать про альфа-распад, например, или о тех, же землетрясениях, но для большинства читателей, это вовсе не повседневный опыт, а чертыхаются на остановках многие. Я предлагаю, посмотреть на это чертыхание немного под другим углом. Использование вероятностных технологий при управлении транспортными потоками — великолепная тема! Но не для этой книжки.

Я всегда исхожу из того, что сильно упрощенная модель полезна, пока она позволяет решить задачу реального мира лучше, чем интуитивная/рандомная стратегия. К примеру, алгоритмы букмекеров по рассчету вероятностей в момент матча весьма примитивны, и игнорируют массу важной для болельщиков информации (как не странно, учитывая, что это индустрия мирового масштаба с более, чем столетней историей), но они достаточно точны, чтобы подавляющее большинство болельщиков было неспособно обыграть букмекера, наблюдая за матчем, что говорит о том, что задача реального мира решена, и усложнять модель не нужно.
Но в случае с автобусом упрощенная модель советует поведение (ждать бесконечно долго), которое математически хуже очевидной стратегии (забить на чертов автобус, который не едет уже час, и идти пешком), и поэтому я считаю пример некорректным.
PS: не знаю, насколько мой совет будет уместным, но массу интересностей может подбросить теорема байеса. К примеру, если Вы приехали на работу, и видите последнее свободное парковочное место, стоит ли парковаться. Или каково матожидание выигрыша от покупки б/у машины с ценой на 20% ниже рыночной?
А если двух крайних людей в очереди рассматривать как пару запутанных фотонов? Тогда до момента осознания Алисой, что её очередь продвигается медленно, Боб в соседней очереди не замечает, что его очередь движется быстрее. Мало того — до того как Алиса взглянет на Боба и поймёт что он движется быстрее, сказать кто из них движется быстрее — невозможно. И ещё есть вероятность в 50 процентов что в этот момент Алиса увидит, что двигалась быстрее — она, вот где облом для Боба.
Вы таки большой молодец. Возможно, именно с вашей я начну покупать электронные книги за деньги. Если, конечно, вы будете продавать её в электронном виде за деньги. И в принципе допишете. Короче, неважно, афтар, пешы ищо.
Следует добавить и немного психологии.

Для поддержки мотивации человеку всегда должно быть немного плохо. Мозг ищет что именно плохо и как это побороть. Так что при длительных сериях в плюс и минус здоровый мозг калибрует 0. И золотой молодежи приходится ходить в походы или дауншифтиться, иначе счастье будет только грубым химическим способом.

Память имеет свойство забывать неприятные события быстрее чем позитивные той же силы. Потому раньше трава была зеленее.

Психология плохо формализуется. К тому же, основная моя цель, рассказать не о ментальных ловушках и не о когнитивных искажениях, а о некоторых интересных математических объектах и их свойствах.

Интересная серия статей.


В одной из предыдущих был интересный пример, объясняющий, почему верное дело может окончиться провалом, хотя ничто не предвещало беды — потому что если присмотреться, то окажется, что дело состоит из, например, пяти этапов, каждый из которых приводит к успеху в 90% случаев.
А итоговая вероятность успеха 0.59.


В то же время не совсем ясно вот что. Автор предлагает взглянуть на проблемы по другому, пользуясь статистикой, или не?
Давайте рассмотрим пример с очередями. Да, статистически на соответствующей выборке (много длинных очередей) все очереди будут двигаться примерно одинаково.


Но когда я прихожу в супермаркет (и, тем более, знакомый супермаркет — почему, см. далее), дела обстоят примерно так:


  1. Очередей не так много — 2-3 кассы (жаль, еще с прошлого кризиса 08-09 супермаркеты, кажется, выработали новую кадровую политику, и еще 3-4 кассы стоят закрытыми), т.е. делать выбор и прогнозировать движение очередей легче, а вот для статистики в рамках отдельно взятого супермаркета в этот конкретный момент времени — хуже.
  2. Да, кажется, что "вот, работает всего 2 кассы", некоторые покупатели начинают возмущаться длиной очередей, но статистически очереди все равно небольшие.
  3. Теперь самое интересное.
    Обладая минимальными познаниями в психологии, тем более, если супермаркет знакомый, можно достаточно легко определить такие вещи:
    • вот на этой кассе кассир-копуша;
    • вот на этой кассир работает со средней скоростью, но быстро решает проблемы, если покупатель не взвесил товар, что-то зыбал взять в корзину, или наоборот, что-то хочет возвратить перед оплатой, когда товар уже "пробит" на кассе;
    • а вот на этой кассир-шустряк, но что-то подсказывает, что сейчас он закроет кассу, предложит покупателям перейти к другим кассам, и убежит.
    • о, а вот открылась четвертая касса, но там неприятный по прошлым покупкам кассир, и я туда не пойду, и плевать на статистику, даже если в ту очередь еще никто не встал.

В итоге я могу выбрать нужную мне кассу, чтобы достаточно быстро и равномерно пройти очередь, и перейти из одной очереди в другую, если понял, что встал не туда.
Да, в конкретном случае могу ошибиться, но вот как раз статистически выбор оказывается верным — в любом случае встаю в ту очередь, где мне будет конфортно в ней стоять, и скорость движения только один из факторов (может, в одной уже стоит шумная агрессивная компания).


Это все я к тому, если посылом серии статей было "расслабьтесь, все равно статистически все будет примерно одно и то же".
Статистически на большом количестве людей с большим количеством рассматриваемых типов событий и самих событий — да.
Но отдельный человек, в конкретный момент времени, всегда имеет дело с чем то одним или нескольким — и как повернется событие тут, зависит не сколько от статистики, сколько от того, как обстоят дела в этом конкретном случае, и как человек может на них повлиять.


Ну и конечно, нужно без фанатизма — одно дело переходить дорогу на зеленый на хорошо оборудованном и топологически верно спроектированном перекрестке, и, если делать это осмотрительно, вы сможете отыграть у и без того хорошей статистики еще какую-то долю вероятности положительного исхода, а, если переть на красный, то, не зависимо от качества перекрестка, вида и загруженности дороги, статистика все равно будет играть против вас.

Посыл этой серии: статистика, даже простая, таит в себе кое-что интересненькое. Вывод: "расслабьтесь, все равно статистически все будет примерно одно и то же" — тривиален и отражает общее мнение о мат. статистике, как о бесполезной описательной науке. Мне бы хотелось это мнение изменить.
Ваши примеры и уточнения изобилуют деталями, а мне хочется показать, что некоторые эффекты "вшиты" на самом минимальном уровне детализации, при минимуме допущений, параметров и степеней свободы. Если к этим базовым моделям добавить возмущения, то описываемые эффекты могут либо проявиться ярче, либо потеряться в модулирующем фоне. Не так интересно, что вода в стакане может раскачиваться, если качать стол, любопытно, если она начнёт по какой-либо причине совершать автоколебания сама…

Про очереди я читал более убедительное объяснение: в течении дня у кассира случаются разнообразные остановки в работе: закончилась лента, пробился не тот товар, у покупателя не считывается карточка и т.п. Такие события происходят с равной вероятностью на каждой из касс. Если очередь движется быстрее соседних, значит на этой кассе некоторое время не случалось никаких остановок. Следовательно, весьма вероятно, что они скоро случатся! Но покупатели этого не учитывают и стараются встать в самую быстро идущую очередь («ну и пусть там народу больше, зато кассир быстрей работает»). В итоге подучается следующее: больше всего людей встали в быструю очередь, в ней ожидаемо начали случаться остановки, очередь стала медленной и длинной, а в соседних кассах уже разобрались с остановками и вышли на нормальную скорость.
Поэтому наблюдение «соседняя очередь всегда движется быстрее» статистически верно. За исключением слова «всегда», так как закономерность проявляется лишь на больших числах.

О! Вы сначала дали прекрасное описание пуассоновской природы движения очереди и парадокса инспектора, а потом совершили классическую ошибку игрока, предположив что раз давно не случалось неприятности, то более вероятно она случится (к закончившейся ленте, это не относится — это процесс с памятью). Наши с вами объяснения во многом похожи.

Если очередь движется быстрее соседних, значит на этой кассе некоторое время не случалось никаких остановок. Следовательно, весьма вероятно, что они скоро случатся!

Узнаю ход мыслей клиентов одноруких бандитов) К слову, на некоторых моделях автоматов этот принцип работает благодаря компенсаторам;)
Речь, конечно, не о случайных, а о периодических событиях (необходимость менять ленту в аппарате, необходимость отойти в туалет кассиру и т.п.). Время, проведённое в длинной очереди, сравнимо с периодичностью вышеобозначенных событий, поэтому у покупателя появляются основания делать прогноз.
Спасибо за статью, очень интересный подход!

Захотелось самому поиграться, но застрял в самом начале повторения ваших выкладок. В матстатистике полный профан, так что прошу не сильно бить за глупые вопросы)
Как у вас получилась гистограмма «Плотность распределения длительностей промежутков между 52 событиями»? Судя по Википедии у распределения Пуассона максимум будет там, где среднее значение – то есть в нашем случае 7 дней. А у на графике максимум в нуле. Или это что-то не то?

Пуассон подарил своё имя и потоку и распределению. Распределение показывает вероятность набрать какое-то число шагов в потоке. Например, для пуассоновской очереди и заданного числа дискретных временных отсчётов, распределение покажет с какой вероятностью будет обслужено то или иное число клиентов. А вот про интервалы между событиями в потоке нам уже рассказывает экспоненциальное распределение.

Внимательно перечитал статью и ваш комментарий и понял, спасибо!
Расчёты повторить получилось, но, к сожалению, похвастаться нечем – ничего примечательного по сравнению с вашей статьей не нашлось. Так что ещё раз спасибо, что показали всё самое интересное!
Занимательно. Спасибо за статью!
Позвольте замечание:
Для справедливости, положим, что хорошие и плохие события происходят равновероятно

Насколько я понял, это принято как аксиома. Однако, если наше с вами понимание «хорошего» одинаково, в реальном мире это не верно. Соответственно, все последующие выводы также неверны.

Если говорить о влиянии на эмоциональную сферу человека, то моментальную реакцию «хорошо» будут вызывать события желаемые (и, следовательно, ожидаемые). При этом вероятность желаемого события всегда меньше половины. Наши желания комплексные, событие, воспринимаемое нами как одно, на самом деле состоит из многих. Пример: «Хочу принца на белом коне». Разбираем: «принц» – красивый, богатый, «хочу» – в ближайшее время, чтобы сам, свадьбу идеальную, кольцо и тп., да ещё и коня подтянуть и в белый покрасить. Это очень утрированный пример, но, на мой вкус, он хорошо отражает суть. Даже если представить, что у каждого из описанных событий вероятность 50%, то вероятность того, что они произойдут все разом, становится значительно меньше желаемой нами половины.

Мир «несправедлив», и в большинстве случаев вреден и нежелателен для наших хрупких тел. А в плюс к этому ещё и самоподобная кривая вниз норовит уйти.
Память совсем не обязательно должна быть строго линейной. Негативные события можно забывать быстрее, а позитивные — медленнее. Кроме того, интерпретация события может отличаться в зависимости от точки зрения — например, победа одной команды и проигрыш другой в спортивном соревновании в зависимости от того, за какую команду болеешь. Можно вообще отказаться от трактовки «хороший/плохой» и постичь дзен.
Only those users with full accounts are able to leave comments. Log in, please.