Как стать автором
Обновить

Комментарии 27

Лично на мне парадокс дней рождения отметился аж два раза (из тех случаев, что мне известны). В 7-9 классе (более 30 человек) у одного мальчика совпадал день/месяц/год рождения с моим, а когда был студентом, одна девушка в группе (более 20 человек) была ровно на год младше меня.

Парадокс дней рождения достаточно общеизвестен, интересно а какова вероятность, что для одного человека он сработает более раза? Насколько вообще часто встречаются люди, для которых сработал (хотя бы раз) этот парадокс?



Или я бы вот так сформулировал свою задачу, с более точными данными: в скольких группах по 23 человека (в ней вероятность того, что у двух участников совпадёт ДР, почти равна 0,5) нужно поучаствовать человеку, чтобы вероятность того что именно на этом человеке сработает парадокс дней рождения, была близка к 0,5? Была близка к 1?



Вопрос чисто практический. Мы почти все в течении жизни так или иначе многократно попадаем в группы по 20-30 человек (ясли, школа, ВУЗ, работа) и вполне может оказаться, что почти каждый человек хотя бы раз в одной из групп соответствовал парадоксу.
Я лично за свои 35 лет встречал только одного человека, у кого был ДР в один день с моим, год был другии. Имеется в виду только друзья из каких-либо компаний, а не просто рандомные люди.

Я знаю четверых людей у которых со мной ДР в один день, а на одной из них(у нее еще и год со мной совпадает) даже был женат… Но это еще не самая жесть. Один мой близкий знакомый на не очень крупном(2000 человек примерно), но международном, мероприятии умудрился на стойке регистрации познакомиться со своим полным тезкой который был младше его ровно на год, при том, что у них фамилия и отчество достаточно редкие.

Если не ошибаюсь, по необходимому количеству групп будет работать равномерное распределение, тогда для вероятности 0.5 нужно поучаствовать в 11.5 группах (23/2, т.к. каждое совпадение — это сразу два «счастливчика». С более крупными группами — аналогично.
За 45 лет и много разных коллективов не встречал человека, у которого ДР совпадает с моим. Но однажды внезапно узнал, что родился в один день с Анджелиной Джоли.
Предположу, что нужны те же 23 группы, чтобы вероятность наличия «двойника» была не не меньше 50%.
На самом деле, это вопрос не про количество групп, а про общее количество людей в этих группах, ведь то, как они разбросаны по группам, не влияет на наличия человека с тем же днём рождения, так что, кажется, нужны примерно 182 с половиной человека или 365/46 групп

P.S. моё предположение, таким образом, неверно (я не стал его убирать): нужны 8 групп по 23 человека (напомню, чтобы вероятность была не менее 50%)
А почему 182 человека? Если подойти к задаче с точки зрения общего количества людей, вероятность встретить человека с ДР в заданный день 1/365, не встретить (1-1/365) = 0,9972. Тогда чтобы не встретить совпадение с вероятностью 0,5 нужно LOG(0,5)0,9972 = 252,65 человека.
Это размер группы, в которой вероятность встретить человека, у которого ДР совпадает с Вашим равна 50%. Если разбить большую группу на маленькие по 23 человека, вероятность не изменится. Значит, нужно 253/23 = 11 групп, в принципе близко к моей прошлой оценке 11,5.
Дни рождения по месяцам не являются равновероятнотными событиями
Потому, что это не случайное событие. Родители (при запланированной беременности, естественно) могут выбирать месяц или хотя бы время года для рождения ребенка.

А выбор времени года (точнее, предпочтения родителей по этому поводу) не является случайным событием?

Провал в ноябре может быть связан с нежеланием родителей иметь ребёнка, рождённого под знаком скорпиона. Это связано с астрологическими представлениями о влиянии этого на характер человека, а также с поверьем, что рождение ребёнка под знаком скорпиона может вызвать смерть кого-то из его бабушек и дедушек.
Когда я учился в институте с ноябрем было связано одно наблюдение из серии совпадений дат рождений — наибольшее количество дней рождения знакомых (тех кто точно позовёт на день рождения) было 37 человек, при этом в ноябре было 8 дней в которые ни у кого не было дня рождения и были дни когда ДР отмечали более трех человек. К слову сказать я тоже ноябрьский и в день моего рождения одни друзья расписались, у других родилась первая дочь. :-) видать нежелание заводить ребёнка в ноябре не всегда имело место :-)
Да при чем тут астрология? Те, кто планирует беременность, не хотят с новорожденным по грязи и морозу бегать в больницу на осмотры и прочее в том же духе. Гулять с грудничком зимой тоже всяко сложнее чем летом. Статистика же взята из вконтакте, Россия и СНГ.
А провал не такой большой, потому что не все планируют беременность, а некоторые руководствуются суевериями типа «рожденный зимой меньше болеет» и прочей астрологией.
А вот еще один локальный «парадокс» дней рождения: если у вашего знакомого ДР 23 ноября, то с высокой вероятностью его родители имели отношение к армии.

Был уверен, что в вк много людей и фейков с ДР, заполненным от балды (например, 1 января, чтобы колесико не крутить), и вероятность должна быть сильно больше. Забавно, что это не так.

День рождения 1 января — лучшая первоапрельская шутка! :)
Маловато что-то для сентября родившихся.

Я за всю жизнь знал только одного человека у которого день рождения совпадал с моим. И то знал я его не лично — это был президент :)
А в реале, ни в одном коллективе мой день рождения не совпадал ни с чьим.
По месяцам же я среди знакомых наблюдаю заметный перекос в сторону ноября и марта: много людей родились в эти месяцы.

ну так в том то и прикол, — парадокс не про то, что совпадет у конретного человека, а про то, что совпадет у хотя бы одной пары в группе
Если это 1 февраля, то вы как минимум знаете уже двоих
Ну-у… да. 1 февраля.
Ну держите ещё пачку нелично знакомых людей :)
Ну-у — так-то каждый может!
(с) анекдот.

«Почему-то июль наиболее популярный месяц для дня рождения подписчиков МДК.»


Так не совсем корректно говорить, так как этот пик может быть в пределах погрешности. И в этом случае лучше использовать доверительные интервалы и другие стат критерии

Спасибо! Учту в следующих работах

Для начала стоило бы учесть, что месяцы имеют разную длительность и либо нормализовать данные (показывая не общее к-во дней рождения, а например среднее к-во дней рождения в день), либо по оси X отображать равные промежутки (напр. недели вместо месяцев).


В противном случае даже при абсолютно равномерном распределении на гистограмме у вас будут скачки в 3-10%.

В источники я бы добавил классику:
Мартин Гарднер, «Математические головоломки и развлечения», 1971
Помню зачитывался ею в детстве, что впоследствии принесло свои плоды с совершенно неожиданной стороны — на протяжении нескольких лет многие олимпиадные задачи по математике были родом оттуда )))
Построю гистограмму дней рождений.

Из-за локальных всплесков на длинных месяцах (май и октябрь) распределение выглядит более хаотичным, чем есть на самом деле.
Не по теме немного вопрос, почему vk_session.get_api() использует snake_case, а vk.groups.getMembers() camelСase? До сих пор определиться не могут? В PHP тоже такая тема, но там функции строго snake_case, а методы — camelCase, так уж исторически завелось, ибо не переписывать же все, а тут-то сторонняя либа вообще.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории