agehsbarg 18 окт 2020 в 13:58

Закон больших чисел и то, чем он не является

3 мин

31K

Комментарии 13

ildarz 18 окт 2020 в 14:18

Мне кажется, без конкретных практических примеров ("тут работает, тут не работает", и почему) текст выглядит не очень полезным. Возможно, имело смысл разобрать в качестве примеров часто встречающиеся заблуждения (начиная от классического "если 5 раз выпала решка, то дальше-то точно попрут орлы, ибо должно сойтись к среднему").

Pochemuk 18 окт 2020 в 16:06

Если 5 раз подряд выпала решка, то вероятность того, что у нас монета с двумя решками, больше 0,5 :)

Но это уже бета-распределение…

agehsbarg 18 окт 2020 в 16:41

Привет, спасибо за фидбэк! Действительно, я сократил текст до минимума — без примеров или формул, сухо, но, я надеялся, по существу. Судя по опросу, большинству текст не понравился по тем или иным причинам. У меня на подходе аналогичная статья про центральную предельную теорему, сделаю его более развернутым.

A1054 18 окт 2020 в 18:15

Давайте я попробую сформулировать, что в тексте мне не понравилось. Он содержит мало информации, описывает тривиальные и очевидные вещи. Ну т.е. на таком уровне все все знают, нужно глубже и с примерами. В теории вероятностей очень много тонкостей, есть что обсудить.

agehsbarg 18 окт 2020 в 19:28

Интересно, я как раз опасался, что будет слишком сложно. Глубже можно без проблем :)

Hodus 18 окт 2020 в 15:10

Эти возможные законы природы хорошо описывает Талеб в книге «Черный лебедь». Там правда говорится о распределении Гаусса-Лапласа, но суть не меняется. Взять ту-же урожайность, приведенную в пример в конце статьи. Один элемент выборки(неурожай) может превосходить всю выборку, и в таком случае ни нормальное распределение, ни тем более закон больших чисел работать не будет. Т.е. на выходе у вас есть цифра, но она ничего не предсказывает. Работает в математике, но не в реальной жизни.

-1

fougasse 18 окт 2020 в 16:13

Это не Симпсон ли случайно?
Про разбиение выборки и вляние факторов.

Pochemuk 18 окт 2020 в 16:50

А все потому что «черные лебеди» это не гауссовское распределение. Это, скорее, Пуассона, которое, как и гауссовское, является одной из предельных форм распределения Бернулли (но при других пределах).

Поэтому, знание сходимости нам мало что дает. Это как при игре в русскую рулетку — нельзя играть в нее бесконечно — только до первого проигрыша. Поэтому, закон больших чисел здесь неприменим.

agehsbarg 20 окт 2020 в 00:41

hodus это очень интересная тема о границах применимости статистики и теории вероятностей. Например, мы строим модель процесса, скажем, нормальную модель, на основании данных. Это может быть бизнес-процесс (пользователи что-то покупают), может быть природный процесс (та же урожайность). Действительно, с точки зрения описания или прогнозирования, все хорошо до тех пор, пока не происходит совершенно непредсказуемое явление. Окей, наша модель этого не предусмотрела, но может процесс изменился? То есть модель верна для старого процесса, а тут произошло его изменение. Как продвинутая курица Юма, которая знает, что ее кормят, скажем, в среднем каждые 6 часов с дисперсией 10 минут. В какой-то момент, скорее непредсказуемый для курицы, придут откручивать ей голову, но разве она могла эта предсказать? Ее модель была и остается верна, но уже не для нее. Можно пытаться строить композитные модели, с тяжелыми хвостами, с несколькими режимами и вероятностями переключений между режимами. Это интересно!

НЛО прилетело и опубликовало эту надпись здесь

agehsbarg 19 окт 2020 в 00:52

Очень хороший вопрос.

Если точно, то усиленный закон больших чисел утверждает, что сходимости нет на множестве меры нуль, то есть все-таки нельзя утверждать, что есть сходимость для всех последовательностей. У этой «сходимости почти всюду» нет хорошей или внятной физической интерпретации, которую можно применить ко всем случаям жизни, по крайней мере мне такая не известна. Для слабого ЗБЧ такая интерпретация есть.

Есть, разумеется, случаи, когда «сходимость почти всюду» можно примерно понять. Рассмотрим, например, неограниченное подбрасывании симметричной монеты. Множество бесконечных последовательностей нулей и единиц имеет мощность континуум, так что в соответствии с усиленным ЗБЧ сходимости нет на множестве меры нуль, при условии что множество меры 1 это отрезок [0,1]. Например, ясно, что сходимости нет для любых последовательностей, состоящих из конечного числа нулей, и что таких последовательностей счетное число (то же верно и для единиц). Сходимости также нет для «неслучайных» последовательностей типа 001001001..., и что каким-то схожим образом построенных последовательностей тоже счетное число. Исчерпаем ли мы таким перебором все последовательности, для которых нет сходимости? Наверное нет. Вполне может быть, что для этого случая есть теоремы, описывающие структуру этого множества. По крайней мере ясно, что тут происходит в контексте усиленного закона.

Проблемы начинаются, когда мы пытаемся применить усиленный збч к реальным данным. Скажем, у меня есть выборка размера 1000. Обычный закон больших чисел наглядно говорит, что вероятность отклонения среднего от мат.ожидания мала, эту вероятность в некоторых случаях можно оценить. Что же усиленный закон? Мне надо представить последовательности испытаний с выборками размера 1, 2,…, 1000, ..., в одной из которых получается моя выборка, и что по некоторой мере сходимость есть всегда. Что это за мера — конкретно неясно, наверняка какая-то непрерывная вероятностная мера на множестве вещественных последовательностей. Допустим так, но что если моя выборка как раз из той самой «неудачной» последовательности? Эти последовательности же существуют? Как я буду это проверять? Или если эти последовательности не существуют, то почему нет збч в форме сходящихся неслучайных последовательностей? Получаются сложности, с тем, чтобы придумать хорошую интерпретацию того, что усиленный закон говорит.

В некоторой, степени для меня тут вопрос в том, как утверждение «с вероятностью ноль» соотносится с реальностью. Например, случайно выбранная точка из отрезка рациональна с вероятностью ноль, но это же не отменяет то, что все числа, с которыми работаем на компьютере рациональны. Также неясен смысл предельного перехода, отчасти потому что он стоит под знаком вероятности. Мы же работаем с конечными последовательностями или выборками. Получается, предельный переход вообще нерелевантен?

Колмогоров, разумеется, был прав, но мой внутренний физик не может придумать, как это правильно применить.

shuhray 18 окт 2020 в 20:43

Нужен простой пример. Если мы бросаем монету, частота выпадения герба стремится к одной второй для большинства испытаний. Выписать последовательности из двух бросков 00, 01,10, 11, затем из трёх и четырёх, посчитать частоту герба, всё станет ясно. Притом, монета может случайно падать одним гербом сколько угодно раз подряд (но вероятность этого мала).

Sergey_Kovalenko 19 окт 2020 в 13:41

О проблеме вероятности, определенной через саму себя: habr.com/ru/post/493800

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Закон больших чисел и то, чем он не является

Комментарии 13

Публикации

Истории