kriot 14 ноя 2020 в 11:46

Дилемма: пойти в проверенную столовую или попробовать новую?

5 мин

15K

Занимательные задачкиМатематика*Логические игры

+42

Комментарии 26

StjarnornasFred 14 ноя 2020 в 12:59

В реальной жизни наиболее «оптимальна» (не в математическом, а в общем смысле) стратегия №3. Первую треть отпуска можно и нужно ходить в разные столовые как минимум из любопытства и тяги к новому, выбирая из всех существующих те, которые кажутся наиболее интересными (не лучшими, а именно интересными для посещения и отличающимися от других). А потом, когда из них определена лучшая, а все остальные столовые не представляют интереса в силу однотипности с ранее посещёнными, можно ходить только в лучшую.

DmitryOlkhovoi 14 ноя 2020 в 13:05

Помню пробовали этот прикольный сайт WHERE THE FUCK SHOULD I GO TO EAT?
Только, что-то барахлит с сертификатом

НЛО прилетело и опубликовало эту надпись здесь

sophist 14 ноя 2020 в 14:30

Предположение о нормальности распределения качества столовых наиболее естественно. Распределение нормально в ситуациях, когда на величину влияют много независимых факторов.

Вас, вероятно, смущает среднее, равное нулю. Но ведь мы просто принимаем за ноль качество "на троечку" (и ничто не мешает смердящие столовые с бомжами исключить из рассмотрения вовсе).

НЛО прилетело и опубликовало эту надпись здесь

sophist 14 ноя 2020 в 17:09

Скорее, не распределение перестаёт быть нормальным, а центрирующий параметр смещается (возможно, за пределы рассматриваемой области). В любом случае, важно распределение не столовых, в которые мы готовы пойти, а столовых, по которым мы считали квантили, нет?

sophist 14 ноя 2020 в 14:22

Все рассмотренные стратегии детерминированные. Учитывая, что максимизируем мы матожидание, а также что в любой момент можем оценить квантиль текущего максимума, почему бы не рассмотреть такую стратегию: "каждый день с вероятностью, равной этому квантилю, выбираем exploit, а с оставшейся от единицы вероятностью – explore"?

maximw 14 ноя 2020 в 15:16

Это противоречит принципу «сначала изучай»

sophist 14 ноя 2020 в 16:40

Вот поэтому и интересно её рассмотреть. Принцип был выведен для детерминированных стратегий, интересно, как обстоит дело в случае вероятностных.

wataru 14 ноя 2020 в 18:12

Можно было бы так — выбрать случайно сколько дней изучать, или с какой-то вероятностью каждый день переходить в состояние exploit, не возвращаясь больше к explore. Эта стратегия эквивалентна вашей, но не нарушает принципа оптимальности.

tunelix 14 ноя 2020 в 15:08

Sergey_Kovalenko 14 ноя 2020 в 16:00

Над формализацией стоит подумать еще.

НЛО прилетело и опубликовало эту надпись здесь

sophist 14 ноя 2020 в 17:13

Интересно было бы модифицировать задачу для случая, когда априорное распределение качества неизвестно, и всю необходимую статистику для него мы получаем непосредственно в ходе эксперимента.

MichaelBorisov 15 ноя 2020 в 01:42

Для случаев, когда распределение неизвестно, обычно применяются т.н. «непараметрические» методы, т.е. вместо абсолютных значений величины берётся их ранг в выборке. Так как распределение рангов известно — оно равномерное — то дальше можно применять теорию равномерного распределения.

ss-nopol 14 ноя 2020 в 17:23

Не всё так просто. В одной столовой может быть отличный суп, а в другой — борщ (по четвергам). То есть надо перепробовать ещё разные блюда, которые к тому же могут быть не каждый день.

MinimumLaw 14 ноя 2020 в 18:50

Интересно… Я решаю подобные проблемы крайне просто — достаю монетку и подбрасываю. Орел — идем в проверенное, Решка — ищем новое. Но вот меня не хватит проверить математикой ожидаемый результат…
К слову хорошо работающая стратегия. Над нами с женой в магазинах постоянно ржут когда мы выбираем один из двух понравившихся товаров. Нервы она точно сохраняет. А это уже не самый плохой выигрыш.

VolCh 14 ноя 2020 в 19:54

Меня жена убивать готова за монетку при принятии решений, поэтому наловчился в кармане, например, незаметно покрутить и посмотреть.

НЛО прилетело и опубликовало эту надпись здесь

Hodus 14 ноя 2020 в 22:28

Есть теория что мы решения принимаем практически случайно, а после мозг придумывает объяснение, почему мы решили так. Исследования Роджера Сперри это частично доказывают. Нобелевская премия по медицине 81го года

tunelix 15 ноя 2020 в 13:37

попробуйте построить атомную станцию, процессор с миллиардами транзисторов или БАК подбрасывая монетку

teology 14 ноя 2020 в 21:56

Я что-то не понял, а разве это не известная проблема разборчивой невесты? Ею ещё Борис Березовский занимался до олигархического периода своей жизни.

Hodus 14 ноя 2020 в 22:14

теория момента остановки или марковский момент времени. Класические примеры — поиск места для парковки, поиск квартиры для аренды.

kriot 14 ноя 2020 в 23:09

Задача о разборчивой невесте похожая, но другая. Отличия:
— К столовым можно возвращаться, а к женихам — нет
— В классической постановке задаче о невесте считается, что распределение качества женихов не известно, поэтому первое время нужно исследовать именно его, скипая женихов. В задаче о столовых игроку известно распределение
— В задаче о невесте цель найти лучшего жениха. В задаче про столовые цель максимизировать сумму качества посещенных столовых, что больше похоже на «как можно раньше найти более ли менее нормального (не лучшего) жениха»
В частности, это приводит к другой оптимальной стратегии

tmin10 15 ноя 2020 в 01:41

Когда сменил работу, с новыми коллегами обошли все ближайшие кафе на обед, которые находились в радиусе 10-15 минут пешком, а потом ходили в те, что понравились лучше, но не постоянно, чередуя разные варианты. Хотя этот вариант, конечно, не идеален, когда время ограничено.

Firsto 15 ноя 2020 в 10:44

Хорошо, когда идеальная столовая в одном здании с офисом

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Дилемма: пойти в проверенную столовую или попробовать новую?

Комментарии 26

Публикации

Истории