Pull to refresh

Comments 36

Мне кажется во многих случаях этого можно избежать, правильно обрабатывая данные.

Например, в ситуации с размером группы, брать среднее сначение не среди студентов попавших в выборку, а среди групп, студенты из которых попали в выборку
Именно, как тут не вспомнить про среднюю температуру по больнице.
И о том, что статистика — предельная форма лжи.
Все таки не обижайте статистику. Сама по себе она достаточно точна и корректна. Вопрос в способе подачи информации — а этим уже занимаются маркетологи, PR и прочие люди, у которых цели несколько иные, нежели корректная подача информации. Сразу вспоминаются сравнения производительности чего-нибудь со шкалой по «Y», стартующей не с нуля.
Математическую статистику — опирающуюся на теорию вероятности, безусловно уважаю. Но в статье речь явно не о ней. Тот же пример с группами студентов — это явное передергивание фактов, та самая средняя температура по больнице. Математики включили бы в опрос идентификатор группы. А в больнице — статус пациента :)
Не передергивание, а ошибка в методологии. Сложность статистики не в том чтобы поделить результат на размер выборки и экстраполировать на всю выборку, а в том чтобы корректно эту выборку составить. На этом очень многие срезаются. Вспомните хотябы парадокс Монти Холла, уж насколько все кажется элементарно, но практически никто не может без подсказки правильно определить базу для расчета.
Хосподи! Что вы меня все, блин, лечите-то! :))) Да, знаю я вашего Монти-Холла с козлами да машинами.
Всего-то известное (вижу, что не всем) выражение перефразировал:

«Существуют три вида лжи: ложь, наглая ложь и статистика»

// вставил бы ссылку, но теперь уже увы… гугл вам в помощь ;)

dixi
Всем лечащим понятно, что за глупость Вы цитировали, уверяю Вас
off: Забавно, наблюдаю «парадокс минусплюсатора», который можно сформулировать так:

Вижу утверждение которое не нравится, за которым следует утверждение с которым согласен — автоматом ставлю первому «минус» и второму «плюс».

Был бы минус без второго утверждения? Вот Вам и парадокс… :)
Скорее наоборот, после минуса первому утверждению читатель «следом» ставит плюс второму комментарию,
потому что автор второго комментария уже изложил ту самую критику первого утверждения, на основании которой читатель поставил минус первому комментарию.

P.S.: Совершенно непонятно, с чего вы именуете приводимое явление «парадоксом»?
Забавно, наблюдаю «парадокс минусанутого», который можно сформулировать так:
меня минусанули, не буду думать об уместности приятности и полезности своего утверждения, а вместо этого подумаю о том как удивительно устроен мир и люди которые меня окружают и хотят обидеть через эти важные для меня цифорки и байтики и выражу своё несогласие в виде неочевидной апелляции, чтобы никто не сообразил что сейчас произошло.
Так опрашивающий не знает ничего о группах студентов. Сами студенты называют свою группу. И хорошо, если все студенты из 100-ой группы знают, что их 100. Многие ведь могут отвечать примерно: 90-100, 70-95 и т.д. +)
В статье был приведен упрощенный пример, чтобы объяснить парадокс. В жизни разделить на группы не так-то просто.
В опрос следует включить идентификатор группы
Так если опрос касается величин групп студентов. Вы выхватываете из толпы любого студента и узнаете количество студентов в его группе. Первый отвечает, что 75-80, второй — 90-100, третий — 90-95, четвертый — я насчитал 88. Как вы планируете раздавать идентификаторы этим группам? +))
Если все студенты точно знают численность своей группы, то вами предложенное обрабатывание данных сработает. В ином случае все усложняется неоднородными данными полученными при опросе.
Как вы планируете раздавать идентификаторы этим группам?

Студенты могут не знать точно, сколько у них в группе человек. Но номер своей группы они должны знать :)
А если цель опроса — определить примерную среднюю численность группы, и предположить, что студенты не знают номер своей группы и тем более настоящую численность? +))
<irony> Тогда не имеет смысла их об этом спрашивать :)) </irony>
Студенты могут не знать точно, сколько у них в группе человек. Но номер своей группы они должны знать :)

Тогда проще в деканате спросить:)
И в результате будет средний размер групп студентов, попавших в опрос. А в опрос с большей вероятностью попадут большие группы. Ошибка сохранится.
Если предположить, что выборка абсолютно случайна, то вероятность, что из A опрошенных a_i скажут, что в их группе x_i студентов, равна A n_i x_i / N, где N=sum_i n_i x_i — число всех студентов на потоке. А значит, что n_i/N=a_i/(A x_i). С другой стороны, среднее число студентов в группе равно N/sum_i n_i. Отсюда следует, что среднее число студентов можно вычислить как A/(sum_i (a_i/x_i)). То есть информации в опросе достаточно, просто надо ее правильно использовать.
С самого начала прочтения этой статьи, у меня была мысль, что данных должно быть достаточно для оценки среднего значения. Комментатор выше абсолютно прав и приводит правильную формулу для определения среднего значения.
Как легко заметить, во всех приведенных в статье примерах просто допущена банальная ошибка подсчетов, статистика тут совершенно не при чем.
во всех приведенных в статье примерах просто допущена банальная ошибка подсчетов, статистика тут совершенно не при чем

Потому и называется «парадокс»: мнение, суждение, резко расходящееся с общепринятым, противоречащее (в действительности или на первый взгляд) здравому смыслу.
Избежать ошибки, обрабатывая значения среди групп, а не студентов, не получится. Потому что с большей вероятностью исследователю встретятся студенты больших групп и не встретятся студенты групп малочисленных.
Как раз вчера думал про то, что сравнивать молодых и старых не всегда корректно, потому что старые, которые были подверженны тем или иным привычкам, чаще умирали, что создало смещение в выборке.
да, но по сути, это очень похожие вещи
UFO just landed and posted this here
Строго говоря, птицы являются динозаврами, так что вероятность встретить динозавра на улице не так уж и отличается от 50%.
UFO just landed and posted this here
А почему непременно все динозавры должны стать теплокровными? Вот те, которые стали птицами — стали. А остальные — совершенно не обязательно. А во-вторых, палеонтологи говорят, что есть свидетельства, что немалая доля «тех» динозавров также была теплокровной.

ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%BD%D0%BE%D1%84%D0%B8%D0%BB%D0%B8%D1%8F

Вот даже здесь статью специально для вас написали: geektimes.ru/post/249914
Строго говоря, птицы являются динозаврами

Строго говоря, птицы не являются динозаврами.

ДИНОЗА́ВР, динозавра, муж. (от греч. den — давно и saura — ящерица) (палеонт.). Вымершее пресмыкающееся огромных размеров.


(По другим данным, образовано путем сложения греч. deinos «огромный, ужасный» и sauros «ящерица».)
Птицы являются динозаврами лишь в узком смысле, в контексте кладистики.
Ну я точно так же могу сказать, что птицы не являются динозаврами лишь в узком смысле — в контексте вашего словаря. К тому же определение у вас так себе. Получается, что ихтиозавры и вымершие крокодилы также являются динозаврами, а вот велоцираптор — нет, ибо он заметно меньше человека. И вообще, непонятно, какими точно должны быть размеры, чтобы считаться огромными. Так что ваше определение не является не только общепринятым, но и строгим. А чтобы сколько-либо строго определить динозавров, как раз приходится прибегать к кладистике, то бишь называть динозаврами всех представителей некоторой ветви древа жизни. И с этим, насколько я знаю, согласно подавляющее большинство специалистов по систематике.
Давайте тогда сойдёмся на том, что птицы также, строго говоря, являются снарядами, и с этим согласно подавляющее большинство людей, играющих в игру Angry Birds.
Ёж — птица гордая, пока не пнёшь — не полетит.

Что-то мне подсказывает, что когда вам надо будет поменять трубы в ванной, вы пойдёте к сантехнику, а не к игроку в марио.
Не узнал Ализара! Неужто чудо свершилось? Или статистически рано судить?
Sign up to leave a comment.

Articles