Pull to refresh

Comments 74

А есть эти книги в переводе? Хочу дать на почитать паре людей…
Поясню для автора статьи: «Один мой знакомый» не знает английский, можете ли вы погуглить для меня переводы этих книг?
Нет, вопрос именно — есть или нету. Найти я могу и сам.
Просто автор ссылается на них — но всюду на англ.версии.
Варинты: русской нет, либо просто англ удобнее автору.
Лично мне пофиг (я уже скачал англ себе).

p.s.: беглый вопрос по «имя книги + перевод» результата не дало.
Огромное спасибо! Расшарил с «одним моим знакомым» (3шт).
Отличный пример буквально на днях попадался

image

Сначала смутило то, что статуя свободы изображена больше Волгоградской Родины, но и остальными статуями на картинке расклад тоже такой же

Для тех, кто не в курсе, статуя свободы без пьедестала (как изображено на картинке) всего 45 метров, а Родина Мать без пьедестала — 52.
И это тоже ложь — цифры с пьедесталом, статуи без.
В своё время нам твердили, что Останкинская башня — самая-самая!
Полез на днях в Вики: добрёл до высотных сооружений…
Ну и листаю по мере роста от Эйфевелевой и по годам…
Дохожу до 2000-х с арабской мегапостройкой — Останкинской нету!
Начинаю поиск от Останкинской — выясняется, что как чисто высотка она в свои годы не дотягивала до рекордсменов!!!
НО!
Если учитывать только телевизионные, только бетонные и только без внешних распорок… То да, она была таки на первом месте!
Тоже статистика, однака…
А у нас тут, как видите, добыча газа неуклонно растет.
image
Такая практика используется и в айтишных кругах:
image
Для тех, кто не в курсе, статуя свободы без пьедестала (как изображено на картинке) всего 45 метров, а Родина Мать без пьедестала — 52.

Для тех, кто не в курсе. Высота пьедестала статуи «Родина Мать» в Волгограде — около 2 метров. 52 метра — это высота самой фигуры без пьедестала. 85 метров — высота фигуры без пьедестала до конца меча. Высота Статуи Свободы без пьедестала до конца факела 45-46 метров (по разным данным).

А вы дезинформируете народ, давая высоту Статуи Свободы по факел, а Родины Матери по макушку ;)
Ух. Интересно, сколько таких статуй на просторах СНГ?
а то оказалось, чтол статуя «Родина-Мать» внезапно есть не только в Киеве, а и в Волгограде…
Очень важная статья для любого менеджера проекта, я считаю!
UFO landed and left these words here
20% — это вероятность того, что пять орлов не выпадут ни разу за 50 подходов. Значит, искомая вероятность — 80%. Это, конечно, не есть абсолютная уверенность в успехе, но всё-таки немало. Но не суть. Автор исходного текста имел в виду «мы будем повторять опыт, пока он не даст нужные нам результаты».
UFO landed and left these words here
Хорошая статья, спасибо. Теперь будет на что ссылку давать тем, «кто знает как правильно всем этим заниматься», прежде чем отсылать почитать Тафти и учебник по статистике.

По поводу восприятия людьми различных стимулов — известный Закон Стивенса.
Ресурс, именно по типичным ошибкам в статистике: Statistics Done Wrong.
Ну и масса блогов по визуализации данных.
А ещё гуглите «Манипулятивная диаграммология».
Она же вот эта статья с загуглённой презентацией «Как не дать диаграммам себя обмануть».
Спасибо за статтю.

Напомнило:
Если взять число и отнять от него 20%, потом добавить 20% от того что плучилось, то получится число, на 4% меншее за исходное.
Неужели это кого-то удивляет? Отнять 20% от числа — это то же самое, что умножить его на 0.8. Добавить 20% к числу — это то же самое, что умножить его на 1.2. Собственно, (N * 0.8) * 1.2 = N * (0.8 * 1.2) = N * 0.96. То есть ровно 96% от исходного.
А если взять число и отнять от него 99%, а потом добавить 9999%, то удивительно, проиграем всего 1%!
Не стоит доверять вам деньги. В вашем примере мы выигрываем 0.99%.
Приятно знать, что тут пересчитывают любые выкладки в комментариях :)
Лол) Тогда не деньги, а вам самому доверять не стоит :-) Шутка конечно же.
Спасибо за перевод. Было интересно почитать.
Есть ошибочка. Причём в оригинале. Хотя ситуацию принципиально она не меняет, но
Давайте попробуем еще разок, пусть текущий год — 100%, значит цены на молоко составляли 200% в прошлом году, а хлеб 50%.

10 копеек от 30 копеек, будет 33,(3)%, а не 50%.
Судя по всему, в статье должно быть не «а хлеб вырос на 20», а «а хлеб вырос до 20».
Что конечные точки на графиках как бы рядом, хотя там идёт огромный скачок на шкале от 800к до 1.5кк)
Ещё один частый подлог — корреляция преподносится как причинно-следственная связь.

image
Абсцисса на этом графике просто великолепна.
Меня всегда раздражают душераздирающие графики ужасающего падения величины почти до нуля, при том, что внизу шкала Y начинается с лишь немного меньшего значения, чем максимум на графике. В итоге, падение на полпроцента создаёт панику в головах людей.
О дааа :)
Помню, лет 7–8 назад, когда был одним из ответственных за доступность сети банкоматов, негодовал, почему большие начальники докладывают самым большим начальникам уровень доступности в масштабе по оси ординат что-то типа от 95 до 97 процентов. Естественно, при таком раскладе падение на полпроцента выглядело феерическим провалом и влекло за собой необходимость долго объясняться. Один раз мои начальники со мной согласились и доложили в масштабе от 0 до 100. На это получили выговор: «не видно изменений, переделайте».
UFO landed and left these words here
Ну так «уровень доступности» стоило бы измерять в процентах недоступности ибо пользователя не волнует сколько раз он успешно воспользовался банкоматом, но его бесит каждый случай когда он воспользоваться им не смог :)
Было бы от 0% (идеал) до, скажем, 7% (ужас). Полпроцента в таком масштабе вполне себе ощущаются.

А 95-97% сделали, надо полагать, потому что «95% доступности» звучит лучше чем «5% недоступности».
Но вот начало шкалы-то как раз выбрали правильно, на графиках для адекватного отражения ситуации все равно следовало бы отразить примерно тот же диапазон, просто в цифрах доступности — т.е. те самые 90-100% или 93-100%.
На мой вкус — статья несколько… biased («предвзята»).

Все-таки, за такого рода ляпами чаще стоит неграмотность, чем злой умысел. Сколь-нибудь квалифицированные статистики редко делают такие ошибки 00 слишком они «дидактичны». Такие цифры чаще производят на свет менеджеры по продажам и пр.

В пору доступности «Big Data» нужно быть особо осторожным на предмет «False Positive Discoveries» — «Ложные открытия»
(картинка подо катом)
(картинка подо катом)
Вы недооцениваете человеческую тупость.

Я видел подобные фокусы (в частности, совершенно по-идиотски сконструированные выборки и откровенную подмену причинно-следственной связи корреляцией) в исследованиях, причем не в каких-то несчастных местечковых самопалках и студенческих работах, а «типа как серьезных» публикациях оплаченных вполне ощутимыми грантами (собственно, очень многие из поддерживаемых Институтом Гувера исследований в т.н. social sciences грешат подобными «фокусами»).
«Деньги взад» у таких учоных, насколько я знаю, еще ни разу никто не попросил.
Хотел бы ещё добавить, что у Мартина Гарднера в книге «А ну-ка, догадайся!», посвящённой парадоксам в широком смысле слова, пятая (кажется) глава посвящена статистике и типичным ошибкам интерпретации.

Например, по статистике, смертность от рака (относительная, доля от всех причин смерти) в мире с каждым годом всё выше. Казалось бы, из этого напрашивается вывод, что медицина плоха и всё хуже справляется с раком. Ну или что экология стала хуже. Или ещё что-то в этом роде.
На самом же деле это прямое следствие увеличения средней продолжительности жизни и уровня её качества — подавляющее большинство случаев рака бывает у пожилых людей, а раньше просто до рака, так сказать, не успевали дожить.

Есть в переводе на русский, читается легко, всем советую.
На самом деле, и ваш вывод после слов «На самом же деле» далеко не бесспорен. :)
У нас в лаборатории большинство экспериментов проводилось на допотопном оборудовании. Прибор чертил на бумаге пером кривую, по наклону которой (методом прикладывания линейки к воображаемой средней линии) определялись различные параметры.

Когда определяли например графики активности ферментов, дабы не смущать научрука большим отклонением от его ранее полученных данных, один край линейки чуть сдвигался вверх или вниз (буквально на 0.5-1.0 мм) в зависимости от допущенной ошибки. Заметить такой финт — невозможно из-за «шумности» прибора.
Обожаю математику и тервер!
В инсте просто прикола ради рассчитал вероятность того, что пол-аудитории задохнётся: вероятность того, что атом воздуха находится в передней или задней части аудитории — 0.5: тупо или там или там.
Размер аудитории известен, число атомов на кубометр — известно. Надо посчитать вероятность того, что ВСЕ атомы воздуха окажутся с одной стороны…
Число вышло исчезающе малым, но таки ВЕРОЯТНЫМ!
Долго одногрупников пугал, а потом объяснил, что рассчёт яйца выеденного не стоит, т.к. не учитывает давления и т.д.: если в какой-то стороне газа больше, то лишних тупо выпнут в другую часть…
Ваши одногрупники очень пугливы. Там и без давления вероятность настолько мала, что у меня рука отвалилась бы нули писать.
«вероятность того, что ВСЕ атомы воздуха окажутся с одной стороны…»

50% же — окажутся или не окажутся :)
Сразу вспоминаются все эти ТВ ролики с высказываниями вида «Номер 1 в России/Европе/Мире*».
Да, недавно вроде был пост про подобные маркетинговые уловки. И про звездочки и про растительное масло без холестерина.
Даже известный своей качественной работой с данными New York Times выпустил подобный совершенно сбивающий с толку график (обратите внимание на скачок с 800к до 1,5м в центре шкалы).

А в графике New York Post, тоже очевидно «известный» своей качественной работой с данными
Это рассчитано на тех, кто читает очень быстро. При большой скорости чтения, например 500 слов в минуту на критическую оценку текста времени нет, и читатель впитывает всё, что ему написал автор.
Тут есть люди, которые читают по паре-тройке книг в неделю. Они не отдают себе отчёта в том, что не обдумывают прочитанное — они просто поглощают.
Я некоторые книги по полгода читаю, а некоторые вовсе не осилил, при этом часть книг я не читаю, а изучаю с карандашом в руках. В среднем на книгу уходит месяц, иногда больше. То, что можно читать по пути на работу, в метро повиснув между пассажирами, я книгами не считаю.
Книг 5-6 в месяц читаю, конечно это художественная литература, на техническую уходит больше времени, как раз в транспорте. Если точнее, то фиксирую момент когда книга прочитана, промежуток времени, затраченный на чтение может быть и больше, и меньше, т.к.читаю параллельно несколько. Запоминать художку имхо смысла нет, понравившиеся идеи, мысли — в цитатник.
Поясните пожлуйста, а что именно здесь не так? Нет, я понимаю, что написана ерунда, но что именно вас возмутило?) Подобные книги можно целыми параграфами в качестве цитат приводить…
Вспоминается советский анекдот:
Хрушёв и Кеннеди решили устроить шуточный забег глав государств. Кеннеди, как более молодой, выиграл.

В Американских газетах:
В забеге глав крупнейших государств наш президент первый, а советский генсек пришёл самым последним.

В Советских:
В забеге глав крупнейших государств Никита Сергеевич Хрушёв занял почётное второе место. Американский президент лишь на предпоследнем.
Прикольно. Совершенно хрестоматийный обман.
Что-то не вижу явного обмана (если, конечно, указанные цифры соответствуют действительности), скорее вижу грубую небрежность в построении графиков (проще говоря, графики построены в разных масштабах, чтобы казалось, что они пересекаются гораздо раньше, чем на самом деле) и полное отсутствие пояснений по промежуточным значениям (и при этом зачем-то внизу сделана линейка), да и вообще, непонятна цена деления (делений 22, а годов — 10).
А Вам не кажется немного странным, что тезис — про «рождаемость» а на первом графике (где столбики и человечки) «численность жителей»?

Ежели я в Екатеринбург перееду, то численность там вырастет на 1 :)

Второй график чуть менее «палевный» (хотя надо бы проверить цифры), но всем нормальным специалистам известно что в РФ имеется периодическое колебание рождаемости, которое надо учитывать при оценке ценности заявлений относительно того что «Политик Х увеличил рождаемость....»

Так что очень, очень хрестоматийный пример.
Если цифры рождаемости и смертности не взяты с потолка, то это — скорее уже не явный обман, а всего лишь демагогия. То есть, «мы сказали всю правду, а то, что вы их неправильно поняли, это ваши проблемы».
Я сказал «хрестоматийный», то есть достойный помещения в некий (смею надеяться, воображаемый) дидактический материал, содержащий систематически подобранные материалы о том, как «правильно» обманывать.
Согласен с тем, что первый график удобно притянут за уши. А вот второй мне понравился. По моим прикидкам разница рождаемость-смертность принесла "-50000" :) Так что «понаехало» прилично.
При этом сам график не врёт в плане «позитива» — рождаемость привысила сметность, динамика тоже положительная, выборка за 10 лет тоже добавляет оптимизма. А вот правдо ли это — другой вопрос.
Так я и говорю: демагогия. Даны три утверждения:
1) с 2000 по 2010 правил Путин;
2) за это время рождаемость повышалась, смертность уменьшалась, так что в какой-то момент рождаемость превысила смертность впервые со времён перестройки;
3) за этот период население города увеличилось.
Допустим эти утверждения верные. О причинно-следственных связях между ними ничего не сказано, но невнимательный читатель решит, что они выстроены именно так: Путин правил хорошо, поэтому рождаемость увеличилась настолько, что стала причиной роста населения, на что собственно и рассчитано. А вот разные масштабы графиков — это уже грубый просчёт, надо было хотя бы разместить их отдельно, если хотелось, чтобы их не сравнивали.
Only those users with full accounts are able to leave comments. Log in, please.