Pull to refresh
23
0
Владимир Волохонский @volokhonsky

Аналитик данных

Send message

Здравствуйте! Прошу прощения за задержку с ответом...

Да, действительно, в Израиле доля программистов среди населения заметно выше, чем в Мексике. Однако, есть нюанс. В Израиле профессиональных разработчиков около 60 тысяч человек на 9 миллионов населения, т.е. 0.7%. Доля программистов в Мексике намного меньше, 0.1% от населения. Но вот населения там почти 130 миллионов. В итоге профессиональных программистов, по нашим расчётам, в Мексике (как и в Канаде) получается в два раза больше, чем в Израиле, в Испании - в три раза больше.

К сожалению, чем меньше целевая популяция и чем выше средние доходы в стране, тем дороже набрать выборку для исследования. Мы просто не можем набрать достаточно израильских программистов, чтобы выделить их в отдельную категорию. Они находятся в группе "Другие страны Европы" в прекрасной компании Кипра, Италии, Португалии, Швейцарии, Монако и Лихтенштейна.


Единственное исключение тут - это Беларусь, в которой программистов предположительно меньше, чем в Израиле. Но как раз там у нас легко собираются ответы и мы исторически их выделяли в отдельную группу.

Просто в те годы, когда я учился, профессия программиста была интересной, но ещё не столь массовой. Так что они не "исчезают". Они просто не появлялись в таких количествах 20+ лет назад.

С простыми переменными всё понятно, а как из языка в язык передаются более сложные структуры, хотя бы — датафреймы?
А про Wargaming я правильно понял — там работали несколько человек менеджерами продукта, развивали некий движок, который компания объявила открытым. Эти ребята увели часть команды и на этом «открытом» движке сделали свою игру и назвали компанию по названию той игры, над которой они работали в WG? А это была их инициатива в WG — объявлять о том, что движок открытый?

Если так, то мне кажется, что после такого любая компания, когда её сотрудники приходят и начинают говорить, что надо сделать открытый движок или ещё какую-то часть кода, будет смотреть на этих людей как на вот таких вот талантливых, кхм, молодых лидеров.
Опрос-то глобальный, так что более актуально добавить в перечень языков Apex и ABAP. Но вообще может быть сделать какую-то опцию для таких сверхузкоспециализированных корпоративных языков.
Но мы в следующем году планируем добавить русский перевод, так что 1С-ники смогут Выполнить(Опрос). :-)
Действительно, у меня сейчас уже нет сил и времени реагировать на подобный бред, который пишет автор. Причём ведь это, кажется, не первая успешная его попытка хабрахайпануть на теме.
Ну очевидно же, что если к обычным ежегодным причинам смертности добавить ещё несколько тысяч человек, умерших от коронавируса, то будет больше, чем от естественных причин. Всем суждено умереть в каком-то возрасте, так что если просто убить 100-200 тысяч стариков, то ничего не изменится, таков ход мысли автора.
У меня никаких предложений, я не возражаю против оценки в 17.3 дня.
С односторонним уровнем значимости в 5% — при условии, что вероятность выпадения орла меньше 0.223.
Но пример с орлами и монетками не очень интуитивен. Представьте себе некий аппарат, выстреливающий шариками со случайной вероятностью 80% белых, 20% чёрных. Из этого аппарата сделано НЕИЗВЕСТНОЕ количество выстрелов в ящик. Вы вынимаете из ящика два шара и они оказываются чёрными. Какова вероятность того, что ящик после этого не пустой?
Это действительно грустно. Нет, понятное дело, есть куча всевозможных статистических ухищрений, специальных формул для вычисления величины эффекта из данных разной природы, но практически никогда нет оснований взять и свалить все исследования в одну кучу и посчитать статистику по собранным в одну большую кучу данным.
А вы так пишете, как будто только что прочитали про них в Википедии и спешите донести эту ценную информацию граду и миру. Как вы думаете, почему в современных медицинских исследованиях стали приняты не только двойные слепые плацебо-контролируемые рандомизированные исследования, но ещё и многоцентровые?
А вот тут уже, чтобы что-то утверждать, моих знаний явно недостаточно. Но вызывает большие сомнения про «практически все». Гриппом-то на земле наверняка есть миллионов сто, которые ни разу не болели. Как и туберкулёзом и множеством других заболеваний разной степени летальности и контагиозности.
Вот скажи мне, зачем ты разместил второй раз комментарий, который заминусили? Ты может не понял, за что? За утверждение «первый адекватный за сегодня». И за неспособность статьи писать.
Тут такое дело. Когда делается метаанализ различных публикаций, то такого рода усреднение средних — практика нормальная, хотя математически она может казаться странной. Но только на первый взгляд.
Мы имеем три разные оценки одного и того же параметра генеральной совокупности. Это не три средних трёх выборок, которые нужно сложить в одну выборку и получить такую вот мегасупероценку. Это три независимых исследования, в которых получены разные оценки.

Смотрите, что происходит. Допустим у нас есть пять иследователей в пяти точках земного шара, каждый из которых купил градусник на Али. Первый измерил температуру здоровых австралийских женщин 100 случаев и получил среднее 36.62. Второй измерил температуру случайной выборки людей старше 18 лет 200 случаев и получил 36.7, третий измерил температуру случайной выборки школьников 200 раз и получил 36.45, четвёртый исследовал неизвестно кого 400 раз и получил 36.8. Наконец, было ещё одно исследование со случайной выборкой здоровых людей в Германии, где было изучено 1300 человек и получена средняя температура 37.8.
Примерно с такими данными приходится иметь дело, когда делаешь какой-то метаанализ. Что-то ты выкидываешь, как заведомо некачественное и не относящееся к вопросу, что-то оставляешь. Но ты всегда должен предполагать, что у кого-то был сломанный китайский градусник. :-)
Иногда вообще неизвестно, какого размера была выборка, которая привела к какому-то показателю. Но всё равно эти данные, которые стоит как-то учесть, если в принципе данных очень мало и они разнородны.
Хм, любопытно. А тут можно любые жалобы на бывших работодателей писать с обвинениями в уголовках, в том числе, что они тимлида закопали в подвале?
Сперва сотрудник соглашается работать за чёрную зарплату, потом не выходит на работу, говоря, что имеет право. Идёт на встречу, не взяв с собой диктофон, а потом пишет свои воспоминания об этой встрече в сеть.
Я — главный редактор СМИ. Мне регулярно угрожают исками за публикацию совершенно достоверных данных, по которым у меня есть доказательства. Иногда даже реально подают в суд. Я бы никогда не решился опубликовать такой текст, если у меня нет хотя бы двух свидетелей, железно готовых всё подтвердить. С учётом 30+ тысяч просмотров на хабре, ущерб деловой репутации вообще стопудовый.

А вообще, это может быть разводкой следующего рода — на хабре появляется пост пользователя, который тут всего три дня про некое ООО. Пользователь исчезает навсегда. А волшебное ООО подаёт иск на хабровладельцев (в любой юрисдикции). Со стопроцентным шансом на выигрыш.
Она ни о чём не говорит, если у нас нет вообще никакой информации об истинном значении этого показателя. В случае же, если у нас есть основания полагать, что летальность существенно ниже 33%, то она именно и говорит о наличии скрытых случаев.
Мне кажется, автор проводит какой-то странный социальный эксперимент — какое количество людей поверит сказанной с умным видом очевидной нелепости, если они хотят поверить выводам, основанным на ней.
В комментах уже всё сказано. Дам автору пару идей для будущих постов, развивающих его блестящий подход:
1) Смертность среди смертельно больных — 90%, а среди здоровых — 0.1%, следовательно средняя смертность составляет 45,05%. Но смотрите, от коронавируса умирают гораздо меньше людей, нет оснований паниковать, коронавирус возможно даже снижает общую смертность!
2) Смотрите, ваша вероятность умереть в ближайшие 30 лет — 20%. А от коронавируса всего один процент. Так чего вы боитесь-то?
3) Если в женщину выстрелить из ружья с расстояния в 10 метров, она в 40% случаев умрёт. Но смотрите, среди умирающих доля женщин 50%, то есть опасность выстрелов из ружья сильно преувеличена!
Мне представляется, что летальность — это вероятность умереть в случае заражения вирусом по причинам, непосредственно связанным с заболеванием. Может быть с такой поправкой — вероятность для тех, у кого вирус явно себя проявил, потому что там ещё есть неизвестное количество людей, которые и не заметили, что у них вирус побывал — пока нет широко распространённого тестирования, затрагивающего множество здоровых, как в случае с ВИЧ.
Это везде неясно написано. И я не понимаю, почему вы считаете, что кто-то пользовался этой величиной для каких-либо расчётов. Было указано, что она недостоверна и всё на этом.
Конечно, не значит. Потому что мы знаем для монетки её вероятность выпадения решкой (0.5) и зная, что Вы кидали несколько раз монетку и получили две решки, я могу рассчитать доверительный интервал, по которому получается, что Вы кидали монетку от 2 до 9 раз. И даже если бы у вас была не монетка, а кубик, который выпадал два раза единичкой, всё равно в 95% доверительный интервал попадало бы от 2 до 30 бросаний кубика.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity