Как стать автором
Обновить

Из физиков в Data Science (Из двигателей науки в офисный планктон). Третья часть

Время на прочтение12 мин
Количество просмотров33K
Всего голосов 78: ↑76 и ↓2+74
Комментарии23

Комментарии 23

Отличная история! Спасибо!

Вот поэтому приращение интеллектуального продукта в крупных компаниях все больше идет по пути скупки сторонних команд, а не вызревания изнутри. Забавно, но в некоторой степени то же наблюдается и в академической среде, недавно была


крайне любопытная статья

Wu, L., Wang, D., & Evans, J. A. (2019). Large teams develop and small teams disrupt science and technology. Nature, 566(7744), 378–382. https://doi.org/10.1038/s41586-019-0941-9


о том, что прорывные идеи формируются в маленьких научных коллективах.
И то же с престижем журналов, который лишь очень опосредованно и не всегда гарантирует качество статьи.
Живем в мире брендов =\

*звуки зависти*
На что они похожи
Доставляет. Особенно, где автор упоминает о том, что он — Ветеран боевых действий (в предыдущих статьях чуть более развернуто).
Говорят, что религии отбросили развитие человечества на несколько сот лет назад. И что-то мне подсказывает, что HR отделы смело могут нести ответственность еще за пару десятков
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
А мне было бы интересно посмотреть, как изменилась бы наука, если бы преподавателям платили из зарплат воспитанных ими учеников.
НЛО прилетело и опубликовало эту надпись здесь
Если зарплаты в науке поднимут до уровня индустрии(или тем более, выше), то мы увидим на хабре целые серии статей по типу «Я работал в МВД двадцать лет, но ВНЕЗАПНО понял, что всю жизнь любил химию. Делюсь своей историей, как от искусства допросов перейти к искусству проводить синтез липидов)))) ».

Не так уж и плохо будет, если он это осилит.

Это только на первый взгляд. Потому что, если чуть подумать, то очень быстро такие деятели составят большинство. ;)
Очень странные задачи для академической науки имхо, детекция и сегментация по готовому сету. Было бы более похоже, если кто-то из спонсоров спустил бы такие задачи в качестве satellite events, наряду с концертами и cocktail party. Особенно robotic instrument segmentation. GIANA — чистая прикладная мед задача. А если это и правда были задачи «академические», то все правильно, драть таких надо во все щели своими глубокими сетями и гнать из науки хгбустами, «научной новизны нет». Научные задачи заключаются в проверке гипотез, а не о конкретном перформансе. Чем более фундаментальна гипотеза, тем важнее получаемое знание. Если в датасете есть необъезженные гипотезы, или датасет был получен с применением качественно новых технологических решений, этот датасет обычно зажимают и не делятся, потому что тогда «академик» потеряет свое конкурентное преимущество — первенство в предметной области.

Однако история заставляет очень сильно задуматься о своем положении…
Проще всего организовать конкурс по какой-нибудь одной тупой метрике, которая отражает один-два параметра решения «в вакууме», а не в конкретных ограничениях. Тут конкурс скорее всего направлен на то, чтобы узкие спецы оценили некий технологический уровень в более широкой области, а плюшка нужна просто для пиара и привлечения людей со стороны.

Про перформанс — если вы получили повышение точности +1% за счет +100 классификаторов в стэке, то это никакая не прикладная наука, а грубая вычислительная сила («есть чо? а если найду?»). Загоним сырые данные в облако с теслами и посчитаем катбустом. Хотя можно было насчитать 5 фичей и обучить логрег. Такие модели до нормального продакшена не доживают, т.к. во многих случаях важнее простота и предсказуемость ошибок, чем высокая точность.

А насчет того, кто чаще всего зажимает датасеты, так скорее уж бизнес (он ими торгует).
НЛО прилетело и опубликовало эту надпись здесь
Ну красавчик! Респект и уважуха! Чем-то перекликается с моим опытом — в том смысле, что приходилось тоже двигаться туда, куда интересно, но опыта нет. В прошлом я тоже физик, защитил к.ф.-м.н. по моделям синергетики и теории самоорганизации, но все это было далеко от ML и DL. Да и был период нерелевантного опыта (хотя тоже — опыта:)), надо было деньги на жизнь зарабатывать. И вот из всего этого рванул с нуля (и даже с минуса, можно сказать)) в ML. Поначалу было все, мягко говоря, неопределенно и непонятно ))) Было только желание, ну и голова на плечах)) Но вот сейчас уже тоже есть знания, опыт и уже не первый год на позициях Sr. DS
Шел январь 2017 года. На тот момент у меня было чуть больше года трудового стажа и работал я в Сан-Франциско в компании TrueAccord как Sr. Data Scientist

Я никак не могу понять как человек с 1 годом опыта в индустрии может иметь приставку Сеньор?

PhD в хорошем вузе частично закрывает опыт.

Читал как художественную книгу, спасибо. Прям интересно.
И знаете вот этот приём в фильмах, когда показывают как герой тренируется, и за 5 минут фильма изображают 10 лет тренировок. Я всегда считал, что это фантастика, а оказывается нет. Вот герой этого рассказа в моём представлении делает тоже самое. Почитал, порешал задачки, раз и научился, кажется, что это так легко.

А на самом деле, какая же интеллектуальная пропасть между автором и обычными людьми, которые не помнят как корень квадратный из четырёх вычислить. Какой мощный у вас мозг. Столько информации усваивать. Так благодарен людям с такими умственными способностями. Столько всего удобного и полезного изобрели. А обычные люди этим пользуются и даже представления не имеют сколько под этими изобретениями научных трудов, исследований и работ.
Вы только забываете что люди делающие научный прогресс каждый день кушают, а сколько труда потрачено чтобы вырастить теже помидоры они тоже не догадываются)))))
да, согласен, но как мне кажется любой умный человек сможет вырастить еду, но не каждый фермер сможет программировать, например.
Нет, справедливости ради, этот не так. И хэллоуворд средний фермер способен написать, если его как-то за комп запинать. И средний программист без труда вырастит огурчик на подоконнике. Но создание и поддержка нормального работоспособного приложения, которым не три с половиной человека пользуются, это нелегкий труд с неочевидными решениями. Однако и выращивание еды под какие-то пищевые стандарты и в более-менее пристойном количестве — это нифига не просто. Но обывателям со своих сторон видится, что программисты заняты ерундой, печатают чего-то да в экран с нахмуренным видом пялятся, а фермачи ковыряют землю и семена кидают, колхозня да и только.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий