Pull to refresh

Comments 8

Грабли #1. Редчайший случай, когда саентист занимался успешно управлением бизнеса. От специалиста DS требуют звезды kaggle, github и пр.пр. ( и HH это уж точно может проверить по всем вакансиям в т.ч. своим) Но в бизнесе то он никогда никаких решений не принимал и перед акционерами за прибыль не отвечал. Кажется пропущен интерфейс между двумя мирами. Одни думают что решают правильную задачу, а другие думают, что выгодную. Но получается как всегда.

Грабли #2 — 5. Код для RD и код для прода отличаются всегда и существенно. Полностью различные цели и задачи. В RD алгоритм решения не известен полностью и идет поиск именно его — а иначе зачем R&D? В проде алгоритм известен весь и решается задача его оптимальной реализации — с учетом действующей инфраструктуры и экологии данного конкретного бизнеса. Любой другой путь приводит к граблям. Путь проверен и эффективен — НИР, ОКР, Прод. Можно сокращать этапы, совмещать частично, можно как угодно приспосабливать и коверкать скрамами, матом и канбаном — но без них будут грабли, не будет ответа нужного.

Грабли #6. Фундаментальная организационная проблема. Если задача после того, как ее решали 2 недели, забылась — или задача не нужна или поставлена некорректно. И, судя по применению A/B тестов, скорее всего второе. Если задача поставлена корректно — она понятна DS, DE и бизнесу и что бы забыли все сразу! Это что то исключительное. Самая большая проблема — корректная, с точки зрения математики, задача, с приемлемым приближением реальности и при этом предлагающая решение бизнес проблемы.

Отличный пример живого проведения RD и DS в реальном бизнесе. Очень полезный и наглядный пост.
От специалиста DS требуют звезды kaggle, github

Если требуют — бегите от такого работодателя! Это такой же миф, как тот, что «олимпиадное программирование» == «хорошее программирование для бизнеса». Быть крутым «олимпиадником» не помешает, разумеется, но это РАЗНЫЕ вещи!!!

Путь проверен и эффективен — НИР, ОКР, Прод.

Да я тоже занимался «академической наукой»… Но опять же реальность немного другая. Фактически есть «быстрые R&D» и «долгие R&D». Бывают случаи когда нужно просто решить задачу… и так, чтобы сразу (ну почти сразу) в продакшн…

Жизнь разная бывает. Не все в Яндексах и Гуглах работают…
Если требуют — бегите от такого работодателя! Это такой же миф, как тот, что «олимпиадное программирование» == «хорошее программирование для бизнеса». Быть крутым «олимпиадником» не помешает, разумеется, но это РАЗНЫЕ вещи!!!
Олимпиадное и промышленное программирование уже давно разделились, а олимпиадное и промышленное ML — ещё нет. Все либо делают одно и то же, либо не понять что.
Самая большая проблема — корректная, с точки зрения математики, задача

DS по определению занимается обратными и некорректно поставленными задачами

Интересно, получается что у адвокаты и юристы склонны к Scala и c#, а к Java. Почему так?

На самом деле, нейросеть одинаково не находит между этими терминами связи, значения прогноза на уровне сотых — в пределах случайной погрешности.

Может стоило начать статью с определентя, что такое ML?
Из личного опыта скажу, что люди часто произносят слова не понимая их значения. И думашь то ли лыжи не едут, то ли ...

Возможно, но тогда мог бы выйти бодрый спор об определениях, наподобие «как это машина автоматически подбирает функции, решающие правила, когда pipeline для этого настраивает и запускает человек? линейная регрессия в Excel это уже ML или ещё нет? а в scikit-learn? а если сначала коэффициенты подобрали ML'ем, а потом подправили, ввели бустинги и fixlist'ы вручную — было машинное обучение, а какое стало?»
Sign up to leave a comment.