Как стать автором
Обновить
0
0

Пользователь

Отправить сообщение

Как управлять проектами машинного обучения и data science

Время на прочтение6 мин
Количество просмотров6.3K

Управлять проектами машинного обучения (Machine learning) и data science сложно, поскольку проекты часто носят исследовательский характер, и трудно предсказать, сколько времени потребуется на их завершение. Часто всё начинается с одной идеи, а затем перетекает в новое направление, когда предложенный метод не срабатывает или если предположения относительно данных оказываются неверными.

Построение модели также является длительным процессом (по сравнению с работой в сфере программного обеспечения и аналитики), и data scientist нередко попадает в кроличью нору и тратит месяцы на проект, не имея четких представлений о прогрессе. Еще одно отличие от стандартных практик разработки программного обеспечения заключается в том, что построение модели обычно выполняется всего одним человеком, и это не совсем вписывается в традиционные командные рабочие процессы, такие как Kanban и Scrum.

Я потратил достаточно много времени, изучая существующие рабочие процессы (в основном в Jira) с точки зрения пригодности для управления проектами машинного обучения и data science, но безуспешно. Большая часть информации нацелена на разработку программного обеспечения и фокусируется на Agile методологиях.  Обсуждая этот вопрос с коллегами и друзьями мне не удалось найти ничего, что было бы адаптировано для машинного обучения и data science. Я заметил, что часть коллег пытаются адаптировать свой рабочий процесс к стандартной инженерной практике, в других же случаях, они вообще не пытаются управлять проектами. Последнее особенно проблематично, по причине того, что проекты, которые требуют слишком много времени и замахиваются на слишком большую предметную область, вероятнее всего провалятся.

Поскольку мне не удалось найти подходящее решение, я решил разработать собственную рабочую схему для управления проектами машинного обучения и data science. Данный процесс может быть реализован в Jira и позволяет мне легко отслеживать статус проектов, вести отчетность, а также не давать раздуваться предметной области, избегая построения чересчур сложных моделей. У наших исследователей появляется рабочая схема, которая помогает им в построении модели, что повышает их успехи в проекте. Я пользуюсь этой системой уже несколько лет, и мы с моей командой очень довольны ею.

Читать далее
Всего голосов 10: ↑7 и ↓3+4
Комментарии3

Время поговорить об MDM

Время на прочтение5 мин
Количество просмотров3.9K
image

Рады приветствовать Вас на корпоративной странице компании «Юнидата». В последнее время имя нашей компании все чаще стало звучать на «Хабре», что сподвигло нас создать свой корпоративный блог, в котором мы будем писать об управлении данными, руководстве данными, анализировать основные тренды в области Data Management. Словом, делиться на просторах «Хабра» разными интересными материалами в области данных, что обычно мы делали в рамках нашего Сообщества экспертов по управлению данными.

Среди тем, которые мы будем регулярно затрагивать в своем блоге – управление данными, руководство данными (Data Governance), качество данных (Data Quality), основные тренды в области данных, методология внедрения в области управления данными, DAMA-DMBOK и многое другое.
Читать дальше →
Всего голосов 8: ↑6 и ↓2+4
Комментарии5

Популярный open source — часть первая: 3 инструмента для работы с данными

Время на прочтение4 мин
Количество просмотров8.7K
Мы решили подготовить серию дайджестов с обзорами наиболее популярных open source проектов. В список попали самые обсуждаемые на Hacker News решения с открытым исходным кодом. Тема первой подборки — инструменты и сервисы для работы с логами и базами данных.

Читать дальше →
Всего голосов 19: ↑17 и ↓2+15
Комментарии2

aSocial — полностью распределенная социальная сеть

Время на прочтение14 мин
Количество просмотров8.9K

В свете последних событий идея о распределенной социальной сети вновь зохватывает разум...

Читать дальше
Всего голосов 11: ↑10 и ↓1+9
Комментарии42

Ошибки трансферта технологий №3 / «Ошибки оффшоров» + АПДЕЙТ

Время на прочтение18 мин
Количество просмотров9.2K
Оказывая помощь в выводе разработок и бизнесов на внешние зарубежные рынки, приходится постоянно наблюдать одни и те же ошибки, и как следствие — неудачи и потери.
Читать дальше →
Всего голосов 79: ↑72 и ↓7+65
Комментарии42

Оффшор для IT-бизнеса в Грузии: лайфхаки и подводные камни

Время на прочтение10 мин
Количество просмотров49K
Сингапур, Кипр, Китай, Голландия — государства, которые, первыми приходят на ум, когда речь заходит об офшорах для ИТ-компаний. Но в этой статье я расскажу о стране, которая граничит с Россией и предлагает, на удивление, очень соблазнительные условия для стартап-компаний в сфере информационных технологий. Проверено на себе! Погнали?

Гамарджоба, генацвале!

Необходимость открыть свою IT-компанию была вызвана запуском в сторы мобильной игры CubenatiK, идейным вдохновителем и главным разработчиком которой стал наш сын, в 13 лет написавший весь код для этой головоломки.

Авантюристы по натуре, мы решили совместить в своей работе приятное с полезным: отправиться в путешествие, параллельно заканчивая игру и занимаясь регистрационными вопросами. Изучив возможные и доступные для нас варианты, остановились на самом нетривиальном — Грузия.

На момент нашего отъезда лишь единственный источник в интернете достаточно подробно рассказывал об условиях работы для грузинских IT-компаний. Данной информации оказалось достаточно, чтобы мы отправились в двухмесячную командировку в Тбилиси и на собственном опыте проверили нововведения этой страны.

Читать дальше →
Всего голосов 28: ↑26 и ↓2+24
Комментарии82

Как я обучаю людей проходить проверку на детекторе лжи

Время на прочтение18 мин
Количество просмотров31K

В прошлый вторник у нас выступал Михаил Веселов — полиграфолог со стажем в 10 лет. Миша провел более 3000 допросов и обучил почти 400 человек проходить проверки на детекторе лжи.

Это уже не первый спикер со специализацией, которую на Хабре недолюбливают: например, летом выступал Вячеслав Дреер, монетизатор мобильных игр и обсуждение под его выступлением растянулось почти на 150 комментариев.

Жизнь интересная штука: иногда узнать, как работают и думают люди, которые на совершенно другом от тебя полюсе даже любопытнее, чем общаться с теми, с кем ты «на одной волне». Это нечастый аттракцион (все же, мы стараемся окружать себя единомышленниками и часто варимся в своей закрытой кастрюльке). Кроме того, это возможность задать вопросы такому человеку напрямую и подтвердить свою сложившуюся точку зрения или наоборот — поменять ее.

Поэтому я всегда с нетерпением жду выступления таких спикеров и с любопытством читаю комментарии под расшифровкой. Под катом рассказ Миши о том, как он работал в уголовном розыске, пришел к профессии, сажал преступников в тюрьму, как часто айтишников просят пройти проверку на полиграфе и еще много интересного.




Меня зовут Михаил Алексеевич Веселов, я – полиграфолог, бывший сотрудник уголовного розыска. Родился и вырос в Москве, служил в армии, а потом решил свою жизнь связать с милицией. В милиции много различных служб, одна из них – это уголовный розыск, который занимается непосредственно раскрытием преступлений. В общем, 11 лет после армии я этим и занимался.
Всего голосов 79: ↑45 и ↓34+11
Комментарии44

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность