9 октября

Как собирать данные, где искать специалистов и куда всё движется: подкаст Habr Special о Big Data в российских IT

Data MiningBig DataКарьера в IT-индустрииIT-компании
Первый же комментарий к нашему с МТС опросу про Big Data бьёт не в бровь, а в глаз: «Интересно, много ли таких, кто ещё не понимает, какая польза от Big Data?». Как ни странно, да. Больше половины опрошенных, как показали подсчитанные и приведённые нами в отдельном посте результаты, просто не используют Big Data, в то время как в МТС это важная часть бизнеса, и компания активно ищет релевантных специалистов.
В чём причина такого противоречия? Какие байки ярче всего иллюстрируют заблуждения о больших данных? Какой на самом деле можно получить профит от Big Data? Сколько его придётся ждать и сколько денег необходимо в это вложить? Что лучше — построить свою внутреннюю службу или привлечь консультанта? И, конечно, главное — как правильно произносить это магическое словосочетание?
Всё это мы обсудили в подкасте с руководителем центра компетенций Data Science в МТС Виктором Кантором. Расшифровка для тех, кто любит читать, прилагается.

Тайм-коды:
0:32 Что такое Big Data?
2:45 О размечивании данных
4:25 Big Data, биг дата, биг дейта или просто большие данные — как правильно?
5:50 Какие компании заказывают себе проекты с Big Data?
8:45 Как оценивается результат внедрения Big Data?
10:14 Сколько времени занимает внедрение Big Data?
10:55 Почему «собрать» данные не так просто, как кажется
12:23 Штатный специалист по Big Data vs внешний исполнитель
14:55 Хорошие специалисты по Big Data — хватает ли их рынку и как их отличить?
19:46 О том, как пришёл в МТС
21:18 О МФТИ
24:00 Big Data — это сложно и дорого?
25:56 О хранении данных
26:52 Две популярные байки о Big Data: о беременной девушке и пиве с подгузниками
29:25 Будущее Big Data
33:39 О сотрудничестве с вузами
36:25 О продактах в сфере Big Data
39:05 О Big Data в реальном секторе (в частности, в энергетике)
42:03 Big Data: с чего начать компании?

— Начнём с самых основ. Расскажи, что же такое Big Data. Желательно с примерами.
— Изначально Big Data — это история про обработку большого объёма данных, то есть сотен терабайт и петабайт данных. Дальше уже люди начали добавлять к этому определению дополнительные свойства, например что эти данные обязательно должны быть неструктурированными и из разных источников. То есть если у вас есть готовый, хорошо структурированный источник, в котором сколько-то записей, а по каждой из них сколько-то атрибутов на 5 петабайт, то якобы это уже не Big Data. Впрочем, обычно новые формулировки придумывают не те люди, которые непосредственно эту Big Data делают, а теоретики. Так что для меня Big Data — это обработка большого объёма данных.
Big Data — это, например, построить агрегацию, какую-то предобработку и дальнейшее интеллектуальное использование данных большой компании вроде МТС. Если у вас малый или средний бизнес, у которого клиенты исчисляются десятками или сотнями, то это не история про Big Data. Но если у вас возникают миллионы объектов в вашем анализе и по каждому из них десятки и сотни атрибутов, то это можно назвать Big Data.
— Все эти данные, как я понимаю, нужно правильно разметить, формализовать. Как это сделать?
— Аналитика на неразмеченных данных тоже существует. Эта история тесно связана с машинным обучением — речь про построение алгоритмов, которые учатся на основе имеющихся данных принимать какие-то решения и дальше на новых данных что-то подсказывать. Есть машинное обучение без учителя — это как раз история, когда нет разметки, и обучение с учителем — история, когда разметка есть. Но аналитика с разметкой обычно получается более качественной. Она может собираться логированием обычных событий, которые происходят с пользователем.
В случае с обращениями пользователей изначальной разметки обычно нет, хотя если мы попросим операторов, которые работают с этими обращениями, ставить разметку, то работа станет заметно проще. Так что, чтобы получить максимально интеллектуальную разметку, надо сразу предусматривать её добавление в процессе взаимодействия с пользователем, чтобы она появлялась и логировалась. Ещё бывает, что какие-то данные появляются в процессе сбора ответов на вопросы после обслуживания, но эти данные не всегда логируются. Важно позаботиться о том, чтобы никакие потенциально полезные данные не терялись.
Другой вариант — когда берутся специальные люди, которые будут размечать данные, их обычно называют асессорами. Им предлагаются примеры правильной разметки, и они по аналогии размечают новые данные.
— Мы уже несколько раз произносили слова Big Data, несколько раз — «большие данные». Какой вариант более устоявшийся и правильный? Я так понимаю, что английский?
— Кто-то скажет «большие данные», кто-то скажет Big Data, я лично разницы не вижу. Говорят и так и так. Иногда, кстати, коллеги приезжают на конференции, их спрашивают: «Кем работаешь?», они отвечают: «Дата-сайентист», а их не понимают, поскольку «дата», по идее, произносится как «дейта». Так что самая устоявшееся формулировка не всегда самая удобная для коммуникации с коллегами.
— Ты сказал, что вы предоставляете сервисы компаниям для интеграции Big Data в их бизнес. Как это устроено?
— По-разному, зависит от клиента. Например, digital-маркетологам МТС мы помогаем с помощью Big Data делать более точное таргетирование в зависимости от тематики рекламных материалов. Соответственно, покупая услуги МТС-маркетолога, вы получаете ещё и кусочек Big Data.
Иногда возникает история про какой-то кастомный сервис — это, конечно, всегда большие клиенты. Здесь либо люди приходят с каким-то конкретным запросом, либо мы смотрим на их бизнес в целом и рассказываем, что интересного и полезного сделать с помощью Big Data. Бывают проекты про то, как помочь найти бизнесу новых клиентов с помощью Big Data, есть совсем кастомные истории, например решение для стройплощадок, где Big Data помогает следить, соблюдается ли техника безопасности.
— Вы сами собираете данные или вы рассказываете клиентам, как собрать данные?
— Зависит от ситуации. Либо мы ставим своё оборудование, либо клиент даёт нам доступ к данным, которые он собрал сам.
— Какого масштаба обычно это компании? Насколько большие?
— Достаточно крупные, сравнимые с МТС по размеру, ну, может, в 10 раз меньше. Скажем так, это всё-таки не средний бизнес.
— Миллионы клиентов?
— Скорее да. Хотя в случае со строительной компанией формально их не миллионы, но если считать людей, которые потом будут пользоваться построенными ими зданиями, то и тут миллионы.
— А много таких компаний на рынке вообще?
— Если про крупные истории говорить, их десятки. Не сказать, что у нас в России очень много крупных компаний, которые готовы внедрять Big Data эффективно, но какое-то количество заказчиков набирается.
— А как вы понимаете, что желаемый результат достигнут?
— Если речь идёт о построении какого-то сервиса или алгоритма, то проводится АБ-тестирование. В каких-то случаях алгоритм используется, в каких-то нет, мы сравниваем результат либо по выручке, либо по другим важным для бизнеса показателям.
Если речь про рекламу, то часто там это история про конверсию, кому-то интересно, за сколько денег конверсия достигается и охват.
Фактически продажа Big Data — это продажа денег, потому что компании платят сколько-то денег за то, что внедряется некий алгоритм, который сколько-то денег даёт. Если экономический эффект существенно превосходит затраты, значит, сработало.
— А если говорить о сроках — на сколько обычно растягивается такой проект?
— Если проекты, которые можно сделать за 3−6 месяцев, а некоторые растянутся на 2−3 года. Это если в среднем по проектам судить. Обычно в полгода-год по первой итерации укладываемся. Если речь идёт про сервис, который уже оформлен, у него много пользователей, то, конечно, всё быстро: подключаешься — и вот тебе результат.
— Я просто пытаюсь представить себя на месте такого бизнеса, чтобы понять, в какой ситуации и на каком этапе бизнес приходит и говорит: «Я хочу собрать много данных, чтобы хорошенько проанализировать всё и получить профит».
— Собрать — это, кстати, тоже не так просто. Собрать надо так, чтобы потом в этих данных был толк. Бывает, когда часть данных собирается специальными техниками, которые ездят, измеряют что-то. А потом выясняется, что кто-то вместо того, чтобы измерять раз в час, измерял раз в день, потом раз в неделю, а потом размножил данные. В итоге мы о какой-то проблеме узнаём не за день, а за неделю — это не очень хорошо для решения задач, которые могут хотеть решать с помощью Big Data.
— Окей. А на стороне компании должен быть прошаренный специалист в этой области? Или вы можете полностью покрыть все клиентские потребности?
— Мы можем покрыть все потребности, но нужно понимать, когда это оправданно, а когда нет. Если клиенту нужно регулярно решать разные разовые задачи в сфере Big Data, то каждую такую задачу заказывать отдельно экономически менее эффективно, чем завести свой отдел, который эти задачи делает.
Если речь про то, что нужен какой-то сервис, который постоянно надо использовать, то здесь имеет смысл обратиться за помощью к тому, кто может это сделать. Например, к нам.
— Есть ли конкуренция между вашими услугами и наличием Data Science отдела в компании?
— Специалисты действительно иногда думают, что такая конкуренция есть. Но на уровне руководителей понятно, что работы столько, что её точно хватит всем: и своим, и для компаний-подрядчиков. Просто, опять же, если речь идёт про ad-hoc-решения, то свой отдел, будучи больше погружённым в нюансы бизнеса, нюансы того, какие данные собираются, а какие напрямую не собираются, но их можно вытащить косвенным образом, действительно с этим справится лучше. Решать все задачи на заказ не очень правильно. Но если есть команда, которая уже похожую задачу решила, и решила её хорошо, то, наверное, лучше обратиться к ней, а не пытаться свои велосипеды изобретать.
— Есть ли в вашей области дефицит специалистов?
— Если считать специалистом любого человека, который говорит, что он дата-сайентист, то тогда дефицита точно нет. Если считать специалистом человека, который удовлетворяет бизнес качеством своей работы, тогда дефицит определённо есть.
Я бы сказал, что на уровне junior-позиций дефицит если есть, то совсем минимальный, а вот на более высоких уровнях есть серьёзные проблемы. Так как наша область молодая, специалисты обычно тоже молоды, многие готовы быстро принимать решения и стараются побыстрее «перепродать себя подороже», не доводя проекты до конца и до результата. Есть такая общая тенденция. На мой взгляд, дорого цениться на рынке должен человек, который действительно создаёт крутой результат. Если это наложить на хайп, то возникает дефицит. Ты готов заплатить человеку столько, сколько нужно, даже с учётом хайпа, но только если он реально крут.
— Дилетантский такой вопрос, но как отличить крутого специалиста от некрутого?
— На собеседовании этого точно не узнать, только в каком-то общем приближении.
Мне приходилось собеседовать сотни людей за последние 10 лет, и я понял, что, с одной стороны, человек должен быть в состоянии делать что-то руками. Даже если он уже на какой-то более высокой руководящей позиции, то ему всё равно надо понимать, что и как делают подчинённые. Это проверяется разговором, ответами на вопрос о том, как человек будет какие-то задачи решать, вопросами про технические детали, вопросами про то, что он будет делать с такой-то проблемой. Например, как он будет понимать, что модель устаревает, хватает ли данных, имеет ли смысл собирать больше, ведь это дополнительные затраты? Вот такого рода вопросы.
Второе — насколько человек зарывается в свою текущую задачу, есть ли такое, что он видит деревья, но не видит лес. Ему сказали делать — он делает. Не приходит с вопросами о том, какая у нас целевая метрика, почему она — заказчик попросил или мы тоже согласны? Часто люди не думают о том, что если целевая метрика определённая, то и алгоритмы надо строить таким образом, чтобы они её оптимизировали.
К сожалению, есть набор стандартных практик, которые рассказывают на первых лекциях по машинному обучению. Как обучать модели, что оптимизировать, как измерить качество — часто специалисты просто берут и повторяют то, что услышали на курсах, не задумываясь о том, что в их конкретном случае надо подумать, какая из этой кучи метрик в наибольшей степени соответствует бизнес-задачам.
Те люди, которые об этом думают, причём не просто думают, а могут ответить на вопросы на этот счёт (что для того, чтобы оптимизировать вот это, а это надо оптимизировать, потому что это ценно для бизнеса по каким-то причинам, нужно строить алгоритмы, которые будут на такую метрику ориентированы), а дальше могут рассказать, как проект выстроить по шагам, более сильны как специалисты.
Я сам к команде МТС присоединился год назад в нынешнем качестве, и для меня важным фактором было общее впечатление от команды. Перед тем как согласиться на должность, я пообщался с каждым человеком в команде.
— У вас большая команда?
— Всего 330 человек, но я пообщался не со всей командой, а с дата-сайентистами, их несколько десятков человек. Это, конечно, заняло время, но было очень полезно.
Я задавал вопросы ребятам, узнавал, как они оценивают качество того, что делают, как понимают, что нужно конкретную метрику использовать как целевую. У меня остались позитивные впечатления, хотя, возможно, я был несколько предвзят, поскольку в течение всего времени, что я работаю в области Big Data, я преподаю, и среди людей в команде МТС много тех, кого я когда-то учил. Может быть, я немного завысил свою оценку, но мне ребята очень понравились, поэтому я пришёл в команду.
— Откуда таких специалистов, как ты, выпускают?
— Из МФТИ выпускают, я окончил физтех. Кстати заметил, что когда вы учились в вузе, а его кто-то нахваливает, вы обычно начинаете говорить «да ну, это самое обычное место», но вот если ругают, то вы расстроитесь, и ругать «разрешаете» только тем, кто из того же вуза. То есть если спросить физтеховцев про их альма-матер, то они обычно ответят, что-то, насколько физтех крутой, преувеличено, но если кто-то его поругает, то физтеховец очень расстроится. На самом деле физтех был замечательным местом, хотя я бы не хотел пройти учёбу снова.
— Тяжело было?
— Да, конечно. Но когда я поступил в МФТИ, то был счастлив, что у меня есть доступ ко всем этим знаниям. Я из небольшого города в регионе, так что про некоторые вещи я до поступления в вуз даже не знал, где почитать.
— Мы, чтобы подготовиться к подкасту, проводили несколько опросов, и в вопросе про будущее больших данных мнения аудитории разделились. Многие ответили, что Big Data не сможет дальше существовать, потому что нужно всё это хранить и очень сложно обрабатывать. Другие считают, что Big Data будет использоваться повсеместно, особенно в государственных целях. Что ты думаешь по этому поводу? Куда всё это вырастет? И есть ли куда расти?
— Вопрос, что считать использованием Big Data. Допустим, когда мы в поисковике что-то ищем — мы используем Big Data или нет? Поисковик же внутри использует технологии Big Data, поэтому, в принципе, Big Data мы уже используем в повседневной жизни. Например, когда смотрим про пробки, о том, где находятся машины и с какой скоростью они двигаются, — там данных тоже очень много.
Опять же, если какие-то рекламные кампании таргетируем для своего бизнеса, пусть даже небольшого, это всё тоже на основе Big Data. В таком смысле мы все уже её используем.
Если говорить про построение своей Big Data внутри компании, про сбор данных и агрегацию из своих источников, то это будет по-прежнему интересно крупным компаниям, потому что другим будет просто недостаточно данных для этого.
— То есть проблема не в том, что сложно и дорого?
— Это взаимосвязанные вещи. Сложно и дорого, потому что в целом задача не вполне тривиальная. Поэтому позволить себе это могут те, кому действительно надо.
— Если взять мысль, что «сложно хранить и обрабатывать», то о каких объёмах обычно речь?
— Начиная с сотен терабайтов, дальше петабайты и т. д.
— И как решается проблема с хранением?
— По-разному. Кто-то покупает свои машинки и с ними живёт. Кто-то может воспользоваться облачными решениями. То, что у вас Big Data, не означает, что вы не можете всё хранить в облаке, но там тоже нужны специализированные подходы.
— На твой взгляд, куда всё это движется, чего нам ждать? Я однажды слышал фантастическую историю про то, как поисковик по запросам на печенье узнал, что девушка беременна. Это байка?
— Есть две известные Big Data байки: про памперсы и про беременность. Про памперсы — это про то, что люди в магазинах часто покупают одновременно пиво и памперсы (и больше ничего к ним). Звучит смешно, но причина в том, что часто за памперсами посылают мужей, которые себя тоже хотят не обидеть и решают что-то себе прихватить. Эта история с очень большой вероятностью байка. При этом пиво и памперсы можно поставить рядом, а можно в разных концах зала. И оба варианта будут обоснованными. Первый вариант — чтобы не забыли. Второй — чтобы, пока дойдёшь, ещё что-то прихватил. Как видите, даже если мы нашли какой-то инсайт в данных, то это не значит, что мы знаем, как его использовать.
А про беременность — там была байка о том, что девушка шопилась в интернет-магазине, а ей начали рекомендовать товары для маленьких детей. Девушке было 14 лет — не очень подходящий возраст, чтобы показывать такие объявления. Отец девушки как-то об этом узнал, оскорбился, начал выяснять отношения с компанией, компания извинилась, а потом выяснилось, что девушка действительно беременна. Это история про то, что раз в год и палка стреляет. Если мы будем выдавать разнообразные рекомендации, то рано или поздно они попадут в цель. Я не знаю, насколько история фейковая. Но то, что алгоритмы могут по каким-то микроизменениям понять, что женщина-пользователь беременна, — это глупости. Пока не могут.
— А в будущем чего ждать? Говорят, достаточно высокий уровень технологий неотличим от магии. Будет магия?
— Магия-то точно будет, потому что всё, что нас сейчас окружает, — тоже магия. Отступить на 10 лет назад — никто не мог бы поверить, что так будет. Но вряд ли всё будет так, как звучит в фантастическо-прогностических историях. Эти истории нужны для продвижения идеи использования данных, хотя иногда больше пугают людей, чем вдохновляют. Для того чтобы делать тонкие выводы, надо очень хорошо данные собирать, очень хорошо валидировать, обеспечивать очень высокую частоту. Это вещь, которая тесно связана с нашей безалаберностью, с тем, чтобы где-то исказить данные.
Современный мир бесит тем, что есть возможность использовать кучу гаджетов и технологий в течение дня, но чем больше технологий используешь, тем больше глючит. Получается, что чистота данных тоже зависит от того, куда данные пришли, где они корректны. В итоге, я думаю, что добиться нужной чистоты данных сложно.
С другой стороны, если в поисковике девушка несколько раз вбивала что-то про беременность и после этого ей рекламируют товары для беременных… Это Big Data, таких девушек много, нужно это всё найти и сопоставить, как те запросы, которые она вбивала, относятся к этой теме. Иногда такой нетривиальный анализ вылезает там, где, казалось бы, просто по ключевым словам посмотри. Этих ключевых слов сколько? А товаров? Они на категории чётко разбиты либо гибко и много тегов стоит? Это всё довольно интересно.
— Если про ваш бизнес говорить, то какие новые фишки ожидаются?
— Я бы новые фишки раньше времени не анонсировал, но могу сказать так: Big Data может развиваться как сервисное подразделение, которое позволяет МТС экономить ого-го какие деньги, но оно, конечно, никогда не будет сравнимо с основным бизнесом. Но если мыслить более продуктово, то на основе Big Data интересно находить какие-то продуктовые вещи, которые могут показать взрывной рост. Мне, кстати, кажется, что в современном мире почти любой IT-специалист должен в какой-то степени быть продактом. Понимать, зачем он делает то, что делает, кому это нужно и т. д.
Может быть, есть компании, которые по-прежнему воспринимают Big Data как сервисную вещь, но, мне кажется, многие понимают, то это большой рынок, который будет развиваться, на котором много что ещё выстрелит.
— Вернусь к опросу. Там был вопрос о сфере применения Big Data, и многие ответили, что технология помогла бы научным исследованиям. Есть ли у вас решения, связанные с интеграцией Big Data в научную сферу?
— Тут тоже вопрос, что считать. Мы в разных проектах сотрудничаем с вузами, были истории от одного очень хорошего вуза про аналитику их выпускников, чтобы понять, насколько образование повлияло на их дальнейший профессиональный путь.
— Но, по идее, это даже не про научные исследования внутри института?
— Это исследование института внутри института с нашим участием. Это, конечно, меня чуть меньше вдохновляет, чем какие-то хардовые научные исследования.
Понятно, что математик всегда будет смотреть на социологию как на штуку интересную, но с очень уж большим уровнем неопределённости — любые выводы вызывают всегда вопросы.
— А по части обучения специалистов по Big Data с вузами не сотрудничаете?
— Да, но про одну из коллабораций ничего конкретного говорить не буду, мы скоро анонсируем. Плюс у нас совместно со «Сколково» есть образовательная программа, на которой мы готовим специалистов, которые будут создавать продукты, в частности, с использованием Big Data, потому что у нас в индустрии таких специалистов не хватает. И Big Data не сказать, что старая вещь, и умный продакт-менеджмент тоже в последние годы активно развивается, поэтому нужно специально таких людей готовить.
— Я правильно понимаю, что как раз разница между джуниором и синьором в том числе в том, насколько он продакт?
— Да, можно и так сказать. Опять же, с продакт-менеджментом история в том, что, если взять среднего человека, называющего себя продакт-менеджером, то на рынке он будет достаточно мало цениться, потому что продакт-менеджером сейчас себя называет каждый, кто захочет.
Если говорить про продакт-менеджера — действительно профи, то цена таких специалистов высока. Тут возникает вопрос: должны ли обязательно продакты в Big Data расти из специалистов по Big Data?
Вообще, как мне кажется, из достаточно сильных дата-сайентистов будут получаться хорошие продакты. Но при этом хороший продакт с достаточно хорошим техническим бэкграундом (не обязательно с техническим образованием), интересующийся этой темой, может достаточно хорошо погрузиться в Data Science.
— Правда, когда ты становишься продактом, руками перестаешь работать. Не жаль?
— Конечно, жаль. Это вообще всегда боль для технического специалиста. Но нужно понимать, что ценность работы руками иногда сформирована не столько самим специалистом, сколько социальной оценкой. В среде «своих», если ты перестаёшь работать руками, зачастую начинают смотреть… снисходительно. Многих это сдерживает.
Но при этом в Data Science есть люди, которые не хотят работать руками — в конечном счёте им это меньше нравится, чем более продуктовые вещи продумывать.
— Возвращаясь к опросу: там был вопрос о том, что насчёт реального сектора? Применима ли Data Science, например, в энергетике, чтобы предсказывать пики, спады?
— Применима, но если говорить про энергетику, про прогнозирования потребления, то это древнейшая задача.
— Она до сих пор не решена?
— Решается. Но там же есть такая проблема, что просто не отдать электроэнергию нельзя. Если предложение сильно превышает спрос, то получается вплоть до того, что надо доплатить, чтобы её кто-то забрал.
А если вернуться к вопросу о реальном секторе, то да, конечно, применяется. Это тоже одна из причин, почему мне хотелось заняться Data Science в МТС — мне хотелось, чтобы моя область приносила пользу реальному бизнесу, реальному сектору, не была чем-то космическим и далеким от людей. Понятно, что люди каждый день используют сервисы, в которых есть Big Data, но когда человек идёт в магазин, а там есть товар, потому что Big Data спрогнозировала, то это здорово. Когда человек, опять же, видит определённые рекомендации на сайте, которые попадают в сферу его интересов, а не просто треш, который его бесит и отвлекает, — тоже хорошо.
Если говорить про реальный сектор, то в промышленности всё больше применения Big Data для оптимизации процессов на производстве и для раннего обнаружения дефектов. Опять же, вспомним нашу историю про безопасность на стройке. Применений много.
— Короче говоря, насколько я понял, всё движется к тому, что компании не просто продолжат экономить с помощью Big Data, а начнут делать прорывные вещи?
— Да, я думаю, что к этому всё идёт. И идёт давно — вспомним, когда первый поисковик появился, при этом «Яндексу» на один год больше, чем «Гуглу».
Будет всё больше таких применений — и Big Data будет ещё всё ближе к людям. В целом можно ожидать, что Big Data всё плотнее будет окружать нас в форме различных сервисов и продуктов.
— Напоследок: какой порог входа в эту историю для компании? Допустим, компания вырастает до масштаба, когда есть данные либо есть потребность в данных. С чего обычно всё начинается? Как подступиться?
— Тут может быть много разных подходов, какие-то мне больше импонируют, какие-то меньше. Есть вариант «давайте наймём студента-стажера, он нам что-то начнёт разгребать вначале, мы посмотрим, если есть что-то интересное, то будем расширять». Мне первый вариант со стажёром нравится меньше всего, потому что человеку без достаточного опыта и кругозора сложно сделать так, чтобы Big Data заработала и выстрелила, а у компании при этом после работы с ним остаётся ощущение, что вся ваша Big Data — несерьезно. Начинаешь выяснять, как делали, что делали, и понимаешь, что всё делали как можно проще и «на коленке». Так что лучше сразу привлечь специалиста с хорошим опытом в штат.
Ещё можно привлекать эксперта, но проблема в том, что эксперты стоят довольно много. Можно привлечь на уровне какого-то консультирования вначале, правда, консультант — это часто не тот, кто принимает решения, и в итоге всё получается криво. Тут надо подумать, как консультирование организовать так, чтобы была польза от того, что человек посоветует, а для этого надо как-то прислушаться и понять. Опять же, можно начать работать в формате консультирования, потом уже нанять его в качестве того, кто сформирует команду и займётся реализацией.
— Понятно. Спасибо, что пришёл. Было очень интересно. Я бы с радостью через 5 лет встретился и задал те же вопросы, потому что, судя по тому, что я сегодня услышал, всё быстро развивается. Спасибо, что слушали нас, ребята. До новых встреч.
Теги:МТСBig Dataбольшие данныеподкаст
Хабы: Data Mining Big Data Карьера в IT-индустрии IT-компании
+22
8,9k 37
Комментировать