26 September 2019

В России резко вырос спрос на специалистов по данным и машинному обучению

Data MiningBig DataMachine learningE-commerce managementIT career


Академия больших данных MADE и HeadHunter опубликовали совместное исследование «Портрет российского Data Scientist» со статистикой вакансий для специалистов этой профессии в 2015−2019 годы.

Судя по цифрам, рынок переживает настоящий бум. В 2018 году количество вакансий с упоминанием специальности data scientist выросло в семь раз по сравнению с 2015 годом, а вакансий с ключевыми словами machine learning — в пять раз. В интернет-компаниях и IT дата-сайентистам предлагают медианную зарплату 145 000 руб., а в в сфере услуг для бизнеса — 170 000 руб. В последнем случае речь идёт об анализе больших массивов данных, в том числе алгоритмами машинного обучения, чтобы выявить полезные для бизнеса закономерности, которые не очевидны для человеческого мозга.

На диаграмме выше показаны ключевые навыки, указанные в резюме специалистов по данным. Всего проанализировано 5500 вакансий и 8000 релевантных резюме и из общей базы 36,2 млн резюме.

Навыки


Среди ключевых навыков специалисты по Data Science указывают в резюме следующее:

  • Python (74%)
  • SQL (45%)
  • Git (25%)
  • Data Analysis (24%)
  • Data Mining (22%)

Те специалисты, которые в резюме пишут о своей экспертизе в машинном обучении, также упоминают владение Linux и C++.

Самые популярные языки программирования:
  • Python
  • C++
  • Java
  • C#
  • JavaScript

Дефицит специалистов


Специалисты по машинному обучению в дефиците – всего три резюме на одну вакансию. У специалистов по данным ситуация чуть лучше: в среднем, шесть резюме на вакансию, рассказал представитель HeadHunter. По его словам, вакансия не считается дефицитной, если на неё приходится восемь и более резюме.

Традиционно новые профессии сначала осваивают мужчины, а за ними приходят женщины. Сейчас 81% дата-сайентистов — мужчины. Больше половины соискателей — специалисты в возрасте 25-34 лет. Интересно, что среди женщин-соискателей почти 40% — это молодые девушки в возрасте 18-24 лет.

Старше 45 лет кандидатов на рынке практически нет (всего 3%). Эксперты считают, что соискатели с большим опытом работы реже размещают свои резюме на крупных поисковых ресурсах и чаще находят работу по рекомендациям. Но и количественно их тоже меньше.



Больше половины вакансий (60%) и соискателей (64%) находятся в Москве. Специалисты востребованы также в Санкт-Петербурге и Татарстане (3% и 8%). Доля остальных регионов по специалистам не превышает 4%, а по вакансиям — 2% от общего количества.

«Дата-сайентисты занимают особое положение на рынке труда в сфере IT, благодаря неизменно растущему спросу со стороны компаний-работодателей, — говорит Мария Игнатова, руководитель Службы исследований компании HeadHunter. — Именно поэтому они стали объектом нашего совместного с Академией больших данных MADE исследования. В нём мы постарались рассмотреть эту профессию с разных фокусов, в том числе по востребованности, навыкам, образованию, чтобы составить максимально объективный портрет российского дата-сайентиста и привлечь в эту профобласть как можно больше талантливой молодёжи. Более того, результаты нашего анализа станут полезным референсом для корпоративных образовательных платформ, таких как Школа программистов hh.ru и Академия больших данных MADE, в подготовке специалистов на основе реальных требований и задач бизнеса».

Спрос на специалистов по данным растёт в банках, торговле, телекоммуникациях. Например, в Ozon отдел Data Science в 2018–2019 гг. расширился втрое, подтвердил руководитель направления Data Science в Ozon Ксения Бокша.

В электронной коммерции анализ данных напрямую связан с прибылью, а результат применения алгоритмов можно измерить непосредственно в долларах (или рублях) сразу после внедрения с помощью A/B-тестирования. Ozon применяет машинное обучение для системы персональных рекомендаций и при сборе заказов в логистическом центре, а аналитику данных — в закупках. Стоимость ошибки в 1% при ассортименте в 2,5 млн товарных наименований может обойтись компании в 10 млн руб., говорит Букша.

«Ведомости» также приводят примеры использования data science в других отраслях:

  • Операторы связи. В «Мегафоне» анализом данных занимается около 200 человек. За два с половиной года команда выросла в несколько раз. Она занимается оптимизацией тарифов, определяет оптимальное расположение магазинов, прогнозирует товарные запасы и т. д.
  • Банки. «Тинькофф» рассказал, что у них с клиентами общается чатбот, который помогает экономить до 50 млн руб. в месяц на зарплате ставших ненужными специалистов из службы поддержки. Бот самостоятельно обслуживает 30% обращений клиентов в чате и помогает операторам с остальными 70% запросов.

    Банк ВТБ тоже с начала года активно ищет и нанимает специалистов в области машинного обучения и аналитики данных.

Например, в Mail.ru Group такие специалисты нужны везде, где требуется обрабатывать текстовые данные, картинки, видео, заниматься синтезом и анализом речи — в почтовых и облачных сервисах, социальных сетях, играх, электронной коммерции, рассказал в комментарии «Ведомостям» вице-президент Mail.ru Group по персоналу и образовательным программам Дмитрий Смыслов. Число таких сотрудников за последние два года в компании выросло почти втрое, а за восемь месяцев 2019 г. компания наняла примерно столько же специалистов по анализу данных, сколько за весь 2018 год.

Эта статистика подтверждается цифрами из исследования: действительно, в первом полугодии 2019 года спрос на специалистов по Data Science составил 65% от спроса за весь 2018 год.



Представитель Huawei тоже сказал, что за 2018 год и в особенности 2019 году потребность в специалистах по анализу данных возросла практически вдвое. В ближайшее время Huawei планирует почти вчетверо увеличить персонал российских центров исследований и разработок. Сейчас у Huawei два российских R&D-центра: в Москве (400 человек) и Санкт-Петербурге (150 человек). До конца года Huawei планирует открыть три новых R&D-центра и нанять в них 500 инженеров. В течение ближайших пяти лет штат увеличится ещё более чем на 1000 сотрудников. Это и понятно, ведь Huawei пытается плотно интегрироваться в российскую экономику: например, недавно стало известно, что Huawei станет поставщиком проекта российской государственной облачной платформы, рассматривая возможность выпускать серверы с российскими процессорами «Эльбрус» на российской ОС, чтобы участвовать в гостендерах как «российский производитель».

Высшее образование и курсы


У 90% специалистов по данным высшее образование. Большинство из них учились в одном из следующих вузов:

  • МГТУ им.Н.Э. Баумана;
  • МГУ им. М.В. Ломоносова;
  • МФТИ;
  • НИУ ВШЭ;
  • СПбГУ;
  • Финансовый университет при Правительстве РФ;
  • НГУ;
  • КФУ.

К этим же вузам лояльно относятся и работодатели.

43% специалистов отметили, что вдобавок получили хотя бы одно дополнительное образование. Чаще всего в резюме упоминаются онлайн-курсы по машинному обучению и анализ данных на Coursera.

Курсы нужно выбирать аккуратно. Не везде можно получить качественное образование. На волне дефицита IT-специалистов и относительно больших зарплат предприниматели пытаются заработать на стремлении граждан получить образование. По недавнему опросу РОЦИТ, обучающие онлайн-курсы вошли в топ-3 самых востребованных у россиян интернет-сервисов после госуслуг и продажи и доставки лекарств. Однако на отечественном рынке мало серьёзных игроков, а сомнительных тренеров и коучей появляется всё больше: «Как добросовестные, так и недобросовестные тренеры прибегают к распространённому маркетинговому инструменту — воронке продаж. Клиентам сначала предлагают какой-то бесплатный продукт, например, PDF-книгу или участие в вебинаре, затем дешевый курс в пределах 300–500 рублей, затем основной продукт. Пользователь делает один шаг за другим, пока не дойдет до покупки. Многие называют этот способ манипуляцией, но он становится таким же привычным, как, к примеру, нативная и таргетированная реклама».

Такое мошенничество наиболее распространено в бизнес-тренингах. Всё-таки в области data science гораздо труднее продать убедительную «фальшивку». Впрочем, и здесь некоторые используют манипулятивные воронки продаж, приглашая аудиторию сначала на бесплатные вебинары, затем дешёвый курс, а уже потом предлагая основной продукт.

Корпоративные программы обучения


Чтобы восполнить дефицит кадров, многие компании открывают программы обучения для собственных сотрудников и «школы» для новых кандидатов. Они фактически сами выращивают специалистов для себя. Например, «Вымпелком» запустил проект «Лаборатория Big Data» и готовит магистрантов в области программирования и анализа больших данных вместе с тремя крупными техническими вузами в Новосибирске, а также сотрудничает с вузами Москвы. Сотрудники «Вымпелкома» могут изучать анализ больших данных в корпоративном университете.

«Большие данные рассматриваются как важнейшее сырьё XXI века. Ископаемые и нефть были стратегическим сырьём XX века, в XXI веке, их место будет занято технологиями Big Data», — говорится на сайте обучающего центра.

Ozon открыл вечерние курсы по анализу данных, на которых преподают сотрудники Ozon: в этом году принято 78 студентов.

У Samsung есть собственный научно-исследовательский центр в России. Каждый год компания организует летнюю школу AI Bootcamp по байесовским методам глубинного обучения. Первая летняя школа была организована в 2018 году, под руководством специалистов московского Центра искусственного интеллекта Samsung студенты изучали основные аспекты построения нейросетей, познакомились с решением задач компьютерного зрения: сегментации, локализации и увеличения разрешения растровых изображений.

С этого года Samsung Research Russia начала выпуск бесплатных образовательных онлайн курсов: первый курс «Нейронные сети и компьютерное зрение» набрал за два месяца более 11 тысяч слушателей.

Ну а лидером в области обучения специалистов Big Data считается «Яндекс», где с 2007 года работает Школа анализа данных. Представители компании говорят, что в ближайшие три года она подготовит ещё около 600 экспертов в данной области.



В Школу анализа данных поступают старшекурсники, выпускники и аспиранты МГУ, МФТИ, ВШЭ, ИТМО, СПбГУ, УрФУ, НГУ и других вузов. Два года они изучают предметы, которые обычно не входят в университетские программы, хотя пользуются огромным спросом в науке и разных отраслях, где уже применяются наукоёмкие информационные технологии. Все преподаватели ШАД работают в IT-индустрии или занимаются современной наукой.

Похоже, что бум на рынке вакансий data science только начинается.
Tags:data scienceмашинное обучениевакансиизарплатыобучение
Hubs: Data Mining Big Data Machine learning E-commerce management IT career
+13
12.2k 18
Comments 21