Как стать автором
Обновить

Комментарии 13

Есть ли подобное исследование рынка в Казахстане для разработчиков?

Добрый день!
Мы (Kolesa Group) планируем сделать подобное для рынка разработчиков в этом году.
Если в компании нет DWH — откуда берутся большие данные?
Я отлично понимаю, что для полезной и нужной аналитики и отчётов хватит excel + 32Gb оперативки в правильных руках, но это не совсем Big Data.
Видимо, оттуда и зарплаты.
Добрый день
Есть ощущение, что график «Источники постановки задач» содержит больше, чем 100% в сумме
В вопросах с множественными ответами, в сумме не будет 100%, т.к. мы считаем % респондентов. Т.е. некоторые люди имеют несколько источников постановки задач.
Наверно лучше подобные результаты приводить в нормализованном виде (общепринятая практика), чтобы исключить эту или подобные ситуации
Интересно как “SQL-решения и реляционные базы данных” выводятся в отдельную категорию от “облачных сервисов”. Разве облачные сервисы не основаны на тех же “SQL-решениях и реляционных баз данных”?

Еще интересно как MySQL можно эффективно использовать хотя бы для нужд аналитики, не говоря уже для полноценного ‘data science’ и разработки ML моделей.

ИМХО, Data Scientist — не есть профессия, или даже специализация. Не имея понимания о специфике бизнеса, навыки ETL, или развертывание Hadoop кластера мало чем поможет в реальном понимании той информации, которую эти инструменты предоставляют (ну или могут предоставлять).
Интересно как “SQL-решения и реляционные базы данных” выводятся в отдельную категорию от “облачных сервисов”. Разве облачные сервисы не основаны на тех же “SQL-решениях и реляционных баз данных”?

Не всегда, некоторые облачные хранилища очень далеки от реляционных баз данных. Например Amazon S3 — объектное хранилище.

Еще интересно как MySQL можно эффективно использовать хотя бы для нужд аналитики, не говоря уже для полноценного ‘data science’ и разработки ML моделей.
Когда аналитика основана на small data вполне себе можно использовать как источник данных для аналитики DS и ML. Если данных много, то конечно MySQL станет узким местом в процессах.
Не всегда, некоторые облачные хранилища очень далеки от реляционных баз данных. Например Amazon S3 — объектное хранилище.

Я говорил о хранилище данных для аналитики, при чем активной. Данные, конечно, хранить в объектном хранилище можно, ну нужно ли? Холодные копии для исторических данных разве что.

Когда аналитика основана на small data вполне себе можно использовать как источник данных для аналитики DS и ML.

Извините, но мне казалось, что аналитика на small data, Экселем называется. Ну и Machine Learning и Data Science, технически, на небольшом количестве данных проводить можно, но не целесообразно. Модели будут очень далеки от реальности.
Извините, но мне казалось, что аналитика на small data, Экселем называется. Ну и Machine Learning и Data Science, технически, на небольшом количестве данных проводить можно, но не целесообразно. Модели будут очень далеки от реальности.

Не соглашусь тут с Вами. Например на ежедневных данных продаж за последние 10 лет представленных как временной ряд + дополнительные регрессоры можно построить вполне себе приличный DS анализ, хотя размер таблицы будет немногом больше 3,5 тыс. строк.
Или таблица по 10 тыс. покупателям и 50 характеристикам по каждому из них. На ней прекрасно можно провести кластерный анализ и сегментацию. Хотя размер таблицы 10000х51. Тут большими данными и не пахнет. А пользу из данных можно вытащить кучу.
Так что и на small data также можно прекрасно DS алгоритмы применять. Хотя да в DS есть алгоритмы, которые требовательны к размеру данных (например нейронные сети, особенно глубокие)
Например на ежедневных данных продаж за последние 10 лет представленных как временной ряд + дополнительные регрессоры можно построить вполне себе приличный DS анализ, хотя размер таблицы будет немногом больше 3,5 тыс. строк.

Мне казалось, что это называется бизнес аналитикой уже как лет 15. И занимаются ею бизнес аналитики, а не новомодные Data Scientist-ы.
Вы не понимаете: в мск хороший бизнес-аналитик будет получать 200, а датасататанист — 350.
Поэтому есть огромный стимул переобуться и заниматься тем же, но более лучше зарабатывать ©, принося бизнесу профит и давая повод с гордостью вещать про ML, блокчейн и аджайил /sarcasm
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.