Никита Башун @niqx

Data Analyst

Профиль Публикации 1Комментарии 16Закладки 19

Sofia_Semenova 21 сен 2023 в 11:08

Сам себе BI-аналитик или как навести порядок в отчётности компании

Простой

8 мин

8.7K

Визуализация данных*Хранение данных*Блог компании Кошелёк

Привет, Хабр! На связи аналитики Кошелька. Наша команда состоит из 13 дата-аналитиков, 5 DE-инженеров, 2 ML-инженеров и ровно 0 BI-аналитиков. Что мы любим делать? Определять метрики и рисовать дашборды. Что нужно заказчику? Метрики и дашборды (а еще достижение целей и выручка, но не будем сейчас об этом).

В этой статье мы собрали инструкцию, как можно навести порядок в отчётности без отдельных BI-аналитиков, и с какими проблемами вы можете столкнуться в процессе.

+10

ivan_leontyev 4 июл 2023 в 16:29

Как мы посчитали уровень Data Driven’ности в компании и вклад в него каждого аналитика?

7 мин

3.7K

IT-стандарты*Управление e-commerce*Статистика в ITIT-компанииБлог компании СберМаркет

Кейс

Салют! Меня зовут Ваня Леонтьев, я директор по аналитике в СберМаркете. Эта статья о том, как мы оцифровали такую сложную концепцию как data-культура в компании. Поделюсь предпосылками, нашим подходом к расчету и планами по её развитию. Думаю, наш опыт будет интересен аналитикам, лидам аналитических команд, руководителям продукта и компаний в целом — всем тем, кто кто стремится продвигать культуру данных в своей компании. А также тем, кто хочет иметь инструмент для приоритизации и управления в команде аналитики.

tgaychenkova 29 дек 2022 в 13:29

Чтобы не терять деньги: оповещения о падениях продуктовых метрик

9 мин

10K

Блог компании VKАлгоритмы*Машинное обучение*Софт

Ретроспектива

Пытаясь уследить за всем многообразием метрик и срезов на дашбордах, можно легко упустить из виду важное изменение метрик, сигнализирующее о проблеме. И если вовремя не отреагировать, то можно лишиться аудитории или выручки. Расскажем, как мы автоматизировали оповещения о падениях (или нездоровых взлётах) продуктовых метрик, чтобы сразу оценивать масштаб проблемы в деньгах, и что это дало продукту. Наш опыт будет полезен в первую очередь аналитикам и руководителям продуктов.

+44

howchangenickname 9 авг 2022 в 15:58

Не работай «в стол»: руководство для эффективного аналитика

9 мин

10K

Анализ и проектирование систем*Управление проектами*Исследования и прогнозы в IT*Блог компании Delivery Club Tech

Привет, Хабр! Меня зовут Денис, я работаю продуктовым аналитиком в Delivery Club. Наша команда за последние полгода провела около сотни продуктовых исследований данных, которые способствовали появлению нескольких десятков продуктовых гипотез по улучшению нашего продукта. За это время мы структурировали процесс и минимизировали работу «в стол». Я расскажу об основных этапах исследования, применив которые вы можете значительно улучшить качество своей работы.

+24

X5Tech 2 авг 2022 в 16:59

Бутстреп и А/Б тестирование

10 мин

49K

Python*Математика*Статистика в ITБлог компании X5 Tech

Привет, Хабр! В этой статье разберёмся, как с помощью бутстрепа оценивать стандартное отклонение, строить доверительные интервалы и проверять гипотезы. Узнаем, когда бутстреп незаменим, и в чём его недостатки.

+12

gorbachev_denis 12 ноя 2021 в 11:30

Гигиена встреч для продакта: как не сойти с ума от митингов

5 мин

2.4K

Управление проектами*Блог компании Кошелёк

В какой-то момент у любого продакта (да и вообще менеджера) рабочий график превращается в сплошную полосу из регулярных встреч, сессий, планирований, синков, статус-репортов, воркшопов и ван-он-ванов. В результате ты обязательно задаёшься вопросом — а успеваешь ли ты работать? И нужно ли столько времени тратить на ужимки перед веб-камерой, не будучи при этом стримером?

Чтобы не сойти с ума и фильтровать все входящие запросы на митинги, я сформулировал несколько правил гигиены календаря и осмысленности встреч.

Эти банальные правила помогают мне выносить пользу со встреч, а ещё разгружать календарь. Возможно, помогут и кому-то из читателей.

Danil_Sibilev 30 мар 2022 в 11:43

Ключевые метрики: как мы рассчитывали RPS, а пришли к custdev

13 мин

5.5K

Аналитика мобильных приложений*Управление продуктом*Блог компании КошелёкIT-компании

Многие сталкиваются с проблемой оценки эффективности работы отдельной команды. Как понять куда двигается команда? На что она должна влиять, а на что может? Как её работа улучшает всю компанию?

Эти вопросы задавали и мы себе в команде Каталога приложения «Кошелёк». Поначалу ответы нам казались очевидными — выбираем метрику и по ней делаем все выводы.

В этой статье я расскажу, почему всё оказалось не так просто. Как мы прошли путь от одной метрики до продуктовых исследований, опросов и формирования системы метрик. И как сделать так, чтобы дашборды с показателями и графиками были не просто красочной картинкой, а приносили пользу команде и влияли на её планы и вектор развития.

+14

lnkov 31 мая 2019 в 11:56

Как устроено A/B-тестирование в Авито

7 мин

78K

Математика*Визуализация данных*Веб-аналитика*Аналитика мобильных приложений*Блог компании AvitoTech

Всем привет. Меня зовут Данила, я работаю в команде, которая развивает аналитическую инфраструктуру в Авито. Центральное место в этой инфраструктуре занимает А/B-тестирование.

А/B эксперименты — ключевой инструмент принятия решений в Авито. В нашем цикле продуктовой разработки А/B-тест является обязательным этапом. Мы проверяем каждую гипотезу и выкатываем только позитивные изменения.

Мы собираем сотни метрик и умеем детализировать их до бизнес-разрезов: вертикали, регионы, авторизованные пользователи и т. д. Мы делаем это автоматизированно с помощью единой платформы для экспериментов. В статье я достаточно подробно расскажу, как платформа устроена и мы с вами погрузимся в некоторые интересные технические детали.

Читать дальше →

+43

lonely_luckily 24 июн 2018 в 18:40

Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin

6 мин

35K

Python*Разработка игр*Аналитика мобильных приложений*Управление продуктом*Блог компании Pixonic

Все рано или поздно приходят к аналитике за данными. В больших многопользовательских играх (да и синглплеере) без этого уже вообще никуда. Сколько пользователей предпочитают новый режим; где слабые места монетизации; куда смотреть геймдизайнерам, чтобы повысить вовлеченность игроков; и еще миллион вещей — подсчитывается вообще всё. И всё это влияет на решения, которые потом принимают разработчики.

А вот внедряют аналитику все по-разному: кто-то покупает сторонние решения (просто, но негибко), кто-то пишет под себя (долго и дорого), а кто-то пока просто считает несколько базовых метрик силами программистов и не заморачивается.

Поэтому я расскажу об инструменте, который будет полезен для всех. Кто только начинает выстраивать аналитику — сможет «на коленке» создать систему с нуля, а компании с уже готовыми решениями — «бустануть» свой подход.

Читать дальше →

+42

ogurtsov 7 апр 2020 в 14:59

Машинное обучение на языке R с использованием пакета mlr3

16 мин

9.1K

Data Mining*R*Машинное обучение*Блог компании Open Data ScienceData Engineering*

Источник: https://mlr3book.mlr-org.com/

Привет, Хабр!

В этом сообщении мы рассмотрим самый продуманный на сегодняшний день подход к машинному обучению на языке R — пакет mlr3 и экосистему вокруг него. Данный подход основан на «нормальном» ООП с использованием R6-классов и на представлении всех операций с данными и моделями в виде графа вычислений. Это позволяет создавать упорядоченные и гибкие пайплайны для задач машинного обучения, но на первых порах может показаться сложным и запутанным. Ниже постараемся внести определенную ясность и замотивировать к использованию mlr3 в ваших проектах.

Содержание:

Читать дальше →

+31

ilmarin77 22 фев 2020 в 10:50

Применяем Data Science в мирных целях покупки дома

9 мин

25K

Data Mining*DIY или Сделай самЛайфхаки для гиков

Чтобы продать что-нибудь ненужное, нужно сначала купить что-нибудь ненужное, а у нас денег нет.
— Трое из Простоквашино

Введение

Так получилось, что я живу в своей квартире (или кондо по-местному) в Монреале. И однажды, примерно год назад меня посетила мысль что неплохо бы перебраться в собственный дом. Некоторый опыт покупки и продажи жилья у меня уже был и, в принципе, можно было бы подойти к этому вопросу просто, как поступает большинство местных обывателей: нанять риэлтора и предоставить ему разобраться со всеми вопросами, но это было бы скучно и неинтересно.

Поэтому я решил подойти к этому делу научно. Есть задача: надо разобраться сколько примерно стоит то что у меня есть, и где находится то что я могу себе позволить. Ну и попутный вопрос — понять куда дует ветер. И изучить гео-пространственные вычисления в R.

Читать дальше →

+24

Ananiev_Genrih 20 дек 2019 в 15:18

EDA под другим углом

10 мин

20K

R*Визуализация данных*

Поговорим не про еду, а про разведочный анализ данных (exploratory data analysis, EDA) который является обязательной прелюдией перед любым суровым ML.

Будем честны, процесс довольно занудный, и чтобы выцепить хоть какие-то значимые инсайты про наши данные — требуется потратить достаточное количество времени активно используя любимую библиотеку визуализации.

А теперь представим что мы довольно ленивы (но любопытны) и будем следовать этому постулату всю эту статью.

Читать дальше →

egor_labintcev 12 мая 2017 в 13:59

Метрики в задачах машинного обучения

9 мин

623K

Python*Data Mining*Математика*Машинное обучение*Блог компании Open Data Science

Привет, Хабр!

В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста.

В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так.

Читать дальше →

+38

Syurmakov 17 июл 2019 в 00:32

Галерея лучших блокнотов по ML и Data Science

3 мин

33K

Python*Data Mining*Big Data*Машинное обучение*

Привет, читатель.

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи. Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

Итак, приступим.

Вводные курсы в Jupyter Notebook

Читать дальше →

+27

iggisv9t 4 сен 2019 в 14:04

Визуализация больших графов для самых маленьких

12 мин

56K

Data Mining*Визуализация данных*Машинное обучение*Блог компании Open Data ScienceИскусственный интеллект

Что делать, если вам нужно нарисовать граф, но попавшиеся под руку инструменты рисуют какой-то комок волос или вовсе пожирают всю оперативную память и вешают систему? За последние пару лет работы с большими графами (сотни миллионов вершин и рёбер) я испробовал много инструментов и подходов, и почти не находил достойных обзоров. Поэтому теперь пишу такой обзор сам.

Читать дальше →

+93

yorko 20 дек 2017 в 15:00

Материалы открытого курса OpenDataScience и Mail.Ru Group по машинному обучению и новый запуск

9 мин

146K

Python*Блог компании VKData Mining*Машинное обучение*Блог компании Open Data Science

Недавно OpenDataScience и Mail.Ru Group провели открытый курс машинного обучения. В прошлом анонсе много сказано о курсе. В этой статье мы поделимся материалами курса, а также объявим новый запуск.

UPD: теперь курс — на английском языке под брендом mlcourse.ai со статьями на Medium, а материалами — на Kaggle (Dataset) и на GitHub.

Кому не терпится: новый запуск курса — 1 февраля, регистрация не нужна, но чтоб мы вас запомнили и отдельно пригласили, заполните форму. Курс состоит из серии статей на Хабре (Первичный анализ данных с Pandas — первая из них), дополняющих их лекций на YouTube-канале, воспроизводимых материалов (Jupyter notebooks в github-репозитории курса), домашних заданий, соревнований Kaggle Inclass, тьюториалов и индивидуальных проектов по анализу данных. Главные новости будут в группе ВКонтакте, а жизнь во время курса будет теплиться в Slack OpenDataScience (вступить) в канале #mlcourse_ai.

+78

Kh_artem 17 фев 2015 в 11:21

Революция в области искусственного разума. Часть первая: путь к Сверхразуму

24 мин

58K

Из песочницы

Вторая часть
Примечание переводчика: Данная статья является переводом публикации «The AI Revolution: The Road to Superintelligence». Оригинальная статья была написана для широкой аудитории, поэтому многие термины использованные в ней могут быть не точными или вообще не научными. При переводе я старался сохранить непринуждённый дух статьи и юмор, с которым был написан оригинал. К сожалению, это не всегда получалось. Переводчик согласен не со всем, что написано в данной статье, но правки к фактам и своё мнение не были добавлены даже в виде примечаний или комментариев. В тексте могут быть ошибки и опечатки, сообщайте о них, пожалуйста, в личные сообщения, буду стараться исправлять всё максимально быстро. Все ссылки в тексте скопированы из оригинальной статьи и ведут на англоязычные ресурсы.

We are on the edge of change comparable to the rise of human life on Earth. — Vernor Vinge

Мы стоим на пороге перемен сравнимых, разве что с самим рождением человечества. Вернор Виндж.

Каково это находиться здесь?

Читать дальше →

+50

130

kruegger 18 окт 2018 в 14:00

Как правильно «фармить» Kaggle

27 мин

154K

Python*Data Mining*Математика*Машинное обучение*Блог компании Open Data Science

*фарм — (от англ. farming) — долгое и занудное повторение определенных игровых действий с определенной целью (получение опыта, добыча ресурсов и др.).

Введение

Недавно (1 октября) стартовала новая сессия прекрасного курса по DS/ML (очень рекомендую в качестве начального курса всем, кто хочет, как это теперь называется, "войти" в DS). И, как обычно, после окончания любого курса у выпускников возникает вопрос — а где теперь получить практический опыт, чтобы закрепить пока еще сырые теоретические знания. Если вы зададите этот вопрос на любом профильном форуме, то ответ, скорее всего, будет один — иди решай Kaggle. Kaggle — это да, но с чего начать и как наиболее эффективно использовать эту платформу для прокачки практических навыков? В данной статье автор постарается на своем опыте дать ответы на эти вопросы, а также описать расположение основных грабель на поле соревновательного DS, чтобы ускорить процесс прокачки и получать от этого фан.

проверить глубину этой кроличьей норы

+85

randall 28 июл 2020 в 15:53

Большие ошибки в больших данных: проблемы анализа на практике

7 мин

7.4K

Анализ и проектирование систем*Блог компании VKBig Data*Математика*Визуализация данных*

При работе с big data ошибок не избежать. Вам нужно докопаться до сути данных, расставить приоритеты, оптимизировать, визуализировать данные, извлечь правильные идеи. По результатам опросов, 85 % компаний стремятся к управлению данными, но только 37% сообщают об успехах в этой области. На практике изучать негативный опыт сложно, поскольку о провалах никто не любит говорить. Аналитики с удовольствием расскажут об успехах, но как только речь зайдет об ошибках, будьте готовы услышать про «накопление шума», «ложную корреляцию» и «случайную эндогенность», и без всякой конкретики. Действительно ли проблемы с big data существуют по большей части лишь на уровне теории?

Сегодня мы изучим опыт реальных ошибок, которые ощутимо повлияли на пользователей и аналитиков.

Читать дальше →

+22