Pull to refresh
9
0
Сергей Булатецкий @Ranlod

Аналитик

Send message

Более 250 бесплатных курсов и ресурсов по аналитике

Level of difficultyEasy
Reading time11 min
Views10K

Большая подборка для аналитиков данных, продуктовых аналитиков, веб аналитиков, маркетинговых аналитиков и особенно тех, кто хочет ими стать. От автора Telegram-канала «Аналитика и Growth mind-set».

Но прежде несколько важных моментов:

Читать далее
Total votes 17: ↑15.5 and ↓1.5+14
Comments2

Полное солнечное затмение 8 апреля 2024 года

Level of difficultyMedium
Reading time7 min
Views103K

Это затмение называют "Великим Американским Затмением". Можно догадаться почему. Зона его видимости — североамериканский континент. За незначительным исключением, нигде на суше, кроме США, Канады, Мексики и нескольких стран центральной Америки, затмение не видно.

Да — в зоне видимости будет еще акватория Тихого и Атлантического океанов, ряд островов расположенных в них, Гренландия и самый краешек северной Европы — совсем уже на излете (во время захода Солнца и в очень малых фазах). Но если говорить о полосе полной фазы, в которой для наблюдателей Солнце затмится Луною совершенно, наступят густые сумерки, и на небе вспыхнут самые яркие звезды и планеты, то она коснется лишь трех стран: Мексики, США и Канады.

Читать далее
Total votes 74: ↑75.5 and ↓-1.5+77
Comments47

Мониторинг Apache Airflow. Оценка «прожорливости» тасок

Reading time10 min
Views2.9K

Всем привет! Случались ли у вас ситуации, когда количество DAG’ов в вашем Airflow переваливает за 800 и увеличивается на 10-20 DAG’ов в неделю? Согласен, звучит страшно, чувствуешь себя тем героем из Subway Surfers… А теперь представьте, что эта платформа является единой точкой входа для всех аналитиков из различных команд и DAG’и пишут более 50 различных специалистов. Подкосились ноги, холодный пот и желание уйти из IT?

Не спешите паниковать, под катом я расскажу о том, как контролировать потребление ресурсов DAG’ов Airflow для предупреждения неоптимально написанных DAG’ов и борьбы с ними.

Меня зовут Давид Хоперия, я Data Engineer в департаменте данных Ozon.Fintech и моим основным инструментом является Apache Airflow, поэтому настало время углубиться в детали его работы.

Поехали
Total votes 16: ↑16 and ↓0+16
Comments10

Надежный обход блокировок в 2024: протоколы, клиенты и настройка сервера от простого к сложному

Level of difficultyMedium
Reading time45 min
Views136K

Поскольку блокировки интернета в РФ в последние недели и месяцы многократно активизировались, а маразм все крепчает и крепчает, стоит еще раз поднять тему обхода этих самых блокировок (и делаем ставки, через сколько дней на эту статью доброжелатели напишут донос в РКН чтобы ограничить к ней доступ на территории страны).

Вы, наверняка, помните отличный цикл статей на Хабре в прошлом году от пользователя MiraclePtr, который рассказывал о разных методах блокировок, о разных методах обхода блокировок, о разных клиентах и серверах для обходов блокировок, и о разных способах их настройки (раз, два, три, четыре, пять, шесть, семь, восемь, десять, десять, и вроде были еще другие), и можете спросить, а зачем еще одна? Есть две основные причины для этого.

Читать далее
Total votes 506: ↑498 and ↓8+490
Comments351

SimulIDE: открытый симулятор цифровых схем и микроконтроллеров

Reading time3 min
Views21K

В этой заметке я решил рассказать о SimulIDE. Это относительно новое программное средство с открытым исходном кодом, предназначенное для моделирования 8-битных микроконтроллеров семейств AVR и PIC, а также прочих электронных схем. По интерфейсу SimulIDE напоминает Proteus. SimulIDE кроссплатформенный и работает под Linux, Windows и Mac. Далее будут рассмотрены основные возможности этого симулятора и рассказано о моих личных впечатлениях от работы с данной программой.

Читать далее
Total votes 57: ↑57 and ↓0+57
Comments35

Шпаргалка для алгособеса — алгоритмическая сложность, структуры данных, методы сортировки и Дейкстра

Level of difficultyMedium
Reading time33 min
Views97K

Привет, Хабр!

Так уж повелось, что любой уважающий себя работодатель перенимает передовые^✻ методики FAANG — по этой причине практически во всех IT-собесах есть она: секция алгоритмов. Кто-то ей рад, кто-то не очень, но секция есть и уходить пока не планирует. Поэтому нужно закатать рукава и достойно встретить суровую реальность.

Читать далее
Total votes 216: ↑214 and ↓2+212
Comments77

Обзор библиотеки Stan в R

Level of difficultyMedium
Reading time11 min
Views1.2K

Приветствую!

Stan - это библиотека на C++, предназначенная для байесовского моделирования и вывода. Она использует сэмплер NUTS, чтобы создавать апостериорные симуляции модели, основываясь на заданных пользователем моделях и данных. Так же Stan может использовать алгоритм оптимизации LBFGS для максимизации целевой функции, к примеру как логарифмическое правдоподобие.

Для облегчения работы с Stan из языка программирования R доступен пакет rstan, который предоставляет интерфейс R для Stan.

Сегодня мы и рассмотрим этот пакет.

Читать далее
Total votes 12: ↑10 and ↓2+8
Comments0

Параллельное выполнение в R

Level of difficultyEasy
Reading time7 min
Views1K

Привет, Хабр!

Параллельные вычисления – подход к проектированию и выполнению программ, который позволяет ускорить обработку данных и вычисления, используя множество процессоров или ядер процессора одновременно.

В ЯП R паралельное выполнение также имеет свои варианты реализации. Рассмотрим их в статье.

Читать далее
Total votes 16: ↑15 and ↓1+14
Comments0

Как я создаю себе колоды Anki для немецких слов

Level of difficultyMedium
Reading time14 min
Views6.8K

Я захотел продолжить некогда заброшенное изучение немецкого языка. Долгое время на просторах интернета слышал мнение, что карточки Anki – чуть ли не самый лучший способ изучение языка, и решил, собственно, посмотреть что к чему. Рекомендации YouTube привели меня к интересному видео, где автор рассказывает о своем шаблоне карточек с немецкими словами. Автор не желал публиковать свою колоду, и не найдя аналогов среди публичных колод, я принялся делать свое. Конечно же не вручную.

Читать далее
Total votes 17: ↑17 and ↓0+17
Comments36

Семантический поиск и генерация текста на R. Часть 1

Level of difficultyMedium
Reading time10 min
Views2.1K

Для этой задачи использую LLM (Large Language Models - например, chatGPT или opensouce модели) для внутренних задач (а-ля поиск или вопрос-ответную систему по необходимым данным).

Я пишу на языке R и также увлекаюсь NLP (надеюсь, я не один такой). Но есть сложности из-за того, что основной язык для LLM - это python. Соответственно, на R мало примеров и документации, поэтому приходится больше времени тратить, чтобы “переводить” с питона, но с другой стороны прокачиваюсь от этого.

Чтобы не городить свою инфраструктуру, есть уже готовые решения, чтобы быстро и удобно подключить и использовать. Это LangChain и LlamaIndex. Я обычно использую LangChain (дальше он и будет использоваться). Не могу сказать, что лучше, просто так повелось, что использую первое. Они написаны на питоне, но с помощью библиотеки reticulate всё работает и на R.

Читать далее
Total votes 8: ↑8 and ↓0+8
Comments4

Семантический поиск и генерация текста на R. Часть 2

Level of difficultyMedium
Reading time5 min
Views932

В первой части говорили про использование поиска и генерации ответа с помощью языковых моделей. В этой части рассмотрим память и агентов.

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments0

Как получить повышение. Взгляд глазами руководителя

Level of difficultyEasy
Reading time8 min
Views66K
Новый год — это не только праздник/отдых/премии и вот это вот все, нужное подчеркнуть; это еще и старт нового промоушен-периода, когда вы можете претендовать на повышение грейда или увеличение зарплаты.

В моем отделе (B2В Product Design, хотя это сейчас неважно) 25 человек. Непосредственно я руковожу не линейными сотрудниками, а тимлидами команд, но суть в том, что по каждому из коллег в мои задачи входит распределение премий, повышение зарплат и назначение новых грейдов.

За время моей работы я не только помогла с промоушеном примерно полутора десяткам коллег, но и много раз сталкивалась с типовыми ошибками сотрудников в этих вопросах. И хотела бы поделиться своим опытом со стороны руководителя, как вы можете увеличить свои шансы получить заветное повышение.

И я не зря публикую этот пост в самом начале года: во-первых, в разных компаниях промоушен-периоды проходят в разные сроки, начиная в том числе прямо с зимы; во-вторых, чем раньше вы выберете правильную тактику, тем больше у вас шансов на успех.


(Моя любимая команда. И тут, кстати, не все))
Читать дальше →
Total votes 135: ↑63 and ↓72-9
Comments294

Состояние рынка труда и зарплат в IT

Level of difficultyEasy
Reading time5 min
Views24K

На Хабре регулярно публикуются зарплатные исследования сервисов для поиска работы. Данные одних основываются на зарплатах, которую предлагают работодатели в вакансиях. Другие же анализируют зарплаты, которые указали в анкетах сами IT-специалисты. Эти исследования учитывают зарплаты только внутри России, но с февраля 2022 года сотни тысяч айтишников России (и не только) уехали в другие страны. Многие из них нашли работу в новых странах, но кто-то продолжил работать на компанию из родной страны. Кроме того, эти исследования не учитывают важные, на наш взгляд, факторы: работает специалист удалённо или в офисе, оформлен ли трудовой договор или договор оказания услуг, и как от всего этого зависит зарплата. Так в коллективе профсоюза родилась идея провести собственное исследование состояния рынка труда и зарплат в IT.

Читать далее
Total votes 49: ↑44 and ↓5+39
Comments84

Профилирование Python — почему и где тормозит ваш код

Level of difficultyMedium
Reading time10 min
Views17K

Представьте ситуацию: вы написали скрипт для обработки каких-то данных на ноутбуке, ушли попить кофе, а когда пятнадцать минут спустя вернулись, завершилось едва ли 10%.

Почему скрипт работает так медленно? Какая его часть тормозит? Дело в чтении данных, их обработке или сохранении? Как ускорить исполнение? Действительно ли скрипт вообще медленный?

Ответить на все эти вопросы поможет инструмент под названием «профилировщик» (profiler).
Читать дальше →
Total votes 68: ↑67 and ↓1+66
Comments10

Статистические тесты и проверка гипотез в R

Reading time15 min
Views5.4K

Современный мир насыщен данными, анализ информации становится критически важным инструментом для принятия обоснованных решений. Однако просто иметь данные не достаточно – необходимо извлечь из них ценную информацию. В этом процессе статистические тесты и проверка гипотез играют важнейшую роль. Они позволяют нам сделать выводы на основе данных, опираясь на строгие методы анализа, и тем самым способствуют принятию обоснованных решений.

Статистические тесты – это мощный инструмент, который позволяет провести объективную оценку данных и проверить гипотезы, основанные на этой информации. Они позволяют определить, насколько вероятно, что наблюдаемые различия или закономерности случайны, а не реально существующие в популяции. Статистические тесты позволяют избежать ошибок и предоставляют научно обоснованный подход к анализу данных.

Читать далее
Total votes 11: ↑11 and ↓0+11
Comments1

Заметки по R: находим каждый последний понедельник месяца в наборе данных

Level of difficultyEasy
Reading time3 min
Views1.3K

Периодически возникают задачи в R, которые просты по своей сути, но не очевидны для тех, кто только начинает свой путь.

Представим, что в нашей организации каждый последний понедельник месяца происходит учет товара. В эти дни нет продаж. И мы бы хотели учесть это в наших прогнозах. Стоит вопрос: как в данных "выловить" эти понедельники, не используя function.

Читать далее
Total votes 2: ↑2 and ↓0+2
Comments2

Списковые включения в Python мощнее, чем можно подумать

Reading time7 min
Views31K

В Python списковые включения (и генераторы списков) —  замечательные механизмы, способные серьёзно упрощать программный код. Правда, чаще всего их используют в форме, предусматривающей наличие единственного цикла for и, возможно, одного условия if. И это всё. Но если попытаться немного вникнуть в эту тему, то окажется, что у списковых включений Python имеется гораздо больше возможностей, чем можно подумать, возможностей, разобравшись с которыми, можно, по меньшей мере, кое-чему научиться.

Читать далее
Total votes 35: ↑32 and ↓3+29
Comments15

Что можно поменять в дёснах (правда, цена операции — 2 месяца смузи-диеты)

Reading time11 min
Views17K
Вы просили рассказать про рецессию десны — когда она «уходит» с возрастом и улыбка становится зловещей, с чёрными треугольниками. Часто это можно относительно легко поправить.

Можно перекроить лицо, сделать грудь больше или внести пару изменений в интимную зону. А вот пластика десны (гингивопластика) — понятие для многих пациентов нашей клиники незнакомое. Хотя поправить можно много чего. Мне как практикующему ортопеду и хирургу такое положение дел не нравится. Не из личной гордости — просто вовремя проведённая операция на дёснах помогает моим пациентам избежать более серьёзных стоматологических проблем.

Пластика десны — это когда мы перекраиваем, урезаем или, наоборот, наращиваем дёсенную ткань. Для эстетики и красивой улыбки и по медицинским показаниям. Вообще эта операция используется для лечения разных патологий, но мы рассмотрим её в контексте рецессии десны.

Поэтому в статье раскроем следующие моменты:

  • Как устроены зубы и десна человека.
  • Что такое рецессия десны, чем она вызывается и к чему может привести.
  • Как и когда лечится рецессия десны.
  • Как проводится пластика десны.
  • Как и сколько длится восстановление после операции.
  • В каких клиниках она проводится и сколько стоит.


Рецессия десны до и после пластики

Осторожно, под катом фотографии самой процедуры интраоперационно. Если вы сейчас едите, может излишне впечатлить.
Читать дальше →
Total votes 48: ↑41 and ↓7+34
Comments31

Зубы мудрости: удалить нельзя оставить

Reading time6 min
Views350K
image

Уважаемые друзья, сегодня я предлагаю вам поговорить о зубах мудрости. Причём, поговорить о самом сложном и самом непонятном — показаниям к их удалению.

Издавна с восьмёрками (третьими молярами или «зубами мудрости») связано очень много анекдотов, суеверий, легенд и историй, в том числе весьма страшных. И распространена вся эта мифология не только среди обычных людей, но и в медицинском сообществе. Постепенно, в ходе обсуждения, я попробую их развенчать и показать, что зубы мудрости — не такая уж проблема, как в плане диагностики, так и в плане удаления. Тем более, если речь идёт о современном докторе и современной клинике.
Читать дальше →
Total votes 149: ↑142 and ↓7+135
Comments254

Как увеличить точность модели с 80% до 90%+ (мой опыт)

Reading time4 min
Views16K

Разберем способы поднять точность модели!

Привет, чемпион! Возможно, перед тобой сейчас стоит задача построить предиктивную модель, или ты просто фармишь Kaggle, и тебе не хватает идей, тогда эта статья будет тебе полезна!

Наверное, уже только ленивый не слышал про Data Science и то, как модели машинного обучения помогают прогнозировать будущее, но самое крутое в анализе данных, на мой взгляд, - это хакатоны! Будь-то Kaggle или локальные соревнования, везде примерно одна задача - получить точность выше, чем у других оппонентов (в идеале еще пригодную для продакшена модель). И тут возникает проблема...

Читать далее
Total votes 7: ↑5 and ↓2+3
Comments4
1
23 ...

Information

Rating
Does not participate
Location
München, Bayern, Германия
Date of birth
Registered
Activity