Статьи / Закладки / Профиль barbaris76 / Хабр

@barbaris76

Пользователь

Профиль Публикации Комментарии 492Закладки 110

vasilevafb 10 апр в 15:15

Более 250 бесплатных курсов и ресурсов по аналитике

Простой

11 мин

10K

Big Data*

Роадмэп

Большая подборка для аналитиков данных, продуктовых аналитиков, веб аналитиков, маркетинговых аналитиков и особенно тех, кто хочет ими стать. От автора Telegram-канала «Аналитика и Growth mind-set».

Но прежде несколько важных моментов:

+14

sawabear_a 27 мар в 14:02

Управление цветами в Seaborn: как визуализировать данные красиво

Средний

20 мин

6.8K

Python*Визуализация данных*ПрезентацииБлог компании Lamoda Tech

Туториал

Привет, Хабр. В этой статье я расскажу про своё видение работы с цветом при визуализации графиков. Буду показывать все на примерах — уверен, они вам понравятся.

Я покажу не только картинки было-стало, но и приведу примеры кода, а также объясню логику принятия решений: как использовать ту или иную палитру в конкретной задаче. И что самое главное, дам пошаговые советы, как сделать график логичнее и понятнее для заказчиков.

Меня зовут Саша, сейчас я работаю в Lamoda Tech старшим бизнес/дата-аналитиком. До этого я несколько лет был специалистом по данным в другой компании и регулярно представлял совету директоров анализ и прогноз физических и бизнес-показателей. Умение донести результаты исследования до заказчика, особенно если он не погружен в работу с данными — это важный аспект моей профессии. Надеюсь, моя статья с этим немного поможет.

+25

egaoharu_kensei 22 мар в 14:58

Метод опорных векторов (SVM). Подходы, принцип работы и реализация с нуля на Python

Сложный

14 мин

6.4K

Python*Data Mining*Алгоритмы*Машинное обучение*Искусственный интеллект

Туториал

Метод опорных векторов (Support Vector Machines или просто SVM) — мощный и универсальный набор алгоритмов для работы с данными любой формы, применяемый не только для задач классификации и регрессии, но и также для выявления аномалий. В данной статье будут рассмотрены основные подходы к созданию SVM, принцип работы, а также реализации с нуля его наиболее популярных разновидностей.

+16

kmoseenk 10 дек 2021 в 17:13

Работаем с большими наборами данных в Spark3.2.0 с использованием Pandas

7 мин

Программирование*Блог компании OTUS

Перевод

Благодаря недавнему релизу spark3.2.0 у нас появилась возможность масштабировать данные с помощью pandas.

vladislav_smirnov 14 мар в 14:11

Замыкания и декораторы в Python: часть 2 — декораторы

Простой

11 мин

7.1K

Python*Функциональное программирование*

Туториал

Уважаемые читатели, рад вас приветствовать в новой статье. Этот материал является продолжением предыдущей публикации, посвященной замыканиям. В данной части обзора мы углубимся в тему декораторов.

Эта статья написана в первую очередь для тех, кто только начинает свой путь в программировании или начал изучать Python. Потому здесь я не буду рассматривать декораторы классов, чтобы сделать материал более доступным для новичков. Тем не менее, для тех, кто изучит данную статью, не составит труда разобраться в декораторах классов, так как они не имеют существенных отличий от рассматриваемых здесь декораторов функций.

AvramovMax 14 мая 2020 в 10:12

Артикли в английском: безжалостная война правил и исключений

21 мин

68K

Изучение языков

В русском языке есть такие сложные грамматические понятия как род и падеж существительных. Даже нам, носителям языка, порой бывает сложно. А что уже говорить об иностранцах, изучающих русский?

В английском языке у существительных нет ни рода, ни падежа. Чтобы жизнь мёдом не казалась, мы должны уметь правильно использовать артикли. Они помогают понять конкретное ли это существительное или нет, исчисляемое или неисчисляемое, стоит ли оно в единственном или множественном числе. Проблема в том, что они непостоянны и могут меняться в зависимости от значения и контекста. Да и наличие исключений не упрощает нам жизнь.

Нет смысла писать ещё одну статью о базовых правилах употребления артиклей в английском. Сегодня я расскажу о правилах и о способах их нарушить.

Читать дальше →

+38

vlakir 17 ноя 2023 в 13:22

Асинхронный python без головной боли (часть 3)

Простой

10 мин

14K

Python*Программирование*

Туториал

Ну вот и пришла пора погрузиться в недра asyncio и подробнее познакомиться с циклом событий. С его помощью мы научимся писать собственные асинхронные веб-серверы, создавать асинхронные драйверы внешних устройств и справляться с вычислительно-затратными задачами в асинхронных приложениях.

И снова здравствуйте

+14

lebron32rus 12 ноя 2023 в 17:04

Практический гайд по процессам и потокам (и не только) в Python

Средний

5 мин

21K

Высокая производительность*Python*Программирование*Параллельное программирование*

За то время что я занимаюсь менторством я заметил, что большинство вопросов новичков связаны с темами: конкурентность, параллелизм, асинхронность. Подобные вопросы часто задают на собеседованиях, в работе эти знания позволяют писать более эффективные и производительные системы.

Цель статьи - понятно и доходчиво, используя примеры кода и бенчмарки рассказать о том какие инструменты есть в Python и как с их помощью добиться высокой производительности.

+10

Liloon21 31 окт 2023 в 15:19

Руководство для начинающих по Spark UI: Как отслеживать и анализировать задания Spark

Простой

13 мин

4.6K

Big Data*Блог компании СлёрмData Engineering*

Туториал

Recovery Mode

Перевод

Публикуем перевод гайда по Spark UI. Это встроенный инструмент Apache Spark, который предоставляет полный обзор среды Spark: узлов, исполнителей, свойств и параметров среды, выполняемых заданий, планов запросов и многого другого. Кроме теории в статье вы найдёте несколько примеров, которые помогут попрактиковаться в отслеживании и анализе заданий Spark.

SSul 23 ноя 2022 в 10:50

Как работать с процессами и потоками в Python

16 мин

70K

Python*Программирование*Параллельное программирование*Блог компании SimbirSoft

Раскрывать тему параллельного или асинхронного программирования непросто. Во-первых, она перегружена терминологией и трудна для понимания. Как правило, тонкости и особенности работы с языками усваиваются, лишь когда столкнешься с ними на практике. Во-вторых, в контексте Python тоже много своих подводных камней. Но сегодня почти любой современный web-сервис сталкивается с необходимостью многопоточности или асинхронности. Поскольку это многопользовательская среда, мы хотим направить всю процессорную мощность не на ожидание, а на решение прикладных задач бизнеса, чтобы все пользователи во время получили необходимые данные.

Эта статья будет полезна тем разработчикам, которые хотят выполнять больше работы за одно и то же время и задействовать все ресурсы своего железа. Проще говоря, делать больше при этом обходиться меньшими ресурсами. Пусть железо работает, а не простаивает.

+16

denis_kiber 24 авг 2015 в 10:52

Криптография на Python: шифрование информации и создание электронных цифровых подписей с помощью пакета PyCrypto

6 мин

85K

Информационная безопасность*Криптография*Python*Программирование*

Туториал

Из песочницы

Долго мучился с PyCrypto, в итоге получилась эта статья и полная реализация следующего протокола:

Этап отправки:

1. Алиса подписывает сообщение своей цифровой подписью и шифрует ее открытым ключом Боба (асимметричным алгоритмом).
2. Алиса генерирует случайный сеансовый ключ и шифрует этим ключом сообщение (с помощью симметричного алгоритма).
3. Сеансовый ключ шифруется открытым ключом Боба (асимметричным алгоритмом).
Алиса посылает Бобу зашифрованное сообщение, подпись и зашифрованный сеансовый ключ.

Этап приёма:

Боб получает зашифрованное сообщение Алисы, подпись и зашифрованный сеансовый ключ.
4. Боб расшифровывает сеансовый ключ своим закрытым ключом.
5. При помощи полученного, таким образом, сеансового ключа Боб расшифровывает зашифрованное сообщение Алисы.
6. Боб расшифровывает и проверяет подпись Алисы.

Читать дальше →

+12

krisstinkou 24 сен 2021 в 19:45

Работаем с текстами на Python: кодировки, нормализация, чистка

9 мин

81K

Python*Data Engineering*

Из песочницы

Об обработке текстов на естественном языке сейчас знают все. Все хоть раз пробовали задавать вопрос Сири или Алисе, пользовались Grammarly (это не реклама), пробовали генераторы стихов, текстов... или просто вводили запрос в Google. Да, вот так просто. На самом деле Google понимаетот него хотите, благодаря ш, что вы тукам, которые умеют обрабатывать и анализировать естественную речь в вашем запросе.

При анализе текста мы можем столкнуться с ситуациями, когда текст содержит специфические символы, которые необходимо проанализировать наравне с "простым текстом" или формулы, например. В таком случае обработка текста может усложниться.

Вы можете заметить, что если ввести в поисковую строку запрос с символами с ударением (так называемый модифицирующий акут), к примеру "ó", поисковая система может показать результаты, содержащие слова из вашего запроса, символы с ударением уже выглядят как обычные символы.

Так как всё-таки происходит обработка таких запросов?

+22

MaxRokatansky 27 апр 2023 в 17:22

Анализ временных рядов

Простой

8 мин

36K

Анализ и проектирование систем*Визуализация данных*Блог компании OTUS

Обзор

Привет! В последние годы аналитика данных переживает настоящий бум. Все большее количество компаний принимают решение сбора, хранения и анализа данных, чтобы повысить эффективность своих бизнес-процессов и принимать решения на основе фактов.

Одним из наиболее важных инструментов в аналитике данных является анализ временных рядов. Временной ряд - это последовательность наблюдений за определенным параметром в разные моменты времени. Таким образом, временной ряд содержит информацию о том, как изменяется параметр со временем.

badcasedaily1 30 мар 2023 в 17:23

Ультимативный Roadmap для Python-разработчика в 2023 году + источники знаний

Простой

4 мин

137K

Python*Учебный процесс в IT

Роадмэп

Python — один из самых популярных языков программирования в мире. Статистика современного рынка свидетельствует о том, что Python желаемый навык, и что его использование широко распространено в различных сферах, таких как наука, инженерия, бизнес, аналитика данных и многих других.

В этой статье я составил полную дорожную карту для изучения Python, прилагая полезные источники знаний.

VadimPachin 14 мар 2023 в 17:51

Midjourney, BlueWillow, PLAYGROUND AI, Stable Diffusion, Leonardo AI — как пользоваться

Средний

3 мин

13K

Обработка изображений*Графический дизайн*Искусственный интеллект

Из песочницы

Собрал в одно месте все самое нужное и популярное. Для тех, кто больше любит посмотреть, чем почитать, в конце прикрепил ссылку, где можно посмотреть ролики авторов, которые очень подробно обо всем рассказывают. Пользуйтесь на здоровье =)

prompt для этих ИИ будут фактически одинаковым, как и для других похожих сервисов.

i_am_polushko 9 дек 2022 в 23:26

Шпаргалка для подготовки к экзамену по машинному обучению

9 мин

15K

Python*Машинное обучение*

Из песочницы

Многие студенты колледжей в России в этом году будут обязаны сдать демо-экзамен по дисциплине, посвящённой изучению темы машинного обучения, но качество обучения в учебном заведении может страдать в силу малого количества опыта в вопросе проведения подобного рода тестирования. В силу данного обстоятельства студенты в поисках материала для подготовки обращаются к помощи интернет ресурсов, но с ужасом обнаруживают, что информация не такая структуризированная, как было бы удобно экзаменуемым.

Меня тоже коснулась эта проблема, поэтому я решил написать статью, объясняющую принципы работы с необходимыми инструментами для сдачи демонстративного экзамена.

+16

nyalekseevna 9 сен 2022 в 11:47

Факторный анализ для интерпретации исследования клиентского опыта

6 мин

5.7K

Python*

Из песочницы

Вы провели опрос клиентского опыта в вашей компании. В данном случае на каждый вопрос клиенты отвечали по 10 бальной шкале, где 1 - совсем неудовлетворен, а 10 - полностью удовлетворен. Вопросы разбиты на несколько тематических блоков. В начале блок основных вопросов:

Katser 9 сен 2022 в 00:04

Обзор метрик обнаружения аномалий (плюс много дополнительной информации)

10 мин

9.3K

Python*Анализ и проектирование систем*Машинное обучение*Искусственный интеллектБлог компании Росатом

Привет, Хабр! На связи снова Юрий Кацер, эксперт по ML и анализу данных в промышленности, а также руководитель направления предиктивной аналитики в компании «Цифрум» Госкорпорации “Росатом”.

До сих пор рамках рабочих обязанностей решаю задачи поиска аномалий, прогнозирования, определения остаточного ресурса и другие задачи машинного обучения в промышленности. В рамках рабочих задач мне приходится часто сталкиваться с проблемой правильной оценки качества решения задачи, и, в частности, выбора правильной data science метрики в задачах обнаружения аномалий.

aledovskiy 6 авг 2022 в 21:36

Мои принципы в менеджменте ИТ-команд

6 мин

9.9K

Управление разработкой*Управление проектами*Управление продуктом*Управление персоналом*

Уже более 5 лет я занимаю руководящие позиции в области анализа данных. От синьора DS с двумя подчиненными до лида трех команд аналитиков и инженеров в Малом бизнесе Сбера. За это время я сформировал приципы, которые помогают мне в управлении творческими специалистами.

Не претендую на истину, да и не всему всегда получается следовать. Принципы не отражают всех задач менеджера, а относятся к конкретным вопросам. Делюсь с вами своим опытом, буду рад услышать ваше мнение.

+24

1shaman 3 авг 2022 в 11:00

Пять советов по исправлению перекошенных соединений в Apache Spark

9 мин

2.2K

SQL*Серверная оптимизация*Apache*Блог компании FirstVDS

Перевод

Соединения (Joins) являются одними из наиболее фундаментальных преобразований в типичной процедуре обработки данных. Оператор Join позволяет коррелировать, обогащать и фильтровать два входных набора (пакета / блока) данных (Datasets).

Обычно два входных набора данных классифицируются как левый и правый на основе их расположения по отношению к пункту/оператору Join.

По сути, соединение работает на основе условного оператора, который включает логическое выражение, основанное на сравнении между левым ключом, полученным из записи левого блока данных, и правым ключом, полученным из записи правого комплекса данных. Левый и правый ключи обычно называются соединительными ключами (Join Keys). Логическое выражение оценивается для каждой пары записей из двух входных наборов данных. На основе логического вывода, полученного в результате оценки выражения, условный оператор включает условие выбора — для отбора либо одной из записей (из пары), либо комбинированной записи (из записей, образующих пару).

Читать дальше →

2 3 4 5 6

Более 250 бесплатных курсов и ресурсов по аналитике

Управление цветами в Seaborn: как визуализировать данные красиво

Метод опорных векторов (SVM). Подходы, принцип работы и реализация с нуля на Python

Работаем с большими наборами данных в Spark3.2.0 с использованием Pandas

Замыкания и декораторы в Python: часть 2 — декораторы

Артикли в английском: безжалостная война правил и исключений

Асинхронный python без головной боли (часть 3)

Практический гайд по процессам и потокам (и не только) в Python

Руководство для начинающих по Spark UI: Как отслеживать и анализировать задания Spark

Как работать с процессами и потоками в Python

Криптография на Python: шифрование информации и создание электронных цифровых подписей с помощью пакета PyCrypto

Работаем с текстами на Python: кодировки, нормализация, чистка

Анализ временных рядов

Ультимативный Roadmap для Python-разработчика в 2023 году + источники знаний

Midjourney, BlueWillow, PLAYGROUND AI, Stable Diffusion, Leonardo AI — как пользоваться

Шпаргалка для подготовки к экзамену по машинному обучению

Факторный анализ для интерпретации исследования клиентского опыта

Обзор метрик обнаружения аномалий (плюс много дополнительной информации)

Мои принципы в менеджменте ИТ-команд

Пять советов по исправлению перекошенных соединений в Apache Spark

Информация

Специализация