Как стать автором
Обновить
8
0

Data scientist

Отправить сообщение

Как я изучал структуры данных и алгоритмы для собеседования в FAANG

Время на прочтение 12 мин
Количество просмотров 60K
Продолжая тему устройства в FAANG, которую уже мы поднимали в нашем блоге, и специально к старту нового потока нашего курса по алгоритмам сегодня делюсь описанием пути Эско Обонга, старшего инженера-программиста Uber.

Эта история началась в 2015 году, когда стартап, к которому я присоединился как «сотрудник-основатель», закрылся через шесть месяцев после первого раунда инвестиций, и я искал новую работу. Первое моё собеседование было с  Codecademy, где на этапе телефонного разговора меня заверили: «Не волнуйтесь, мы не задаём сумасшедших вопросов об алгоритмах или что-то в этом роде». И я им поверил…


Приятного чтения!
Всего голосов 61: ↑55 и ↓6 +49
Комментарии 71

Я год шпионил за собой — что из этого вышло. Простой секрет личной эффективности

Время на прочтение 5 мин
Количество просмотров 120K

На стенах храма Аполлона было написано "Познай самого себя", но там нигде не было сказано как это сделать. Предлагаю исправить такое положение дел, да и к тому же разобраться как это поможет стать более продуктивным.

Читать далее
Всего голосов 97: ↑90 и ↓7 +83
Комментарии 145

Data-Science-процессы: Jupyter Notebook для продакшена

Время на прочтение 9 мин
Количество просмотров 7.3K

Jovian Blues by ShootingStarLogBook

Рефакторинг написанного в Notebook кода для запуска в продакшене — трудная и ресурсоемкая задача. Команда VK Cloud Solutions перевела материал о том, как с помощью MLOps-инструментов и приемов сократить время от исследования до запуска решения. Описанное в статье — результат структурированного опыта дата-сайентистов и ML-разработчиков из сотен компаний.
Читать дальше →
Всего голосов 39: ↑38 и ↓1 +37
Комментарии 1

Основная информация про опен сорс и полезные ссылки

Время на прочтение 8 мин
Количество просмотров 10K

Написано довольно много хороших материалов о свободных лицензиях, в том числе тут, на Habr. Почему стоит прочитать еще и эту статью: 

Читать далее
Всего голосов 25: ↑11 и ↓14 -3
Комментарии 40

Стажировки в международных компаниях: как не завалить интервью и получить заветный оффер

Время на прочтение 7 мин
Количество просмотров 13K
Эта статья является переделанной и дополненной версией моего рассказа про стажировку в Google.

Привет, Хабр!

В этом посте я расскажу, что такое стажировка в зарубежной компании и как подготовиться к собеседованиям так, чтобы получить оффер.

Почему вы должны меня слушать? Не должны. Но за последние два года я побывал на стажировках в Google, Nvidia, Lyft Level5 и Amazon. Собеседуясь в компании в прошлом году, получил 7 офферов: от Amazon, Nvidia, Lyft, Stripe, Twitter, Facebook и Coinbase. Так что у меня есть кое-какой опыт в этом вопросе, который, возможно, окажется полезным.


Читать дальше →
Всего голосов 11: ↑10 и ↓1 +9
Комментарии 5

[Личный опыт] Как специалисту по Data Science с тремя годами опыта устроиться в Google и переехать в Лондон

Время на прочтение 7 мин
Количество просмотров 12K
Привет, Хабр! Продолжаем делиться с вами историями IT-эмиграции. После Амстердама, Риги, Сиднея настала очередь Лондона. Анастасия Манохина – Cloud-инженер в Google, поделится своим опытом прохождения собеседований и переезда в британскую столицу. Передаем ей слово!



Всем привет, меня зовут Настя, и вот уже несколько месяцев я работаю в Google в Лондоне. Это время оказалось крайне насыщенным: переезд, погружение в новую среду, а затем карантин и массовая удаленная работа. Но обо всем по порядку.
Читать дальше →
Всего голосов 36: ↑20 и ↓16 +4
Комментарии 13

Распознаем медицинские тексты

Время на прочтение 11 мин
Количество просмотров 3.7K

Это третья публикация в рамках цикла статей по изучению московской базы ковидных больных. В настоящей работе были созданы векторные представления медицинских терминов, которые теперь доступны на Github.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 4

Первые 255 задач на «‎литкоде»‎

Время на прочтение 3 мин
Количество просмотров 27K
Были годные статьи об аргументированной пользе алгоритмов (например, habr.com/ru/company/geekfactor/blog/597035), тут хочется поделиться личным опытом.

На всякий случай, не стоит переоценивать пользу алгоритмов: если вы на одном уровне зп и при этом коллега крутил на всем подряд биг О нотэйшн, скорее всего софт скилы у него развиты лучше.

Что дано: фронтэнд с элементами nodejs разработки. Знаю javascript, взял java из-за общего префикса и Брюса Эккеля. Язык годный, легко читать, осознал что надо оч много писать после 175 задачек на ресурсе под именем leetcode. Попробовал язык мобилок, язык прекрасный, но не для мобилок. Swift прекрасен и будет еще прекраснее в будущем. До наступления прекрасного будущего решил юзать питон: легко и мало писать, но трудно читать — да и пофиг, так как каждый день новая задачка.
Читать дальше →
Всего голосов 13: ↑7 и ↓6 +1
Комментарии 16

Маркетинговая аналитика на Python. Пишем код для RFM-сегментации

Время на прочтение 8 мин
Количество просмотров 12K

RFM - классический инструмент маркетинга для сегментации вашей клиентской базы. Я использую ее для работы в В2В, В2G сегменте. В основе него - понятные управленцу ценности: LTV и Purchase Frequency. Как можно строить сегменты с помощью Python - читайте в материале.

 

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 7

Введение в Data classes

Время на прочтение 7 мин
Количество просмотров 204K

Одна из новых возможностей, появившихся в Python 3.7 — классы данных (Data classes). Они призваны автоматизировать генерацию кода классов, которые используются для хранения данных. Не смотря на то, что они используют другие механизмы работы, их можно сравнить с "изменяемыми именованными кортежами со значениями по умолчанию".



Введение


Все приведенные примеры требуют для своей работы Python 3.7 или выше

Большинству python-разработчикам приходится регулярно писать такие классы:


class RegularBook:
    def __init__(self, title, author):
        self.title = title
        self.author = author

Уже на этом примере видна избыточность. Идентификаторы title и author используются несколько раз. Реальный класс же будет ещё содержать переопределенные методы __eq__ и __repr__.


Модуль dataclasses содержит декоратор @dataclass. С его использованием аналогичный код будет выглядеть так:


from dataclasses import dataclass

@dataclass
class Book:
    title: str
    author: str
Читать дальше →
Всего голосов 48: ↑46 и ↓2 +44
Комментарии 19

HyperBand и BOHB. Понимание современных алгоритмов оптимизации гиперпараметров

Время на прочтение 7 мин
Количество просмотров 7.6K
Специально к старту курса «Машинное обучение» в этом материале представляем сравнение BOHB и HyperBand — двух передовых алгоритмов оптимизации гиперпараметров нейронной сети и простого случайного поиска оптимальных гиперпараметров. Сравнение выполняется с помощью платформы neptune.ai — инструмента для управления экспериментами в области ИИ. Рисунки, графики, таблицы результатов сравнения — всё это вы найдете под катом.


Приятного чтения!
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 0

Самая сложная задача в Computer Vision

Время на прочтение 13 мин
Количество просмотров 66K
Среди всего многообразия задач Computer Vision есть одна, которая стоит особняком. К ней обычно стараются лишний раз не притрагиваться. И, если не дай бог работает, — не ворошить.
У неё нет общего решения. Практически для каждого применения существующие алгоритмы надо тюнинговать, переобучать, или судорожно копаться в куче матриц и дебрях логики.

Статья о том как делать трекинг. Где он используется, какие есть разновидности. Как сделать стабильное решение.
Всего голосов 127: ↑127 и ↓0 +127
Комментарии 42

Алгоритм Jerdella: решаем проблемы семантического безумия в IT-системах банков

Время на прочтение 15 мин
Количество просмотров 4.1K
Семантические проблемы в IT системах. Что бывает, когда много разных людей начинают творить

Есть ветхозаветная легенда о том, как люди в древнем городе Вавилон начали строить башню, но Всевышний перемешал им языки, и башня достроена не была. Еще бы, ведь башню строили сотни маленьких групп, которые в совокупности не понимали друг друга. А не понимая друг друга, невозможно взаимодействовать. Действительно, просто безумие – называть одну и туже вещь, подразумевая её одинаково, разными словами. И удивительного тут ничего нет.

Ветхозаветную легенду можно с легкостью перенести на современные крупные компании, внедряющие современные ИТ-решения. В пример таких компаний, вне всякого сомнения, можно отнести современные российкие банки, которые имеют десятки, а то и сотни бизнес-подразделений, в которых складывается своя субкультура общения, построенная на своих правилах и уникальном стиле делового оборота. Естественно, при формировании ИТ-инфрастурктуры учитывается устоявшийся в коллективе стиль именования бизнес-сущностей. За последние десять лет появилось множество работ на эту тему, например эта [1]. Те, кто сталкивался с аналитикой информационных систем в банках знают, что такое сделать так называемый «маппинг» данных, особенно, если конечные системы делали разные команды аналитиков, разработчиков и заказчиков или вендоров. Как правило, на 60% составление маппинга является уяснением сути и семантики передаваемых данных.

Читать дальше →
Всего голосов 8: ↑8 и ↓0 +8
Комментарии 61

Информация

В рейтинге
Не участвует
Дата рождения
Зарегистрирована
Активность