В этой статье, а вернее целой истории, я хотел бы поделиться своим путем становления в качестве разработчика на Python и рассказать о некоторых идеях и советах, которые я усвоил за это время. Начиная с моих первых проектов и заканчивая моей текущей деятельностью, я поделюсь накопленным опытом и попробую осветить проблемы, с которыми я столкнулся на своем пути. Кого-то данная статься вдохновит начать свой собственный путь в разработке, а кому-то будет интересно прочитать историю успешного кейса входа и закрепления в ИТ.
ui, data science, bots
Маленькая компания на большом Хабре: как выжить среди акул?
Компании на Хабре не любят. Точнее, так: достойная публикация хороша как в корпоративном блоге, так и в частном, а вот так себе статья в блоге компании будет низвержена с особым пристрастием. Это вполне нормальная реакция аудитории на рекламный (хоть и нативный) контент: если делаешь, делай хорошо, мы сюда пришли не рекламные буклеты читать. А с другой стороны, это ещё и возможность прислушаться к отзывам читателей и стать лучше, серьёзнее, актуальнее и глубже. И если вы думаете, что на картинке к статье акула — это большие компании на Хабре, а рыбки — малые, вы ошибаетесь. Рыбки — это все компании, а акула — ироничная, умная и осторожная аудитория Хабра, с которой нужно ладить. Без обмана, навязчивости и непрофессионализма. Трудно, но надо.
Открытый курс машинного обучения. Тема 4. Линейные модели классификации и регрессии
Всем привет!
Сегодня мы детально обсудим очень важный класс моделей машинного обучения – линейных. Ключевое отличие нашей подачи материала от аналогичной в курсах эконометрики и статистики – это акцент на практическом применении линейных моделей в реальных задачах (хотя и математики тоже будет немало).
Пример такой задачи – это соревнование Kaggle Inclass по идентификации пользователя в Интернете по его последовательности переходов по сайтам.
UPD 01.2022: С февраля 2022 г. ML-курс ODS на русском возрождается под руководством Петра Ермакова couatl. Для русскоязычной аудитории это предпочтительный вариант (c этими статьями на Хабре – в подкрепление), англоговорящим рекомендуется mlcourse.ai в режиме самостоятельного прохождения.
Все материалы доступны на GitHub.
А вот видеозапись лекции по мотивам этой статьи в рамках второго запуска открытого курса (сентябрь-ноябрь 2017). В ней, в частности, рассмотрены два бенчмарка соревнования, полученные с помощью логистической регрессии.
Способы представления словарей для автоматической обработки текстов
В общем виде словарь — множество записей вида {строка, данные ассоциированные с этой строкой}.
Например, для морфологического анализа словарь состоит из троек {словоформа, нормальная форма, морфологические характеристики}. При анализе слова «мыла» из предложения «мама мыла раму» надо уметь получать следующие варианты анализа:
Нормальная форма | Характеристики |
---|---|
МЫЛО | S (существительное), РОД (родительный падеж), ЕД (единственное число), СРЕД (средний род), НЕОД (неодушевленность) |
МЫЛО | S (существительное), ИМ (именительный падеж), МН (множественное число), СРЕД (средний род), НЕОД (неодушевленность) |
МЫЛО | S (существительное), ВИН (винительный падеж), МН (множественное число), СРЕД (средний род), НЕОД (неодушевленность) |
МЫТЬ | V (глагол), ПРОШ (прошедшее время), ЕД (единственное число), ИЗЪЯВ (изъявительное наклонение), ЖЕН (женский род), НЕСОВ (несовершенный вид) |
Информация
- В рейтинге
- Не участвует
- Откуда
- Иркутск, Иркутская обл., Россия
- Дата рождения
- Зарегистрирован
- Активность