Открыть список
Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

17 марта состоится ML meetup Online

Блог компании Центр Финансовых Технологий (ЦФТ)Машинное обучение


В среду, 17 марта, состоится ML meetup Online — встреча для исследователей, инженеров и разработчиков.

Начало в 15:00 (время МСК).

Для участия необходимо зарегистрироваться: team.cft.ru/events/191
В ответ на отправленную заявку вы получите ссылку на трансляцию и все явки-пароли.
Читать дальше →
Всего голосов 3: ↑3 и ↓0 +3
Просмотры477
Комментарии 0

Kaggle-подходы для CV в проде: внедрить нельзя выпилить

Блог компании Open Data ScienceОбработка изображенийМашинное обучениеУправление проектамиИскусственный интеллект
Среди дата сайнтистов ведется немало холиваров, и один из них касается соревновательного машинного обучения. Действительно ли успехи на Kaggle показывают способности специалиста решать типичные рабочие задачи? Арсений arseny_info (R&D Team Lead @ WANNABY, Kaggle Master, далее в тексте A.) и Артур n01z3 (Head of Computer Vision @ X5 Retail Group, Kaggle Grandmaster, далее в тексте N.) отмасштабировали холивар на новый уровень: вместо очередного обсуждения в чате взяли микрофоны и устроили публичное обсуждение на митапе, по мотивам которого и родилась эта статья.
Читать дальше →
Всего голосов 54: ↑53 и ↓1 +52
Просмотры10.2K
Комментарии 4

Нейронные сети предпочитают текстуры и как с этим бороться

Блог компании Open Data ScienceОбработка изображенийМашинное обучениеИскусственный интеллектМозг


В последнее время вышло несколько статей с критикой ImageNet, пожалуй самого известного набора изображений, использующегося для обучения нейронных сетей.


В первой статье Approximating CNNs with bag-of-local features models works surprisingly well on ImageNet авторы берут модель, похожую на bag-of-words, и в качестве "слов" используют фрагменты из изображения. Эти фрагменты могут быть вплоть до 9х9 пикселей. И при этом, на такой модели, где полностью отсутствует какая-либо информация о пространственном расположении этих фрагментов, авторы получают точность от 70 до 86% (для примера, точность обычной ResNet-50 составляет ~93%).


Во второй статье ImageNet-trained CNNs are biased towards texture авторы приходят к выводу, что виной всему сам набор данных ImageNet и то, как изображения воспринимают люди и нейронные сети, и предлагают использовать новый датасет – Stylized-ImageNet.


Более подробно о том, что на картинках видят люди, а что нейронные сети

Читать дальше →
Всего голосов 100: ↑100 и ↓0 +100
Просмотры27.3K
Комментарии 68

TensorRT 6.x.x.x — высокопроизводительный инференс для моделей глубокого обучения (Object Detection и Segmentation)

Блог компании Open Data SciencePythonОбработка изображенийМашинное обучениеDevOps
Tutorial
image
Больно только в первый раз!

Всем привет! Дорогие друзья, в этой статье я хочу поделиться своим опытом использования TensorRT, RetinaNet на базе репозитория github.com/aidonchuk/retinanet-examples (это форк официальной репы от nvidia, который позволит начать использовать в продакшен оптимизированные модели в кратчайшие сроки). Пролистывая сообщения в каналах сообщества ods.ai, я сталкиваюсь с вопросами по использованию TensorRT, и в основном вопросы повторяются, поэтому я решил написать как можно более полное руководство по использованию быстрого инференса на основе TensorRT, RetinaNet, Unet и docker.
Читать дальше →
Всего голосов 57: ↑56 и ↓1 +55
Просмотры11K
Комментарии 10

SVM. Объяснение с нуля и реализация на python. Подробный разбор метода опорных векторов

Блог компании Open Data SciencePythonData MiningАлгоритмыМашинное обучение

Привет всем, кто выбрал путь ML-самурая!


Введение:


В данной статье рассмотрим метод опорных векторов (англ. SVM, Support Vector Machine) для задачи классификации. Будет представлена основная идея алгоритма, вывод настройки его весов и разобрана простая реализация своими руками. На примере датасета $Iris$ будет продемонстрирована работа написанного алгоритма с линейно разделимыми/неразделимыми данными в пространстве $R^2$ и визуализация обучения/прогноза. Дополнительно будут озвучены плюсы и минусы алгоритма, его модификации.


image
Рисунок 1. Фото цветка ириса из открытых источников

Читать дальше →
Всего голосов 52: ↑51 и ↓1 +50
Просмотры41K
Комментарии 5

Открытый курс «Deep Learning in NLP» от создателей DeepPavlov на базе курса cs224n

Блог компании Open Data SciencePythonМашинное обучениеИскусственный интеллектNatural Language Processing

Всем привет!
Если возник вопрос по курсу — посмотрите раздел Q&A ниже.


Вступление


Меня зовут Алексей Клоков, я хочу рассказать о запуске классного курса по обработке естественного языка (Natural Language Processing), который очередной раз запускают физтехи из проекта DeepPavlov – открытой библиотеки для разговорного искусственного интеллекта, которую разрабатывают в лаборатории нейронных систем и глубокого обучения МФТИ. Благодарю их и Moryshka за разрешение осветить эту тему на Хабре в нашем ods-блоге. Итак, поехали!

Читать дальше →
Всего голосов 63: ↑61 и ↓2 +59
Просмотры18.9K
Комментарии 6

Data science vs COVID-19_Часть 1

Блог компании Центр Финансовых Технологий (ЦФТ)Машинное обучение


Уже очевидно, что в 2021-м COVID-19 все еще будет оставаться, как говорится, на повестке дня. А значит, закономерно возникают вопросы: есть ли у нас инструменты для прогнозирования роста и снижения заболеваемости, можем ли мы предсказать развитие событий через неделю, месяц или даже год? Давайте разбираться.

Дано: колоссальные возможности data science, три талантливых специалиста.
Найти: способы предсказать распространение COVID-19 на неделю вперёд.

Решение:

На самом деле решений будет три, следите за публикациями. А сегодня мы обсудим одно из них, с Владиславом Крамаренко. Он нашёл модель, способную построить самый точный прогноз* для всего мира на неделю вперёд.
Читать дальше →
Всего голосов 13: ↑10 и ↓3 +7
Просмотры2.1K
Комментарии 6

Data science vs COVID-19_Часть 2

Блог компании Центр Финансовых Технологий (ЦФТ)Машинное обучение


Всем привет. Мы продолжаем серию статей о том, какие ответы может дать data science о прогнозировании COVID-19. Первая статья здесь. Сегодня поговорим о втором классе моделей по предсказанию динамики распространения COVID-19. Они основаны на предположениях о росте заболеваемости и описывают ситуацию в средне- и долгосрочной перспективе. Беседуем с Николаем Кобало, старшим инженером данных ЦФТ.

Напомним, какие у нас условия:
Дано:
Колоссальные возможности data science, три талантливых специалиста.
Найти: Способы предсказать распространение COVID-19 на неделю вперёд.

Переходим ко второму решению.
Читать дальше →
Всего голосов 7: ↑3 и ↓4 -1
Просмотры1.2K
Комментарии 5

Data Science vs COVID-19_Часть 3

Блог компании Центр Финансовых Технологий (ЦФТ)Машинное обучение


Всем привет. Выходим на финишную прямую: сегодня финальная статья о том, какие ответы может дать data science о прогнозировании COVID-19.

Первая статья здесь. Вторая здесь.

Сегодня мы общаемся с Александром Желубенковым о его решениях по предсказанию распространения COVID-19.

Условия у нас следующие:
Дано: Колоссальные возможности data science, три талантливых специалиста.
Найти: Способы предсказать распространение COVID-19 на неделю вперёд.

И вот решение от Александра Желубенкова
Читать дальше →
Всего голосов 10: ↑8 и ↓2 +6
Просмотры1.3K
Комментарии 4