Как стать автором
Обновить
44
Карма
0
Рейтинг
Илья Захаркин @izakharkin

Computer Vision & Graphics RnD

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

Спасибо за ценные замечания! Я тогда не обратил на это внимания.

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

Про какую статью идет речь, можно ссылку на статью и скриншот с CenterNet-DLA со скоростью FPS и точностью AP?


Object as Points, Table 2. Скриншот:image

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

На тот момент меня впечатлила прежде всего возможность решать с помощью одной модели (CenterNet) сразу трех задач: детекция в 2D, в 3D и оценка позы, плюс они в статье репортят SOTA-скорость у CenterNet-DLA (в таблице 2) при AP выше, чем у YOLOv3, что в моих глазах выглядело как SOTA в speed/accuracy trade-off (что, на мой взгляд, для детекторов важнее, чем только speed или только AP).

Сам я измерение скорости и качества всех приведенных в этом посте моделей не проводил, потому и написал «Кажется», и "(но это не точно)", однако хотел все же обратить внимание на CenterNet.

p.s. Поздравляю с YOLOv4! Выглядит очень многообещающе, однозначно добавлю в этот пост Вашу статью.

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

Здравствуйте!
Рад, что статья оказалась полезной)
Кажется, что тот же github.com/argman/EAST уже обучен под детектирование в том числе и цифр. Если Вам нужно только цифры, и чтобы текст не детектировался, то наверное проще всего просто на этапе пост-обработки детекций выбрасывать боксы только с текстом, или же да, обучить архитектуру с нуля только под цифры. Код из вышеприведенного репозитория позволяет это сделать.

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

Да, это правда, спасибо :)
Картинку взял на самом деле для демонстрации того, как выглядят боксы (слева). Про сегментацию будет отдельный разговор в третьей части.

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 1)

Спасибо! Рад, что статья оказалась полезной
Постараюсь сделать вторую часть достаточно подробной

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 1)

Спасибо!
Если речь идёт о видеокартах, то мы используем Nvidia GeForce GTX 1080 Ti. Если интересует более подробно, могу поделиться в личных сообщениях

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 1)

В статье использованы изображения из открытых источников, все ссылки на них указаны здесь: bit.ly/2YIVokO

Generative adversarial networks

Визуализация особенно доставила)
Спасибо за статью!

Скрытые Марковские модели в распознавании речи

В самой первой формуле опечатка — произведение не по t, а по i.

История 3-го места на ML Boot Camp III

Большое спасибо за статью.
Особенно понравилась идея с ансамблем (получение «доверительных вероятностей»), успехов Вам в будущих соревнованиях!

Как различать британскую и американскую литературу с помощью машинного обучения

Очень интересное исследование!
Спасибо за статью

Практика метапрограммирования на C++: бинарное дерево поиска на этапе компиляции

Большое спасибо за статью!
Очень грамотно и интересно написано, буду ждать продолжения

Тематическое моделирование репозиториев на GitHub

Крутая статья и интересное исследование, спасибо :)

«Во все тяжкие» или суровые реальности инди разработки Dark Forester

Топ стори, буду ждать продолжения!

Диаграмма Вороного и её применения

Согласен, в 3D всё будет уже не так интуитивно понятно и просто. В будущем, возможно, я напишу статью и на эту тему (однако сначала реализация алгоритма Форчуна).

Диаграмма Вороного и её применения

Вы правы, у жирафов рисунок не всегда в точности является диаграммой, тем более, что у всех жирафов он разный.
Однако в тексте отмечено, что он фактически является диаграммой, поскольку сходство очевидно, и наличие нескольких линий, делающих многоугольники рисунка невыпуклыми, этого факта не отменяют.

Информация

В рейтинге
5,841-й
Откуда
Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность