Как стать автором
Обновить

Комментарии 7

Интересно, нельзя ли обобщить подход с пирамидами? Это может быть путём к инвариантности по масштабированию, например для единообразного узнавания котиков с любого расстояния.
Хорошее замечание, подход с пирамидами действительно довольно общий и успешно применяется в том числе в object detection, например — towardsdatascience.com/review-fpn-feature-pyramid-network-object-detection-262fc7482610
Коты божественны
Еще более распространенные приложения — визуальная одометрия, компрессия видео
Это не так. В сжатии используется не OF, а старый добрый блочный МЕ. А OF, да, дышит в затылок. Но пока как-то не сложилось. И вычислительная сложность для многих практических применений опять же не очень. И обработка оклюженов. Но дышит )

А так, да, вехи правильные в обзоре )
Вот такое без хромакея так и не сделать пока на сегодняшний день?:

image

Без хромакея крайне сложно сделать качественный маттинг (точно вырезать объект с альфа-каналом).

Сложно, но, вообще говоря, возможно. Зависит от условий задачи. Если real-time на телефоне, то для пёстрого фона да ещё при плохих условиях съёмки большой точности достичь пока не выйдет.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий