Comments 9
Спасибо за статью. Отличный обзорный материал!
Хотелось бы отметить одну вещь насчет терминологии:
Но вы же даже дальше сами называете некоторые из них на русском.
Классификация, семантическая сегментация, детекция (локализация) объектов, сегментация объектов.
Хотелось бы отметить одну вещь насчет терминологии:
не приходилось встречать переводы их названий даже в русскоязычных источниках, поэтому на английском, чтобы не создавать путаницу
Но вы же даже дальше сами называете некоторые из них на русском.
Классификация, семантическая сегментация, детекция (локализация) объектов, сегментация объектов.
+2
Называю их по русски дальше потому что мне показалось, что мои неформальные переводы будет легко связать по смыслу с той или иной задачей. Но если изначально дать собственные обозначения, кто-то потом может не связать их с общераспространёнными терминами в других местах.
Вы могли бы посоветовать что-то лучше? Черезмерное перемешивание русского текста с английским тоже не все любят, а его и так зачастую избежать не получается.
Вы могли бы посоветовать что-то лучше? Черезмерное перемешивание русского текста с английским тоже не все любят, а его и так зачастую избежать не получается.
+2
Лично меня не напрягает перемешивание русского текста с английским, но:
Можно не давать собственные обозначения. Я же выше привёл общепринятые, в общем-то (кроме разве что instance segmentation, где перевод не особо устоявшийся).
если изначально дать собственные обозначения, кто-то потом может не связать их с общераспространёнными терминами в других местах
Можно не давать собственные обозначения. Я же выше привёл общепринятые, в общем-то (кроме разве что instance segmentation, где перевод не особо устоявшийся).
0
Спасибо.
nearest neighbor > ближайший сосед. это так и называется, мы это используем, но не в ml.
nearest neighbor > ближайший сосед. это так и называется, мы это используем, но не в ml.
+2
Не очень ясен момент с производительностью такой сети. Это обработка в реальном времени видео-потока? Или выделение из статичных фото объектов?
0
Mask R-CNN в риалтайме на видео можно использовать разве что с очень уж неглубокой свёрточной частью типа MobileNetV2, и то FPS будет очень низким.
0
В pdf про Mask R-CNN пишут про 195ms — 400ms на изображение на Nvidia Tesla M40 GPU. Для видео это, наверно, многовато, но упоминается, что дальнейшая оптимизация возможна. Судя по тому, что эксперименты так же проводились на Cityscapes-датасете, об и пользовании модели в real-time задачах в будущем авторы задумывались.
0
Sign up to leave a comment.
Articles
Change theme settings
Mask R-CNN: архитектура современной нейронной сети для сегментации объектов на изображениях