Pull to refresh

Comments 3

Я не понял, откуда берутся детекторы признаков.
Первый слой еще понятен, это простые геометрические примитивы, их ограниченное число (96?) и их можно создать искусственно.
Второй слой — комбинации всех 96 первичных признаков в матрице 11х11=121. Итого 96 в 121 степени уникальных возможных сочетаний?
Видимо, все таки, эти детекторы должны как-то генерироваться в процессе обучения?

И еще. Похоже, такая сеть учится распознавать изображения определенного размера, не вижу механизма масштабирования. Собачка в углу кадра и собака крупно?
Видимо, все таки, эти детекторы должны как-то генерироваться в процессе обучения?

Так и есть. Никто не прописывает веса вручную, все веса вычисляются на основе примеров алгоритмами, подобными градиентному спуску.


Похоже, такая сеть учится распознавать изображения определенного размера, не вижу механизма масштабирования.

Некоторые сети — да. Но распознавание разных масштабов можно добавить предобработкой или чем-то вроде inception-слоёв.

Картинка кажется относительно нормальной, когда вы смотрите на неё в перевёрнутом виде, поскольку человеческая зрительная система привыкла видеть глаза и рты в таком положении

Признаться жутко мне стало от этого фото в первую долю секунды в любом виде)

Sign up to leave a comment.

Articles