catamoron 23 апр 2019 в 12:49

С бородой, в тёмных очках и в профиль: трудные ситуации для компьютерного зрения

11 мин

11K

Блог компании VKОблачные вычисления*Big Data*Машинное обучение*Облачные сервисы*

+46

Комментарии 15

Tsvetik 23 апр 2019 в 14:29

А вот с таким макияжем нейросеть справится?

catamoron 23 апр 2019 в 15:15

А вот и да)

QDeathNick 23 апр 2019 в 22:44

И кто же в системе person0?

alekssamos 24 апр 2019 в 02:35

Сделайте, пожалуйста, приложение для незрячих, этакий русский аналог английского Microsoft Seeing A I (2), чтобы оно могло описывать изображения (что на них находится и происходит) и скан документов с высокой точностью, это будет очень здорово. А если сделаете распознавание и описание видео — вообще будет уникально!
Поддержите идею, если согласны со мной. Это сделает жизнь слепых проще, а мир — ярче!

Naton_Krush 24 апр 2019 в 12:32

Было бы очень круто, если бы к каждому примеру добавили — сколько изображений того же человека «скормили» сети перед этим. Плюс немного подозрительно, что вы не написали ничего об ошибках и неправильных срабатываниях, закрадывается немного страх, что показаны только удачи и положительные результаты, в то время как об обратном умолчали:) Иногда такое бывает непреднамеренно.

А вообще интересно было бы попробовать, надо на досуге запилить pet-project какой-нибудь:D

catamoron 24 апр 2019 в 12:33

Системе достаточно одной фотографии человека, по которой она присваивает ему PersonID. Вторая фотка, содержащая его лицо — также вернет его PersonID, присвоенный первый раз.
Ошибки бывают конечно, там выше есть целый блок про тесты и достигнутые точности в тех или иных ситуациях.

igordoge 24 апр 2019 в 12:32

Доступ к API можно моментально получить при регистрации и подключении Vision.

Но для подключения Vision требуется привязать банковскую карту или сделать селфи с паспортом, об этом вы забыли сказать :)

catamoron 24 апр 2019 в 12:35

Это для регистрации в ЛК MCS в целом, а не для Vision как такового))
Первые 5000 транзакций в любом случае бесплатны, на первичное тестирование хватит более чем. А если напишите в личку аккаунт, на который подключились — накинем еще)

torgeek 24 апр 2019 в 13:28

А есть ли каки-то способы маскировки от узнавания?

catamoron 24 апр 2019 в 15:10

Закрыть лицо физически. Балаклава, шарф, маска, дикий грим)

OlegStrekalovsky 22 июл 2019 в 16:41

Каким образом вы проводите миграции в своей системе?
Например выходит новый алгоритм сравнения лиц и вам надо пересчитать вектора признаков по фотографиям детектов — всегда ли ваш детект совместим с модулем корреляции? Вы храните оригиналы фотографий в системе или только обрезанные лица?
Каким образом после миграции вы пересчитываете кастомные пороги на инсталляциях?

EdT 22 июл 2019 в 16:50

Привет,
Миграция. Можно сделать совместимым вектора разных моделей, если примешивать вовремя обучения embedding из предыдущей версии модели использовать во время обучения новой (Harmonic regularization). Но мы так не делаем, т.к. качество, разумеется, страдает у новой модели.
Мы версионируем свои модели, и при выпуске новой модели (это редкое событие на самом деле) делаем влоб: репарс всего. Логика репарса на стороне клиента.
Пороги. Там, где мы сами рекомендовали конкретные значения, то выдаем новыми. Мы их подбираем на основе распределения на выборках, поэтому просто запускаем скрипт подбора еще раз.

OlegStrekalovsky 22 июл 2019 в 18:22

А что подразумевается под репарсом? Пересоздание по загруженным пользователями файлам или использование уже готовых детектов по загруженным пользователями файлам?

EdT 22 июл 2019 в 18:37

Можно и так, и так. Смотря как проект хранит у себя фотки. В Облаке@Mail.ru по файлам, т.к. детект и рикогнишен спарены в backend'е.

OlegStrekalovsky 22 июл 2019 в 19:05

А если заказчик будет использовать ваше API для облака? Он должен будет сам хранить у себя оригиналы и самостоятельно миграцию проводить прогоняя все свои оригинальные фотографии повторно?
И что такое «скрипт подбора»?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий