Как стать автором
Обновить

С бородой, в тёмных очках и в профиль: трудные ситуации для компьютерного зрения

Время на прочтение11 мин
Количество просмотров11K
Всего голосов 50: ↑48 и ↓2+46
Комментарии15

Комментарии 15

А вот и да)

image
Сделайте, пожалуйста, приложение для незрячих, этакий русский аналог английского Microsoft Seeing A I (2), чтобы оно могло описывать изображения (что на них находится и происходит) и скан документов с высокой точностью, это будет очень здорово. А если сделаете распознавание и описание видео — вообще будет уникально!
Поддержите идею, если согласны со мной. Это сделает жизнь слепых проще, а мир — ярче!
Было бы очень круто, если бы к каждому примеру добавили — сколько изображений того же человека «скормили» сети перед этим. Плюс немного подозрительно, что вы не написали ничего об ошибках и неправильных срабатываниях, закрадывается немного страх, что показаны только удачи и положительные результаты, в то время как об обратном умолчали:) Иногда такое бывает непреднамеренно.

А вообще интересно было бы попробовать, надо на досуге запилить pet-project какой-нибудь:D
Системе достаточно одной фотографии человека, по которой она присваивает ему PersonID. Вторая фотка, содержащая его лицо — также вернет его PersonID, присвоенный первый раз.
Ошибки бывают конечно, там выше есть целый блок про тесты и достигнутые точности в тех или иных ситуациях.
Доступ к API можно моментально получить при регистрации и подключении Vision.


Но для подключения Vision требуется привязать банковскую карту или сделать селфи с паспортом, об этом вы забыли сказать :)
Это для регистрации в ЛК MCS в целом, а не для Vision как такового))
Первые 5000 транзакций в любом случае бесплатны, на первичное тестирование хватит более чем. А если напишите в личку аккаунт, на который подключились — накинем еще)
А есть ли каки-то способы маскировки от узнавания?
Закрыть лицо физически. Балаклава, шарф, маска, дикий грим)
Каким образом вы проводите миграции в своей системе?
Например выходит новый алгоритм сравнения лиц и вам надо пересчитать вектора признаков по фотографиям детектов — всегда ли ваш детект совместим с модулем корреляции? Вы храните оригиналы фотографий в системе или только обрезанные лица?
Каким образом после миграции вы пересчитываете кастомные пороги на инсталляциях?
Привет,
Миграция. Можно сделать совместимым вектора разных моделей, если примешивать вовремя обучения embedding из предыдущей версии модели использовать во время обучения новой (Harmonic regularization). Но мы так не делаем, т.к. качество, разумеется, страдает у новой модели.
Мы версионируем свои модели, и при выпуске новой модели (это редкое событие на самом деле) делаем влоб: репарс всего. Логика репарса на стороне клиента.
Пороги. Там, где мы сами рекомендовали конкретные значения, то выдаем новыми. Мы их подбираем на основе распределения на выборках, поэтому просто запускаем скрипт подбора еще раз.

А что подразумевается под репарсом? Пересоздание по загруженным пользователями файлам или использование уже готовых детектов по загруженным пользователями файлам?

Можно и так, и так. Смотря как проект хранит у себя фотки. В Облаке@Mail.ru по файлам, т.к. детект и рикогнишен спарены в backend'е.
А если заказчик будет использовать ваше API для облака? Он должен будет сам хранить у себя оригиналы и самостоятельно миграцию проводить прогоняя все свои оригинальные фотографии повторно?
И что такое «скрипт подбора»?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий