ZlodeiBaal Jul 30 2018 at 01:02

Правда и ложь систем распознавания лиц

11 min

61K

Recognitor corporate blogData Mining*Algorithms*Image processing*Machine learning*

+83

Comments 79

tersuren Jul 30 2018 at 03:55

Я дико извиняюсь, но мне кажется что в статье упущен очень важный фрагмент работы реальных систем: возможность массового сравнения многих фотографий. Статистика приведена по одиночному упражнению сравнения. Но в метро телепортации нет и одна и также фигура проходит много контрольных точек и попадает на много камер. Я сам не знаком с конкретным применением всего этого, но чисто интуитивно мне кажется, что во-первых отслеживание движения очень хорошо дополняет распознавание лиц тут, а во-вторых элементарная арифметика. Если человек заходит в вестибюль метро (два кадра к примеру), потом спускается по эскалатору (ещё три кадра) и проходит к платформе (пусть ещё кадр), то мы вполне можем «ловить» его на совпадение с, к примеру, паспортной фотографией разыскиваемого статистически. Не? То есть я понимаю что близнецы вызовут именно таки 6 ложно-положительных срабатываний — ибо с ними проблема не в несовершенстве алгоритма распознавания, а в реальной похожести. Но неужели с ложноположительными срабатываниями вызванными несовершенством алгоритма нельзя бороться простой мыслью: «если на станции есть Джон До, то он не может быть опознан только одной камерой»?
И насчёт отслеживания движения: ну возьмём тот же эскалатор как самый яркий пример. Последовательность появления на нем довольно легко предсказывается, отслеживать можно просто по комбинации цветов одежды как-то. Скорость потока пешеходов в переходе отслеживать по характерным лицам — сто пудово там будет пик средних значений показывающий скорость потока.
Неужели это все прямо совсем не применяется?

ZlodeiBaal Jul 30 2018 at 04:04

В идеале, на полупустой улице это теоретически возможно. Но в метро/любом прочем транспорте где толпа и всё загружено — это нереально. Алгоритмы сильно не идеальные. Тут сразу две задачи, одна это «Tracking», вторая — «Reindentification». Можете погуглить. Первая решается хоть как-то, но при толпе всё плохо. Вторая решается откровенно плохо. Либо надо просто сплошное поле камер, вертикально ориентированных, перекрывающееся на потолке вешать, где трекать по головам. Но это нереально по стоимости. Да и не понятны цели. Плюс такую систему никто не будет давать гарантий что она работает.
Сильно проще поставить шлюзы с хорошим освещением и хорошими камерами на вход в метро. Точность значительно выше будет, чем от всяких таких ухищрений. Но даже так — не достаточно, я это тоже писал. Ложняков будет много, даже если и пропуски сильно упадут.

А по головам считать… Мосгостранс вроде уже 3-4 год ищет хоть у кого-то решение, чтобы поставить в автобусы и считать людей по головам с достаточной точностью. Так никто же не предлагает...;)

tersuren Jul 30 2018 at 05:15

Видимо я плохо выразился. Необязательно именно тракать людей идеально то. Смотрите, цифры такие: у нас на станции одновременно находится не более 3000 человек. Больше не влезет физически. В среднем человек проводит на станции скажем 5 минут. Нам не надо точно тракать положение человека в толпе то и его траекторию. Нам достаточно знать что с момента обнаружения подозреваемого в вестибюле входа у нас есть окно в скажем 10 минут и перед ним ещё 5 камер. Если сработало распознание на эскалаторе — 8 и 4 камеры, а шестая осталась сзади и не распознала. И так далее. И дальше мы просто тупо смотрим: а сколько ещё камер опознают его? Сколько пропустит?
То есть если можно ещё и тракать с какой-то точностью, то оно лучше, конечно. Но и без тракинга при 3000 лиц в кадрах и базе подозреваемых скажем в 300,000 — имхо статистика таки поможет. Типа если у вас на 4х из 6 камер опознался разыскиваемый — можно ментам на платформе давать команду брать клиента под руки. Если на 1ой, то можно не суетить.
И там ещё как-то хитрить трезво понимая что Джон До то он один. И если у нас есть срабатывание на него в вестибюле, то потом в потоке можно искать не только сравнивая с паспортной фотографией Джона, но и стой, которая опозналась. Учитывая что похмелье на лице потенциального Джона за две минут между верхом и низом эскалатора вряд ли прошло — может оказаться проще выцепить его и сравнить с эталонным изображением настоящего Джона после.

Alexeyslav Jul 30 2018 at 10:55

Камеры сами по себе не распознают. Распознаёт алгоритм, который работает на серверах по изображениям с камер. Ошибка не будет зависеть от камеры а только от ракурса и условий съемки.

tersuren Jul 30 2018 at 10:57

Это понятно. Ракурс то и условия будут каждый раз разными, очевидно.

ZlodeiBaal Jul 30 2018 at 11:50

Смотрите. Я в статье писал про математику, про FAR и FRR. И проще оценивать через них.
FARы таким подходом мы не сильно сократим если люди похожи, похожи причёски, и.т.д. а большая часть FARов именно на таких данных. FRR — мы таким подходом можем немного сократить, там с 40% в лучшем случае до 20-30.
Но даже если мы выиграем порядок — ситуация сильно не поменяется. Как вы видите по остальным цифрам — для полного решении задачи там ещё много порядоков точности надо. А для минимальной помощи сотрудникам — да, можно уже сейчас делать, я это тоже показывал. Можно чуть-чуть уменьшить количество ошибок.
Если же камеры с хорошим освещением поставить на входе — то можно выиграть сильно дешевле, без непонятной математики два порядка. Всё равно для полноценной системы не хватит. Но уже лучше.

MaksV Jul 30 2018 at 16:52

Системы нахождения похожих лиц не смотрят на прически. Было бы странно, чтобы компьютер обращал на это внимание. :) Даже овал лица некоторые алгоритмы не учитывают, так как под разными ракурсами одно и то же лицо будет иметь совершенно разные профили. Как-то так. matthewearl.github.io/assets/switching-eds/landmarks.jpg

-1

ZlodeiBaal Jul 30 2018 at 16:54

В начале приведено три статьи о том как сейчас работают системы распознавания. Я бы рекомендовал сперва с ними ознакомится…

MaksV Jul 30 2018 at 18:32

Видимо я Ваш предыдущий коментарий неправильно понял. Если там речь шла только о вариантах как трэчить и делать многократное сопоставление, то вопросов нет. Если же пытаться использовать прически при сопоставлении лиц, то эти попытки приведут к обратному результату (увеличению ошибок). В широко известном заменителе лиц FaceSwap много усилий сделано на то чтобы отделить лицо от посторонних предметов перекрывающих лицо, таких как прическа, руки, самый тяжелый алгоритм GAN128 направлен именно на это разделение.

ZlodeiBaal Jul 30 2018 at 18:38

Ещё раз. Советую посмотреть как сейчас делается обучение embeding'а через triple loss, center loss и.т.д… Что там подаётся на вход.
Да, у итогового решения есть зависимость от растительности на лице, от линии причёски, от цвета волос, и.т.д. и это нормально, так как при обучении достигается максимальная разделяющая статистика.
Приведённая вами картинка dlib-овской разметки не имеет ничего общего с тем как сейчас делается распознавание лиц…

UFO just landed and posted this here

ZlodeiBaal Jul 30 2018 at 11:58

Сделайте;)
Опять же. Вы говорите про очень-очень сложную систему. Которая съест огромное число человекочасов, стоимость внедрения которой будет астрономической. Но зачем, если можно делать проще, лучше, надежнее, поставив её на входе?
При этом эти стоимости — никак не будут окупаться. Система будет стоить миллиарды. Общественный резонанс — ужасный. Что от самой идеи, что от стоимости. Финансовая прибыль — нулевая. Все задачи можно решить проще и дешевле.
А то что такая система будет хоть как-то работать, у меня есть очень большие сомнения. Выше я писал почему (все алгоритмы всех уровней сырые, дают плохие точности). Камеры ужасные.

То что сейчас есть — уже позволяет работать в ручном режиме, если надо кого-то найти поймать. Это как сделать и разработать робота который будет вам наливать в бокал коктейль. Сделать можно, из любви к искусству. Но стоимость создания и эксплуатации в жизни не окупиться.

UFO just landed and posted this here

ZlodeiBaal Jul 30 2018 at 13:05

Не все задачи решены, ещё раз. Есть математические и физические ограничения сегодняшнего развития: их никто не отменял.
Я знаю, что сейчас алгоритмов трекинга/реиндентификации не хватает для этой задачи. Можно ли их допилить? Возможно да, возможно нет. Они явно не допиливаются госконторой в рамках госзаказа -> не хватит компетенций и энтузиазма.
Да, если вбухать туда денег как в олимпиаду — наверное можно через десять. А может получиться как с тем ишаком говорящим.

В любом случае, любые задачи которые на сегодняшний день существуют — можно решить проще, дешевле и быстрее. Хотя да, местами нужны будут административные вмешательства.

pashasak Jul 30 2018 at 11:02

А как работает «магазин без касс и очередей» Amazon Go, в котором, не только людей «трекают», но то, что они положили в корзину?

Loki3000 Jul 30 2018 at 11:40

Они там при входе идентифицируют себя, насколько я помню. Так что надо смотреть по базе из нескольких десятков человек.

TimsTims Jul 30 2018 at 22:06

из нескольких десятков человек

Из одного человека, ведь он провёл картой)

unclejocker Jul 30 2018 at 13:07

А там как раз сплошное поле камер (около 2000 на не самый большой магазин), и им не надо узнавать конкретного человека, а только трекать человекоподобную фигуру от входа до выхода — это просто другая задача.

Welran Jul 30 2018 at 13:26

Весь магазин утыкан камерами по самое нехочу. Никто в метро столько камер ставить не будет.

dimka11 Jul 30 2018 at 20:23

Интересно зачем они использовали камеры, когда каждому человеку можно дать метку и идентифицировать его по ней.

Ghool Aug 2 2018 at 23:27

Затем, что бы покупатели метки не «забывали» в магазинах или чужих карманах

Ndochp Jul 30 2018 at 22:29

Мск, новая станция «Ховрино» я себя реально как в каком- нибудь ДеусЭксе чуствовал, или ещё каком стелс шутере. И ловил себя на размышлениях, а с какой камеры надо начать их отстреливать, чтобы ни разу не попасть в кадр. Но кажется это в том камерном поле невозможно.

InterceptorTSK Jul 30 2018 at 20:51

Алгоритмы не то что неидеальные, они как будто «вражинами» писаны.
Объяснюсь.
Делали приложение для инстаграмчика. Проще некуда, продажа книжек, все банально.
Дизайнер сделала изумительно хороший «шаблон» дизайна любой «книжки». На это написалось простенькое ПО.
На пальцах: кладется закрытая книжка на светлосерую крышку от системного блока, фотается специальной приспособой, открывается книжка, фотается страницы 3-5 и т.д. Если прицепить тел с которого это фотается, запущенная служба стаскивает сама все фотки, банально сортирует по времени и по краям изображений книжки закрытой/открытой создает красивый коллаж. И автоматом зашвыривает на трубу или на эмулятор уже готовые файлы.

Фокус: все это залетело в бан, ибо инстаграм на вопросы зачем и почему вбан написал следующее: вы подписываете фотки как книги, инфа о книгах, авторы книг, а они «системой» определяются как иллюстрации.

Только конченый дебил тут не понимает сразу же, что искусственный интеллект подходит только для быдлы. Как только появляется что-то новое, чего абсолютно нет в премилом обученном быдлой ии — вы сразу улетите в бан, ну вот потому что ии считает, что вы его обманываете.

И так на каждом шагу. Что бы ни контролировалось искусственным интеллектом — нужно быть как все. Иначе фейл.

В гробу я видал этот ваш искусственный интеллект.

UFO just landed and posted this here

denis-19 Jul 30 2018 at 05:21

Распознать это еще полбеды, а аналитику снять с мимики и прочих радостей и эмоций на лице — вроде VisionLabs и этим тоже занимается еще, например.

mephistopheies Jul 30 2018 at 09:07

пост годный, афтор пеши исчо, но есть но: можно плес вставлять пустую строку между всеми абзацами, реально глаза болят читать при таком форматировании

пс: ссылаться на ализара это конечно тоже зашквар :trollface:

ZlodeiBaal Jul 30 2018 at 12:05

Спасибо!
Вроде на Ализара я ссылался только в местах где контекст «журналисты говорят». Там как-бы подразумевается, что всё написанное несусветная противоречивая чушь:)
Но, возможно, я сделал это чересчур серьёзно…

ValdikSS Jul 31 2018 at 15:11

можно плес вставлять пустую строку между всеми абзацами, реально глаза болят читать при таком форматировании

Автор, не делайте так, пожалуйста, а то глаза начинают болеть у меня.

ZlodeiBaal Jul 31 2018 at 15:14

Прилетело НЛО и навставляло… Я обычно стараюсь чтобы пустой строкой были разделены какие то глобальные темы, а абзацы шли энтерами. Но знаю что многим это не нравиться.

ValdikSS Jul 31 2018 at 15:17

Аналогично, и модераторам это очень не нравится. Я в свои статьи вставляю следующий скрытый текст:

<!-- 



Пожалуйста, не правьте форматирование. Я не могу читать статьи с пустой строкой на каждое предложение, у меня просто от такого форматирования разбегаются глаза. Если вы внесете правки, я верну все назад.



-->

Но они все равно часто правят, приходится сохранять исходник в виде файла и периодически возвращать обратно, но когда они это замечают, они блокируют мои статьи на редактирование. Как можно читать текст с отступами на каждое предложение — не знаю, у меня не получается, приходится использовать юзерскрипты, вырезающие переносы.

ZlodeiBaal Jul 31 2018 at 15:22

Не знал, что есть люди с моими проблемами! :)

ElegantBoomerang Aug 1 2018 at 02:00

А как вы форматируете обычно? Новый абзац без пустой строки начинаете с отступа?

ValdikSS Aug 1 2018 at 02:06

Я вставляю пустую строку только для логически нового абзаца, чтобы отделить не связанный между собой текст. Не вставляю дополнительный перенос после заголовка (там и так есть отступ), не вставляю перенос перед блоком кода или цитаты.
Посмотрите пример: habr.com/post/335436

UFO just landed and posted this here

Ivan_Gudoshnikov Jul 30 2018 at 11:59

«Для каждого человека настроить область гиперпространства где хранятся достоверные для него величины» — о, любопытное приложение математики. Простите, можно вопрос: область считается выпуклой?(выпуклой комбинацией доступных точек?) Если не выпуклой, как на картинке, то каким методом считают расстояние до множества?

ZlodeiBaal Jul 30 2018 at 12:01

Обычно используют алгоритмы кластеризации достаточно простые DBSCAN там, k-mean. В статье на которую я давал ссылку в начале это немного освещается.

odin_v_pole Jul 30 2018 at 12:21

FAR, FRR… А как же ситуация когда человек есть в базе, но мы его опознаем как другого человека из базы?

ZlodeiBaal Jul 30 2018 at 12:23

Это считается событием FAR обычно, исходя из наиболее распространённой методологии вычисления ошибок.

UFO just landed and posted this here

ASTAPP Jul 30 2018 at 15:08

Но ведь можно поступить по другому. Для каждого человека настроить область гиперпространства где хранятся достоверные для него величины

В NIST FRVT сравниваются между собой не «лица», а «персоны». т.е. дескриптор строится именно на наборе фотографий одного человека и вендор имеет возможность параметризовать в дескрипторе область распределения данного лица.

ZlodeiBaal Jul 30 2018 at 15:36

Вроде как тут вот «5.2 Test design» написано всё же, что «The number of images used to make 1 template is 1». Поправьте если не прав.
С дескриптором персоны методология должна усложниться ощутимо.

ta6aku Jul 30 2018 at 15:24

Статья очень интересная, весьма содержательная.
Единственная странность — нет ни единого упоминания известной фруктовой компании.

ZlodeiBaal Jul 30 2018 at 15:32

А зачем? Они решают другую задачу.

ta6aku Jul 30 2018 at 16:11

задача вроде та же — сравнение с образцом, только по железной части возможностей побольше
и интерес китайцев к распознаванию лиц, я уверен, во многом связан с появлением «разблокировки по лицу» в большинстве последних китайских смартфонов

ZlodeiBaal Jul 30 2018 at 16:19

Есть задача идентификации, есть задачи верификации. Это две разных задачи. Для них по разному выбираются пороги, по разному происходить оптимизация. Apple не надо иметь хороших алгоритмов, в том числе из-за их железа. Там и детектор лица на порядок проще, и поиск ключевых точек.
По сравнению с тем, что у Ntech и VisonLabs — у них детский сад.
У них есть своё решение по 2д + используется 3Д. Но оно очень нишевое под их задачу. По сравнению с конкурентами именно по 3д лицу — там всё слабо. Единственный их плюс, но плюс существенный — это то что их математика оптимизирована для распознавания пользователя смартфона. Её достаточно сложно обмануть. Гопники из из соседнего подъезда не откроют(хотя для любого профессионала сложности нет). При этом оно куда удобнее в эксплуатации того же Самсунга с радужкой. И всё. Всё остальное — весьма слабо и не имеет отношения к тему статьи.

UFO just landed and posted this here

kbaa Jul 31 2018 at 05:07

Общался с ребятами из Vocord несколько лет назад на одной из выставок MIPS, насколько я помню, у них система была ориентирована на всякие мероприятия, и состояла из 2 стоек с камерами, которые располагаются по краям прохода (вход на стадион, в зал и т.п.), в таких условиях и само лицо все время будет где то в заданной области, и ракурс хороший, обещали высокую вероятность правильного срабатывания. Ценник только кусачий был все равно, потенциальных заказчиков в нашем регионе вряд ли было бы больше десятка, поэтому сильно вопрос не изучал

ZlodeiBaal Jul 31 2018 at 10:47

Это старое 3д распознавание. Тут я писал про 2д. 3д — совсем про другое. Оно достаточно дорого и очень мало применений. Плюс оно работает только на проходных.

AlexShvili Jul 31 2018 at 11:12

Это вы говорите про систему 3D распознавания лиц. Мы ее делали в еще до дипленинговую эпоху, когда использовались старые алгоритмы очень нестабильные при изменении ракурса лица. Там для распознавания можно использовать и форму поверхности лица и фронтализированную текстуру. Сейчас с точки зрения точности эта система не дает практически ни какого выигрыша в сравнении с нашей 2D системой, она имеет смысл если вам нужно детектировать liveness на лету.

AlexShvili Jul 31 2018 at 10:46

Статья качественная. Спасибо за добрые слова о Vocord :).
Очень близко к тому, что мы пытаемся донести нашим заказчикам, но как только они узнают что ошибок оказывается две, да они еще и лежат на какой то кривой, то глаза их становятся печальны они начинают искать кого то кто им просто скажет что у них распознается 99% :) Касательно практического применения есть 2 замечания:
1. Если говорить про задачу типа «распознавания в метро» то «старый» wild не очень адекватен. В реальности при правильном подборе камер и правильной их установке снимки получаются лучше и соответственно результаты лучше.
2. Если говорить про задачу распознавания лиц в целом, то это не только алгоритм распознавания, но и способ получения изображения для распознавания. Если ориентироваться на результаты того же NIST FRVT, то там видно что прирост точности который получается за счет улучшения качества изображения намного выше чем разница в точности алгоритмов входящих в топ10. Говоря по простому камеры решают все :). Именно поэтому мы делаем не только свой алгоритм, но и свои камеры. Но их протестировать можно только в полевых испытаниях, а это намного сложней и затратней чем тестировать алгоритмы :(
Ну и ради высшей справедливости замечу, что если взять последние отчет NIST за 21.06.2018, то там видно что Vocord вернулся в топ4 :). В предыдущем алгоритме была ошибка поэтому результаты были такими грустными. Так что жив еще курилка!

KuzMax Jul 31 2018 at 16:44

Скажите, а видимый спектр остаётся и для машинного распознавания самым интересным? Расширение диапазона не добавляет ли к результату?

Alexeyslav Jul 31 2018 at 17:03

ИК и УФ камеры пока диковинка, очень дорогая диковинка. А системам распознавания и без этого есть куда стремиться — достичь хотябы способностей обычного человека.

AlexShvili Jul 31 2018 at 17:08

Камеры чувствительные в ближнем ИК это совсем не диковинка. Практически все сенсоры используемые в камерах и мобильных телефонах чувствительны в ближнем ИК, причем для цветных сенсоров это отдельная проблема т.к. чувствительность в ближнем ИК приводит к искажениям цветного изображения и приходится ставить дополнительные фильтры которые отрезают ближний ИК

AlexShvili Jul 31 2018 at 17:04

Расширение диапазона в сторону ближнего ИК в принципе интересно т.к. в этом случае можно использовать невидимую глазу ИК подсветку и таким образом решать проблему низкой освещенности при получении изображения. Во всех системах распознавания автомобильных номеров (в том числе и в нашей :)) это прекрасно работает, а вот с лицам все хуже.
В лицах расширение спектра добавит к результату в двух случаях: либо будет достаточна богатая обучающая выборка в расширенном спектральном диапазоне, либо научиться интерполировать картинки из видимого диапазона в «расширенный». Мы этим начинали заниматься, но ничего прорывного сходу не получилось поэтому отложили до лучших времен.

sarbash Aug 1 2018 at 09:18

Американцы после 11 сентября в это направление инвестировали огромные деньги и через пару лет поняли что задача не решается в принципе, только некоторая вероятность. Китай с Россией еще не поняли наверно… хотя они запросто могут запретить бороды, бейсболки, пользоваться смартфонами в общественных местах и т.п. чтобы поднять немного вероятность.
Хотя процент можно поднять достаточно высоко, если правильно все сделать, т.е. должен быть предварительный отбор с низким FAR и высоким FRR, после этого сразу трекинг роботизированными камерами с оптикой хорошей чтобы получить качественные кадры с разных углов, и затем уже с высоким FAR прогон по нескольким алгоритмам.

N01Z3 Aug 1 2018 at 13:45

Статья — огонь! Спасибо!
С безопасностью примерно ясно. А что с задачей know your customer? Условно: идентификация покупателя в магазине, чтобы сопоставлять его хэш-код лица и покупки. Кажется, что требования куда менее жесткие: можно повесить свою классную камеру, в конкретном магазе иметь небольшую локальную базу лиц. Тем не менее, не слышно про успешно реализованные кейсы. В чем тут могут быть сложности?

ZlodeiBaal Aug 1 2018 at 13:54

Вроде про установку в премиум-магазинах я давно слышал. Там это всё замечательно работает, пока база покупателей 1-2 тысячи.
А в каком-нибудь магазине на пару десятков тысяч покупателей те же проблемы. Тобишь 10тыщ — это 10^4 актов сравнения на покупателя. Если реально хорошая камера и освещение — ложняк будет на каждом сотом. Если как обычно — то на каждом втором:)
Но в реальности поставить хорошую камеру сложно. К нам приходило 5-6 команд которые такое пытались сделать. Качество картинок у всех ниже плинтуса, широкие углы, плохая установка. Реально поможет только поставить фронтальную камеру и хорошую подсветку забацать. Но это никому не понравиться.
Мы их отправляли всех в Ntech/VisionLabs/Vocord со словами что это может вам помочь, но мы думаем что нет, качества и статистики не хватит. Но удачных внедрений не слышал.

Kriminalist Aug 2 2018 at 12:52

Спасибо за статью!
Какой потенциально самый эффективный вектор атаки на системы распознавания? По обоим направлениям — минимизация вероятности опознавания лица, которое есть в базе, и имитация?

ZlodeiBaal Aug 2 2018 at 12:55

Основная минимизация распознавания — это изменение лица тем или иным способом. Если вас другой человек плохо узнает — то и система тоже
Имитация… Ну проще всего фотку показать. Или фотку на лицо наклеить)

Kriminalist Aug 2 2018 at 14:46

Ну был материал о нанесении на лицо некоего паттерна линий/точек, так что гейросеть узнавала селебрити в этом образе. Если быть конкретнее, нет ли данных по скажем таким примерам:
— мужчина отрастил/сбрил бороду,
— мужчина отрастил/сбрил усы,
— женщина с макияжем/без,
— тёмные/зеркальные очки,
— медицинская маска.

SantaCluster Apr 30 2019 at 08:19

все эти системы направлены на работу "против" добропорядочных граждан. из этой статьи и ряда других становится понятно, что на данный момент сокрытие личности дело несложное. особенно, если целенаправленно подготовиться к обману системы.
добавлю к вашему списку:

кусочек изоленты или другая наклейка на лицо
"двусторонняя" одежда (вывернул, и ты уже не человек в синей куртке) :)
парики или манипуляции с волосами (особенно длинными)
бижутерия на лицо (в нос, губы, брови)
да ещё и в динамике ;)
вариантов-то масса.

Alexeyslav May 1 2019 at 00:09

Пока на лице остаются видимы глаза-нос-уши, это всё не поможет. Для каждого человека взаимное положение этих частей тела достаточно уникальное, и даже пластические операции не помогают скрыть.

BigBeaver May 1 2019 at 10:06

В теории это так, но на практике очень спорно.

Допустим, линейные размер головы ~20см. Если мы распознаем координату каждого признака с точностью до 1мм, то число комбинайиц будет 200^3=8 000 000. В принципе, не очень плохо.

Допустим, с помощью нанесения какого-то маркера (нарисуем стрелки, линзы со смещенным зрачком или не знаю) мы можем двигать координату признака на, скажем ±2.5мм. Вот у нас точность распознавания падает на порядок. Приходится крутить баланс чувствительность/избирательность. В итоге система может и увидит злоумышленника, но одновременно с ним и еще сотню человек. Пока у вас задача найти одного человека, это условно Ок. Подумаешь, сто непричастных людей проверить. Но это будет очень быстро нарастать.

Понятно, что с этим всем можно бороться — наращивать число признаков, более хитро обрабатывать и тд, но абсолютная точность недостижима, а за неточность онлайн системы расплачиваются офлайн структуры, стоящие за ней.

Alexeyslav May 1 2019 at 10:38

Непонятно как было посчитано число комбинаций? Сравниваются не координаты и не длины, сравниваются соотношения расстояний до элементов признаков. Пока систему не будут массово обманывать, она будет достаточно эффективна. А тех кто её будет пытаться обмануть, можно будет выявлять по другим признакам — наличие специфических линз при досмотре, стрёмный макияж и т.д. Их гораздо легче будет отлавливать при покупке этих самых линз или оборудования по их изготовлению.
Абсолютная точность и не нужна, да она собственно нигде и не достижима.
Макияж, к слову, не спасёт от 3Д-сканирования. А это всего две камеры поставленные в проходе.

BigBeaver May 1 2019 at 11:11

Из приведенной же формулы очевидно, что перемножением. На самом деле это очень грубая оценка сверху,

Понятно, что конечная система смотрит расстояние в пространсте признаков, а не в геометрическом. Но распределение признаков (то же положение глаз) у нас гладкое и условно нормальное (вероятность глаз ровно над носом пренебрежимо мала). Это значит, что (при прочих равных) лица с похожими координатами глаз дадут близкие точки в пространстве признаков.

А тех кто её будет пытаться обмануть, можно будет выявлять по другим признакам — наличие специфических линз при досмотре, стрёмный макияж и т.д.

Вы давно последний раз людей видели? Под каждый конкретный способ «маскировки» можно подобрать стиль такой социальной группы, в которой он будет органичен. Кроме того, были, емнип, показаны модификации, которые обманывают систему распознования, но не заметны человеку. Для этого неплохо бы знать алгоритмы конкретной системы, но это решаемо.

Макияж, к слову, не спасёт от 3Д-сканирования. А это всего две камеры поставленные в проходе.

Во-первых, тоже спорно. Хотя полагаю, что хорошие камеры при хорошем освещении действительно сработают (или для обхода понадобится макияж, вызывающий больше проблем, чем камеры). Но обратите внимание, что я говорю не о полной возможности скрыться, а о внесении в систему флуктуаций, делающих ее бесполезной. Это уже выглядит реальным. Во-вторых, это хорошо работает, когда вам надо ограничить доступ в офис или типа того. Для отслеживания перемещений по городу уже плохо работает. Как и для поиска людей — оно норм, если к камере приставлен надзиратель. А если нет, то волосы на лицо + капюшон + взгляд в пол, и вот вы имеете 3д скан близкий к яйцу по своей информативности.

Alexeyslav May 1 2019 at 16:21

В упор не вижу формулы, есть какое-то равенство и всё. Ну ладно, это не суть.
«волосы на лицо + капюшон + взгляд в пол» и получаем отличного кандидата на досмотр патрулём. Или все так ходить начнут?

BigBeaver May 1 2019 at 16:59

Неужели правда ночевидно, что я просто перемножил диапазоны? Если лицо 200мм и у нас 3 геометрических измерения этого лица, то для каждого из измерений мы имеем 200 возможных значений. Возведя в куб, получаем полное число возможных комбинаций. Очевидно, что для реального лица это число будет на несколько порядков меньше.

С каких пор растрепанная челка стала поводом для досмотра? С каких пор смотреть под ноги стало незаконно?

Alexeyslav May 1 2019 at 18:46

Досмотрят и отпустят, раз нарушения нет. Это называется «подозрительная личность».
Да, причем тут геометрические измерения лица? Есть лица размером 10x10x10 мм? Надо учитывать не размерность лица, а расстояния между характерными элементами — глаза, уши, нос, соотношение ширины лица к высоте. Тут с десяток измерений найдётся, правда с узкими диапазонами. Участковых и патрульных учат распознавать лица тоже по этим признакам и они как-то довольно успешно справляются.

BigBeaver May 1 2019 at 19:04

Ну так это одно и то же. Точность этих измерений конечна, а их величина не превышает размер лица. Ну давайте в пикселях на картинке с камеры посчитаем, если вас милиметры не йстраивают. Или в каких-то приведенных виличинах — это не важно в итоге — их все равно конечный и довольно узкий спектр.

SantaCluster May 1 2019 at 15:25

как уже заметили, в теории всё круто. и в отчётах продавцов этих систем :)
на деле даже алгоритмы поведенческого анализа можно обойти, хотя это считается более сложной задачей. но что это за мелочь для профессионала! :) конечно, случайный обыватель не будет изменять свою походку, осанку и т.п. Но преступник… а именно его нам и нужно в толпе найти.
То, что с этим не всё хорошо не отменяет необходимости в совершенствовании алгоритмов и оборудования. Но всегда будут люди, желающие и способные сломать систему ;)

Alexeyslav May 1 2019 at 16:17

Система нацелена на массы. А обходящих систему будет гораздо меньше, и их искать будут уже классическим методом, не распыляясь. А вот преступнику необходимость маскировки будет ограничивать область для манёвров, и попробуй где-то ошибиться — сразу засветишься в массовой системе.

BigBeaver May 1 2019 at 17:00

А зачем искать массы — вот же они.

Alexeyslav May 1 2019 at 18:47

Но не все же разыскиваемые преступники.

BigBeaver May 1 2019 at 19:06

Так преступник маскируется.

Alexeyslav May 6 2019 at 08:08

Вот прям все и всегда?

BigBeaver May 6 2019 at 12:49

При наличии эффективных систем поиска/распознавания — конечно. Противное было бы эквивалентно добровольной сдаче.

Alexeyslav May 6 2019 at 15:28

Но это сделает невозможным прохождение официальных пунктов пропуска, каждый патруль будет «тормозить» и т.д. неудобства. С маскировкой придётся уйти в глубокое подполье.

BigBeaver May 6 2019 at 15:47

Так в мире глобального контроля выбор стоит между подпольем и тюрьмой. Тяжело быть преступником…