Как стать автором
Обновить
6
0
Тимур Кадыров @tim_kadyrov

Data Scientist

Отправить сообщение
Всё верно. Они и не используются для построения портрета потребителя. Пример был показан скорее как еще одно применение модели. Ведь если есть инструмент, то его можно попробовать использовать для разных целей.
Возможно, мы плохо исследовали вопрос. Не подскажите какие сайты и сколько стоит 1000к распознований? Например, cloud vision api гугла нам не подошёл. Но даже если бы он умел хорошо определять модель авто, то при наших объемах его стоимость обходилась бы космических денег.
Никаких обид! Тем более это очень здоровая критика.
Вы правы, задача действительно решается сложным путём и выглядит как оверинжиниринг. Мы бы хотели сделать решение проще. Были даже предприняты несколько подходов, в основном связанные с текстами. Но получилось плохо, всё равно оставалось множество нерелевантных запросу примеров.
Если бы была законная возможность иметь доступ к базе номеров, то мы скорее всего пошли бы именно таким путём. Но тогда встает вопрос: что делать с фотографиями на которых номер либо не виден, либо скрыт?
И вы снова абсолютно правы на счет смещения в статистических исследованиях. Кажется, что сделать не смещенное статистическое исследование основанное на социальной сети не простое занятие. На мой взгляд, эта тема выходит за рамки текущей статьи. Спасибо за пищу для размышлений, мы постараемся подготовить материал на эту тему. :)
В защиту текущей модели могу добавить, что собирать отчёты с минимальным привлечением человека стало проще.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность