Pull to refresh

Comments 38

Это те самые фотографии из капчи! Гугл использует нас!
UFO just landed and posted this here
А можно вообще писать только контрольное слово
Например
image
А я вписываю правильные. Приятно хоть в чем-то помочь такой компании как Google.
UFO just landed and posted this here
А зачем они их продают?
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
Надеюсь не сильно испорчу утешение, сообщив что цифры все-равно будут распознаны верно :)
Каждое фото показывают нескольким людям.

Вписав неправильное вы лишь только добавите несколько дополнительных проверок.
UFO just landed and posted this here
Это как голосовать за Жириновского — смысла никакого, но есть ощущение что пошел против системы.
UFO just landed and posted this here
Без ввода неправильных цифр?
UFO just landed and posted this here
Самое смешное, когда кто-то ещё вкладывает свои деньги в распознавание капчи через сервисы антикапч ( antigate, pixodrom.com и т.п.)
А почему смешное? У меня на antigate $10 лежит, для целей автоматизации, не смеюсь :)
На мой взгляд новость должна звучать так:

Инженеры Google рассказали об успехах в распознавании номеров улиц с фотографий StreetView. Все очень просто — они использовали миллиард реальных человеческих мозгов, благодаря чему точность распознавания системы Google составила 96%. Однако, 2% людей намеренно вбивают неверное значение, поэтому 98% — эта цифра и будет целью для дальнейших исследований.
В последнее время я половину всех встреченных капчей не смог распознать. Сдается мне оставшиеся 2% — это мой косяк. Видимо я робот. Простите.
С нашей Российской нумерацией… отсутствием во многих местах надписей о номере дома (могут присутствовать надписи другого типа =D)… я думаю программа гугла загнулась бы еще на этапе старта.
У нас еще все очень здорово. В некоторых странах вообще нумеруются только дома на перекрёстках (да и то не всегда)…
Ещё интересно, как они там в гугле решают, что увиденная цифра — номер дома. Т.к. цифра может быть частью названия улицы, номером какой-нибудь трансформаторной будки и пр.
Давайте посмотрим на Калининград, с диапазонной нумерацией домов. А в Падове адрес компаний меняется в зависимости от этажа.
В Японии, ЕМНИП, номера домов назначены хронологически, а кварталы сами по себе имеют имена (в отличие от улиц). Но в рашеньке, КОНЕЧНО ЖЕ, всё априори хуже, чем везде.
В рашке тоже такое встречается. Взгляните на Набережные Челны на яндекс.карте.
Конечно же хуже. Но не априори, а по факту. И не все, а конкретная ситуация с номерами домов.

В Японии есть такая специфичная традиция — ну ок. А в Питере на половине домов нет номеров. Безо всякой традиции — их тупо нет. Удачи, гугл!
Интересно, что на домах пишут не только номера домов. Например, есть номера пожарных кранов. А есть еще номера телефонов для аренды офисов — прямо на все окно или дверь — неплохой 10и значный номер. Есть буквы после номеров домов, которые напоминают цифры как Б и В и они не обязательно пишуться через тире. Да, есть много успешный способов сбить нейронную сеть с толку, уже опрабованных на тысячах других нейронных сетях по сложности превосоходящих любой неживой объект во вселенной. Чувствую, будет как в анекдоте
— 3030-й! Я последний раз спрашиваю, где 3030-й!
— Зозо моя фамилия, товарищ прапорщик.
UFO just landed and posted this here
Мне вот вообще не номер, а пятно на стене попалось. Так что ошибки классификации бывают.
Скрытый текст

Главный вопрос: кто находит и вырезает номера домов со снимков Street View для удовлетворения условий «на изображении номер должен точно присутствовать, и изображение должно быть подготовлено таким образом, чтобы искомый номер занимал примерно одну треть его»?
Если алгоритм или нейронная сеть — то интересно было бы почитать его описание.
Если штат индусов — то могли бы и цифры распознать заодно, никакие алгоритмы не нужны.

Что-то тут нечисто. :)
UFO just landed and posted this here
А тут уже все зависит от многих факторов. Среди них такие, как объем выборки (если у нас всего 100 изображений или 1млн — разные вещи) и уровень значимости (насколько точный результат нам надо, может быть нас удовлетворят и 90% правильных распознаваний). И многое другое.
Другими словами, в одной ситуации разница в 2% и в 4% представляет собой почти одно и тоже, а в другой ситуации — это непростительно. И как раз таки в ситуации с номерами домой, я думаю, это вполне простительно.
Там вообще-то рассмотрена эта проблема и решена, на мой взгляд, остроумно: результат каждого распознавания оценивается по степени его «надежности» и «ненадежно» распознанные варианты отбрасываются. Чем выше порог — тем меньше будет распознано изображений, но среди распознанных будет меньше процент ошибок.

И если выставить порог точности распознавания в 98%, то нейросеть распознает 96% изображений :). Т.е. 96% работы можно выполнять автоматически а остальные 4% поручить людям. Либо распознавать все 100% изображений, но уже с 4% ошибок. На мой взгляд это очень впечатляющее достижение.
Надёжность часто описывается вроде 99,9%, постоянно увеличивая количество девяток после запятой. И каждая девятка — десятикратное уменьшение брака.
Жаль что в этой работе не указан объем обучающей выборки. Если 96% достигнуто на второй половине базы после обучения на первой половине — то это отличный результат, а если в обучающую выборку входила вся база целиком (а у меня складывается ощущение, что в изрядной части «потрясающих достижений нейросетей» так и делали), то эти 96% ни о чем не говорят.
Sign up to leave a comment.

Articles

Change theme settings