jeston Jan 7 2014 at 13:41

Инженеры Google рассказали об успехах в распознавании номеров домов с фотографий StreetView

2 min

33K

Image processing*

+24

Comments 38

Menjoy Jan 7 2014 at 14:42

Это те самые фотографии из капчи! Гугл использует нас!

+41

UFO just landed and posted this here

bakatrouble Jan 7 2014 at 16:27

А можно вообще писать только контрольное слово

Например

-7

NeoCode Jan 7 2014 at 18:07

А я вписываю правильные. Приятно хоть в чем-то помочь такой компании как Google.

+16

darken99 Jan 7 2014 at 18:36

UFO just landed and posted this here

leMar Jan 7 2014 at 21:11

А зачем они их продают?

UFO just landed and posted this here

Antares19 Jan 8 2014 at 23:41

Надеюсь не сильно испорчу утешение, сообщив что цифры все-равно будут распознаны верно :)
Каждое фото показывают нескольким людям.

Вписав неправильное вы лишь только добавите несколько дополнительных проверок.

UFO just landed and posted this here

x7mz Jan 9 2014 at 08:17

Это как голосовать за Жириновского — смысла никакого, но есть ощущение что пошел против системы.

UFO just landed and posted this here

x7mz Jan 9 2014 at 17:33

Без ввода неправильных цифр?

UFO just landed and posted this here

art_of_press Jan 17 2014 at 14:59

Вписывая правильные слова, вы помогаете оцифровывать отсканированные книги. Вот отличный спич на TED человека, который придумал это.

Error_403_Forbidden Jan 7 2014 at 15:20

Самое смешное, когда кто-то ещё вкладывает свои деньги в распознавание капчи через сервисы антикапч ( antigate, pixodrom.com и т.п.)

JaLoveAst1k Feb 15 2014 at 02:39

А почему смешное? У меня на antigate $10 лежит, для целей автоматизации, не смеюсь :)

x7mz Jan 7 2014 at 15:34

На мой взгляд новость должна звучать так:

Инженеры Google рассказали об успехах в распознавании номеров улиц с фотографий StreetView. Все очень просто — они использовали миллиард реальных человеческих мозгов, благодаря чему точность распознавания системы Google составила 96%. Однако, 2% людей намеренно вбивают неверное значение, поэтому 98% — эта цифра и будет целью для дальнейших исследований.

+15

leMar Jan 7 2014 at 21:13

В последнее время я половину всех встреченных капчей не смог распознать. Сдается мне оставшиеся 2% — это мой косяк. Видимо я робот. Простите.

edinorog Jan 7 2014 at 16:21

С нашей Российской нумерацией… отсутствием во многих местах надписей о номере дома (могут присутствовать надписи другого типа =D)… я думаю программа гугла загнулась бы еще на этапе старта.

-4

frog Jan 7 2014 at 16:40

У нас еще все очень здорово. В некоторых странах вообще нумеруются только дома на перекрёстках (да и то не всегда)…
Ещё интересно, как они там в гугле решают, что увиденная цифра — номер дома. Т.к. цифра может быть частью названия улицы, номером какой-нибудь трансформаторной будки и пр.

sereje4kin Jan 7 2014 at 20:01

Давайте посмотрим на Калининград, с диапазонной нумерацией домов. А в Падове адрес компаний меняется в зависимости от этажа.

AlexanderG Jan 7 2014 at 17:36

В Японии, ЕМНИП, номера домов назначены хронологически, а кварталы сами по себе имеют имена (в отличие от улиц). Но в рашеньке, КОНЕЧНО ЖЕ, всё априори хуже, чем везде.

Edro Jan 7 2014 at 19:04

В рашке тоже такое встречается. Взгляните на Набережные Челны на яндекс.карте.

-1

zencd Jan 7 2014 at 21:50

Конечно же хуже. Но не априори, а по факту. И не все, а конкретная ситуация с номерами домов.

В Японии есть такая специфичная традиция — ну ок. А в Питере на половине домов нет номеров. Безо всякой традиции — их тупо нет. Удачи, гугл!

ZeroBit Jan 7 2014 at 19:16

Интересно, что на домах пишут не только номера домов. Например, есть номера пожарных кранов. А есть еще номера телефонов для аренды офисов — прямо на все окно или дверь — неплохой 10и значный номер. Есть буквы после номеров домов, которые напоминают цифры как Б и В и они не обязательно пишуться через тире. Да, есть много успешный способов сбить нейронную сеть с толку, уже опрабованных на тысячах других нейронных сетях по сложности превосоходящих любой неживой объект во вселенной. Чувствую, будет как в анекдоте
— 3030-й! Я последний раз спрашиваю, где 3030-й!
— Зозо моя фамилия, товарищ прапорщик.

UFO just landed and posted this here

SVlad Apr 29 2014 at 16:42

Мне вот вообще не номер, а пятно на стене попалось. Так что ошибки классификации бывают.

Скрытый текст

enemo Jan 7 2014 at 20:24

Главный вопрос: кто находит и вырезает номера домов со снимков Street View для удовлетворения условий «на изображении номер должен точно присутствовать, и изображение должно быть подготовлено таким образом, чтобы искомый номер занимал примерно одну треть его»?
Если алгоритм или нейронная сеть — то интересно было бы почитать его описание.
Если штат индусов — то могли бы и цифры распознать заодно, никакие алгоритмы не нужны.

Что-то тут нечисто. :)

UFO just landed and posted this here

artyums Jan 7 2014 at 22:27

А тут уже все зависит от многих факторов. Среди них такие, как объем выборки (если у нас всего 100 изображений или 1млн — разные вещи) и уровень значимости (насколько точный результат нам надо, может быть нас удовлетворят и 90% правильных распознаваний). И многое другое.
Другими словами, в одной ситуации разница в 2% и в 4% представляет собой почти одно и тоже, а в другой ситуации — это непростительно. И как раз таки в ситуации с номерами домой, я думаю, это вполне простительно.

0serg Jan 7 2014 at 22:39

Там вообще-то рассмотрена эта проблема и решена, на мой взгляд, остроумно: результат каждого распознавания оценивается по степени его «надежности» и «ненадежно» распознанные варианты отбрасываются. Чем выше порог — тем меньше будет распознано изображений, но среди распознанных будет меньше процент ошибок.

И если выставить порог точности распознавания в 98%, то нейросеть распознает 96% изображений :). Т.е. 96% работы можно выполнять автоматически а остальные 4% поручить людям. Либо распознавать все 100% изображений, но уже с 4% ошибок. На мой взгляд это очень впечатляющее достижение.

darkfrei Jan 9 2014 at 00:44

Надёжность часто описывается вроде 99,9%, постоянно увеличивая количество девяток после запятой. И каждая девятка — десятикратное уменьшение брака.

0serg Jan 7 2014 at 22:43

Жаль что в этой работе не указан объем обучающей выборки. Если 96% достигнуто на второй половине базы после обучения на первой половине — то это отличный результат, а если в обучающую выборку входила вся база целиком (а у меня складывается ощущение, что в изрядной части «потрясающих достижений нейросетей» так и делали), то эти 96% ни о чем не говорят.

Show the best of all time