Pull to refresh

Wolfram Alpha научился описывать содержимое любых картинок и фото

Reading time 2 min
Views 17K


Разработчики сайта Wolfram Alpha добавили в копилку уникальных возможностей системы ещё одну удивительную функцию – распознавание любых фотографий. Каждый желающий может опробовать ImageIdentify в работе. Достаточно загрузить картинку на демонстрационный сайт и через несколько секунд вы получите ответ. Как утверждают сами разработчики – почти всегда правильный.

Стивен Вольфрам, основатель и главный идеолог компании, подробно описывает работу системы в записи в своём блоге. Стивен говорит, что 40 лет ждал момента, когда компьютеры научатся распознавать изображения, и был уверен в том, что этот момент настанет. Задача распознавания – одна из самых базовых для человека, и одна из самых сложных – для компьютерных систем и алгоритмов.

Стивен пишет, что хотя алгоритм и не всегда распознаёт изображения верно, даже его ошибки сильно напоминают человеческие.

Распознавание изображений теперь работает не только на демонстрационном сайте, но и в самом Wolfram Language. Можно задать изображение, получить его описание, а потом использовать уже само описание – получить, например, определение предмета из словарной статьи, или построить облако слов из статьи в Википедии.

image
image
image

Можно написать программу, автоматически анализирующую фотографии и составляющую статистику, делающую какие-либо другие подсчёты, связанные с содержанием картинок, или разбивающую их на категории. Также функция распознавания доступна через API.

Для тренировки системы разработчики использовали десятки миллионов изображений. С точки зрения Стивена это сравнимо с тем количеством информации, которое человек получает за первые пару лет жизни. Также Стивен подробно рассказывает в блоге, как разрабатывали систему машинного обучения на нейронных сетях, и какие при этом возникали проблемы. Например, когда систему ещё не научили распознавать лица, она, обработав портрет Индианы Джонса, выдала результат «Шляпа».

image

Для проверки системы Вольфрам пробовал скармливать ей разные противоречивые картинки и получал иногда странные, иногда – забавные или даже милые результаты.

image

Некоторые ошибки распознавания оказались не только вполне объяснимыми, но и даже весьма «очеловеченными». Также интересным оказался опыт распознавания абстрактной живописи – эти картины работали как своеобразные «тесты Роршаха».

image

В данный момент ImageIdentify способна распознавать до 10000 различных объектов. Пока она плохо справляется с распознаванием конкретных людей, произведений искусства и редких объектов.

Довольно забавно играть с системой, подсовывая ей не самые лёгкие варианты картинок и получая довольно своеобразные ответы.

image

Проект Wolfram Alpha был запущен в 2009 году. Система способна отвечать на заданные ей на обычном языке вопросы, и, используя данные из открытых источников, подсчитывать ответы. Например, на вопрос, заданный со смартфона, «Какие самолёты сейчас есть у меня над головой?» система ответит, определив местоположение по GPS, и укажет список самолётов, исходя из данных по рейсам авиаперевозчиков.
Tags:
Hubs:
If this publication inspired you and you want to support the author, do not hesitate to click on the button
+31
Comments 40
Comments Comments 40

Articles