Pull to refresh
  • by relevance
  • by date
  • by rating

Нейросеть Adobe определяет фотографии, обработанные в Photoshop

Image processingArtificial IntelligenceIT-companies


Команда Adobe рассказала о новом проекте, который ведет совместно с Калифорнийским университетом — создании искусственного интеллекта, способного выявлять контент, отредактированный при помощи продуктов компании. Первая разработка в серии, нейросеть под названием CNN, различает изображения, к которым применялся один из популярных фильтров Adobe Photoshop, почти в два раза успешнее, чем средний человек.
Читать дальше →
Total votes 13: ↑13 and ↓0 +13
Views8.2K
Comments 12

Непрерывное wavelet преобразование

Algorithms
Здравствуйте, уважаемое хабрасообщество.
В последнее время на хабре стали появляться статьи, так или иначе связанные с анализом и обработкой сигналов и изображений (например Обнаружение устойчивых признаков изображения: метод SURF, Интегральное представление изображений от BigObfuscator), в связи с чем я хотел бы вкратце осветить такой инструмент для анализа сигналов, как wavelet-преобразование.

Для того, чтобы понять смысл вейвлет анализа начнем довольно издалека. В данной статье описывается математический смысл (простыми словами) вейвлет-преобразований, о применимости и его дискретной версии я расскажу позднее.

Спектральный анализ — это один из методов обработки сигналов, который позволяет характеризовать частотную составляющую измеряемого сигнала.

Читать дальше →
Total votes 66: ↑63 and ↓3 +60
Views48.8K
Comments 55

Макромедиа: анализ и интерпретация мультимедиа информации. M-Lang

Algorithms
Sandbox
Данная статья посвящена общей проблематике использования и разработки макромедиа технологий. Опираясь на известные принципы и методы анализа и обработки информации, автор поставил перед собой цель определить основные понятия и правила, необходимые для разработки некой порождающей грамматики и языка описания процесса анализа мультимедийной информации.
Рассматриваются два подхода к анализу мультимедийной информации: контентный, и контентно-интерпретационный. Так же в статье изложены основные правила и приведены примеры конструкций и спецификаций языка описания алгоритмов анализа графической информации — M-Lang.
Читать дальше →
Total votes 3: ↑3 and ↓0 +3
Views2.3K
Comments 2

«Выглядит похоже». Как работает перцептивный хэш

Image processing
Translation
За последние несколько месяцев несколько человек спросили меня, как работает TinEye и как в принципе работает поиск похожих картинок.

По правде говоря, я не знаю, как работает поисковик TinEye. Он не раскрывает деталей используемого алгоритма(-ов). Но глядя на поисковую выдачу, я могу сделать вывод о работе какой-то формы перцептивного хэш-алгоритма.
Читать дальше →
Total votes 149: ↑145 and ↓4 +141
Views101.7K
Comments 43

DARPA создает систему анализа изображений

Image processing
image
Некоторое время назад на Хабре появился топик о том, что такой крупный игрок IT-рынка как Google приобрел компанию PittPatt, намереваясь использовать её результаты для распознавания объектов на изображениях. Правда, некоторое время до этого Эрик Шмидт делал недвусмысленное заявление о том, что его компания хотя и обладает всеми техническими возможностями для реализации этой задачи, тем не менее, из-за проблем с законным использованием её возможностей Google пока не будет использовать её в своих продуктах и технологиях.

По всей видимости DARPA (Defense Advanced Research Projects Agency — агентство передовых оборонных исследовательских проектов), являясь агентством Министерства обороны США, не будет иметь таких проблем как поисковый гигант. Несколько дней назад стало известно, что организация, стоящая у истоков создания интернета и BSD-версии UNIX, намерена создать программное обеспечение Visual Media Reasoning (VMR), предназначение которого заключается в исследовании фотографий, распознавании объектов на них и каталогизации по тому или иному признаку. Разработкой будет заниматься подразделение I2O, специализирующееся на информационных системах мониторинга и управления, технологии высокопроизводительных вычислений, интеллектуальном анализе данных, системе распознавания образов. Среди очевидных применений VMR авторы называют использование его в разведке и правоохранительных организациях, которые вынуждены иметь дело с огромными объемами цифровых изображений, нуждающихся в автоматизированном анализе.
Узнать подробности
Total votes 6: ↑4 and ↓2 +2
Views1.2K
Comments 4

Алгоритм детектирования теней на видеоизображении

Image processing

Введение


В данной статье мне хотелось рассказать об алгоритме, который позволяет разделять на видеоизображении реальные объекты и тени.



Данный алгоритм был впервые реализован мной во время разработки алгоритмов видеоаналитики для IP-видеосервера MagicBox, которое разрабатывает компания Синезис, в которой я работаю в настоящее время. Как известно, при детектировании движения на видеопоследовательности, условия освещенности не всегда идеальны. И простейший детектор движения, основанный на разности текущего кадра и некого усредненного фона будет реагировать не только на реальные объекты, но также и на виртуальные: подвижные тени и световые зайчики. Что является нежелательным, так как может приводить искажению формы детектируемых предметов а также к ложным срабатываниям детектора движения. Это актуально в солнечную погоду, а особенно в случае переменной облачности. Потому наличие алгоритма по выделению теней, может весьма положительно сказаться на точности всего детектора. Но давайте рассмотрим все по порядку.
Читать дальше →
Total votes 99: ↑99 and ↓0 +99
Views7.3K
Comments 17

Wolfram Alpha Pro

Search engines


Сегодня официально представлена продвинутая версия научного поисковика Wolfram Alpha Pro. Это самый значительный апдейт за всё время существования поисковой системы. Хотя её и раньше трудно было назвать «поисковой системой», а сейчас это вообще нечто фундаментально иное.

Итак, на что способен Wolfram Alpha Pro за пять долларов в месяц?


Читать дальше →
Total votes 139: ↑134 and ↓5 +129
Views51.5K
Comments 80

Как работает автоматическое выделение документа на изображении в программе ABBYY FineScanner?

ABBYY corporate blogImage processing
image
Что такое ABBYY FineScanner
ABBYY FineScanner – программа для iOS-устройств, которая может фотографировать документы и обрабатывать снимки так, чтобы получившиеся электронные копии (по сути – сканы) были удобны для работы – чтения, печати или хранения/пересылки в удобочитаемом виде. О выходе первой версии мы писали здесь.

Фотографии документов, получаемые на мобильных устройствах, обладают различными искажениями по сравнению с изображениями, получаемыми из обычного сканера. К таким искажениям относятся: цифровой шум, геометрические искажения, вызванные поворотом документа или наличием перспективы, неравномерность в освещенности, расфокусировка, смаз. Далее мы опишем алгоритм, который позволяет автоматически устранить геометрические искажения документа на изображении.

Весь процесс можно разделить на несколько основных этапов:

1) Уменьшение исходного изображения
2) Выбор наиболее информативного канала
3) Предобработка изображения, выделение контуров
4) Детектирование границ и определение углов документа
5) Проверка полученных гипотез
6) Уточнение координат углов документа

Рассмотрим каждый из этапов подробнее.
Читать дальше →
Total votes 37: ↑35 and ↓2 +33
Views15.1K
Comments 11

Поиск кропнутых дубликатов изображений с помощью перцептуальных хешей

Image processing
В этой статье пойдет речь о том, как решалась небольшая задачка поиска дубликатов по фрагменту или кропу картинки.



Читать дальше →
Total votes 129: ↑118 and ↓11 +107
Views66.8K
Comments 39

Поиск людей на фотографиях на Android с помощью OpenCV

Development for AndroidImage processing
Sandbox
Недавеча столкнулся с одной интересной задачкой для мобильного “коня” на Android’e- необходимо определить контуры людей на фотографиях (если таковы там были, естественно). После поиска в интернете, было решено использовать open source проект OpenCV, который может работать на платформе Android.

О нем уже было много написано, но данный сабж мной найден не был и был собран из нескольких источников и личных наблюдений.


Читать дальше →
Total votes 36: ↑29 and ↓7 +22
Views39.7K
Comments 11

Как бороться с репостами или пара слов о перцептивных хешах

ProgrammingImage processing
Sandbox
В этой публикации речь пойдет о подходах к построению перцептивный хешей изображения и возможностях их использования (например, поиск дубликатов).

перцептивный хэш-алгоритмы описывают класс функций для генерации сравнимых хэшей. Они используют различные свойства изображения для построения индивидуального «отпечатка». В дальнейшем эти «отпечатки» можно сравнивать друг с другом.

Если хэши отличаются, значит, данные разные. Если хэши совпадают, то данные, скорее всего, одинаковые (поскольку существует вероятность коллизий, то одинаковые хэши не гарантируют совпадения данных). В этой статье речь пойдет о нескольких популярных методах построения перцептивный хешей изображения, а также о простом способе борьбы с коллизиями. Всем кому интересно, прошу под кат.
Читать дальше →
Total votes 55: ↑54 and ↓1 +53
Views26.9K
Comments 26

Введение в курс «Анализ изображений и видео». Лекции от Яндекса

Яндекс corporate blogProgrammingAlgorithmsImage processing
Мы начинаем публиковать лекции Натальи Васильевой, старшего научного сотрудника HP Labs и руководителя HP Labs Russia. Наталья Сергеевна читала курс, посвящённый анализу изображений, в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS клуба



Всего в программе — девять лекций. В первой из них рассказывается о том, как применяется анализ изображений в медицине, системах безопасности и промышленности, какие задачи оно еще не научилось решать, какие преимущества имеет зрительное восприятие человека. Расшифровка этой части лекций — под катом. Начиная с 40-й минуты, лектор рассказывает об эксперименте Вебера, представлении и восприятии цвета, цветовой системе Манселла, цветовых пространствах и цифровых представлениях изображения. Полностью слайды лекции доступны по ссылке.
Читать дальше →
Total votes 60: ↑54 and ↓6 +48
Views64.4K
Comments 5

Основы пространственной и частотной обработки изображений. Лекции от Яндекса

Яндекс corporate blogProgrammingAlgorithmsImage processing
Мы продолжаем публиковать лекции Натальи Васильевой, старшего научного сотрудника HP Labs и руководителя HP Labs Russia. Наталья Сергеевна читала курс, посвящённый анализу изображений, в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS-клуба.



Всего в программе — девять лекций. Первая из них уже была опубликована. В ней рассказывалось о том, в каких областях встречается анализ изображений, его перспективах, а также о том, как устроено наше с вами зрение. Вторая лекция посвящена основам обработки изображений. Речь пойдет о пространственной и частотной области, преобразовании Фурье, построении гистограмм, фильтре Гаусса. Под катом — слайды, план и дословная расшифровка лекции.
Читать дальше →
Total votes 51: ↑48 and ↓3 +45
Views52.7K
Comments 9

Морфологическая обработка изображений. Лекции от Яндекса

Яндекс corporate blogProgrammingAlgorithmsImage processing
Мы продолжаем публиковать лекции Натальи Васильевой, старшего научного сотрудника HP Labs и руководителя HP Labs Russia. Наталья Сергеевна читала курс, посвящённый анализу изображений, в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS-клуба.



Всего в программе девять лекций. Первая и вторая уже были опубликованы. В предыдущем рассказе речь шла об основах пространственной и частотной обработки изображений. Третья лекция посвящена основным операциям морфологической обработки изображений. Под катом — слайды, план лекции и её дословная расшифровка.
Читать дальше →
Total votes 39: ↑38 and ↓1 +37
Views31.4K
Comments 7

Поиск по подобию. Поиск нечетких дубликатов. Лекции от Яндекса

Яндекс corporate blogProgrammingAlgorithmsImage processing
Сегодня мы публикуем шестую лекцию из курса «Анализ изображений и видео», прочитанного Натальей Васильевой в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS-клуба.



Всего в программе девять лекций, из которых уже были опубликованы:
  1. Введение в курс «Анализ изображений и видео».
  2. Основы пространственной и частотной обработки изображений.
  3. Морфологическая обработка изображений.
  4. Построение признаков и сравнение изображений: глобальные признаки.
  5. Построение признаков и сравнение изображений: локальные признаки.

Под катом, вы найдете план новой лекции, слайды и подробную расшифровку.
Читать дальше →
Total votes 41: ↑40 and ↓1 +39
Views19K
Comments 3

Поиск четырёхугольников документов на мобильных устройствах

Smart Engines corporate blogProgrammingDevelopment of mobile applicationsAlgorithmsImage processing


Некоторые из модулей распознавания документов, разработанных нашей компанией, в качестве первого этапа своей работы должны определять расположение объекта на поступающем изображении или в видеопотоке. Сегодняшняя статья посвящена одному из задействованных у нас подходов к решению этой задачи.

Постановка задачи

Для начала определим, какую информацию мы можем использовать в своих целях.
В приложениях достаточно жёстко заданы предполагаемые типы документов. Будем считать, что никто всерьёз не пытается распознать паспорт приложением для банковских карт или наоборот, а значит нам известны, как минимум, пропорции искомого объекта. Также заметим, что абсолютное большинство мобильных девайсов имеет камеры с фиксированным фокусным расстоянием.
Читать дальше →
Total votes 17: ↑16 and ↓1 +15
Views12.4K
Comments 4

Пропорции в искусстве. Есть ли что-то лучше золотого сечения? Исследование более 1 000 000 старых и современных картин

Wolfram Research corporate blogEntertaining tasksProgrammingMathematicsOpen data
Translation


Перевод поста Майкла Тротта (Michael Trott) "Aspect Ratios in Art: What Is Better Than Being Golden? Being Plastic, Rooted, or Just Rational? Investigating Aspect Ratios of Old vs. Modern Paintings".
Код, приведенный в статье, можно скачать здесь.
Выражаю огромную благодарность Кириллу Гузенко KirillGuzenko за помощь в переводе и подготовке публикации

Содержание


Предисловие: золотое сечение — красивая математическая концепция
Работа Фехнера 1876 года об эстетичности прямоугольников и соотношениях сторон в картинах
Легкий старт: анализ «Artwork» — области базы знаний Wolfram Knowledgebase
Первая часть: особенности вероятностного распределения соотношений сторон
Соотношения сторон для разных веков, жанров и художников
Анализируя пять старых немецких музейных каталогов
Коллекция Кресса: четыре больших PDF файла
У нас представлены коллекции следующих галерей: Метрополитен (Metropolitan), институт искусств Чикаго, Эрмитаж, Национальная Галерея (National Gallery), Рейксмюзеум (Rijks) и Тейт Британия
Исключение в соотношениях сторон: Национальная портретная галерея
Веб-галерея изящных искусств: удобная база данных, готовая к использованию
Примечание II: важность точности в измерениях
WikiArt: еще один крупный веб-ресурс
Коллекция Французского государственного музея
Картины в итальянских церквях: высота есть всё
Смитсоновская коллекция
Большая коллекция картин в Великобритании
Нынешний рынок изящных искусств: рациональней чем когда-либо
Проданные картины: большинство написаны недавно, а у распределения длинный хвост
Восток: все показатели отличаются
Пропорции пакетов, автомобилей, этикеток, логотипов, эмблем, бумаги, банкнот, почтовых марок и фильмов
Продукты из супермаркета
Винные этикетки
Этикетки немецких сортов пива
Логотипы продуктов питания
Банкноты
Размеры автомобилей
Бумажные листы
Марки
Эмблемы команд NCAA (Национальной ассоциации студенческого спорта)
Эмблемы немецких футбольных клубов
Форматы фильмов
Заключение: так какое соотношение самое «лучшее»?
Картины великих мастеров — едва ли не самое прекрасное из человеческого наследия. Ими дорожили и восхищались, бережно хранили и продавали за сотни миллионов долларов, и, возможно, не по случайности они являются главной целью похитителей предметов искусства. Их композиции, цвета, детали, темы могут держать нас в восхищении и внимании часами. Но что можно сказать об отношении их внешних размеров — высоты к ширине?

В 1876 году немецкий ученый Густав Теодор Фехнер изучал человеческое восприятие прямоугольных форм, а после заключил, что прямоугольники с золотой пропорцией (то же, что и золотое сечение) наиболее приятны для человеческого глаза. Чтобы проверить свои экспериментальные наблюдения, Фехнер также проанализировал соотношения более десяти тысяч картин.
Читать дальше...
Total votes 89: ↑83 and ↓6 +77
Views63K
Comments 30

Как программно разметить спутниковую фотографию? Решение задачи Dstl Satellite Imagery Feature Detection

Mail.ru Group corporate blogAlgorithmsImage processingMachine learning


Привет, Хабр! Меня зовут Евгений Некрасов, я программист-исследователь в Mail.Ru Group. Сегодня я расскажу о своем решении соревнования по анализу данных Dstl Satellite Imagery Feature Detection, которое было посвящено сегментации спутниковых изображений. В этом соревновании я использовал относительно простой поход к моделированию и занял 7 место из 419 команд. Под катом — рассказ, как мне это удалось.
Читать дальше →
Total votes 43: ↑43 and ↓0 +43
Views10.3K
Comments 3

Что можно «выжать» из usb-микроскопа

Даджет corporate blogGadgetsPhotographic equipment

Слева — «сырые» кадры с устройства. Справа — обработка.

В этой статье постараюсь добиться максимального качества макроснимка от типичного usb-микроскопа. Такие устройства – не предназначены для получения художественных фотографий. Их задача — позволить быстро и легко рассмотреть мелкие детали предмета. Однако я постараюсь специальными условиями съемки, постобработкой и некоторыми другими способами отчасти нивелировать эти недостатки.

Статья написана «Just for Fun» и по сути является рассказом о пути поиска лучшего результата. Не стоит рассматривать ее как рекомендацию. Если вам нужна хорошая макрофотография — лучше всего воспользоваться для этого специальной аппаратурой.
Читать дальше →
Total votes 22: ↑21 and ↓1 +20
Views26.2K
Comments 30

Microsoft поможет определить не только возраст и пол человека по фотографии, но и его эмоции

Artificial IntelligenceIT-companies


Корпорация Microsoft, запустив в работу сервис, позволяющий определить возраст человека по фотографии, решила идти дальше. Теперь специалисты компании разработали алгоритм, который определяет эмоции человека, изображенного на фотографии. Всего проверка идет по восьми позициям: злость, удовлетворение, отвращение, страх, счастье, нейтральность (читаем — отрешенное выражение лица), грусть, удивление.

Разработчики утверждают, что результаты не слишком точные, но при этом видно, что оценка идет более точная, чем в случае определения возраста. В качестве примера можно взять многим из нас известную фотографию Киану Ривза, сидящего на лавочке и что-то жующего. Microsoft считает, что такая эмоция, как грусть, почти отсутствует на лице актера (0,01831), его выражение лица нейтральное.
Читать дальше →
Total votes 13: ↑11 and ↓2 +9
Views16.5K
Comments 6
1