Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

«Выглядит похоже». Как работает перцептивный хэш

Обработка изображений
Перевод
За последние несколько месяцев несколько человек спросили меня, как работает TinEye и как в принципе работает поиск похожих картинок.

По правде говоря, я не знаю, как работает поисковик TinEye. Он не раскрывает деталей используемого алгоритма(-ов). Но глядя на поисковую выдачу, я могу сделать вывод о работе какой-то формы перцептивного хэш-алгоритма.
Читать дальше →
Всего голосов 149: ↑145 и ↓4 +141
Просмотры102.3K
Комментарии 43

Старт! Первый пост

Digital Cloud Tecnologies
Мы рады приветствовать Хабра жителей!

C большим удовольствием начинаем вести свой блог на одной из лучших IT-площадок РУНЕТА.

image

Мы — молодая, целеустремленная, профессиональная, амбициозная, креативная команда, для которой важно движение только вперед!

На сегодняшний день мы сделали много интересных проектов. У нас есть ряд собственных приложений – мы с удовольствием расскажем как они были разработаны и какие решения в них были применены.

Наши сотрудники активно принимают участие в работе профессиональных сообществ разработчиков, выступают на технических конференциях, проводят тренинги и делятся своими знаниями.

Нашими ключевыми компетенциями являются: WP7, W8, Kinect, Облачные технологии, MS SQL, ASP.NET MVC и Silverlight.

Наша компания поддерживает сообщество разработчиков UNETA (http://uneta.ua) и проводит ежегодную международную конференцию UNETA+.

Среди планируемых тем, которые мы будем освещать — Kinect, WP7, XNA, Silverlight, MS SQL, Windows 8 App., MetroStyle App., Azure, AWS, ASP.NET MVC, HTML5, JavaScript, NOSQL.

Мы уверены, что наше общение на Хабре будет позитивным, интересным и эффективным.

Следите за нашим Хабра-блогом и вы получите море полезной информации.
Всего голосов 27: ↑5 и ↓22 -17
Просмотры1.8K
Комментарии 5

Быстрое сжатие изображений по алгоритму JPEG на CUDA

Высокая производительностьGPGPUОбработка изображений
Краткое содержание: Создан быстрый кодер FVJPEG для сжатия изображений по алгоритму JPEG на видеокартах NVIDIA. Значительное ускорение получено при распараллеливании алгоритма, его реализации и оптимизации с помощью технологии CUDA. По скорости сжатия кодер FVJPEG превосходит все существующие в настоящее время программные и аппаратные решения для компрессии изображений по алгоритму Baseline JPEG.
Читать дальше →
Всего голосов 74: ↑59 и ↓15 +44
Просмотры18.5K
Комментарии 49

Первое украинское приложение на Windows Store

Digital Cloud Tecnologies
28 марта вышло первое приложение, написанное украинскими разработчиками под Windows 8 — Euro Cup 2012. Приложение является первым украинским приложением в Windows Store. Разработчиком приложения стала компания Digital Cloud Technologies.
image
Я являюсь одним из разработчиков этого приложения и хочу рассказать немного о процессе его создания, о проблемах, которые возникали при его выпуске.
Команда состояла из 5 разработчиков под руководством Сергея Лутая — MVP Silverlight, соавтора первой в мире книге по разработке на C# под Windows 8 и Дениса Резника MVP SQL Server.
У разработчиков не было опыта работы с платформой, за исключением курсов, проводимых Майкрософт в Москве, в которых некоторым из нас посчастливилось поучаствовать. Архитектура приложения основана на паттерне MVVM — это нам значительно помогло, но и доставило несколько серьезных проблем.
Читать дальше →
Всего голосов 12: ↑9 и ↓3 +6
Просмотры4.4K
Комментарии 15

Поиск кропнутых дубликатов изображений с помощью перцептуальных хешей

Обработка изображений
В этой статье пойдет речь о том, как решалась небольшая задачка поиска дубликатов по фрагменту или кропу картинки.



Читать дальше →
Всего голосов 129: ↑118 и ↓11 +107
Просмотры67K
Комментарии 39

Изобретаем JPEG

АлгоритмыОбработка изображений
Tutorial

Вы правильно поняли из названия, что это не совсем обычное описание алгоритма JPEG (формат файла я подробно описывал в статье «Декодирование JPEG для чайников»). В первую очередь, выбранный способ подачи материала предполагает, что мы ничего не знаем не только о JPEG, но и о преобразовании Фурье, и кодировании Хаффмана. И вообще, мало что помним из лекций. Просто взяли картинку и стали думать как же ее можно сжать. Поэтому я попытался доступно выразить только суть, но при которой у читателя будет выработано достаточно глубокое и, главное, интуитивное понимание алгоритма. Формулы и математические выкладки — по самому минимуму, только те, которые важны для понимания происходящего.

Знание алгоритма JPEG очень полезно не только для сжатия изображений. В нем используется теория из цифровой обработки сигналов, математического анализа, линейной алгебры, теории информации, в частности, преобразование Фурье, кодирование без потерь и др. Поэтому полученные знания могут пригодиться где угодно.

Если есть желание, то предлагаю пройти те же этапы самостоятельно параллельно со статьей. Проверить, насколько приведенные рассуждения подходят для разных изображений, попытаться внести свои модификации в алгоритм. Это очень интересно. В качестве инструмента могу порекомендовать замечательную связку Python + NumPy + Matplotlib + PIL(Pillow). Почти вся моя работа (в т. ч. графики и анимация), была произведена с помощью них.

Внимание, трафик! Много иллюстраций, графиков и анимаций (~ 10Мб). По иронии судьбы, в статье про JPEG всего 2 изображения с этим форматом из полусотни.
Читать дальше →
Всего голосов 356: ↑354 и ↓2 +352
Просмотры152K
Комментарии 70

Распознавание речи для чайников

ПрограммированиеАлгоритмы
Tutorial

В этой статье я хочу рассмотреть основы такой интереснейшей области разработки ПО как Распознавание Речи. Экспертом в данной теме я, естественно, не являюсь, поэтому мой рассказ будет изобиловать неточностями, ошибками и разочарованиями. Тем не менее, главной целью моего «труда», как можно понять из названия, является не профессиональный разбор проблемы, а описание базовых понятий, проблем и их решений. В общем, прошу всех заинтересовавшихся пожаловать под кат!

Читать дальше →
Всего голосов 71: ↑61 и ↓10 +51
Просмотры150.2K
Комментарии 20

Как бороться с репостами или пара слов о перцептивных хешах

ПрограммированиеОбработка изображений
Из песочницы
В этой публикации речь пойдет о подходах к построению перцептивный хешей изображения и возможностях их использования (например, поиск дубликатов).

перцептивный хэш-алгоритмы описывают класс функций для генерации сравнимых хэшей. Они используют различные свойства изображения для построения индивидуального «отпечатка». В дальнейшем эти «отпечатки» можно сравнивать друг с другом.

Если хэши отличаются, значит, данные разные. Если хэши совпадают, то данные, скорее всего, одинаковые (поскольку существует вероятность коллизий, то одинаковые хэши не гарантируют совпадения данных). В этой статье речь пойдет о нескольких популярных методах построения перцептивный хешей изображения, а также о простом способе борьбы с коллизиями. Всем кому интересно, прошу под кат.
Читать дальше →
Всего голосов 55: ↑54 и ↓1 +53
Просмотры27K
Комментарии 26

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF

Работа с видеоАлгоритмыОбработка изображений
Перевод


Автор: Monty (monty@xiph.org, cmontgomery@mozilla.com). Опубликовано 28 июня 2018 года.

Если кто не читал предыдущую статью… AV1 — это новый универсальный видеокодек, разработанный Альянсом за открытые медиа (Alliance for Open Media). Альянс взял за основу кодек VPX от Google, Thor от Cisco и Daala от Mozilla/Xiph.Org. Кодек AV1 превосходит по производительности VP9 и HEVC, что делает его кодеком не завтрашнего, а послезавтрашнего дня. Формат AV1 свободен от любых роялти и навсегда останется таковым с разрешительной лицензией.

Эта статья задумывалась как вторая в серии статей, которые подробно описывают функциональность AV1 и новых технологий, которые лежат в его основе и впервые используются в продакшне. Предыдущая статья на Xiph.org объясняла функцию прогнозирования яркости Chroma from Luma (CfL). Сегодня мы расскажем об ограниченном направленном корректирующем фильтр (Constrained Directional Enhancement Filter). Если вы всегда задавались вопросом, что нужно для написания кодека, пристегните ремни и приготовьтесь к образованию!
Читать дальше →
Всего голосов 14: ↑14 и ↓0 +14
Просмотры8.9K
Комментарии 3

Исследование многократного перезалива JPEG

АлгоритмыОбработка изображений
Tutorial

В VK есть группа со следующим описанием:


Одна и та же фотография каждый день вручную сохраняется на компьютер и снова заливается, постепенно теряя в качестве.

Слева исходная картинка, загруженная 7 июня 2012, справа — какая она сейчас.


КДПВ


Видео

Такая разница очень подозрительна. Попробуем разобраться, что происходило в течение этих 7 лет. Для ознакомления есть статья на Медузе про эту группу, но нас будет интересовать только техническая сторона.

Читать дальше →
Всего голосов 219: ↑213 и ↓6 +207
Просмотры111.3K
Комментарии 99