RolexStrider 28 янв 2013 в 14:09

Решение MintEye CAPTCHA в 31 строку кода, даже не открывая картинку

4 мин

42K

Java *Алгоритмы *

Из песочницы

+127

Комментарии 44

Davidov 28 янв 2013 в 14:17

А можете показать пару графиков изменения «реального» размера файла? Ну или количества нулей, что то же самое.

RolexStrider 28 янв 2013 в 14:43

Пожалуйста, вот график изменения количества нулей между картинками — Math.abs(delta), для капчи с футболистами из заголовка. Правильная картинка, очевидно, 15-я.

НЛО прилетело и опубликовало эту надпись здесь

RolexStrider 28 янв 2013 в 15:15

Можно, я его и хотел было вставить, но какой-то он… мммм… неприличный, что ли выходит:

+27

НЛО прилетело и опубликовало эту надпись здесь

Shiz 28 янв 2013 в 15:20

смешной комментарий про график

-6

SegaZero 28 янв 2013 в 20:39

поучительный комментарий про карму

-10

SegaZero 6 фев 2013 в 17:08

-1

НЛО прилетело и опубликовало эту надпись здесь

Weageoo 29 янв 2013 в 05:55

«Решение MintEye CAPTCHA без кода, китайцами»

Rastishka 28 янв 2013 в 14:42

Странно, я думал что наоборот сильно скрученная картинка (левая картинка из первой тройки) имеет больше плотность переходов между «кольцами» спирали => имеет больше градиентов => больше размер => меньше нулей в конце.

Или имеется ввиду сравнение количества нулей в последовательно идущих искаженных изображений?

RolexStrider 28 янв 2013 в 14:44

Именно, между двумя последовательными.

Rastishka 28 янв 2013 в 14:46

Да, по графику выше теперь все понятно. Хотя я все равно думал что крайние слева и справа столбцы должны быть выше центрального…

iCoderXXI 15 фев 2013 в 06:17

Не вдавался в нюансы формата JPG, но если в заголовке там указывается «размер тела», то не обязательно концовку нулями заполнять, можно просто мусором. Хотя если есть размер тела в заголовке, то нули в конце не обязательно подсчитывать. Можно просто размеры тела сравнивать.

FZambia 28 янв 2013 в 14:44

Спасибо! А вот тут автор уложился в 23 строки

-18

DjPhoeniX 28 янв 2013 в 14:49

Уже на хабре.

НЛО прилетело и опубликовало эту надпись здесь

RolexStrider 28 янв 2013 в 14:51

Да, но используя при этом numpy и OpenCV.

Error_403_Forbidden 28 янв 2013 в 15:22

с вероятностью практически 100% будут иметь различный размер в байтах

Вообще-то, если говорить строго, то есть вероятность больше нуля, что размеры изображения будут совпадать с точностью до байта. Даже если разброс в размерах JPEG-изображений одинакового размера будет колебаться от 1Кб до 1000Кб, то вероятность того, что следующая картинка будет такого же размера, что и предыдущая равна 1/1000. Что не так уж и мало.
А чем меньше изображение, тем этот разброс в размерах в байтах будет меньше.

-6

gasya 28 янв 2013 в 15:27

Вы такой умный.

-2

gasya 29 янв 2013 в 00:27

Для тех, кто не заценил мой острый комментарий:

а) то, что с некоторой вероятностью размеры могут и совпасть — очевидно, и нет большой заслуги в том, чтобы явно указывать на это.

б) то, что для разброса в n байт вероятность совпадения 1/n в общем случае не верно. Предположение о равномерном распределении ничем не подкреплено, и, как минимум, интуитивно понятно, что оно неверное. С таким же успехом можно утверждать, что вероятность совпадения 1/2 — ведь либо совпали, либо не совпали.

Так что не стоит оперировать понятиями теории вероятностей, не будучи знакомым с ней в какой-то минимальной степени.

Принимая во внимание два вышеуказанных тезиса, смело заявляю, что комментарий Error_403_Forbidden не содержательный, а частично и вовсе содержит неверные утверждения.

Error_403_Forbidden 29 янв 2013 в 01:15

Вы такой умный.

gasya 29 янв 2013 в 03:12

Знаю =)

НЛО прилетело и опубликовало эту надпись здесь

samodum 28 янв 2013 в 16:01

Да, это так. Для примера — обе jpg-картинки имеют одинаковый размер и весят по 20304 байт каждая:

RolexStrider 28 янв 2013 в 16:20

Интересно, интересно… Правда сжаты они в Lossless-режиме, в хедере у обоих картинок: «CREATOR: gd-jpeg v1.0 (using IJG JPEG v80), quality = 100».
Но странно, почему после Хаффмана они все еще совпадают байт-в-байт? Впрочем, к этим картинкам подход совершенно другой нужен.

samodum 28 янв 2013 в 16:35

Ничего странного нет. Обе картинки состоят из разных данных и после сжатия их размер непредсказуем. А раз так, то ничто не мешает им случайно совпасть.
Скажем, приведённые выше изображения в данном размере, таких же примерно насыщенности деталями и степени сжатия, будут примерно в пределах от 5000 байт до, например, 35000 байт.
Получается, что уникальных по объёму изображений может быть только 30000. Ведь и миллион таких картинок будет укладываться в этот диапазон объёма. Иначе были бы мегабайтные картинки, что невозможно при данных условиях сжатия JPEG.

masai 28 янв 2013 в 20:26

Более того, у некоторых алгоритмов сжатия (того же JPEG2000) можно кодеку прямо указать, сколько байт нужно получить на выходе.

Alexufo 29 янв 2013 в 01:32

Да и так как бе, тоже можно. Но байт в байт сомневаюсь.

RolexStrider 29 янв 2013 в 01:35

А разве это 2000?

Alexufo 29 янв 2013 в 01:37

Ну я потому так и пишу: как бы можно и с обычным jpg.

RolexStrider 29 янв 2013 в 01:39

О, у JPEG2000 совсем другая, отдельная, очень интересная, достойная отдельного поста алгоритмическая база: вейвлеты.

masai 29 янв 2013 в 13:32

Ну, сжатием-то не вейвлеты сами по себе занимаются.

TiGR 28 янв 2013 в 15:38

Значит, нужно добавлять шум во все картинки. Это может помочь.

eugenius_nsk 28 янв 2013 в 17:43

Или наоборот слегка размывать — основную побольше, остальные поменьше.

Alexufo 29 янв 2013 в 01:40

Или просто в лосслесс выводить в bmp) Или его можно сжать в jpg и прогнать алгоритмом автора?)

RolexStrider 29 янв 2013 в 01:51

Безусловно, может. А тогда мы берем «Решение MintEye CAPTCHA в 23 строки кода» на Python.

ayakovlev 28 янв 2013 в 16:14

Им нужно доработать алгоритм так, чтобы сжатие было с возрастающим «к краям гистограммы» уровнем качества. Тогда результирующий размер будет выравниваться и такой статистический подход перестанет работать.

UncleAndy 28 янв 2013 в 17:00

А почему нельзя концы картинок заполнить не нулями, а рандомным содержимым? Причем, разным у образца и у той картинки которая в списке.

RolexStrider 28 янв 2013 в 17:12

Это не помогло бы: реальную длину JPEG-файла весьма несложно получить из служебной информации в заголовке.

UncleAndy 28 янв 2013 в 17:23

Да, верно. Не сообразил.

Fil 28 янв 2013 в 21:29

...«блок кодирования» — это линейный массив из 64 байт, получаеый из блока изображения размером 8x8 пикселов путем обхода его по вот такой хитрой траектории, напоминающей «змейку»;
К «блокам кодирования» применяется дискретное косинусное преобразование...

Вы видимо решили, что к линейному массиву применяется DCT-II с N = 64? Нет, на самом деле, матрица 8x8 исходных значений (Y, Cb или Cr), подвергается DCT-II с N = 8 сначала по всем строкам (итого 8 раз DCT), а затем, по полученным коэффициэнтам еще 8 раз, но по столбцам. Можно наоборот, сначала по столбцам, затем по строкам, результат будет тот же.

Короче, у вас перепутаны этапы кодирования. Сначала блок 8x8 подвергается ДКП, результатом которого является матрица коэффициэнтов. Левое верхнее значение — самый значащий коэффициэнт — DC. И чем дальше от этого значения, тем более высокочастотны и менее значащи коэффициэнты. Затем квантование этой матрицы (вообще, там нет никакого порога, значения матрицы умножают на значения матрицы квантования) И поэтому, именно эти коэффициэнты, а не сами исходные значения, записывают в зигзагообразном порядке, чтобы обойти сначала более, а затем менее значащие. А длинный хвост обнуленных значений кодируется очень хорошо :)

Ну и справедливости ради отмечу, что согласно спецификации, преобразование в YCbCr не обязательно. Downsampling выполняется не всегда, и не обязательно 1:2. А вот разбиение на блоки именно 8x8 заданы спецификацией.

RolexStrider 29 янв 2013 в 02:11

Абсолютно согласен. Просто, с одной стороны, не хотелось перегружать пост столь тонкими техническими подробностями, а с другой стороны — хотелось сохранить относительную легкость понимания не скатываясь в откровенную профанацию.

Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Решение MintEye CAPTCHA в 31 строку кода, даже не открывая картинку

Комментарии 44

Публикации

Истории