Как стать автором
Обновить

Комментарии 38

Интересно, конечно, но описываемые в статье методы самые базовые, и появились и использовались задолго до H.264, в MPEG-2, например.
Соглашусь, большинство описанного не относится только к H.264 и поэтому может стоило назвать статью по другому, но оставим это на совести автора, сама статья мне показалась полезной.
Классная статья, спасибо за перевод!
Это всё здорово, но стандарту уже больше 10 лет. И о самом стандарте сказано мало.
Лучше расскажите про магию плагинов к AviSynth'у ლ(ಠ益ಠლ)
H.264, насколько я понимаю, увешан патентами, как новогодняя елка — игрушками?
А кроме гугловского Webm есть еще конкуренты?
WebM не гугловский, WebM — контейнер, упрощенный Matroska до такой степени, что в него можно добавить только VP8/9, Vorbis/Opus, WebVTT-дорожки.

Вы, видимо, VP8/9 имели ввиду. Реальных конкурентов пока нет. Разрабатывается AOMedia Video 1.
Прошу прощения, конечно же VP8,9
Если брать разрабатываемые кодеки, то можно ещё упомянуть Daala. К тому же, самым что ни на есть реальным конкурентом для H.264 является H.265 (HEVC).
Вы неправы, H.265 не конкурент AVC, это скорее его потомок, он принадлежит той же MPEGLA. А вот конкурентом будет VP9, а так же VP10, который будет заменен AV1
https://en.wikipedia.org/wiki/AOMedia_Video_1
Свободный кодек, который пилял гугл, циска, мозилла, amd, nvidia, да куча уже участников. У мпеглы появится свободный конкурент)
почему вы решили, что патенты, которые держит mpegla не покрывают vp9 или av1?
Я ничего не решил, это будут эксперты по патентам решать. Но авторы хотят, чтобы пересечений не было.
я бы рекомендовал не распространять гугловый миф о том, что у mpegla нет патентов, затрагивающих vpN.

H264 как раз открытый кодек с хорошим открытым описанием в отличие от гугловых ранних поделочек.
Почему H.264, с потерями сравнивается со сжатием без потерь в PNG, а не с «аналогичным» JPEG?
Я думаю, смысл заключался как раз в демонстрации контраста размера данных между сжатыми с потерями и исходными.
Тогда почему не BMP, к примеру?
Можно было сравнить и с ним, тогда контраст был бы ещё нагляднее
НЛО прилетело и опубликовало эту надпись здесь
В чём заключается оптимизация? Индексированные цвета?
НЛО прилетело и опубликовало эту надпись здесь

А с помощью каких алгоритмов h.265 (HEVC) добивается лучших результатов сжатия?

не стоит поднимать эту тему…
Там вроде как технические мелочи типа другой упаковки макроблоков.
Только надо понимать, что мы так долго ждали появления новых способов кодирования видео не потому, что теория кодирования активно развивается последние годы, а потому что производительность процессоров подросла и они могут выполнять более изощрённые алгоритмы декодирования в реальном времени. Следующий шаг, наверное, это отказ от декодирования на стороне процессора с прицелом только на видеоускорители. Они и сейчас способны декодировать видео, но алгоритм достаточно прост, чтобы на компьютере без видеоускорителя процессор мог справится сам, пусть и загруженный почти на полную. Формат будущего, возможно, будет настолько сложен, что даже процессор ПК не будет способен своевременно его обрабатывать.

Квантованием называется как раз урезание пространства — вместо чисел 1,2,3,4 мы храним числа 2,2,4,4. Картинка от такого портится слишком заметно. Именно поэтому квантование применяется в частотной области.

Сам показанный алгоритм примитивен и не показывает отличий h264 от предшественников.

Вообще если говорить про встраиваемые системы или планшеты/телефоны, то там все делается исключительно аппаратными кодерами, обычное ядро захлебнулось бы.

У меня и ноутбук старенький (AMD E-350) не может даже WXGA декодировать на лету.
> PNG скриншот главной страницы 1015 Кб
> 5 секунд H.264 видео при 60 fps той же страницы 175 Кб

Так вы же не то сравниваете. Сравнивать надо jpeg с h264.

Другой вопрос в том, что i-frame в h264 может выйти меньше чем jpeg при прочих примерно равных.
Во первых, сравниваю не я, а автор оригинальной статьи. А во вторых, я уже предположил почему автор выбрал PNG, а не JPEG выше.
Такой процесс сжатия с потерями называется Квантованием

Про квантование в статье ни слова не сказано, на самом деле.

Спасибо за статью, очень интересно было почитать. Спасибо!
И всё-таки frequency domain по русски — это «частотная область»
Возможно. Я перевёл это полагаясь на русскоязычную статью в википедии
Переводчик гуманитарий, понятно.
Приведённая вами статья в википедии вообще не про то. Правильная статья, раздел «применение». Впрочем, вики, как обычно, безграмотна, и использует неизвестный науке термин «частотное пространство» (46 запросов в месяц по вордстату, что в 30 раз реже «частотной области»).
Прошу прощения конечно, но не надо говорить о том, чего не знаете (о моём образовании имею ввиду)
Соглашусь, что в данном контексте пространство(область) подходит больше. Ошибся, бывает, но это не значит что можно делать преждевременные выводы.
неизвестный науке термин «частотное пространство»

Это необоснованное обобщенное утверждение. Не беритесь говорить за всю науку.
И потом, со смысловой точки зрения «частотное пространство» точнее «частотной области». Частотная область это, например, от 10 до 50 КГц, понимаете, да? Это некоторая область частот в частотном пространстве. Вы, вероятно, сможете привести в пример какой-нибудь советский талмуд с «областями», но лично я не сторонник подерживать традиционные семантические ошибки.

А вот где переводчик ошибся, так это в расстановке точек после единиц веса.
Сколько было статей на Хабре про энтропию, читал и в Вики и в Сети, никак не мог понять. А теперь… Я правильно понимаю, что энтропия — это всего лишь
минимальное количество единиц, которое нужно использовать, чтобы представить все элементы данных.
?
Не совсем. Термин энтропия используется в разных областях, если обобщить, то это мера неопределённости и хаотичности в соответсвующих областях. Но в статье идёт речь только об информационной энтропии
На пальцах лучше так: количество информации (в сообщении, файле и т.д.) равно длине архива, сделанного из этого сообщения/файла/… неким идеальным архиватором. Измеряется в битах, байтах и т.д.
Энтропия — это мера неопределённости ваших знаний о некотором объекте или системе, т.е. объём информации, которую вы не знаете. Прочтение сообщения с количеством информации N bit уменьшает энтропию (ваше незнание) на эти же N bit. Соответственно, энтропия объекта/системы равна количеству информации (длине заархивированного сообщения), полностью описывающей его/её состояние.

Спасибо за перевод.
4 раза перечитывал книгу Методы сжатия данных в бумажном варианте еще в универе. Некоторые алгоритмы очень изящны и красивы. Очень рекомендую всем интересующимся.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории