Как стать автором
Обновить

Комментарии 24

Пометили бы статью «перевод», написали бы комментарий от переводчика что автор перепутал lossless и lossy, была бы зачетная статья для Хабра

www.haaretz.com/israel-news/tech-news/.premium-the-man-who-actually-made-the-world-a-better-place-with-data-compression-1.9497904

You’ve probably never heard of him, but you have certainly used technology based on his mathematical inventions — most famously lossless compression of data which enables us to use files like PDF, GIF, MP3 and countless others.


(есть вообще какие-то санкции для тех кто не оформляет посты-переводы как перевод? хотя это корп блог. им всё можно.)

Лично мне не мешает, что статья — перевод. Главное, чтобы читалось хорошо.

Проблема не в самом переводе, а оформлении — как минимум некрасиво выдавать переводы за свои статьи.

У меня есть подозрение, что в сжатии с потерями используют в том числе алгоритмы сжатия без потерь на каких-то этапах.

Да, коэф-ты после FFT (что в MP3 что в JPEG) квантуются и ужимаются методом Хаффмана, но не LZW.
так в мп3 потери не от сжатия, там просто отбрасывается то что человеческое ухо не слышит а остальное сжимается уже без потерь

А в жпеге потери тоже не от сжатия, там просто дискретным косинусоидальным преобразованием отбрасывается всё то, что человеческий глаз не слышит, а остальное сжимается уже без потерь? :-)

Да, остальное сжимается без потерь.
Полученные коэффициенты после ДКП квантуются (вот тут как раз потери возникают) и потом сжимаются методом Хаффмана (который lossless) и укладываются в файл.

Тут вопрос терминологии, в таком случае надо делать ремарку отделять понятия "кодек" и "компрессор", тогда да — можно сказать, что в кодеке мп3 из-за именно компрессии потерь не возникает. Иначе исходный коммент звучит слегка нелепо.


Понятно, что в основе многих систем сжатия с потерями будет лежать сжатие без потерь на каком-то этапе — просто потому что раз уж жмём, почему бы и не дожать, раз уж можем.

Кодек — это сокращение от кодер/декодер, компрессор это и есть кодер.
Сжатие достигается путем отбрасывания младших бит у коэффициентов ДКП высокочастотных составляющих + дополнительное уменьшение числа бит на коф-т за счет кодирования методом Хаффмана (арифметическое сжатие).
Сжатие достигается путем отбрасывания младших бит у коэффициентов ДКП высокочастотных составляющих


Сначала режут высокочастотные компоненты преобразования ДКП, а потом квантуют низкочастотные. Грубо говоря, из 64 коэффициентов ДКП преобразования 8х8 оставляют 5-6, остальные обнуляют. Потом оставшиеся 5-6 квантуют. После квантования бинаризация строк, затем уже сжатие бинарных строк без потерь различными методами: это может быть и алгоритм Хаффмана, а может быть и простое Run-Length кодирование.

Арифметическое сжатие — это уже другой, более сложный алгоритм. Применяется начиная с H.264.

Для преобразования двумерной матрицы коэффициентов в одномерную используют порядок обхода зигзагом (см. логотип ffmpeg).
Очень просто: при переводе предложение было ужато и там потерялась немного информации.
Он пришел в футболке с надписью «Пришел, увидел, купил»

вот ведь… тролль ))))
Уже почти 30 лет минуло, как я реализовывал LZW на C (генерация сжатого TIFF для первого отечественного слайд-сканера). Алгорит простой и элегантный. Спасибо дедам!
Вот я придумал (изобрел?) алгоритмы улучшения качества прогноза на текстовых данных (та же суть, что GPT, но без нейронных сетей). Может некторые из них уже где-нибудь и обсуждались, но не суть. Интересно, что мне нужно сделать, что бы их запатентовать? Если я их просто на хабре опишу, то их просто начнут другие использовать, а обо мне даже не вспомнят.

Пробуйте обратиться в патентное бюро. Но вообще если вы выкладываете в открытый доступ с нужной лицензией, то украсть это сложно.

Предполагаю, что с одной стороны при этом будет много бумажной волокиты, которую под силам разгрести только опытным юристам или тем кто с университетских кругов общается с такими бюро и имеет там знакомства. Как минимум нужно быть где-нибудь рядом с таким бюро, занимающимся именно таким направлением, а не по электронной или почтовой переписке это делать.

А с другой стороны, это существенно не простое взаимодействие разных алгоритмов, и будут ли там вникать в такие сложности? В общем, думаю что при этом просто потону в разбирательствах и до регистрации не дойдет, а описания где-нибудь останутся.
Родоначальником методов сжатия данных без потерь был Дэвид Хаффман
Должно быть, Зив сказочно богат? Увы, нет.
А разве должен быть сказочно богат? Извините, а за что?
Аналогия: найдите того кто решил квадратное уравнение и сделайте его сказочно богатым.

При этом премии у Зива имеются, к каждой премии идут гонорары, иногда приличные иногда так себе.
Премия Израиля… 75 тысяч шекелей
Медаль Ричарда Хэмминга… хз
Премия Маркони… 100 тысяч долларов США
Фонд Эдуарда Рейна
Премия за фундаментальные исследования. Гонорар 25 тысяч евро.
Технологическая премия. Гонорар 30 тысяч евро.
Культурная премия. Гонорар 10 тысяч евро.
Премия Шеннона… хз
Премия Париса Канеллакиса… $10 тыс.
Ротшильдовская премия… хз
BBVA Foundation Frontiers of Knowledge Awards… 400 тыс. евро
Медаль почёта IEEE… хз

там где стоит «хз» — сходу ценник найти не удалось, ищите сами кому не лень
однако же поверхностное нагугленное позволяет сходу оценить масштаб «трагдии» этого наибеднейшего деда ибо ага, похоже он совсем чютка так и не дотянул до нобелевских сумм, какое горе!!! очень жаль бедного дедушку, ну очень жаль
можно зарабатывать моного денег, но при этом не быть богатым. пропивать, например :) или вести научную/благотворительную деятельность «на свои».
Зато дед — уважаемый человек с большой семьёй, позитивно вошедший в историю.
«Ну до чего ж на нашего Буншу Ланового похож!» к/ф «Иван Васильевич меняет профессию».
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.