tw_community 25 мар 2021 в 19:06

Как воссоздать изображение всего по нескольким пикселям

7 мин

20K

Блог компании Timeweb CloudПрограммирование*Машинное обучение*

Туториал

Перевод

+64

Комментарии 41

IgorPie 25 мар 2021 в 19:45

Нематематику — сложновато такое понять.
А просто интерполяцией в лоб нельзя такое сделать? Например, интерполяция по строкам, потом по столбцам, потом взять среднее арифметическое? Мы же не уверены, что пиксели сенсора вышли из строя равномерно, или же по нормальному распределению вероятностей.

lizarge 25 мар 2021 в 19:48

с таким же успехом можно бахнуть блюром по кадру с 10% информации

alliumnsk 7 апр 2021 в 09:53

Зачем блюром, если есть nearest-neighbor? И таки для справедливости автору (оригинала) следовало бы выложить. Я посчитал этот пример по кусочку 226х226 предоставляемых автором (оригинальый испорченный 512х512 найти не удалось).

Результат фурье-обработки, конечно лучше, но автор таки слегка кривит, не показывая простые методы.

Draku1a 30 мар 2021 в 18:55

Для нематиматиков — в статье есть картинки))

Refridgerator 31 мар 2021 в 05:29

Сможете по этим картинкам написать код?

Draku1a 1 апр 2021 в 09:09

Код написать и после прочтения статьи (с формулами) — не смогу, наверное. Но для понимания сути достаточно основного правила чтения научных работ: «Если встречается незнакомый термин (или формула) — пропустить его, суть содержимого от этого не меняется» + часто, смысл термина становится понятен по контексту.

Refridgerator 1 апр 2021 в 10:08

Это не понимание сути — это иллюзия понимания. Если знание нельзя проверить на практике, то как узнать, правильно вы что-то поняли или нет? Без практики такое знание мало чем отличается от астрологии, божественных откровений и прочего аналогичного.

Draku1a 3 апр 2021 в 04:54

Применять знания на практике будут математики, которые хорошо понимают суть каждой формулы. Математики же — могут как повторить эксперимент, так и оспорить его. А ещё будут физики — которые посмотрят, скажут «хм, вроде интересно, но пока мне это не нужно — в детали вдаваться не буду».
Для остальных будет понятно — что математики владеют некой магией вычислений. И да, некоторые, скорее всего, поставят в один ряд с астрологами, нумерологами и прочей нечистью.

Refridgerator 3 апр 2021 в 08:09

Математики применять на практике будут далеко не всегда, потому что программировать не умеют (за очень, очень редким исключением) и им это вообще не интересно. Им даже окончательное решение не всегда интересно находить — достаточно просто доказать, что оно существует. При написании статей они также любят злоупотреблять переусложением и опускать «очевидные» вещи — потому что пишут их для других математиков, а не для программистов.

За примерами далеко ходить не надо — существуют множество статей, посвящённых быстрым преобразованиям Фурье (и я прочитал их все) — однако вы не найдёте такого же многообразия реализованных алгоритмов в коде. Тот же Prime Factor вы сможете найти только на фортране и с ограничением по длине массива в 720720, потому что факторизация дальше 16 в нём не рассматривается. А если посмотреть код и сравнить его с описанием из википедии — то внезапно окажется что общего между ними ровно ноль и как в нём добавить ещё один уровень факторизации неочевидно никому, в том числе и другому математику (кроме того, который этот код и написал). Вот к слову, пруф — только для другого алгоритма, также портированного из фортрана.

Pro-invader 25 мар 2021 в 20:43

Это просто магия кака-то, потрясающе!

Tyusha 26 мар 2021 в 00:34

Я поняла так. Мы делаем априорное предположение, что фурье-образ исходной 100-процентной картинки имеет вид колокола с максимум в нуле (что выполняется для всех "обычных" фотографий, см.ниже). Далее находим такой колокол, который наилучшим образом приближает фурье-образ 10-процентного изображения. Обратное FFT, и вуаля.

Подозреваю, этот алгоритм может конкретно подглючить на каком-нибудь изображении, содержащем периодическую структуру, например ту же девушку на фоне обоев с периодическим орнаментом

SADKO 26 мар 2021 в 13:19

И да, и нет, всё зависит от нюансов реализации.
За кадром в этой статье осталась чувствительность к случайности распределения разряжения. Так что глючить оно может и без обоев, а может и наоборот с обоями не глючить.
Подобно киноплёнке не грешащей муаром.

basilbasilbasil 26 мар 2021 в 04:32

А если живые пиксели расположены в одном углу?

Utopia 26 мар 2021 в 04:36

— хрррр сказала пила,
— … сказали рабочие

+13

Schokn-Itrch 26 мар 2021 в 05:13

Некорректно показывать исходное рядом с воссозданным. «Смотрите, нам почти удалось!» Самовосхваление и не более того.

Показывать нужно «поврежденное» и «восстановленное», а потом выборку людей которые считают «воссозданное» нормальным. И только после обработки выборки показать людям результат опроса, а потом уже продемонстрировать оригинал.

Но «все всегда наоборот». Идея-подгонка-пиар-выбивание бабла.

-13

VDG 27 мар 2021 в 04:39

Повреждённое показано в начале статьи.

Refridgerator 26 мар 2021 в 05:58

Выглядит очень похоже на метод наименьших квадратов.

akokarev 26 мар 2021 в 08:45

Интересно, можно ли нормальное фото, скажем в 4K разрешении, улучшить таким способом до 8К разрешения?
Улучшить фото природы, фото человека, кадр мультфильма, фото звездного неба. Сравнить результаты.

Mort 26 мар 2021 в 16:56

Так тут же нет «улучшения» как такового

Ktator 26 мар 2021 в 19:43

Ну, Nvidia DLSS примерно так и делает.

dmbreaker 27 мар 2021 в 21:47

Вообще не так

НЛО прилетело и опубликовало эту надпись здесь

alliumnsk 9 апр 2021 в 16:16

Увы, нет, с камерами наблюдения это не поможет. Там нужно ответить на вопрос "кто преступник". Нейросеть может нарисовать сколь угодно четкое, но гарантий что там будет что-то реальное, никаких нет. Зарихтовать источники шума с известным распределением или сделать деконволюцию можно, а из 1 пикселя уже ничего нельзя.

imageman 9 апр 2021 в 13:51

Да, увеличивают. Но другими методами.
habr.com/ru/search/?q=%5BSuper%20Resolution%5D&target_type=posts

Одну из реализаций (waifu2x-caffe) я пробовал. Если не придираться — нормально. Если рассматривать внимательнее, то видно, что результат отличается от реальности (я смотрел на мелкую текстуру — увеличение получается «синтетическим»).

eugeneb0 26 мар 2021 в 09:28

А ведь это — способ копировать видео пересъёмкой с экрана. Там тоже теряется эдак процентов 50 сигнала, но если сделать правильные предположения об исходном базисе сигнала, то, кажется, можно его восстановить почти до исходного уровня. *Задумался*…

AndrewSu 26 мар 2021 в 10:18

На самом деле есть много методов восстановления изображения по разреженным данным. И как отметила Tyusha у разных методов могут проявиться интересные особенности на определённых данных. Было бы интересно именно сравнение. Сравнение исходного и восстановленного изображения по какой-либо общеупотребительной метрике. Сравнение методов между собой.

egretos 26 мар 2021 в 20:22

Отсюда вытекает идея, что можно автоматизировать сравнение. Допустим взять 100 методов, отобрать самые близкие по результатам и наложить. *Сильно задумался*…

Tyusha 27 мар 2021 в 09:24

Тут мы упирается в определение, что есть "изображение". Прямоугольник со случайными пикселями это изображение или нет? Поэтому, о чём я и писала, алгоритм ограничивает класс изображений, которые он восстанавливает.

НЛО прилетело и опубликовало эту надпись здесь

Refridgerator 7 апр 2021 в 10:27

Если авторы не лукавят, то код из статьи на языке Julia должен быть полностью рабочим. Значит, можно установить Julia и попробовать. Выбор Julia вместо матлаба, питона и пр. наверняка обусловлен тем, что авторы считают его самым лучшим выбором для мат. вычислений и ненавязчиво рекомендуют убедиться в этом лично.

mctMaks 26 мар 2021 в 16:10

так вот как в фильмах увеличивая изображение с уличной камеры на банкомате в миллион раз получают фото сверхвысокой детализации. надо ж, оказывается не все киношники выдумывают.
во истину математика творит чудеса…

barbos98 26 мар 2021 в 18:03

Множество всех возможных изображений 2 на 2 с цветами, закодированными одним битом>
Как мне кажется, должно быть 16 комбинаций (xy)^количество_цветов=(22)^2
навскидку пропущена нижняя полосаб белое поле тоже имеет право на жизнь.

JohnDidact 14 апр 2021 в 23:19

Там их и так 16… Или это исправили?

Videoman 26 мар 2021 в 18:10

Что-то здесь не так. Очевидно что у этого метода должны быть очень сильные ограничения, даже с учетом перечисленных условий в частотной составляющей. Берем простой пример: допустим у нас в 10% попали только белые точки. Ну и что мы восстановим в этом случае?
Например, имея только 10% мы можем попытаться восстановить все остальные используя те или иные модели сигнала. Далеко ходить не нужно, всё сжатие изображении и видео на этом основано и мы прекрасно видим что такой подход работает и какие артефакты при этом появляются. И что в этом нового?

dmbreaker 27 мар 2021 в 23:55

Занимательный способ сказать: "jpeg занимает меньше места, чем bmp"

OnvogSGN 28 мар 2021 в 15:35

Мы знаем какие пиксели пропали, а какие нет?

klementiev 28 мар 2021 в 18:43

Подскажите пожалуйста как вы сделали преобразование Фурье для изображения. У нас, например, есть 4 пиксела, как для них посчитать амплитуду преобразования Фурье?