nidalee Apr 24 2019 at 20:06

Увеличение видео 1080P до 4K, или Как я научился не волноваться и полюбил апскейл с помощью нейросетей

27 min

185K

Working with video*Machine learning*Artificial Intelligence

Tutorial

+34

Comments 29

AngReload Apr 24 2019 at 21:17

Стоит ли поменять модель waifu2x на другую? CUnet?

Я пользую только CUnet. Гораздо лучше чем другие методы в waifu: выше чёткость, больше деталей, лучше удаление артефактов. Плюс включена опция TTA, хоть и жутко медленно, но чуть качественней.
Опция удаления артефактов даже на первом уровне настройки — очень сильная, годится лишь для аниме/комиксов, для нормальных фоток не применимо т.к. удаляет слишком много деталей, только для пережатых в хлам.
Ну и размытость, если она присутствует на исходнике, waifu не устраняет. И текстуры не дорисовывает. По моему так и должно быть. Вообще, это инструмент не для фоток и видосов, а для анимешных картинок.

nidalee Apr 24 2019 at 21:24

Пару месяцев назад я тестировал оба, и решил, что UpResNet10 выглядит лучше. Надо будет перепроверить, спасибо за отзыв.

Плюс включена опция TTA, хоть и жутко медленно, но чуть качественней.

Да, эта опция на самом деле не стоит того времени, что добавляет к времени обработки.

Опция удаления артефактов даже на первом уровне настройки — очень сильная, годится лишь для аниме/комиксов, для нормальных фоток не применимо т.к. удаляет слишком много деталей, только для пережатых в хлам.

Если я правильно помню, то этот шумодав рассчитан на удаление шумов сжатия JPEG, поэтому может странно работать с кадрами, где их нет в принципе, например — кадрами из видео. Кроме того, не совсем понятно, что делает «Авто-убрать шум», и как работает с видео. Изучу этот вопрос перед следующей статьей.

Ну и размытость, если она присутствует на исходнике, waifu не устраняет. И текстуры не дорисовывает. По моему так и должно быть.

Я тоже так думал до Topaz, теперь уже и не знаю…

Tzimie Apr 24 2019 at 21:53

Я не понимаю вот чего, если каждый кадр обрабатывается независимо, то возможна их нестыковка во времени, например, на кадрах 1 2 3 6 7 нейросеть решает дорисовать тень, а на 4 5 — нет.

nidalee Apr 24 2019 at 22:00

Теоретически — да, на практике я такого пока не встречал. Есть некоторые артефакты, которые ИИ может усилить. Например, в видео YOUTUBE в файле Topaz на с 18 секунды на волосах женщины: простой шум превратился в переливающиеся цвета. Я не стал записывать это в минусы, потому что шум там есть и в оригинале, но нестабильность обработки этого шума хорошо заметна. В остальных сравнениях я такого не наблюдал.

Tzimie Apr 24 2019 at 22:02

Есть еще одно замечание. 1080->4к похоже на сравнение MP3 256 и 320, которые большинство людей на слух не чувствуют. Вот у меня и мониторы full hd. Вот 360->full hd было бы интереснее

nidalee Apr 24 2019 at 22:06

Вот у меня и мониторы full hd. Вот 360->full hd было бы интереснее

Сдается мне, что здесь Topaz будет вне конкуренции, потому что он единственный, кто «додумывает» картинку и убирает блочность. Photoshop тоже пытается, но расплачивается резкостью изображения.
На мониторах FullHD тоже можно увидеть разницу, по крайней мере у Topaz и Instant 4K, да и есть люди, которые качают 4К ради повышенной четкости изображения на тех же 1080P мониторах\телевизорах.
Но я не сомневаюсь, что «не вижу разницы» это вполне легитимная реакция после изучения всех материалов. Часть с гайдами все равно прекрасно распространяется на любые разрешения.

Vitalley Apr 24 2019 at 22:08

Согласен, для реставрации видео было бы интересно

nidalee Apr 24 2019 at 22:12

В следующий раз буду апскейлить из чего-нибудь поменьше, и до 1080Р. Беда низких разрешений не в том, что там мало пикселей, их проблема в том, что сжимали их как правило сурово и без оглядки на качество. Разгребать ошмётки макроблоков и шумы — не совсем задача апскейлера, скорее денойзера и чего-то еще. В любом случае, для этих целей, из выбранных для сравнения программ может сгодиться только Topaz, и то с натяжкой: до первого артефакта, который он примет за «фичу»

Gordio May 1 2019 at 13:58

В вашем случае – да. Хотя можно немного комфортней смотреть 1920x960 -> 4k -> "Fill Screen" (1920x1080)

ValdikSS Apr 24 2019 at 23:39

Что-то более популярное, вроде nnedi3, пробовали?

nidalee Apr 24 2019 at 23:44

Нет, не пробовал, посмотрю. Он ведь через Avisynth?

ValdikSS Apr 25 2019 at 01:05

Да, Avisynth и Vapoursynth. Его поддержка есть также в рендерере madVR.

AngReload Apr 25 2019 at 06:22

На это, конечно, интересно будет посмотреть. Но nnedi3 проиграет другим по резкости. В его основе подход к изображению не как к фракталу, а как к непрерывной функции как у старых методов, вроде бикубика или ланцоша. Проще говоря, если тот же CUnet способен сколько угодно увеличивать изображение, сохраняя чёткими границы (с оговоркой на простые случаи), то у nnedi3 с каждым шагом ресайза будет всё больше блюра.

zartarn Apr 25 2019 at 10:04

Хорошо когда видео можно разложиь на удобные четкие кадры.
Но бывает же и такое, когда в некоторых кадрах присутсвуют поля из соседних, актуально для старых вещей

на рутрекере встречал в примерах

не фиксится. в одном кадре каждое из полей содержит смешанные поля из соседних кадров. Восстановить оригинальный кадр существующими методами (да и в перспективе) невозможно. Можно только минимизировать количество таких кадров применением существующих деблендеров на участках с реальными 12 кадрами в секунду.
Из этих троих кадров

Скрытый текст

получить нормальный кадр невозможно, только что-то такое, после топорного наложения

Заголовок спойлера

Скрины с предыдущего рипа за неимением таких двд, но концепцию иллюстрируют.

nidalee Apr 25 2019 at 10:17

Да, это частая проблема старых видео, на ТВ ее зовут «полуполем». Как правило, вырезается вручную, без попыток исправить. Но это в «боевой ситуации», когда нет времени как-то по-другому исправлять. Не знаю, попадут ли в мою следующую статью подобные видео, будем посмотреть!

ValdikSS Apr 25 2019 at 13:26

Поищите по «avisynth deblend». Попробуйте avisynth.nl/index.php/Srestore

zartarn Apr 26 2019 at 08:35

Я этим не занимаюсь, просто вспомнился пример из коментариев. А данный исходник в целом очень проблемный, над ним уже много кто бился. Сейчас более менее неплохого результата все же добились.

Tzimie Apr 25 2019 at 13:06

Ловите задачу, из видео 4:3 дорисовкой полей получить 16:9. Очень актуально для старых фильмов

nidalee Apr 25 2019 at 13:09

Уже отвечал тут.
Если при апскейле ИИ работает с тем, что в кадре есть, то догадаться, что будет там, где есть лишь черное поле — на данный момент невозможно. Нужно как минимум понимать, что ты дорисовываешь — толпу, стены, деревья…

Tzimie Apr 25 2019 at 13:18

Полностью автоматически нет (за исклюбчением случаев с zoom/понорамированием итд, когда видно, что было рядом). Но в полуавтоматическом режиме с помошью человека — уверен, можно, и уверен, какие нибудь стартапы уже над этим работают

NetBUG Apr 25 2019 at 13:18

Ха.

Есть пример обученной сетки, расширяющей (тривиально, но весьма неплохо) изображения.
kingdomakrillic.tumblr.com/post/178254875891/i-figured-out-how-to-get-esrgan-and-sftgan

Хотя на видео будет а) очень долго (как раньше качали с торрентов — так сейчас придётся ставить на ночь дорисовывать) и б) нестабильно работать на соседних кадрах

nidalee Apr 25 2019 at 13:21

Не нашел там расширения кадров, только апскейл, можно пример(ы)?

KvanTTT May 2 2019 at 01:52

Вообще-то можно и даже без машинного обучения. Для статичных изображений называется Seam Carving (liquid rescaling). Для видео тоже есть, но в качестве "швов" там выступают целые двухмерные поверхности, а не одномерные линии. Смотри также: Improved Seam Carving for Video Retargeting.

afejie4 Apr 25 2019 at 15:59

Топаз весьма хорош, имхо. Интересно было бы взглянуть на кадры не из мультика, а из фильма с живыми людьми.

nidalee Apr 25 2019 at 15:59

В файле SCENE 1 вполне себе живые люди! Хоть и не долго…

afejie4 Apr 26 2019 at 11:05

Хорошо получилось, имхо

Vjik Apr 10 2020 at 11:35

Спасибо за столь подробную статью! Вышел Topaz Video Enhance AI, было бы чудесно добавить и ее в статью.

nidalee Apr 13 2020 at 15:51

Добавлять в эту не буду, только если в следующую. А по поводу самой программы — особых отличий от Gigapixel не заметил, чуть-чуть проще из-за возможности сразу экспортировать в видео, но там мало настроек экспорта, из кадров ffmpeg-ом можно лучше собрать.

maxwolf Aug 20 2020 at 02:24

Извиняюсь, что не совсем в тему, но, может гуру подскажут, на какие инструменты сейчас можно посмотреть для автоматического ретуширования старого кино (типа оцифрованных домашних 8мм)?

Show the best of all time