Pull to refresh

Comments 29

Стоит ли поменять модель waifu2x на другую? CUnet?

Я пользую только CUnet. Гораздо лучше чем другие методы в waifu: выше чёткость, больше деталей, лучше удаление артефактов. Плюс включена опция TTA, хоть и жутко медленно, но чуть качественней.
Опция удаления артефактов даже на первом уровне настройки — очень сильная, годится лишь для аниме/комиксов, для нормальных фоток не применимо т.к. удаляет слишком много деталей, только для пережатых в хлам.
Ну и размытость, если она присутствует на исходнике, waifu не устраняет. И текстуры не дорисовывает. По моему так и должно быть. Вообще, это инструмент не для фоток и видосов, а для анимешных картинок.

Пару месяцев назад я тестировал оба, и решил, что UpResNet10 выглядит лучше. Надо будет перепроверить, спасибо за отзыв.
Плюс включена опция TTA, хоть и жутко медленно, но чуть качественней.
Да, эта опция на самом деле не стоит того времени, что добавляет к времени обработки.

Опция удаления артефактов даже на первом уровне настройки — очень сильная, годится лишь для аниме/комиксов, для нормальных фоток не применимо т.к. удаляет слишком много деталей, только для пережатых в хлам.
Если я правильно помню, то этот шумодав рассчитан на удаление шумов сжатия JPEG, поэтому может странно работать с кадрами, где их нет в принципе, например — кадрами из видео. Кроме того, не совсем понятно, что делает «Авто-убрать шум», и как работает с видео. Изучу этот вопрос перед следующей статьей.

Ну и размытость, если она присутствует на исходнике, waifu не устраняет. И текстуры не дорисовывает. По моему так и должно быть.
Я тоже так думал до Topaz, теперь уже и не знаю…

Я не понимаю вот чего, если каждый кадр обрабатывается независимо, то возможна их нестыковка во времени, например, на кадрах 1 2 3 6 7 нейросеть решает дорисовать тень, а на 4 5 — нет.

Теоретически — да, на практике я такого пока не встречал. Есть некоторые артефакты, которые ИИ может усилить. Например, в видео YOUTUBE в файле Topaz на с 18 секунды на волосах женщины: простой шум превратился в переливающиеся цвета. Я не стал записывать это в минусы, потому что шум там есть и в оригинале, но нестабильность обработки этого шума хорошо заметна. В остальных сравнениях я такого не наблюдал.

Есть еще одно замечание. 1080->4к похоже на сравнение MP3 256 и 320, которые большинство людей на слух не чувствуют. Вот у меня и мониторы full hd. Вот 360->full hd было бы интереснее

Вот у меня и мониторы full hd. Вот 360->full hd было бы интереснее
Сдается мне, что здесь Topaz будет вне конкуренции, потому что он единственный, кто «додумывает» картинку и убирает блочность. Photoshop тоже пытается, но расплачивается резкостью изображения.
На мониторах FullHD тоже можно увидеть разницу, по крайней мере у Topaz и Instant 4K, да и есть люди, которые качают 4К ради повышенной четкости изображения на тех же 1080P мониторах\телевизорах.
Но я не сомневаюсь, что «не вижу разницы» это вполне легитимная реакция после изучения всех материалов. Часть с гайдами все равно прекрасно распространяется на любые разрешения.
Согласен, для реставрации видео было бы интересно
В следующий раз буду апскейлить из чего-нибудь поменьше, и до 1080Р. Беда низких разрешений не в том, что там мало пикселей, их проблема в том, что сжимали их как правило сурово и без оглядки на качество. Разгребать ошмётки макроблоков и шумы — не совсем задача апскейлера, скорее денойзера и чего-то еще. В любом случае, для этих целей, из выбранных для сравнения программ может сгодиться только Topaz, и то с натяжкой: до первого артефакта, который он примет за «фичу»

В вашем случае – да. Хотя можно немного комфортней смотреть 1920x960 -> 4k -> "Fill Screen" (1920x1080)

Что-то более популярное, вроде nnedi3, пробовали?
Нет, не пробовал, посмотрю. Он ведь через Avisynth?
Да, Avisynth и Vapoursynth. Его поддержка есть также в рендерере madVR.
На это, конечно, интересно будет посмотреть. Но nnedi3 проиграет другим по резкости. В его основе подход к изображению не как к фракталу, а как к непрерывной функции как у старых методов, вроде бикубика или ланцоша. Проще говоря, если тот же CUnet способен сколько угодно увеличивать изображение, сохраняя чёткими границы (с оговоркой на простые случаи), то у nnedi3 с каждым шагом ресайза будет всё больше блюра.
Хорошо когда видео можно разложиь на удобные четкие кадры.
Но бывает же и такое, когда в некоторых кадрах присутсвуют поля из соседних, актуально для старых вещей
на рутрекере встречал в примерах
не фиксится. в одном кадре каждое из полей содержит смешанные поля из соседних кадров. Восстановить оригинальный кадр существующими методами (да и в перспективе) невозможно. Можно только минимизировать количество таких кадров применением существующих деблендеров на участках с реальными 12 кадрами в секунду.
Из этих троих кадров
Скрытый текст
image
image
image


получить нормальный кадр невозможно, только что-то такое, после топорного наложения
Заголовок спойлера
image

Скрины с предыдущего рипа за неимением таких двд, но концепцию иллюстрируют.


Да, это частая проблема старых видео, на ТВ ее зовут «полуполем». Как правило, вырезается вручную, без попыток исправить. Но это в «боевой ситуации», когда нет времени как-то по-другому исправлять. Не знаю, попадут ли в мою следующую статью подобные видео, будем посмотреть!
Я этим не занимаюсь, просто вспомнился пример из коментариев. А данный исходник в целом очень проблемный, над ним уже много кто бился. Сейчас более менее неплохого результата все же добились.

Ловите задачу, из видео 4:3 дорисовкой полей получить 16:9. Очень актуально для старых фильмов

Уже отвечал тут.
Если при апскейле ИИ работает с тем, что в кадре есть, то догадаться, что будет там, где есть лишь черное поле — на данный момент невозможно. Нужно как минимум понимать, что ты дорисовываешь — толпу, стены, деревья…
Полностью автоматически нет (за исклюбчением случаев с zoom/понорамированием итд, когда видно, что было рядом). Но в полуавтоматическом режиме с помошью человека — уверен, можно, и уверен, какие нибудь стартапы уже над этим работают
Ха.

Есть пример обученной сетки, расширяющей (тривиально, но весьма неплохо) изображения.
kingdomakrillic.tumblr.com/post/178254875891/i-figured-out-how-to-get-esrgan-and-sftgan

Хотя на видео будет а) очень долго (как раньше качали с торрентов — так сейчас придётся ставить на ночь дорисовывать) и б) нестабильно работать на соседних кадрах
Не нашел там расширения кадров, только апскейл, можно пример(ы)?

Вообще-то можно и даже без машинного обучения. Для статичных изображений называется Seam Carving (liquid rescaling). Для видео тоже есть, но в качестве "швов" там выступают целые двухмерные поверхности, а не одномерные линии. Смотри также: Improved Seam Carving for Video Retargeting.

Топаз весьма хорош, имхо. Интересно было бы взглянуть на кадры не из мультика, а из фильма с живыми людьми.
В файле SCENE 1 вполне себе живые люди! Хоть и не долго…
Хорошо получилось, имхо
Спасибо за столь подробную статью! Вышел Topaz Video Enhance AI, было бы чудесно добавить и ее в статью.
Добавлять в эту не буду, только если в следующую. А по поводу самой программы — особых отличий от Gigapixel не заметил, чуть-чуть проще из-за возможности сразу экспортировать в видео, но там мало настроек экспорта, из кадров ffmpeg-ом можно лучше собрать.
Извиняюсь, что не совсем в тему, но, может гуру подскажут, на какие инструменты сейчас можно посмотреть для автоматического ретуширования старого кино (типа оцифрованных домашних 8мм)?
Sign up to leave a comment.

Articles