marks 28 апр 2016 в 21:41

Нейронные сети научились расцвечивать черно-белые видео

2 мин

14K

Комментарии 23

tormozedison 28 апр 2016 в 22:14

Раньше, чтобы «оцветнить» чёрно-белое изображение на экране телевизора, использовали плёнку-светофильтр с плавным переходом цветов по вертикали. Теперь, наоборот, искусственно омонохромливают изображение на экранах устройств с iOS и Android штатными средствами этих ОС.

-3

Maxmaxmaximus 1 мая 2016 в 17:29

Нет.

Beholder 28 апр 2016 в 22:42

Да хватит уже врать, никакой это не ИИ. Ну да, есть там какая-нибудь нейронная сетка, которая пытается что-то угадать по десяткам или сотням заранее загруженных образцов. Причём получается у неё это так себе. ИИ, если был бы, рассуждал логически, что во что покрасить.

НЛО прилетело и опубликовало эту надпись здесь

QWhisper 29 апр 2016 в 11:58

Это кстати хорошо заметно, когда взаимодействуешь с очень невнятно говорящим человеком. По мере набора информации, качество распознавания речи возрастает. :)

ra3vdx 29 апр 2016 в 20:27

Ключевое свойство любой нервной системы (даже состоящей всего из трёх нейронов) — обучаемость.
Именно поэтому раскрашенная чёрно-белая «классика» зачастую вызывает негативные эмоции — несоответствие индивидуального воображаемого образа и того, что было задумано режиссёром вызывает некий диссонанс.

И действительно, как Вы заметили, всё зависит от количества обработанной информации. В качестве примера приведу эпизод из детства — современные (по тем временам) фильмы показывали по польским каналам и мы, жители приграничного района, смотрели именно их (ни интернета, ни VHS тогда не было). Надо ли говорить, что польским языком мы владели на очень приличном уровне?

Mii 1 мая 2016 в 15:43

Ваш — да!

NikitosZs 29 апр 2016 в 00:25

Синие и зелёные лица, ярко вспыхивающие рукава и многое другое…

link0ln 29 апр 2016 в 14:50

ну… чуть лучше, чем никак, уже что-то…

DROS 29 апр 2016 в 00:29

VHS-style

+15

KvanTTT 29 апр 2016 в 01:50

Для видео, мне кажется, трехмерные сверточные сети очень неплохо бы себя проявили, потому что видео как раз можно представить в виде трехмерного параллелепипеда.

Meklon 29 апр 2016 в 18:19

Я не могу представить видео как трёхмерный параллелепипед. Вы бы еще музыку как тессеракт попросили вообразить ((

KvanTTT 29 апр 2016 в 18:32

Все просто — картинка двухмерная, а время является дополнительной осью.

Sadler 29 апр 2016 в 18:40

На самом деле в общем случае (безотносительно восстановления цвета) вход для видео будет даже четырёхмерным, т.к. придётся подсовывать ещё и 3 цветовых канала (RGB/HSV/whatever), чтобы получить дополнительные данные. В частном же случае трёхмерное представление вполне оправдано.
Представить трёхмерную или четырёхмерную модель можно как видеоплёнку, нарезанную на кадры, которые затем сложены стопкой в порядке следования. В каждый момент времени мы будем рассматривать определённое подмножество кадров в стопке, а определённые участки нейросети будут реагировать на определённые участки или объекты в рамках этого подмножества, а затем воссоздавать недостающую информацию.

Keyten 1 мая 2016 в 03:05

Интересно, а почему не обучать тоже на видео?

Drakoninarius 29 апр 2016 в 10:54

а в чем принципиальная разница между оцвечиванием изображений и видео? учитывая что видео, по сути, последовательность изображений.

НЛО прилетело и опубликовало эту надпись здесь

Drakoninarius 29 апр 2016 в 11:11

Врятли они это делают как-то иначе, емнип все ПО для монтажа\постобработки видео при рендере обрабатывает видео именно покадрово.

-2

Sadler 29 апр 2016 в 16:42

Как раз следует загонять в нейросеть последовательность кадров, а не один кадр, это сильно снижает ошибку. Говорю потому, что сам активно занимаюсь нейросетями, особенно их приложением к графике и видео. Потому работа в этой статье в значительной мере проведена халтурно: при корректной реализации проблемы «плавного перехода между кадрами» либо не существовало бы вовсе, либо это бы менее бросалось в глаза.