Pull to refresh

Искусственный интеллект и машинное обучение в интернет-вещании: последние тренды

Working with videoNetwork technologies


Привет, Хабр. Меня зовут Александр Альперн, я CEO и основатель компании Webinar Group. Сегодня хотелось бы обсудить такие вопросы, как использование технологий машинного обучения и искусственного интеллекта в интернет-вещании, обработка медиаконтента и доставка его пользователю.

Для чего это нужно? Повышение просмотров, лояльности зрителя, информативности передач, а также снижение нагрузки на сеть — лишь часть преимуществ, предоставляемых современными технологиями.

Пандемия + трафик = проблемы


По данным компании TeleGeography, которая проанализировала показатели глобального обмена интернет-трафиком, в 2020 году потребление трафика сильно выросло. Так, средний показатель по миру увеличился с примерно 120 до 170 Тбит/с, в пике — 300 Тбит/с.

image

В принципе, рост и так был немаленьким, но в прошлом году были побиты все рекорды — рост составил 47%. Ларчик открывается просто — сотни миллионов человек оказались заперты дома, поэтому в разы увеличилась активность использования интернет-мессенджеров, онлайн-платформ для обучения, сервисов облачных игр и, конечно, видео-платформ вроде YouTube.

Сильнее всего оказались нагружены точки обмена трафиком в Германии, Франкфурт, (DE-CIX FRA) и в Нидерландах, Амстердам (AMS-IX). В марте в пиринговом центре DE-CIX достигнут all-time пик трафика в 9.1 Tbps.

В России наблюдалась аналогичная ситуация — в марте-апреле 2020 года онлайн-кинотеатры зафиксировали рост трафика в 2-4 раза. Причина все та же — из-за пандемии и самоизоляции люди оказались изолированы в собственных квартирах и домах, поэтому интернет стал одним из способов развлечь себя. Мобильный трафик в тот же период вырос на 10-30%, прежде всего, за счет видеочатов и мессенджеров.

Дело дошло до того, что Netflix и YouTube снизили качество видео для европейских пользователей. YouTube стал показывать видео в стандартном разрешении вместо HD, а Netflix снизили разрешение на 25%.

Что же делать?


В идеале — повышать емкость и пропускную способность сетевой инфраструктуры, как на локальном, так и на глобальном уровнях. Здесь все сложно, поскольку провайдеры интернета, сотовой связи и прочих телекоммуникационных услуг не всегда могут вкладывать значительные ресурсы.

Второй вариант — оптимизировать контент. Здесь имеется в виду не столько снижение качества видео или аудио, сколько другие методы. Их ниже и рассмотрим.

Оптимизация компрессии разных видео


Компания Netflix — крупнейший поставщик медиаконтента. Несколько лет назад она ввела практику подбора разных профилей компрессии для разных видео с учетом их особенностей.

У Netflix — богатейший опыт работы с видео, включая сжатие контента. Используя собственные наработки, компания обучила нейроноподобную систему, которая оценивает низкоуровневые атрибуты видео, определяя его класс, а потом находит оптимальные параметры для каждого класса.

Оцениваются такие параметры, как динамика картинки, степень четкости и общая сложность сюжета. За считанные минуты система оценивает динамику сюжета, степень четкости и общую насыщенность «картинки». На основе данных анализа система принимает решение об оптимизации видео. Так, если шоу или передача не особо динамичные, то качество видео можно снизить. Если же картинка быстро меняется, цвета насыщенные, а сюжет — сложный, то качество либо немного снижается, либо остается на прежнем уровне.

image

Таким образом, достигается оптимизация передачи видео, снижается нагрузка на сетевую инфраструктуру. Работа с видео проводится таким образом, чтобы конечный результат был незаметен для потребителей контента. Другими словами, зрители просто ничего не замечают. Для компрессии компания использует различные кодеки и модели сжатия, включая 4K VMAF, благодаря чему сеть не перегружается даже при трансляции видео в качестве 4К.

Выбор источника видео с оптимальным качеством


Высокое разрешение, и, следовательно, большой объем передаваемых данных вовсе не означает хорошего качества видео, доставляемого получателю. Пример тому — гифка, размещенная выше.

Выбор источника видео с хорошим качеством — актуальная проблема для дистрибьюторов пакетов телеканалов. Компания Ssimwave предложила решение на основе машинного обучения, которое позволяет автоматически подбирать источник контента с максимальным его качеством.

image

Пример — трансляция канала CNN. В одном источнике параметры видео — 1080@29,97i, MPEG-2, 40 Мбит/сек, а в другом — с параметрами 720p60, H264, 22 Мбит/сек. Как и говорилось выше, высокое разрешение вовсе не означает хорошее качество видео у получателя. На качество оказывает влияние большое количество факторов, включая форматы компрессии и передачи цвета, динамический диапазон, процедуры транскодирования, технологии доставки и версии абонентских плееров.

Вручную оценить все это попросту невозможно. А вот нейросеть способна справиться с задачей без особых проблем. Компания Ssimwave смогла разработать решение, которое позволяет за считанные секунды выбирать источник передачи с максимальным качеством и минимальным объемом данных.

Не трафиком единым


Машинное обучение, искусственный интеллект и нейросети помогают не только в оптимизации объема передаваемого контента. Есть масса других направлений, где сейчас без технологий просто не обойтись.

Навигация по каталогу видео


У многих компаний, предоставляющих медиа-контент, есть каталоги — с играми, видеороликами, фильмами и шоу. По данным Netflix, при выборе фильма для просмотра подписчики чаще всего обращают внимание на иконки афиш фильмов. По мнению креативного директора компании Ника Нельсона, в 82% случаях выбор фильма определяется именно представленной иконкой/афишей.

Соответственно, чем удачнее изображение, тем выше вероятность, что зритель выберет именно эту единицу контента. Все это актуально не только для видео, но и для других цифровых товаров.

image

Для того чтобы подтвердить, либо опровергнуть мнение Нельсона, компания Accedo совместно с AWS и Британской телевизионной корпорацией ITV запустила A/B-тест для определения факторов, влияющих на выбор пользователя. Вывод не слишком неожиданный: пользователи выбирают фильм, руководствуясь эмоциями при просмотре скриншотов. На оценку скриншота тратится при этом менее 2 секунд.

Соответственно, технологии машинного обучения и ИИ можно использовать для подбора скриншотов с оптимальной конверсией. Для фильмов такие скриншоты обычно включают изображение героя, лицо которого выражает эмоции, причем чаще всего выбирают картинки с антагонистами. Скриншоты с группами героев вызывают меньший интерес.

Кроме того, искусственный интеллект помог формировать разные подборки для разных категорий/сегментов зрителей — как по социальному признаку, так и по территориальному. Сейчас не вызывает удивления, что в разных странах или регионах одной страны каталоги выглядят по-разному. А ведь всего лет 10-20 назад ситуация была иной.

Повышение информативности видео


image

Речь идет о создании и структурировании мультимедийных метаданных для разных видео — например, спортивных видео. Здесь особенно отличился IBM Watson, суперкомпьютер компании IBM со встроенной системой искусственного интеллекта. Он умеет создавать в режиме реального времени визуальные описания, транскрибировать аудио, добавлять редакторские заметки.

Эти умения используются во время работы с популярными спортивными событиями — например, чемпионатом мира по футболу, US Open, Super Bowl и прочими.

ИИ обрабатывает поток вещания, отмечая в нем ключевые моменты, добавляя примечания и комментарии. Далее уже обработанный поток либо отправляется редакторам выпускающей передачи, либо же транслируется сразу зрителям.

Снижение оттока клиентов


Машинное обучение и искусственный интеллект отлично помогают предотвратить отток клиентов. Так бывает, если заинтересованность пользователей контентом снижается. Согласно нашим данным, неинтересный или чрезмерно сложный контент может стать причиной оттока четверти пользователей. Это очень много и допускать подобное нельзя.

Для того чтобы снизить процент оттока, важно:

  • понять, что может стать причиной оттока
  • автоматизировать аналитику
  • использовать инструменты прогнозирования

В аналитике используются такие данные, как информация о пользователе, просматриваемость контента, оценки пользователей, активность взаимодействия пользователей с поддержкой (здесь может идти речь не только о видео, но и про онлайн-курсы, как в нашем случае) и другие данные. Например, на платформе We.Study система сама регулярно «мониторит» курс, предоставляя конкретные рекомендации по его улучшению, позволяя отследить поведение участников и спрогнозировать отток.

По результатам анализа можно предпринимать определенные действия — менять контент, программу обучения, если это курсы — улучшать взаимодействие с пользователями.

Персонализация рекомендуемого контента


image

Все пользователи YouTube знают, что такое рекомендованный контент. Чем удачнее рекомендация, тем выше шанс, что пользователь просмотрит ролик или просмотрит другой тип контента.

Показательный кейс — проект IBM Watson и платформы Iris.tv. Партнерам удалось добиться оптимальной персонализации контента. Для этого видеосюжеты сначала пропускаются через суперкомпьютер, который собирает метаданные. Потом уже платформа анализирует эти данные для создания новых категорий и наименований фильмотеки.

Кроме того, при помощи машинного обучения платформу удалось обучить анализировать интересы конкретных пользователей, с тем, чтобы гарантированно предлагать интересное человеку видео после того, как он посмотрел очередную программу.

Что дальше?


Кейсов использования ИИ и машинного обучения очень много, так что в статье указаны только самые показательные моменты. Общий же вывод — эти технологии начинают использоваться системно. Раньше они применялись лишь в качестве теста. Сейчас сотни и тысячи компаний, работающих с контентом, используют машинное обучение для оптимизации контента, отладки бизнес-процессов, привлечения новых пользователей и удержания старых.

В течение ближайших 3-5 лет подавляющее большинство поставщиков медиаконтента перейдут на использование современных технологий, благодаря тому, что они позволяют решать задачи как отдельных клиентов, так и бизнеса в целом.
Tags:трансляция видеоинтернетсетьтехнологии
Hubs: Working with video Network technologies
Total votes 3: ↑3 and ↓0+3
Views963

Popular right now