Открыть список
Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Машинное обучение применили в звуке. Новый аудиокодек сжимает речь в 3 Кбита/с

Блог компании Дата-центр «Миран»Сжатие данныхМашинное обучениеЗвук
Сегодня видеочаты стали частью нашей повседневной жизни. Хотя пропускная способность сетей растёт, по-прежнему востребована качественная связь на низком битрейте. Проблема особенно для звука, потому что именно звук передаёт информацию в чате. На самом низком битрейте принято использовать параметрические кодеки с роботизированным голосом, а не нормальные кодеки, которые описывают форму сигнала.

Поэтому разработчики из компании Google разработали высококачественный речевой кодек Lyra с очень низким битрейтом. В разработке использованы генеративные модели, обученные на тысячах часов данных. Теперь машинное обучение применили и в этой области.

Lyra на 3kbps сжимает речь примерно как Opus на 8kbps.
Читать дальше →
Всего голосов 25: ↑25 и ↓0 +25
Просмотры6.7K
Комментарии 23

Google открыла исходный код кодека для сжатия голоса Lyra

Open sourceC++GitHubЗвукIT-компании


6 апреля 2021 года Google открыла исходный код кодека для сжатия голоса Lyra, позволяющего организовывать качественную голосовую связь при низком битрейте. Проект аудиокодека размещен на GitHub под лицензией Apache v2.0. Кодек написан на языке C++ с использованием системы сборки Bazel.
Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Просмотры2.6K
Комментарии 5

Компания DivX на этой неделе проводит IPO

Чулан
Тема онлайнового видео горяча как никогда. Поэтому момент, который американская компания DivX выбрала для первичного выпуска акций, можно назвать очень удачным.

Небольшая компания из Сан-Диего под названием DivX (бывшая DivXNetworks) известна всему миру как разработчик одного из самых популярных кодеков MPEG-4. Она получает основную часть доходов от лицензионных отчислений со стороны производителей аппаратуры. Сейчас компания готовится к IPO. Компания должна быть включена в списки Nasdaq в пятницу, 22 сентября, под тикером “DIVX”.

Благодаря первичному размещению акций планируется привлечь до $104 млн. На биржу будет выброшено около 27% акций DivX (9,1 млн штук) по цене от $12 до $14. Если все пройдет по плану, то общая капитализация корпорации составит около $468 млн. Для сравнения, разработчик альтернативного формата онлайнового видео, корпорация RealNetworks, имеет капитализацию в районе $1,6 млрд.
Рейтинг 0
Просмотры266
Комментарии 1

Google будет финансировать Ogg Theora

Open source
Google выделит финансовые ресурсы для развития кодека Theora, оптимизированного для процессоров ARM. О таком решении сообщается в одном из корпоративных блогов Google.

Компания подчёркивает важность развития именно открытого кодека, который должен стать всеобщим и единым стандартом хотя бы для подстраховки. Как сообщается, единый универсальный формат нужен хотя бы для того, чтобы все могли на него перейти в случае необходимости, если «все остальные форматы не оправдают себя».

Поскольку единый формат нужен для подстраховки, «он не должен быть самым сложным или самым рекламируемым, — пишет Google, — он должен просто быть доступным, причём повсеместно». Таким кодеком может стать именно Ogg Theora, основанный на базе VP3, который стал общественным достоянием несколько лет назад.
Всего голосов 95: ↑85 и ↓10 +75
Просмотры535
Комментарии 48

Покадровое сравнение H.264 и VP8

Работа с видео
В связи с намечающимся противостоянием H.264 и «свободного» кодека VP8 довольно интересно сравнить, какой же из этих кодеков на самом деле лучше в реальном применении. Один из первых адекватных независимых тестов провели ребята из Streaming Media: они взяли стандартный тестовый файл, с помощью Squish сжали его с одинаковым битрейтом кодеками H.264 и VP8, после чего сравнили по кадрам результат.
Читать дальше →
Всего голосов 110: ↑96 и ↓14 +82
Просмотры10.4K
Комментарии 103

GStreamer: кодеки с привкусом Linux

Open source
Вы когда-нибудь задумывались о том как работают Gnome-плееры, такие как Totem, Rhythmbox или Banshee? Наверное каждый из вас в новоустановленной Ubuntu, при попытке проиграть AVI-шку видел сообщение о необходимости установить дополнительный пакет gst-ffmpeg или gst-plugins-ugly. Под катом — моя попытка прояснить свет на то, как работает этот мультимедийный фреймворк и на что он способен.
Читать дальше →
Всего голосов 65: ↑63 и ↓2 +61
Просмотры35.2K
Комментарии 15

Skype переходит на новый кодек Opus

Мессенджеры
Вчера в официальном блоге было объявлено о том, что компания в ближайшее время собирается перевести Skype на использование нового эффективного аудиокодека, ориентированного для работы в беспроводных сетях и предназначенного для повышения качества передаваемого звука.

Разработка Opus была начата в 2009 году и уже в сентябре 2010 года кодек был отправлен на сертификацию в IETF (Internet Engineering Task Force). Главное техническое достоинство Opus заключается в найденном балансе между компрессией аудиосигнала и его качеством, что актуально в условиях передачи в сетях мобильных операторов. Кодек использует гибкий алгоритм адаптации в случае изменения пропускной способности канала — например, при переходе с 3G-сигнала на Wi-Fi соединение — и, в дальнейшем, может обеспечить разговор в CD-качестве. Также применены специальные алгоритмы для борьбы с потерей пакетов при ограниченных возможностях беспроводной сети.
Узнать подробности
Всего голосов 37: ↑34 и ↓3 +31
Просмотры26.2K
Комментарии 29

В мозге обнаружен механизм видеокомпрессии

Работа с видео


Оказывается, мозг осуществляет эффективную компрессию сигнала, который поступает от органов зрения. Учёные из института невральных вычислений при Рурском университете (Германия) доказали, что зрительная кора подавляет избыточную информацию и сохраняет энергию, передавая лишь изменения между картинками. Примерно такие же методы используются в современных видеокодеках.
Читать дальше →
Всего голосов 101: ↑87 и ↓14 +73
Просмотры65.7K
Комментарии 97

Видео-конференц-связь TrueConf. Обзор и сравнение со Skype for Business

Блог компании STSSКонференции
Tutorial


В предыдущей статье о ВКС я описал решение отечественного разработчика Mind. Читатели заметили, что сравнение профессиональных программных решений с аппаратными выглядит однобоко, и требуется сравнение в первую очередь с аналогичными продуктами. Эту статью я посвятил как раз такому продукту Российской разработки от компании TrueConf.

TrueConf и Mind успешно работают на одном рынке в России и за её пределами. Программные решения ВКС этих разработчиков имеют как много общего, так и немало отличий. Но это не мешает им развиваться и выполнять свои задачи, занимая свою нишу и успешно конкурируя с аппаратными решениями ВКС от Polycom, Cisco, LifeSize и прочими.
Прислушавшись к читателям предыдущей статьи, я проведу сравнение функциональных возможностей и стоимости TrueConf с аналогичной программной реализацией Microsoft Lync (Skype for Business), как наиболее распространённой в мире.
Цель данной статьи не принизить или возвысить один из этих программных продуктов, а именно сравнить функционал и стоимость. Выводы каждый делает для себя сам.

Оба этих продукта появились давно, и за многие годы претерпели существенные изменения. Первое, что их объединяет — это основной замысел. И Lync (ныне Skype for Business), и TrueConf, задумывались как программный комплекс Унифицированных Коммуникаций (Unified communications, UC).
Какими средствами они реализовали этот замысел?
Всего голосов 23: ↑15 и ↓8 +7
Просмотры43K
Комментарии 55

Оборудование ВКС для переговорных комнат

Блог компании STSSУправление медиаБрендингКонференцииВидеоконференцсвязь
Как уже отмечалось много раз, за последнее время рынок видео-конференц-связи (ВКС) стремительно смещается в сторону программных решений. В статьях о подобных реализациях (Mind и Yealink) я подробно описал функционал, настройку и стоимость решения, но вопросу оборудования для ВКС было уделено незначительное внимание. Это не справедливо — каким бы ни был удобным и качественным сервис ВКС, при неудачно подобранном оборудовании для персональных рабочих мест или переговорных комнат, Вы не сможете оценить все достоинства программного решения.

В случае с продуктами представителей аппаратных решений, мы имеем готовые комплекты для переговорных — так называемые терминалы, которые включают кодек ВКС, спикерфон и камеру. В случае с программной реализацией, мы можем использовать как готовые аппаратные терминалы, так и различное ВКС-оборудование с программным клиентом на базе ПК.

Выбор этого оборудования весьма велик, и подбор может занять немало времени: важно учитывать особенности переговорной комнаты, её размер, форму и вместимость.

В этой статье я опишу типовые задачи по оборудованию переговорных комнат и решения на основе конкретных примеров.
Какие требования предъявлять к оборудованию для ВКС? Под катом много картинок и анимаций!
Всего голосов 21: ↑14 и ↓7 +7
Просмотры41.6K
Комментарии 7

Магия H.264

Работа с видео
Перевод

H.264 — стандарт сжатия видео. И он вездесущ, его используют для сжатия видео в интернете, на Blu-ray, телефонах, камерах наблюдения, дронах, везде. Все сейчас используют H.264.

Нельзя не отметить технологичность H.264. Он появился в результате 30-ти с лишним лет работы с одной единственной целью: уменьшение необходимой пропускной способности канала для передачи качественного видео.

С технической точки зрения это очень интересно. В статье будут поверхностно описаны подробности работы некоторых механизмов сжатия, я постараюсь не наскучить с деталями. К тому же, стоит отметить, что большинство изложенных ниже технологий справедливы для сжатия видео в целом, а не только для H.264.
Читать дальше →
Всего голосов 72: ↑68 и ↓4 +64
Просмотры81.7K
Комментарии 38

Yealink Meeting Server — комплексное решение для видеоконференцсвязи

Блог компании STSSРабота с видеоIT-инфраструктураРазработка систем связиВидеоконференцсвязь
Tutorial
В ранних статьях, посвящённых программным ВКС-серверам, я описывал различные решения для видеоконференцсвязи на базе программных продуктов отечественной разработки. Сегодняшняя статья посвящается программному ВКС-серверу от компании Yealink — Yealink Meeting Server (YMS). Отличительной особенностью данного решения является бесшовная интеграция с аппаратными терминалами ВКС данного производителя.

Последние годы кодеки Yealink активно конкурируют в своём сегменте рынка с продукцией Polycom, Cisco и прочих крупных вендоров. Но замещение было лишь по клиентской части, так как у Yealink не было собственного сервера ВКС, и для построения законченного решения приходилось интегрировать терминалы Yealink с программными или аппаратными MCU сторонних производителей.

В прошлом году Yealink представил собственный программный сервер видеоконференцсвязи, который поддерживает не только собственное оборудование, но также совместим с большинством моделей кодеков ведущих мировых производителей.
Подробнее о деталях функционала, установке и настройке YMS
Всего голосов 14: ↑14 и ↓0 +14
Просмотры9.1K
Комментарии 5

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF

Работа с видеоАлгоритмыОбработка изображений
Перевод


Автор: Monty (monty@xiph.org, cmontgomery@mozilla.com). Опубликовано 28 июня 2018 года.

Если кто не читал предыдущую статью… AV1 — это новый универсальный видеокодек, разработанный Альянсом за открытые медиа (Alliance for Open Media). Альянс взял за основу кодек VPX от Google, Thor от Cisco и Daala от Mozilla/Xiph.Org. Кодек AV1 превосходит по производительности VP9 и HEVC, что делает его кодеком не завтрашнего, а послезавтрашнего дня. Формат AV1 свободен от любых роялти и навсегда останется таковым с разрешительной лицензией.

Эта статья задумывалась как вторая в серии статей, которые подробно описывают функциональность AV1 и новых технологий, которые лежат в его основе и впервые используются в продакшне. Предыдущая статья на Xiph.org объясняла функцию прогнозирования яркости Chroma from Luma (CfL). Сегодня мы расскажем об ограниченном направленном корректирующем фильтр (Constrained Directional Enhancement Filter). Если вы всегда задавались вопросом, что нужно для написания кодека, пристегните ремни и приготовьтесь к образованию!
Читать дальше →
Всего голосов 14: ↑14 и ↓0 +14
Просмотры8.8K
Комментарии 3

Yealink Meeting Server 2.0 — новые возможности видеоконференцсвязи

Блог компании STSSРабота с видеоIT-инфраструктураРазработка систем связиВидеоконференцсвязь
Tutorial
В прошлой статье: Yealink Meeting Server — комплексное решение для видеоконференцсвязи мы описали функционал первой версии Yealink Meeting Server (далее YMS), её возможности и структуру. В результате, мы получили от Вас множество запросов на тестирование этого продукта, часть которых выросли в комплексные проекты по созданию или модернизации ВКС-инфраструктуры.
Наиболее часто встречающийся сценарий предполагал замену прежнего MCU на сервер YMS, при сохранении существующего парка терминальных устройств, а расширение с помощью терминалов Yealink.

Основных причин тому три:

  1. Масштабируемость существующего MCU невозможна или неоправданно дорога.
  2. «Накопленный долг» за техническую поддержку соизмерим со стоимостью современного ВКС-решения «под ключ».
  3. Производитель уходит с рынка и поддержка перестаёт осуществляться вообще.

Многие из Вас, кто сталкивался с модернизацией Polycom, например, или поддержкой LifeSize, поймут о чём идёт речь.

Новый функционал Yealink Meeting Server 2.0, а также обновление модельного ряда терминальных клиентов Yealink не позволяет уместить всю информацию в рамках одной статьи. Поэтому я планирую сделать серию небольших публикаций на следующие темы:

  • Обзор YMS 2.0
  • Каскадирование серверов YMS
  • Интеграция YMS и S4B
  • Новые терминалы Yealink
  • Многокамерное решение для крупных конференц-залов
Эта статья посвящена первой теме - обзору YMS 2.0
Всего голосов 16: ↑16 и ↓0 +16
Просмотры5K
Комментарии 9

Уличная магия сравнения кодеков. Раскрываем секреты

Работа с видеоПрограммированиеНаучно-популярноеИскусственный интеллектБудущее здесь


В этом году исполняется юбилей — 16 лет, как был запущен сайт compression.ru, на котором автор и сотоварищи организуют сравнения видеокодеков и кодеров изображений. За это время были проведены десятки сравнений с отчетами от 23 до 550+ страниц, количество графиков в последнем сравнении перевалило за 7000, а количество разных феерических случаев за это время окончательно превысило все разумные пределы. Поскольку следующая круглая дата (32 года) наступит еще нескоро, есть желание рассказать в честь юбилея малую толику феерического.

Если говорить про кодеки, то не секрет, что большинство сравнений и графиков, которые видит почтеннейшая публика — это продукт отдела маркетинга. В лучшем случае — графики грамотно делали инженеры, а маркетинг только давал добро на публикацию. В худшем случае инженеры вообще не участвовали в их подготовке. К чему тратить время этих занятых людей!

При этом тема сжатия весьма популярна. В сериале «‎Кремниевая долина»‎ стартап главного героя разработал гениальный алгоритм, который в последней серии первого сезона показал невероятное сжатие 3D видео и в итоге теперь миллионы стартаперов (и инвесторов) мира знают, что главное — это чтобы коэффициент Вайсмана был побольше и ещё гения надо найти, а остальное — фигня-вопрос. Чудо будет! Это естественным образом увеличивает ожидание чудес и, конечно (КОНЕЧНО!) эти чудеса радостно демонстрируются компаниями! В том числе с использованием последних достижений уличной магии.

DISCLAIMER: Любые совпадения имен и названий компаний ниже с реальными именами и названиями абсолютно случайны.

Усаживайтесь поудобнее! Обещаем, что к концу рассказа вы сможете показывать подобные фокусы сами, как, впрочем, и раскрывать многие из них. Поехали!
Читать дальше →
Всего голосов 144: ↑144 и ↓0 +144
Просмотры30.1K
Комментарии 123

Кластер системы видеоконференцсвязи на базе Yealink Meeting Server

Блог компании STSSВысокая производительностьРабота с видеоIT-инфраструктураВидеоконференцсвязь
Tutorial
Эта статья является продолжением цикла публикаций, посвященного комплексному решению ВКС Yealink Meeting Server (YMS).

В прошлой статье Yealink Meeting Server 2.0 — новые возможности видеоконференцсвязи мы описали существенный прорыв в функционале решения:

  • добавился собственный сервис записи конференций, интегрированный в YMS
  • появился новый тип лицензии — Broadcast, который позволяет оптимизировать стоимость асимметричных конференций
  • обеспечена интеграция с решением Skype for Business и Teams

В этой статье мы рассмотрим возможность каскадирования YMS — установку и настройку системы в режиме «кластер».
Подробности
Всего голосов 16: ↑15 и ↓1 +14
Просмотры1.8K
Комментарии 0

Динамическая CDN для WebRTC стриминга с низкой задержкой и транскодингом

Блог компании FlashphonerРазработка веб-сайтовРабота с видеоПрограммированиеВидеоконференцсвязь


В первой части мы развернули простую динамическую CDN для трансляции WebRTC потоков на два континента и убедились в том, что задержки в такой CDN действительно низкие, на примере таймера обратного отсчета.


Однако, кроме низкой задержки, важно обеспечить зрителям хорошее качество трансляции, ведь за это они и платят. В реальной жизни, каналы между Edge серверами и подписчиками могут быть разными по пропускной способности и качеству. Например, мы публикуем поток разрешением 720p с битрейтом 2 Мбит/с, а пользователь играет его на Android-смартфоне, используя 3G подключение в зоне неуверенного приема сигнала, и максимальное разрешение, при котором картинка будет плавной, всего 360p с битрейтом 400 Мбит/с.

Читать дальше →
Всего голосов 10: ↑9 и ↓1 +8
Просмотры1.6K
Комментарии 3

Как работает видеокодек. Часть 1. Основы

Блог компании EdisonПрограммированиеАлгоритмыВизуализация данныхУчебный процесс в IT
Перевод

Вторая часть: Принципы работы видеокодека




Любое растровое изображение можно представить в виде двумерной матрицы. Когда речь заходит о цветах, идею можно развить, рассматривая изображение в виде трехмерной матрицы, в которой дополнительные измерения используются для хранения данных по каждому из цветов.

Если рассматривать итоговый цвет как комбинацию т.н. основных цветов (красного, зеленого и синего), в нашей трёхмерной матрице определяем три плоскости: первая для красного цвета, вторая для зеленого и последняя для синего.
3D матрица RGB

Будем называть каждую точку в этой матрице пикселем (элементом изображения). Каждый пиксель содержит информацию об интенсивности (обычно в виде числового значение) каждого цвета. Например, красный пиксель означает, что в нём 0 зеленого цвета, 0 синего и максимум красного. Пиксель розового цвета может быть сформирован с помощью комбинации трех цветов. Используя числовой диапазон от 0 до 255, розовый пиксель определяется как Красный = 255, Зелёный = 192 и Синий = 203.
Читать дальше →
Всего голосов 58: ↑58 и ↓0 +58
Просмотры31.9K
Комментарии 13

Обучение, переговоры, консультации удалённо — Часть 2: Vinteo Server — 3 месяца бесплатной видеоконференцсвязи

Блог компании STSSТестирование IT-системУчебный процесс в ITКонференцииВидеоконференцсвязь
События, происходящие сейчас во всём Мире, неотвратимо продолжают влиять на отрасль удалённых коммуникаций. Много лет назад видеоконференцсвязь (ВКС) была признаком высокого достатка компании. Последние годы, на волне развития программных решений видеокоммуникаций, ВКС из разряда роскоши перешла в разряд эффективного бизнес-инструмента. Но сейчас, ситуация с карантином делает ВКС вынужденным решением для обеспечения удалённой работы или обучения.
С одной стороны я рад, что это направление кратно стало популярней за последние пару недель, но с другой стороны не рад, что это происходит при таких грустных обстоятельствах.

Несколько месяцев назад я был первым и единственным подписчиком хаба Видеоконференцсвязь image — а сейчас нас почти три сотни.

В ближайшие несколько недель на этом хабе я планирую опубликовать ряд статей из серии «Обучение, переговоры, консультации удалённо», освещающих профессиональные решения ВКС, предоставляющие на время карантина возможность бесплатной эксплуатации их в реальных условиях в существующей инфраструктуре компании. В прошлой статье я описал Mind Server и его бесплатную версию. Эта статья посвящается акции от компании Винтео — единственного в России разработчика массового решения видеоконференцсвязи, построенного на классической архитектуре SIP/H.323.
Бесплатная безлимитная эксплуатация ВКС в течение 3 месяцев
Всего голосов 18: ↑16 и ↓2 +14
Просмотры3K
Комментарии 0

Обучение, переговоры, консультации удалённо — Часть 3: Yealink Meeting Server и 4 специальных предложения

Блог компании STSSТестирование IT-системУчебный процесс в ITКонференцииВидеоконференцсвязь
В прошлой статье я описал Vinteo Server — 3 месяца бесплатной видеоконференцсвязи. Эта статья посвящается сразу нескольким акциям от компании Yealink, которая совместно с российскими партнёрами подготовила ряд антикризисных предложений в области видеоконференцсвязи.
Это касается не только серверного решения ВКС Yealink Meeting Server, но и терминальных клиентов Yealink:

  • Бесплатно до конца сентября 2020 года. Вы получаете дистрибутив Yealink Meeting Server (YMS) и лицензию, включающую: 100 конкурентных симметричных подключений, 100 участников-зрителей и сервис записи/трансляции.
  • Лицензия 16-подключений бесплатно. При покупке терминалов Yealink VC800/VC880 с встроенным MCU до конца сентября — Вы получаете лицензию на 16 конкурентных подключений бесплатно до конца сентября.
  • Гарантия 3 года. Стандартный сервисный контракт (гарантия и техническая поддержка) на ПО YMS и оборудование Yealink в период акции составит не 1 год, как раньше, а целых 3 года.
  • 1 доллар = 70 рублей. До конца лета 2020 года, рублёвая стоимость на оборудование и программное обеспечение Yealink будет зафиксирована по курсу 1:70.

Важное замечание: условия акции, описанные в этой статье, распространяются только на запросы по адресу yealink@prof-av.ru с указанием в теме письма названия акции!

Под катом я опишу подробнее суть и пользу каждого специального предложения, а пока, в очередной раз, приглашаю всех заинтересованных темой ВКС пополнить ряды подписчиков хаба image Видеоконференцсвязь.
Подробнее о каждом пункте и его выгоде для Заказчиков
Всего голосов 11: ↑11 и ↓0 +11
Просмотры1.4K
Комментарии 4
1