Pull to refresh

Comments 2

Наш профайлер показывает, что до 60-70%% процессорного времени занимают операции по копированию фреймов (
Вы не пробовали у себя (в т.ч. в примерах) оптимизировать эти операции?
У меня с разверткой циклов, вставками ассемблерных инструкций получалось до 50% оптимизировать, но, похоже это потолок (
А это очень важно, когда речь идет о кодировании десятков каналов на одном сервере
Не получается GPU утилизировать на 100%
Дублирую ответ от инженеров Intel)

Вместо собственных функций копирования поверхностей нужно использовать инициализацию MediaSDK компонент (кодеков, VPP) с нужным типом памяти.
Если мы говорим о HW имплементации и вам необходимы данные в системной памяти – инициализация с системной памятью, если о SW имплементации и данные необходимы в видео памяти – инициализация с видео памятью

Плюс, нужно избегать случаев, когда происходит неявное копирование, например, используют HW библиотеку и хотят получить данные в видео, но делают следующее: заводят системные поверхности, а потом сами из них копируют в видео – получается двойное копирование

Есть тонкость: для YV12 GPU копирование не работает.
Sign up to leave a comment.