Как стать автором
Обновить

Видеосвязь «глаза в глаза»: попытки решить проблему отсутствия зрительного контакта

Время на прочтение5 мин
Количество просмотров16K
Автор оригинала: Joe Kissell

У наших компьютеров, смартфонов и планшетов имеются встроенные видеокамеры, направленные на пользователей. Видеочаты и видеоконференции – один на один, один со многими, многие со многими – стали обычным делом как в бизнесе, так и среди обычных людей и я думаю, что большинство из нас согласятся, что эта связь гораздо лучше обычного разговора при помощи одного только звука. Наблюдение за лицом другого человека обогащает разговор и повышает удовлетворение от него. Однако меня раздражает одна особенность, связанная с текущей видеосвязью: невозможность участников разговора смотреть в глаза друг другу. В «Звёздном пути» такой проблемы не было, и эта вселенная, естественно, является источником всех моих технологических ожиданий.

Смотри на меня при разговоре


Если вы пользовались видеочатом, вы, наверняка, понимаете, что я имею в виду. Камера, смотрящая вам в лицо, расположена выше (а иногда ниже, или сбоку) от вашего экрана. Это значит, что угол, под которым вы смотрите на экран, отличается от угла, под которым камера (и ваш собеседник) видит вас – этот эффект известен, как параллакс [или нет; ведь параллакс — это изменение видимого положения объекта относительно удалённого фона в зависимости от положения наблюдателя / прим. перев.]. У собеседника создастся впечатление, что вы смотрите ему в глаза, только если вы будете смотреть в камеру. Поэтому, когда вы видите изображение вашего друга на экране, вам кажется, что он смотрит вниз (или в другом направлении, но не на вас), и вы на экране друга выглядите точно так же. Вы, конечно, можете расположить камеру прямо перед экраном, но тогда камера закроет вам изображение вашего собеседника.

Зрительный контакт крайне важен для осмысленного разговора, и, в конце концов, ведь весь смысл использования видео вместо одного аудио заключается в том, чтобы видеть человека, с которым вы разговариваете. Но если вы не можете посмотреть человеку в глаза, это устраняет большую часть преимуществ видео перед обычным телефонным звонком. В инструкциях по эффективному деловому общению обычно говорится, что вы должны смотреть в камеру, пока говорите, чтобы у людей на другом конце создалось впечатление, что вы беседуете непосредственно с ними. Но это неестественно, это не даёт вам видеть их реакцию на вашу речь. На самом деле нам нужно именно то, что происходило на космических кораблях Федерации: видеоэкраны, которые одновременно работают и камерами, чтобы, когда вы смотрели на экран, то и ваши глаза выглядели бы так же с другой стороны. Естественно, инженеры уже пытаются достичь этого эффекта, работая в нескольких направлениях.

Всё дело в зеркалах


Один достаточно простой способ сохранять зрительный контакт при видеосвязи состоит в использовании технологии, позаимствованной у телевизионной индустрии: телесуфлёра. Если вы смотрите новости по ТВ, вы заметите, что диктор смотрит прямо в камеру. Дикторы не выучивают свои репортажи; они читают их со специального видеоэкрана, который как будто появляется прямо перед камерой. На самом деле, экран (обычная плоская панель) располагается лицом вверх перед камерой снизу, а текст на нём демонстрируется в зеркальном отражении. Над этим экраном, прямо перед камерами, под углом в 45° находится частично посеребрённое (или двустороннее) зеркало. Диктор видит в нём отражение текста снизу, а камера видит только диктора.



Телесуфлёры – технология простая и испытанная; они существуют более 60 лет. А когда подобные устройства используются для видеосвязи, их иногда называют видеотуннелями. Но у них есть определённые проблемы. Одна проблема – в размере: оборудование по природе своей довольно громоздкое, поскольку требует расположенного под углом зеркала перед камерой, а также специальной защиты линз от бликов. Телесуфлёры также обычно тяжёлые, хрупкие и дорогие – все эти факторы делают их малопривлекательными для обычных потребителей.

У меня есть устройство ProPrompter Desktop, стоящее «всего» $500, которое можно надеть на мой компьютер (настольный или ноутбук), или на планшет. Это, по сути, миниатюрный телесуфлёр, и видео можно расположить таким образом, что изображение вашего собеседника (вместо текста для чтения) будет расположено прямо перед камерой. Он громоздкий, но рабочий, и оказывается полезным, когда я провожу удалённые видеопрезентации перед большими группами, или записываю видео по сценарию.

Используете вы телесуфлёр, или нет – есть и ещё одна проблема, в случаях, когда в видеоразговоре участвует больше двух человек. Если я смотрю прямо в камеру, то всем людям, которые видят меня на экране, кажется, что я устанавливаю с ними зрительный контакт, даже если они разбросаны по разным местам. Тогда у участников не будет впечатления, что мой взгляд перемещается, когда я перевожу внимание с одного человека на другого – а я не смогу сказать, кто смотрит на меня (или на моё изображение) на экране. Система GAZE-2, которую разрабатывают в Университете королевы в Кингстоне, Онтарио, пытается решить эту проблему, используя несколько камер в видеотуннеле, вместе с дополнительной камерой, направленной туда, куда, как считает компьютер, направлен взгляд пользователя; ПО переключается на камеру, ближайшую ко взгляду пользователя, и вращает изображение на другом конце, чтобы оно совпадало с происходящим.

Эффект присутствия


Ещё одним предложенным решением проблемы определения направления взгляда, разработанным в университете Кейо в Токио в 1996 году, была система MAJIC. Она заменила двустороннее зеркало телесуфлёра большим искривлённым экраном из тонкого перфорированного материала, дававшего отражающую поверхность с одной стороны, и по большей части прозрачного с другой. Камеры за экраном записывали участников разговора в одном месте, а обычные видеопроекторы показывали изображения других участников (расположенные в одном или нескольких местах) на экране. Уникальной особенностью MAJIC было то, что за изображением каждого человека на экране в каждом меньше находилась отдельная камера, работавшая виртуальными глазами этого человека на этом месте (и вместе с динамиком воспроизводившая его голос). В итоге казалось, что каждый человек всегда смотрит на того участника разговора, к которому он повернулся в данный момент, и даже можно было видеть, когда один участник разговора смотрит на другого. Дополнительный плюс: проекции в натуральную величину создавали ощущение реально сидящих за столом друг напротив друга людей. К сожалению, насколько я знаю, эту систему так и не довели до продажи, что неудивительно, учитывая её громоздкость и стоимость оборудования.

Десять лет спустя появилась гораздо более компактная версия этой системы. В январе 2006 Apple получила патент на видеосистему «глаза в глаза», в которой большой массив микроскопических (и по сути, невидимых) камер встраивался в монитор вместе с элементами дисплея; а ПО комбинировало все эти тысячи или миллионы изображений в единое. Это должно дать эффект, похожий на то, что предлагала MAJIC. Время покажет, когда, или в каком виде подобная технология станет доступна потребителям.

Иной, возможно, более многообещающий подход, под названием коррекция взгляда, сейчас изучают исследователи таких крупных компаний, как HP, Microsoft и AT&T, среди прочих. Всё начинается с одной-двух обычных видеокамер, закреплённых рядом с обычным дисплеем. Специальный видеопроцессор цифровым методом изменяет изображение лица каждого человека в реальном времени так, чтобы казалось, что его глаза смотрят прямо в камеру, даже если это и не так. На ранних демонстрациях эти системы выглядят более-менее убедительно – пусть и немного пугающе – однако они пока не готовы для коммерческого использования. Также они пока не адаптированы для удовлетворительной работы со многими участниками, находящимися в одном месте, или для выборочного зрительного контакта с одним из нескольких удалённых участников.


Здорово, что прогресс не стоит на месте, но учитывая наличие огромных вычислительных мощностей в сегодняшних вычислительных устройствах, я удивлён и разочарован тем, что пока нет никаких доступных всем программных инструментов для коррекции взгляда. Раздражает и то, что такой инструмент раньше уже был – приложение для Windows под названием CatchEye, работавшее со Skype, Google Hangouts, Facebook Messenger и другими продуктами. Однако его убрали с рынка в 2017 году без каких бы то ни было объяснений. Хочется думать, что это произошло потому, что разработчика купила крупная компания типа Apple или Microsoft, и теперь усиленно работает над тем, чтобы дать эту возможность массам, но я, возможно, чересчур оптимистичен. Если бы только я смог заглянуть технологическим гигантам прямо в глаза…
Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
Всего голосов 21: ↑20 и ↓1+19
Комментарии5

Публикации