Мне показалось, что S(f), не зависящая от времени — это, фактически, эквалайзер.
Только количество полос у него большое, да пределы усиления/ослабления можно сделать любыми. А так — просто регулировка тембра в магнитоле. Что наводит на мысль о том, что испортить голос он не должен, что согласуется с вашими экспериментами.
А вот S(f), меняющаяся во времени — это уже, боюсь, амплитудная модуляция (а то и с фазовой вместе).
Даже если пропустить простую синусоиду через S(f,t) [для синусоиды будет только одно значение f], то на выходе получим боковые полосы справа и слева от синусоиды, как у всех сигналов AM-радиостанций. Причём их спектр может быть гораздо шире, чем 1/T, где T-время ваших «однократных периодов». Ибо скачки амплитуды и фазы в S(t) — это, в общем случае, не синусоида с периодом Т, а вообще то, что вам в голову взбрело, меандр там, или что ещё.
Так что КАЖДАЯ частота из исходного спектра обрастает боковыми полосами, которых не было в исходном сигнале. Причём состав этих полос зависит от S(f,t). То есть в речь нещадно добавляется то, чего в ней не было, в отличие от S(f), не зависящей от времени. Неудивительно, что речь становится неразличимой.
То есть результаты экспериментов мне кажутся объяснимыми, но я их объясняю не так, как вы.
Но это на первый взгляд, возможно, я ошибаюсь. Что скажете?
P.S. Автору статьи большое спасибо за изложение полезных вещей человеческим языком.
Нажатие кнопок мыши, естественно, сделано. В разных программах по-разному, но у большинства так: держите мышь над значком «левый клик», активируется режим «левый клик». Потом передвигаете курсор в то место экрана, где нужно щелкнуть и держите курсор без движения. Убедившись, что вы больше не хотите никуда увести курсор, программа выполняет щелчок мышью.
Точно так же есть значки правого, двойного щелчка, drag-and-drop, и даже колеса прокрутки.
Так сделано, например, в eViaCam и в моей программе: https://github.com/MastaLomaster/bkb
А вот в Head Mouse можно даже щёлкать мышью, открывая рот. (хотел поставить смайлик, да тут это, говорят, не принято).
Спасибо, возьму на заметку. Это пока первый вариант, в котором нет даже звука при нажатии клавиши, курсор убогий, да и ещё куча недоработок по мелочи. Но уже можно работать.
А в перспективе можно сделать предсказание слов и индикацию последних набранных букв прямо в том месте, куда смотришь, как это сделано в Tobii Gaze Interaction.
Пока же меня больше всего заботят очки.
Задержку нажатия на клавишу пришлось сделать из-за очень низкой точности определения направления взгляда. Если видишь, что полоска растёт не на той клавише, есть время это понять и отвести взгляд в сторону. Если точность новых приборов будет выше, можно задержку свести к минимуму, а ошибочные нажатия отменять Backspace'ом.
Попробуйте моргнуть столько раз, сколько букв в вашем сообщении. Уверяю вас, после этого вы поменяете своё мнение.
Когда полоска растёт, можно и моргнуть, полоска от этого расти не перестанет, просто замрёт на миг, так что в напряжении взгляд держать не обязательно.
А есть ли у него готовый софт для замены мыши и клавиатуры, в том числе с кириллицей?
Если бы знал об устройстве с готовым софтом, способным заменить русскую клавиатуру и мышь за такие деньги, сам бы делать ничего не стал.
Кстати, Tobii REXX продавался за $295 (если не считать стоимость доставки)
Если же готового софта нет, то лично для меня писать для TCP сокетов — незнакомая область. Да и цена в полтора раза больше выходит.
А вы сами используете устройство для замены мыши или клавиатуры, или только для сбора статистики?
Олег,
Жалею, что не успел поблагодарить Вас лично за консультации по тематике, за отзывчивость. То у вас праздники начались, то у нас вот. Ваш ETU-драйвер, действительно, с REXX'ом не заработал, а мне было быстрее написать свой код, чем хакерством заниматься. Жду ещё две железки: EyeX и ту что от TheEyeTribe, думаю, ещё будет о чём Вас порасспрашивать. Алгоритм сглаживания, который Вы мне порекомендовали, тоже не успел разобрать, так и оставил скользящее среднее. Успехов вам и ещё раз спасибо.
П.С. А очки сильные очень, -6 диоптрий, может из-за этого?
К сожалению, точность определения точки на экране, на которую направлен взгляд, довольно низкая. Приходится даже усреднять несколько последних значений координат, иначе бы курсор просто плясал бы на экране. Соответствующий код находится в файле smooth.cpp
В силу ряда причин мне нужно было сделать систему в течение месяца-двух. Поэтому на исследования электромагнитных колебаний мозга времени не было, взял то, что работает сегодня. Поэтому и код довольно грязный, написанный на коленке.
Выход из режима скролла — ещё раз посмотреть на кнопку выбора скролла или выбрать любой другой режим.
Про «обморгаешься» — честно говоря, смотрел на клипы, демонстрирующие работу разных коммерческих программ, и такой способ нажатия на кнопки мыши (фиксация взгляда) мне приглянулся больше всего. Я думаю, так сделали по следующим причинам:
Ложные срабатывания, если один из зрачков нечётко распознаётся
При подмаргивании требуется работа мимических мышц (в отличие от рефлекторного моргания). А эти мышцы при некоторых заболеваниях у человека могут не работать. А именно при таких заболеваниях система могла бы быть весьма полезной.
Только количество полос у него большое, да пределы усиления/ослабления можно сделать любыми. А так — просто регулировка тембра в магнитоле. Что наводит на мысль о том, что испортить голос он не должен, что согласуется с вашими экспериментами.
А вот S(f), меняющаяся во времени — это уже, боюсь, амплитудная модуляция (а то и с фазовой вместе).
Даже если пропустить простую синусоиду через S(f,t) [для синусоиды будет только одно значение f], то на выходе получим боковые полосы справа и слева от синусоиды, как у всех сигналов AM-радиостанций. Причём их спектр может быть гораздо шире, чем 1/T, где T-время ваших «однократных периодов». Ибо скачки амплитуды и фазы в S(t) — это, в общем случае, не синусоида с периодом Т, а вообще то, что вам в голову взбрело, меандр там, или что ещё.
Так что КАЖДАЯ частота из исходного спектра обрастает боковыми полосами, которых не было в исходном сигнале. Причём состав этих полос зависит от S(f,t). То есть в речь нещадно добавляется то, чего в ней не было, в отличие от S(f), не зависящей от времени. Неудивительно, что речь становится неразличимой.
То есть результаты экспериментов мне кажутся объяснимыми, но я их объясняю не так, как вы.
Но это на первый взгляд, возможно, я ошибаюсь. Что скажете?
P.S. Автору статьи большое спасибо за изложение полезных вещей человеческим языком.
Точно так же есть значки правого, двойного щелчка, drag-and-drop, и даже колеса прокрутки.
Так сделано, например, в eViaCam и в моей программе: https://github.com/MastaLomaster/bkb
А вот в Head Mouse можно даже щёлкать мышью, открывая рот. (хотел поставить смайлик, да тут это, говорят, не принято).
А в перспективе можно сделать предсказание слов и индикацию последних набранных букв прямо в том месте, куда смотришь, как это сделано в Tobii Gaze Interaction.
Пока же меня больше всего заботят очки.
Когда полоска растёт, можно и моргнуть, полоска от этого расти не перестанет, просто замрёт на миг, так что в напряжении взгляд держать не обязательно.
Если бы знал об устройстве с готовым софтом, способным заменить русскую клавиатуру и мышь за такие деньги, сам бы делать ничего не стал.
Кстати, Tobii REXX продавался за $295 (если не считать стоимость доставки)
Если же готового софта нет, то лично для меня писать для TCP сокетов — незнакомая область. Да и цена в полтора раза больше выходит.
А вы сами используете устройство для замены мыши или клавиатуры, или только для сбора статистики?
Жалею, что не успел поблагодарить Вас лично за консультации по тематике, за отзывчивость. То у вас праздники начались, то у нас вот. Ваш ETU-драйвер, действительно, с REXX'ом не заработал, а мне было быстрее написать свой код, чем хакерством заниматься. Жду ещё две железки: EyeX и ту что от TheEyeTribe, думаю, ещё будет о чём Вас порасспрашивать. Алгоритм сглаживания, который Вы мне порекомендовали, тоже не успел разобрать, так и оставил скользящее среднее. Успехов вам и ещё раз спасибо.
П.С. А очки сильные очень, -6 диоптрий, может из-за этого?
Про «обморгаешься» — честно говоря, смотрел на клипы, демонстрирующие работу разных коммерческих программ, и такой способ нажатия на кнопки мыши (фиксация взгляда) мне приглянулся больше всего. Я думаю, так сделали по следующим причинам: