xtelekom May 25 2012 at 21:24

Идентификация пользователя по голосу

12 min

60K

Programming*Algorithms*

Recovery Mode

+59

Comments 29

BeLove May 25 2012 at 21:39

Как раз занимаюсь вопросом практической безопасности (точнее, опасности) авторизации по голосу.
Спасибо за материал, очень ценно!

xtelekom May 25 2012 at 21:40

Рад помочь.

nqhost May 25 2012 at 22:33

И никто не пошутит про «Добавочный — три шестьдесят две»? :)

+12

Eskimo May 25 2012 at 23:30

Отлично, сам юзаю вайвлет и метод отпечатков, а до кохонена никак руки не доходили. Спасибо, относительно просто отписали).

jil May 26 2012 at 00:00

Скажите, а кроме голоса, будет ли Ваш метод анализировать другие звуковые шаблоны (скажем машинные звуки, или хлопки/щелчки например)?

xtelekom May 26 2012 at 09:25

Может. У меня даже были планы распознавать фонемы с целью распознавания речи. Но понял, что это одному не потянуть.

doxtarzlo May 26 2012 at 01:44

Я так понимаю, система никак не защищена от подделки в виде звучащего из динамика записанного голоса?

xtelekom May 26 2012 at 09:20

Если динамик будет выдавать голос на тех же частотах, что и оригинал, то никак.

IamKarlson May 26 2012 at 12:48

ЕМНИП то спектаральная характеристика человеческого голоса гораздо шире, чем в спектральная характеристика частоп воспроизводимых динамиком. Чтобы добиться удовлетворительного результата, нужен оочень качественный динамик. Плюс учитывайте что микрофон вносит в искажения при усилении, соответственно усиление и так искаженного звука динамиком будет весьма отличаться от естесственного голоса. В принципе можно всем этим делом пренебречь и взять сферический динамик в вакууме, тогда xtelekom абсолютно прав и отличий не будет.

doxtarzlo May 26 2012 at 14:29

ЕМНИП то спектаральная характеристика человеческого голоса гораздо шире, чем в спектральная характеристика частоп воспроизводимых динамиком.

Стоп, как же это? Самая обычная звуковая система способна воспроизводить частоты от 50 Гц до 18 кГЦ, тогда как спектр человеческой речи лежит в пределах от 100 до 300 Гц. Или я чего-то не понял?

IamKarlson May 26 2012 at 14:54

Я не правильно выразился. Хм, я имел ввиду то что спектры человеческого голоса, да и вообще звуков воспринимаемых человеком гораздо насыщенее нежели спектры воспроизводимые динамиками, пусть у них хоть от 6Гц до 25кГц. Плюс учитывайте тот момент что прежде чем воспроизвести необходимо этот сигнал закодировать. Хорошо, предположим что мы взяли один из популярных lossless форматов и воспроизводим закодированный звук с точностью до бита. Но, точность до бита позволяет добится вам максимальной отдачи при воспроизведение звука у когорого была качественная цифровая обработка с достаточным уровнем дискретизации. А если нет, то все это воспроизведение опять таки будет с искажениями. Проблема состоит в качественной оцифровке голоса, и выделении его составляющих из общего фона.

xtelekom May 26 2012 at 14:57

Качественная оцифровка стоит дорого, поэтому для массового продукта нужно вводить погрешность рассчитанную на микрофоны в ноутбуках и вебкамерах.
Иначе в требованиях к программе нужно указывать конкретные модели микрофонов с которыми ПО протестировано и выдаст предсказуемый результат.

mtp May 26 2012 at 12:35

Идентификация по биометрикам — зло:

— Зачастую слабая защищенность от replay атак
— Нет возможности «сменить пароль» при его компрометации

xtelekom May 26 2012 at 12:36

Поэтому я и забросил проект

doxtarzlo May 26 2012 at 14:20

Возможно вы в курсе, как же тогда лучше идентифицировать?

xtelekom May 26 2012 at 14:24

Если биометрия, то отпечаток пальца или еще лучше сетчатка глаза

amarao May 26 2012 at 21:20

В мифбастерсах показывали, как легко обходятся все датчики отпечатков.

Shultc May 26 2012 at 23:14

Это лишь повод разработать новые, улучшенные датчики отпечатков, но никак не повод отказаться от идентификации пользователей по отпечаткам.

amarao May 27 2012 at 02:40

Каким образом вы хотите отличать отпечаток пальца (принадлежащий человеку) от отпечатка пальца (принадлежащего злоумышленнику)?

amarao May 26 2012 at 21:20

Я вижу единственный вариант «сильной» защиты голосом — если мы научились узнавать голос «вообще», то можно просить каждый раз произнести что-то другое. (совмещение каптчи и голосового распознавания).

mtp Jun 1 2012 at 08:06

О, кстати, сильная идея.

YUVladimir May 26 2012 at 16:34

Что именно делает фильтр шумоподавления, приведенный в начале статьи?

Обрезает высокие частоты? И откуда получены такие коэффициенты?
Т.к. если это фильтр на базе преобразования Фурье, то неплохо бы привести вывод этой формулы, а иначе совсем непонятно что это за зверь и где его можно применить

xtelekom May 26 2012 at 18:04

Там же написано «Входной дискретный звуковой сигнал обрабатывается фильтрами», до фурье еще дело не дошло, там другие фильтры. Коэффициенты подобраны методом научного тыка, не мной, нашел в литературе.

YUVladimir May 26 2012 at 18:40

Да, это я прочитал, что «сигнал обрабатывается фильтрами». Вопрос как раз в том, что делает этот фильтр, описываемый той формулой?
Фильтры бывают разные — усредняющие, полосовые и т.д.
Вот и интересно, что в конкретном случае делается со входным сигналом?

xtelekom May 26 2012 at 18:43

Не помню уже, 9 лет прошло. Помню что разложенный по фурье спектр после этого становился гораздо чище.

amarao May 26 2012 at 21:18

Как вы защищаетесь от записанного на диктофон голоса?

-1

xtelekom May 26 2012 at 21:35

Читайте комменты выше, никак…

Progressr May 26 2012 at 22:15

Биометрическая идентификация имеет свои ниши. К примеру, для автомобильных систем управляемых голосом, востребована идентификация, позволяющая системе выделять из голосов разных людей голос водителя и реагирующая только на него. Аналогично, игровая приставка должна различать голоса игроков и реагировать на них, к примеру изменением поведения их персонажей. Это примеры, в которых достаточно и не 100% идентификации.
Можно еще массово прослушивать телефоны и вылавливать голоса людей, которые находятся в розыске. Наверняка есть еще куча специфических примеров, так что всему свое место.

xtelekom May 26 2012 at 22:21

Вы правы

Show the best of all time