Pull to refresh

Измерение разборчивости речи: субъективные методы

Sound
Sandbox

В чем дело?


Мы разговариваем по телефону, мы слушаем выступления и речи в концертных залах. Некоторые из нас пытаются подслушать чужой разговор, иные – сделать прослушку невозможной. Однако для всех наведенных выше случаев бывали такие ситуации, когда посторонний шум настолько мешал услышать нужное, что слова становились попросту неразборчивыми. Чтобы таких проблем не возникало, перед эксплуатацией трактов проводится акустическая экспертиза каналов речевой коммуникации.

Канал, либо тракт речевой коммуникации (или канал передачи речевой информации) – это физическая среда, путь, который проходит звук от отправления к приему. Это может быть воздушный, электроакустический, вибрационный, параметрический, оптико-электронный канал, однако не будем останавливаться на их рассмотрении, так как наша цель – измерение важнейшего критерия качества тракта – разборчивость речи.

Методы измерения разборчивости речи можно коротко подать в виде списка:
  • Субъективные:
    • Чисто субъективный метод;
    • Объективизированный;
    • Тональный;

  • Объективные:
    • Формантные:
      • AI (Индекс артикуляции);
      • SII (Индекс разборчивости речи);

    • Модуляционные:
      • STI (Speech transmission index – Индекс передачи речи);
      • RASTI (Быстрый STI);
      • STIPA (STI для систем звукоусиления);
      • STITEL (STI для телекоммуникационных систем);

    • %ALcons (Оценка потерь артикуляции согласных);


Конечно, есть еще советские методы Покровского, Быкова, Сапожкова, однако трогать их не будем, по крайней мере пока, так как приведенные выше методы обеспечивают лучший результат.

Разумеется, охватить все и сразу мы не в силах, потому для начала рассмотрим отличия объективных методов от субъективных, а также поподробнее остановимся на последних.

Чистый субъективизм


В оценке разборчивости речи чистым субъективным методом участвует пара диктор-аудитор. Их работу удобно рассматривать на примере тестирования радиостанции по рекомендациям МККР (Международного Консультативного Комитета по Радиосвязи): на передающей стороне радиоканала диктор читает текст, в то время как аудитор на принимающей стороне выставляет оценку тракта по пятибалльной (или какой-либо другой) шкале. Тяжело не заметить очевидный большой недостаток такого подхода, а именно неизбежное влияние на результат особенностей речи и слуха тестирующих людей.

Решение этой проблемы такое же очевидное, как и сама проблема.

Объективизированность


Наиболее распространенным объективизированным методом является метод артикуляции. Он заключается в том, что перед началом измерений в испытуемом канале создаются нормальные акустические условия (уровни шумов). Участвуют несколько аудиторов, а диктор вместо обычного текста читает специально составленные таблицы слогов (артикуляционные таблицы). Аудиторы записывают услышанное и по окончанию сеанса передачи сверяют свои таблицы с дикторскими. Отношение правильно услышанных слогов к их общему числу и есть оценка разборчивости речи, которая выражается в процентах либо в долях единицы.


Отметим, что при большем числе продиктованных и соответственно принятых слогов влияние различных факторов усредняется. Влияние факторов еще более усредняется, если в испытаниях принимают участие различные группы дикторов и аудиторов. В этом и заключается объективизированность артикуляционного метода. Однако не только в этом. Получить объективные результаты помогает начитка именно звукосочетаний, не имеющих смысловой нагрузки, так как при приеме слов или фраз можно додумать и восстановить искаженный трактом элемент.

Что касается аудиторов, есть мнение, что это должны быть специально натренированные бригады, однако ГОСТ Р 50840-95 требует совершенно обратное. Лично я больше склоняюсь к последнему.
Пример артикуляционной таблицы
але бух выр сна онса ари расо няй
инчи сить сиф аво жей чит пам зем
стро паню каф ший обла иде вра жась
зым лях уне нех дись алат бла

Достоинства:
  • Универсальность (метод применим к любому типу тракта);
  • Простота (метод не требует у операторов специальных технических знаний)

Недостатки:
  • Громоздкость процедуры измерений (требуются значительные затраты временных, материальных и человеческих ресурсов);
  • Создание артикуляционных таблиц (с каждым новым типом таблиц результаты измерений отличаются);
  • Зависимость результатов от степени тренерованости операторов;
  • Невозможность автоматизации процесса;
  • Человеческий фактор (влияние на результат особенностей речи и слуха)

Объективизированность. Часть 2


Рассмотрим еще один объективизированный субъективный метод – тональный, согласно которому диктор заменяется генератором чистых тонов. Этот искусственный голос на деле – обычный громкоговоритель без диффузора, который генерирует сигналы таким образом, чтобы уровень звуковых давлений, создаваемый на различных частотах, соответствовал бы кривой спектра формант. Аудиторы никуда не деваются. Теперь их задача – это просто определить, слышен ли сигнал на данной частоте или нет.
Частоты, на которых проводятся измерения
250 500 650 800 990 1125 1300 1500 1700 1875
2050 2225 2425 2725 3100 3500 3850 4550 6150 8600

Уровень ощущения формант измеряется путем плавного ввода затухания до исчезновения слышимости звука, затем затухание следует убавлять до момента появления звука. Два значения затухания усредняются – это и есть результат измерения.

Формантная разборчивость речи определяется по таблице:
дБ % дБ % дБ % дБ % дБ % дБ %
1 0.04 10 0.65 19 1.92 28 3.22 37 4.28 46 4.75
2 0.09 11 0.76 20 2.07 29 3.37 38 4.37 47 4.78
3 0.14 12 0.89 21 2.2 30 3.51 39 4.46 48 4.8
4 0.19 13 1.03 22 2.36 31 3.64 40 4.52 49 4.82
5 0.24 14 1.18 23 2.5 32 3.75 41 4.57 50 4.85
6 0.3 15 1.32 24 2.65 33 3.87 42 4.62 51 4.88
7 0.37 16 1.47 25 2.79 34 3.97 43 4.66 52 4.95
8 0.46 17 1.62 26 2.93 35 4.08 44 4.69
9 0.55 18 1.77 27 3.08 36 4.18 45 4.72
дБ — уровень ощущения тона; % — формантная разборчивость речи

Общая формантная разборчивость определяется как сумма составляющих:


Для окончания измерения разборчивости речи достаточно определить слоговую разборчивость:
A S A S A S A S A S
5 5 25 46.2 45 75 65 90 85 98
10 15 30 55 50 80 70 92.5 90 99
15 26 35 62.5 55 81 75 95.2 95 99.5
20 36 40 69 60 87.2 80 96.2 100 100
A — формантная разборчивость речи; S — слоговая разборчивость речи

Достоинства:
  • Не нужна бригада дикторов;
  • Значительно сокращается время измерений;
  • Не нужны артикуляционные таблицы

Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала;
  • Невозможность автоматизации процесса;
  • Человеческий фактор

А как же…


… отличия объективных методов от субъективных? Думаю, вы уже догадались, что все дело в человеческом факторе, а точнее в его отсутствии, так как для измерений используют искусственный голос, рот и ухо.

Рассмотрим простейший объективный метод.

Прежде всего, на приемном конце испытуемого тракта создается уровень шума, соответствующий условиям работы. Далее измеряется уровень шума на выходе искусственного уха в критической полосе частот слуха, при этом средняя частота этой полосы равна частоте измерительного тона. Этот уровень шума обязательно нужно зафиксировать, он нам еще понадобится. После этого вместо шума на вход тракта подают тональный сигнал. Уровень интенсивности звука на микрофоне берется таким, чтобы при условном нуле на регулировщике затухания распределение звуковых давлений соответствовало кривой спектра формант. Далее с помощью регулирования затухания добиваются, чтобы уровень тонального сигнала на выходе тракта стал равен зафиксированному нами ранее уровню шума. Показания регулятора затухания – результат измерения.

Чтобы определить формантную и слоговую разборчивости, пользуются теми же способами, что и в тональном методе.

Достоинства:
  • Точность и быстрота;
  • Не требуются дикторы и аудиторы;
  • Возможность полной автоматизации процедуры измерений

Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала

The End


Обычно после этих слов и быть ничего не должно, ну разве что титры, потому буду предельно краток: это был «никнейм_внизу», смотрите нас в любое удобное для вас время. И спасибо за внимание!
Tags:разборчивость речиречьизмерениякоммуникации
Hubs: Sound
Total votes 19: ↑17 and ↓2 +15
Views12.2K

Comments 5

Only those users with full accounts are able to leave comments. Log in, please.

Popular right now

Administrator Linux.Basic
April 24, 202155,000 ₽OTUS
SEO-специалист
April 26, 202164,900 ₽Нетология
Факультет дизайна
April 26, 2021236,988 ₽GeekBrains
Профессия iOS-разработчик
April 26, 202190,000 ₽SkillFactory