Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Ученые разработали прототип устройства, переводящего электрические сигналы мозга в речь

МедгаджетыМозгБудущее здесь
image

Людей, которые по той либо иной причине потеряли способность говорить довольно много. Современные технологии позволяют частично решить эту проблему при помощи разных инструментов, от обычной клавиатуры до распознавания движения глазного яблока. К сожалению, чем сильнее степень обездвиженности человека, тем ниже его возможность общаться с окружающими.

Идеальным вариантом могло бы быть устройство, которое способно анализировать активность головного мозга и переводить электрические сигналы в речь. Ранний прототип такого устройства уже создан учеными из Калифорнийского университета в Сан-Франциско.
Читать дальше →
Всего голосов 14: ↑14 и ↓0 +14
Просмотры5.3K
Комментарии 17

Израильтяне совершают компьютерную революцию

Чулан
Его уже назвали «священным Граалем» компьютерной технологии. Речь идет о программном обеспечении, которое позволит человеку общаться с компьютером «нормальным языком», точно так же, как люди общаются друг с другом.

Специалисты-компьютерщики во всем мире уже более десяти лет бьются над ускользающей целью, но пока безрезультатно. Однако на днях основанная в Иерусалиме компания Linguistic Agents сообщила о том, что ее специалистам удалось создать прикладную программу, которая позволит компьютерам понимать человеческую речь. Стоит ли говорить, что это приведет к настоящей революции в компьютерном мире.
Читать дальше →
Всего голосов 19: ↑16 и ↓3 +13
Просмотры286
Комментарии 16

Переходный возраст, реальность, реальность или реальность?

Чулан
Однажды младшая сестрица попросила написать статейку для ее школьной газеты, один номер которой выходил с темой «Кризис подросткового возраста: миф или реальность?»
Можно было выбрать тему, и я решил написать некоторые свои мысли по поводу нашей речевой субкультуры, типа «медведов» и прочих «пацталом».
Хотел бы услышать мысли, идеи, комментарии по этому поводу.

Сразу хочу предупредить, эта статья предназначается не столько IT-сообществу, сколько людям, достаточно далеким от Интернета.
Пожалуйста, принимайте это во внимание при чтении.

Читать дальше →
Всего голосов 32: ↑14 и ↓18 -4
Просмотры177
Комментарии 19

Речь и VoiceOver в Mac OS X на русском язке

Разработка под MacOS
Я кое-что делал для iPhone и столкнулся с интересными «вещами». Эти «вещи» я быстренько приспособил для Mac OS X (развлечения ради), и вот, что получилось… Функционал «Речь» и VoiceOver в Mac OS X на русском языке. Кому-то это может оказаться полезным. Применений можно найти множество, но всё зависит от потребностей.



Эту маленькую статью я разобью на две части. Одна часть для обычных пользователей, которые просто хотят установить поддержку русской речи в Mac OS X. И для начинающих разработчиков, которым я расскажу, как устроен модуль и предоставлю исходные коды.
Читать дальше →
Всего голосов 39: ↑32 и ↓7 +25
Просмотры9.2K
Комментарии 46

Незаметная смерть распознавания речи

Искусственный интеллект
Предполагалось, что когда компьютер научится понимать человеческую речь, мы быстро сможем создать искусственный интеллект. Но точность систем распознавания речи достигла своего пика в 1999 году и с тех пор застыла на месте. Академические тесты 2006 года констатируют факт: системы общего профиля так и не преодолели уровень 80%, тогда как у человека этот показатель составляет 96-98%.

Профессор Роберт Фортнер из Media Research Institute считает, что создатели систем распознавания речи окончательно зашли в тупик. Программисты сделали всё что смогли, и у них не получилось. Спустя несколько десятилетий они поняли, что человеческая речь — не просто набор звуков. Акустический сигнал не несёт достаточно информации для распознавания текста.
Читать дальше →
Всего голосов 190: ↑166 и ↓24 +142
Просмотры25.9K
Комментарии 313

Распознавание речи на собственном сайте: тестовый стенд распознавания Speereo

Speereo Software
Здравствуйте хабравчане! Мы рады появиться на Хабре и надеемся, что мы здесь надолго и будем полезны как Вам, так и для себя извлечем пользу.

Итак, с трепетом к первому посту!

Проблема

Часто на веб-сайтах пользователям приходится заполнять формы запросов. Это могут быть названия железнодорожных станций или аэропортов в сервисе заказа билетов, названия улиц в поиске на карте, названия товаров или групп товаров в интернет-магазине, наконец, обычный поиск по сайту или форуму.
Во всех этих случаях происходит выбор из некоторого, заранее известного списка или индексированного набора слов/фраз.
Особенно неудобно вводить такие текстовые запросы, когда поиск осуществляется со смартфона. Иногда делать это настолько неудобно, что мы отказываемся от использования сервиса, решаем «сделаю попозже» и забываем.

Решение

Мы предлагаем альтернативное решение подобных проблем с помощью собственного «облачного» распознавания слитной речи, внедренного в Ваш сайт.
Читать дальше →
Всего голосов 11: ↑6 и ↓5 +1
Просмотры8.7K
Комментарии 13

Измерение разборчивости речи: субъективные методы

Звук
Из песочницы

В чем дело?


Мы разговариваем по телефону, мы слушаем выступления и речи в концертных залах. Некоторые из нас пытаются подслушать чужой разговор, иные – сделать прослушку невозможной. Однако для всех наведенных выше случаев бывали такие ситуации, когда посторонний шум настолько мешал услышать нужное, что слова становились попросту неразборчивыми. Чтобы таких проблем не возникало, перед эксплуатацией трактов проводится акустическая экспертиза каналов речевой коммуникации.

Канал, либо тракт речевой коммуникации (или канал передачи речевой информации) – это физическая среда, путь, который проходит звук от отправления к приему. Это может быть воздушный, электроакустический, вибрационный, параметрический, оптико-электронный канал, однако не будем останавливаться на их рассмотрении, так как наша цель – измерение важнейшего критерия качества тракта – разборчивость речи.
Читать дальше →
Всего голосов 19: ↑17 и ↓2 +15
Просмотры12.4K
Комментарии 5

Измерение разборчивости речи: формантный подход

Звук
Форманты – это такие области в спектре звука речи, где концентрация энергии максимальна. Впервые формантный подход был предложен еще в 1929 году Д. Коллардом. Он прочно держал свои позиции до 70-х, пока не был предложен модуляционный подход, позволяющий учесть не только шумовую, но и реверберационную помеху, эхо и нелинейные искажения.

За 80 лет существования формантный подход обрел много сторонников и модификаций, однако самой распространенной стала зарубежная версия формантного метода, известная как индекс артикуляции (AI). К нему мы придем, рассмотрев версию Н. Б. Покровского и базирующийся на нем современный отечественный метод измерения разборчивости речи.
Читать дальше →
Всего голосов 24: ↑23 и ↓1 +22
Просмотры16.8K
Комментарии 9

Измерение разборчивости речи: модуляционный подход

Звук
В предыдущих статьях, посвященных разборчивости речи, я рассмотрел объективные методы и формантный подход. Данный топик будет завершающим, и мы рассмотрим модуляционный подход к измерению разборчивости речи как в системах связи, так и в помещении.

Рождением модуляционного метода можно считать 1970 год. Т. Ходгаст и Г. Стинекенр разработали систему, которая использовала тестовый сигнал в виде шума, модулированного по амплитуде сигналом фиксированной частоты с огибающей прямоугольной формы. Спектр несущего шума был подобен спектру долговременной речи. В результате при оценке разборчивости удавалось учесть влияние шума, клиппирования и реверберации. В последствии, специально разработанное устройство давало возможность измерить индекс передачи речи STI (speech transmission index).
Читать дальше →
Всего голосов 10: ↑10 и ↓0 +10
Просмотры6.3K
Комментарии 1

Библия проектирования. Часть вторая. Костыли, изгнание из рая, Каин, Авель, и снова с чистого листа

Проектирование и рефакторинг
image

Вот он первый сорванный дедлайн. Пока еще маленький звоночек больших проблем.
Проходит время, про контер-страйк уже никто не вспоминает, и вместе со слоем пыли на столе для пинг-понга, растет напряжение.
Поломка последней кофе-машины на этаже стала причиной экстренного совещания, и есть только один человек, который сможет найти решение.

Из последних сил и отбросив такт, ты начинаешь свой рассказ.

Читать дальше →
Всего голосов 121: ↑101 и ↓20 +81
Просмотры2.2K
Комментарии 18

Великая речь великого человека

Чулан
Это был его первый звуковой фильм. Его личный протест, никто не соглашался дать ему денег на картину, разоблачающую Гитлера как сумасшедшего тирана. Гитлер по мнению журнала «The Times», был Человеком года и великим политиком.
Тогда Чаплин снял фильм «Великий Диктатор» на свои личные средства.
Фильм, послужившей одной из причин его изгнаия из США.
Фильм, который посмотрел Гитлер и объявил Чаплина своим личным врагом.

И речь, которая остается актуальной и по сей день, не смотря на то, что уже прошло больше 70-ти лет.
3.809.000 — просмотров у оригинального ролика, который уже перевели на 22 различных языка.
Вот русские субтитры к этому ролику:


Почему этот ролик на хабре? Это первое, что пришло к вам в голову после просмотра?
Upd. Огромное спасибо всем, кто гадит мне в карму и угрожает в личке.
Upd2. Это первый случай на хабре, пост не по it? Нет.
*пруф1 freetonik Doug 'QualiaSoup' Непредубежденность
*пруф2 муравьи зомби
Читать дальше →
Всего голосов 173: ↑95 и ↓78 +17
Просмотры2.7K
Комментарии 135

Преобразование текста в речь на Android

Разработка под Android
Перевод
Android предоставляет полезную функцию, которая преобразовывает текст в речь (TTS), и воспроизводит текст на разных языках. Это руководство объясняет, как создать данную функцию. В этом уроке я также объясню, как изменить тип языка, громкость и уровень скорости.

Исходники

Ниже я представил видео конечного результата.



Читать дальше →
Всего голосов 14: ↑8 и ↓6 +2
Просмотры18.9K
Комментарии 5

Способы оценки субъективного качества речи

АлгоритмыРазработка систем связи
Из песочницы
Так или иначе наиболее важным ресурсом в сетях передачи данных является пропускная способность каналов связи. Помимо увеличения максимальной пропускной способности каналов связи и их числа очевидно, что имеет смысл оптимизировать использование уже имеющихся. Например, применяя алгоритмы сжатия. Для каждого случая наиболее оптимальный алгоритм (с точки зрения вычислительной сложности, коэффициента сжатия и т.п.) может быть своим.
Особенностью сжатия звука является субъективность её восприятия человеком. Это одновременно даёт возможность исключать незначительную информацию из сигнала, но и усложняет алгоритм сжатия.
Для того, чтобы достичь наибольшего коэффициента сжатия при минимальных потерях субъективного качества необходимо знать законы его восприятия. Этим занимается Психоакустика.
При использовании психоакустических свойств для сжатия традиционные способы оценки качества уже не подходят. Так, например, соотношение сигнал/шум становится практически бесполезным, т.к. сжатие происходит без учёта тех частей, которые человек не воспринимает. Таким образом, оценка качества так же должна учитывать свойства слухового аппарата человека.

Под катом будут рассмотрены некоторые свойства речевых сигналов и особенностей их восприятия человеком, объективные и субъективные способы оценки качества этих сигналов.

P.S. В данной статье использована моя дипломная работа, защищённая в 2011 году в Московском Авиационном Институте на факультете Радиоэлектроники Летательных Аппаратов каф. 402. Ранее работа нигде не публиковалась.
Читать дальше →
Всего голосов 35: ↑32 и ↓3 +29
Просмотры33.7K
Комментарии 5

Что нельзя говорить со сцены на ИТ-конференциях, но очень хочется

Учебный процесс в IT


Как известно, во многом мы берем пример с Европы и США. К ИТ-сфере это относится в полной мере: разработчики перенимают инструментарий и лучшие техники программирования, ИТ-менеджеры равняются на самые прогрессивные методы управления проектами и разработкой.

Если специалист добился успеха в какой-то сфере знаний и умений, то он должен быть готов поделиться своим опытом с широкой аудиторией. И в этом случае есть на кого равняться: в сети огромное количество записей с крупнейших ИТ-конференций мира и выступлений лучших в своём деле ораторов, спикеров и так далее.

Однако отдельные личности с критическим мышлением предостерегают нас от ошибки при выборе примеров для подражания. Далеко не всё, что говорят даже самые лучшие спикеры, положительно воспринимается аудиторией.
Читать дальше →
Всего голосов 65: ↑57 и ↓8 +49
Просмотры36.2K
Комментарии 39

На волнах эффекта Ли: Питонизируем генерацию DAF

Open sourcePythonПрограммированиеQtЗвук
imageПо статистике 1-4 % населения Земли подвержены дефекту речи, характеризующимся частой пролонгацией звуков (слогов, слов) и/или частыми остановками в речи, нарушающими ритмическое ее течение. В простонародье этот феномен известен как заикание.

На данный момент мир не знает панацеи, на 100 % избавляющей от заикания, однако существует преинтереснейший метод, позволяющий с тем или иным успехом купировать это речевое нарушение у большинства заикающихся. Метод основан на эффекте Ли, заключающемся во влиянии задержки акустической слуховой афферентации на плавность речи, и носит название DAF (Delayed Auditory Feedback).

Ниже рассмотрим пример построения на коленке простого генератора речевой обратной связи силами Python и PyQt. У-у-ух, it's gonna be fun!
Читать дальше →
Всего голосов 14: ↑13 и ↓1 +12
Просмотры3.9K
Комментарии 3

От аукционов до колыбельных: как и где «работает» человеческий голос

АудиоманияНаучно-популярноеЛайфхаки для гиковЗвук
Выразительность человеческого голоса уникальна. Он позволяет людям обмениваться информацией, воздействует на наши эмоции, может служить источником напряжения или расслабления и быть «музыкальным инструментом». Сегодня рассказываем о том, как голос используется в различных ситуациях и влияет на наше настроение и действия.

Кстати, если вам больше нравится микроформат — у нас есть свой Telegram-канал.


Фото Best Picko CC

Быстрая речь


Скорость разговорной речи колеблется в диапазоне между 120 — 200 слов в минуту. Исследования свидетельствуют, что этот показатель меняется в зависимости от культуры говорящего, географического положения, пола, эмоционального состояния или аудитории слушателей.

Скорость произношения может зависеть и от профессии. Например, комментаторы и аукционисты тренируются говорить быстро: в диапазоне от 250 до 400 слов в минуту. Среди аукционистов даже проводятся специальные соревнования, оценивающие скорость и манеру речитатива. Ниже приводим пример выступления из мирового чемпионата по продаже крупного рогатого скота, который проходил в 2015 году.
Читать дальше →
Всего голосов 15: ↑14 и ↓1 +13
Просмотры2.7K
Комментарии 0

Ученые нашли участок мозга человека, отвечающий за высоту тона нашей речи

АудиоманияНаучно-популярноеЗвукМозгЗдоровье
В июне команда ученых из Калифорнийского университета в Сан-Франциско опубликовала исследование, которое проливает свет на то, как люди меняют высоту тона в своей речи.

Результаты этого исследования могут быть полезными в создании синтезаторов естественно звучащей речи — с эмоциями и различными интонациями.

Об исследовании — в нашей сегодняшней статье.

Читать дальше →
Всего голосов 26: ↑23 и ↓3 +20
Просмотры10.3K
Комментарии 4
1