Pull to refresh
0
0
Дмитрий Ивченко @mit_idv

Технологический предприниматель

Send message
Ну тогда Вам сюда: htk.eng.cam.ac.uk/ :)
На самом деле, распознавание и синтез Гугла — это не Open Source, а использование уязвимости.
По идее, Вам бы использовать движки синтеза и распознавания с открытым кодом для чистоты идеи.

Кстати, проблема с распознаванием в умном доме — это как раз микрофоны. Вам надо либо носить микрофон с собой, либо строить в помещении дорогую систему микрофонов.

Опубликуем наш сервис распознавания — попробуете.
Но без коммерческих предпосылок никто конечно не даст коммерческие движки синтеза и распознавания надолго. Пока что это слишком дорогостоящие в разработке штуки.
А Вы приходите всё равно, у нас много и очень разного! :)
1. Ускорять и замедлять голос можно через стандартные возможности API — язык разметки SSML.

2. Тарификация посекундная, так что минуты хватит на несколько «телеграмм».

Чем просто ругать, возьмите бесплатный промо-ключ на 20 минут, попробуйте для конкретной задачи и предложите другое ценообразование, исходя из цены изделия/сервиса, которое вы хотите предложить конечному пользователю.
Большое спасибо за советы, и к массовости мы придём.

Но если даже траву тянуть руками, она быстрее не вырастет. К сожалению, мы не можем разрушать наши целевые рынки, в данном случае рынок систем голосового самообслуживания, демпингом. Так что всему своё время. Если для Вас лично наши цены дороги, а уговорить нас предоставить лично Вам сервис дешевле у вас нет — значит, время не пришло для нашего с Вами лично партнёрства.

У нас нет внешнего инвестора и веб-сервис является внутренним стартапом довольно большой компании, готорая работает с компаниями масштаба Гугла и Яндекса в партнёрских отношениях.
Пишите вашу идею, рассказывайте. Всё обсуждаемо. Просто «некоммерческих» использований на самом деле довольно мало :) Если докажете, что у вас именно такое — дадим. Только не обижайтесь, если мы будем медленно и неохотно отвечать, потому что на самом деле мы делаем суровые «изделия», и у команды довольно немного свободного времени :)
Если появляются конкретные задачи, мы всегда «подпиливаем» синтез для идеального произнесения наиболее характерных для этой задачи фраз. Кроме того, можно размечать текст, чтобы помогать роботу читать его лучше. Просто новости читаются безо всякой помощи человека — это самый сложный случай для робота.
Киллер-фичи тут нет. Синтез речи уже давно не новость. Но вот к его качеству были и будут претензии. Мы стараемся сделать его лучше и лучше. Мы просто технологическая компания, разработавшая технологию русского синтеза с массой тонкостей и претендующая на лидерство в этой технологии. Долгое время держали разработку при себе и на очень узком рынке автоматических систем голосового самообслуживания, а вот сейчас решили расширить аудиторию. Будем рады, если вы воспользуетесь приложением или открыточным сервисом, дадите ваши отзывы, порадуетесь вместе с нами. Если запустите собственный стартап в партнёрстве с нами — вообще отлично! :)
Простите, это правда не совсем так. Мы честно проводили исследования, а не называли цену «с потолка». Вы можете исследовать free-lance.ru или любое другое сообщество фрилансеров, чтобы узнать, за какие деньги можно озвучить текст человеческим голосом. Это в несколько раз дороже 1 доллара в минуту. Тонкость в том, что человек редко может читать текст быстро, точно и с ровным выржением долго и с первого раза. Получаются дубли, монтаж и совсем не 1 минута записанной реч за одну минуту работы.

Впрочем, если Вы чувствуете в себе силы стать профессиональным диктором — поработайте на этом поле, поконкурируйте с нашим синтезом и профессиональными дикторами. Глядишь, мы вас пригласим стать очередным голосом нашего синтеза! :)

Information

Rating
Does not participate
Registered
Activity