Комментарии 113
Вы несколько раз повторили "система обучается". А можно, все-таки, рассказать технические подробности — как устроено обучение, откуда берутся "действия", ну и так далее?
Может быть стоит разместить код на гитхабе?
Поймите правильно, здесь людей интересует прежде всего технарство, а не платность или доступность для инвалидов. Технарства мало, вот и критика. Зато картинки, да.
Вот прочитав то, что здесь написано, и поняли.
Собственно, любая вменяемая статья пишется ради того, чтобы читатель что-нибудь из неё выудил для себя любимого. Отсюда же что-то найти для себя трудно. Разве что отметить: ага, такой-то делает то-то.
здесь, в блоге ии и мл, людей интересует математика и наука, а не это… пффф… технарство
Была бы нейронная сеть с полным пониманием контекста и самообучением из открытых знаниях в интернете, это было бы уже интересно.
А так, это всего лишь поделка любого школьника, начинающего программировать.
Критика вам, может быть, покажется жесткой, но реальность такова.
Поделка любого школьника, Cortana, Siri тоже? Чтобы создать такое, тут надо быть не только программистом.
Критику я любую выслушаю, но если человек для начала подробно поймёт, как работает система.
Ну вы же сами говорите, что понять нельзя, т.к. система нигде в деталях не описана. И что же делать?
Здесь неплохо бы выкладывать то, что поможет другим людям, которые хотят сделать так же.
Была задача поделиться системой, бесплатно пользоваться, а не отдавать труды годов, чтобы сделать плагиат или как некоторые украсть код. Вообще о чём Вы говорите, мне не понятно, здесь тысячи статей без кода, а как информационные.
Между «проинформировать о системе» и «отдавать труды годов» лежит пропасть оттенков. Скажем, исходный алгоритм Google PageRank в открытом виде опубликовали в 1998 году, но вот как-то никто не украл, хотя как оказалось, золотое дно. Не всё так просто.
Доказательство — набор шаблонов. Все в юности такими вещами игрались.
Я тоже такие чат-боты делал для себя лет 10-15 назад и точно так же, на регэкспах. Шаблонов было побольше и бот даже запоминал список дел, умел запоминать введённую информацию и выдавать её по запросу. Но я как-то не рискнул назвать этот примитив «искусственным интеллектом» и не было претензии на такое громкое слово.
Потому что изначально ясно, что этот путь (шаблоны) тупиковый и его используют только чтобы поиграться, но никак не для серьёзного дела.
Интеллектуальная система и искусственный интеллект, это разные вещи, так-же как и искусственный интеллект и искусственный разум.
И, собственно, с каких пор проверка соответствия регэкспу стала делом «традиционно считающимся творческим»? Это, в конце концов — даже не вывод новых фактов по имеющимся :-)
p.s. если таки будет интересно — я бы ударился в тему классификации запросов на естественном языке. Тем более — есть как готовые API (хотя, возможно — не подойдут для нужного языка), так и слегка рабочие локальные библиотеки. Но вообще — api.ai же :-)
Где вы видели в статье текст про создание искусственного интеллекта, где??? Вы путаете понятие интеллектуальная система и искусственный интеллект. По вашему экспертная система так-же должна обладать разумом?
Текущее положение дел у вас можно назвать обучением только с натяжкой, очень примитивным.
В моем понимании обучение, это когда система знает что A=B и B=C, и сама делает вывод что A=C. Или на примере нейронных сетей, с тем же распознаванием картинок, голоса. И это еще не искусственный интеллект.
У вас же просто «вопрос — ответ». Вы еще упоминали, что может быть несколько ответов на вопрос, полагаю, что выбирается любой из них по принципу псевдо рандома.
А еще слова «такого никто не сделал». Вам это уже писали, работа не соответствует заголовку и её описанию.
Распознование и синтез речи не ваши, остальное в таком виде не представляет ценности. Чтобы обучить такую систему понадобятся тысячи человеко-часов. У вас столько есть?
Я сотый раз спрашиваю, где сказано про искусственный интеллект??? Вы опять написали, это ещё не ИИ. Есть человекоподобный робот, он должен быть идентичным человеку или лишь похож на его? Именно распознавание и синтез речи не представляет ценности, а промежуточная система, так что вы глубоко ошибаетесь. Синтез речи проще сделать, чем подобие интеллекта, тот-же очень сложный чат-бот, как тут говорят про умные системы. Если система сама будет обучаться, как у мня коллективное обучение, это будет намного быстрее, чем вы думаете. Насчёт тех, кто пишет, тут просто ответы на фразы, система поддерживает контекст, а так-же ассоциации.
А сообщество видит ИИ в вашем после по контексту, больно пафоса много в ваших словах, слишком амбициозное заявление «человекоподобной системы, которая сможет обучаться как ребёнок и вести осознанный диалог». Вот что я вам пытаюсь донести.
Если вы считаете, что синтез речи проще сделать чат-бота, вы глубоко заблуждаетесь. Правда вопрос в качестве безусловно. Нет такого синтезатора, который бы говорил без ошибок, без «роботизированного акцента».
Для своих целей использую оффлайн синтез речи festival, он значительно уступает облачным аналогам.
Про коллективное обучение. Задачи распознования и синтеза речи являются социально значимыми, на них делают ставки крупные компании. В их обучении используют тонны аудиозаписей.
Да, вам писали про исходный код, что ничего из этой затеи не получится. Но негативная реакция сообщества совсем в ином ключе. Слишком много пафоса, не соответствует ваша система тем громким словам, что вы написали.
А со ссылкой для сбора средств это выглядит, как «дайте мне мильон и будет соответствовать». Дураков здесь нет. Прорывных технологий тоже нет.
Я уже говорил, что при обработке используются перцептроны, а как известно, перцептрон — математическая или компьютерная модель восприятия информации мозгом, перцептрон стал одной из первых моделей нейросетей.
Ох, как вы заблуждаетесь про синтез речи, он уже давно на уровне человеческого, вы даже не отличите его, просто не знаете наверно ЦРТ.
Насчёт соответствует или нет, для начала надо ознакомится, а потом уже делать выводы. А вы этого не знаете, так как говорите про какие то глупые регулярки, которых даже нет.
Вы в своем максимализме сами осознанный диалог вести не в состоянии, к слову про «глупые регулярки» писал не я.
Что касается синтеза речи. Вы считаете что эту запись, скаченную с voicefabric.ru можно назвать на уровне человеческого?
Если это так просто, почему нет хорошего оффлайн решения? Попутно, посмотрите тарифы на ЦРТ.
Ну нет такого решения, которое бы не проглатывало звуки, правильно расставляло интонации и акценты. Задача далеко не тривиальная, чего бы там вам не казалось.
А в свободном доступе даже уровня ЦРТ нет.
С распознованием речи тоже все просто, по всей видимости?
Уже есть
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
https://storage.googleapis.com/deepmind-media/pixie/knowing-what-to-say/second-list/speaker-4.wav
Да, упустил в своем категоричном утверждении, что речь про синтез на русском языке. Тот же google translate говорит «чище» на английском.
Синтезом на английском занимаются гораздо дольше. Могу ошибаться, на мой взгляд английская речь проще, более строгие правила построения предложений и т.п.?
Там же есть примеры речи на китайском языке, а он сложнее русского
Как понял, этих наработок сейчас нет даже в платном доступе. Что-то нашел на гитхабе, почитаю в свободное время.
Тем не менее, чтобы развеять мифы про простоту задачи для andrejevs, там же написано:
метод требует большого количества машинного времени и ресурсов. Система, которая может генерировать внятную человеческую речь, должна быть очень мощной. Дело в том, что WaveNet для синтезирования человеческой речи обрабатывает каждую секунду 16000 образцов аудио.
Исследователи из DeepMind уже загрузили в систему более 44 часов речи. Загружаемые в систему слова, звуки и фразы принадлежат 109 участникам эксперимента, разговаривающих на английском языке.
Зачем Вам перцептрон? Это же глупо, тем более когда база растет. Нейронные сети неспособны мыслить, у Вас там будет просто классификация. Вот мой проект:
Я сам в своем проекте использовал НС.
Но только для синтеза текста из семантического вектора. Для "мышления" использую совсем другие алгоритмы. Сейчас для распознавания голоса тоже НС использую, но не перцептроны, у них очень узкая сфера применения…
Вы это Cubic так-же скажите, который кстати не сделал лучше, при это называется персональный искусственный интеллект.
Да, только на их статью почему то не орали во всё горло, где коды, где ИИ. Тут люди просто не знаю чем отличается ИИ, ИР, экспертная система и т.д. Услышав слово интеллектуальный или умный, значит должен быть разум.
но чувак, в 2к17 делать то что делашь ты — это уровень курсовика второго курса универа, если бы ты статью оформил как «введение в экспертные системы» то собрал бы 100500 плюсов, но ты же одной фразой ставишь себя на уровень выше кортаны и сири
Многие подумают, что это голосовой ассистент типа Cortana, Siri, Дуся и подобные. Нет, я не создаю голосового асистента, а что-то большее, так как упор идёт на разработку человекоподобной системы, которая сможет обучаться как ребёнок и вести осознанный диалог.
ты собираешь на что то бабки, все что хочется написать к этому посту это
как упор идёт на разработку человекоподобной системы, которая сможет обучаться как ребёнок и вести осознанный диалог
осознанно вести диалог? по базе правил? рили? вот зацени https://gigaom.com/2017/01/16/four-questions-for-geoff-hinton/ даже дед нейросетей говорит что следующий барьер который должен преодолеть ИИ это семантическое понимание текстов, но нет, ты же его преодолел еще в 2012 на шарпе и пхп
откуда же столько негатива и минусов? чувак удосужься почитать классическую литературу по ИИ, начни например с «Искусственный интеллект: современный подход» Питера Порвига, затем почитай что нибуль про машинное обучение, например Кевин Мерфи «Machine Learning: A Probabilistic Perspective», затем зацени новую книжку по нейросетям «Deep Learning» Гудфелоу и Бенджио; почитай свежие статьи, и тогда приступай к работе
… даже LUIS не прикрутили, не смотря на "облачность" системы?
Сделайте, я посмотрю. Вы даже не знаете алгоритмы ядра.
Модуль анализа диалога за сутки в разработке, могу сказать что система владеет начальным морфологическим словарём, в дальнейшем который сможет сама пополнять обучаясь, помогая в анализе диалога. Так-же анализ по часто употребляемым словам и некоторым другим особенностям.
В данный момент поиск сказанной человеко фразы происходит по персептрону, который разделяет слова и находит фразы с большей вероятностью. Так же система помнит о чём говорили сегодня.
Про коррекцию. Система использует коллективное обучение, где каждая фраза имеет процент успешности, задавая различные вопросы, система так корректирует свои знания.
Пример: Вы задали вопрос, как зовут мою маму, она ответила не так, вы сказали не правильно и она тут же сделала коррекцию на ответ, если же несколько раз ответ был не правильным на один вопрос, она его удаляет. Так же она может сама задавать вопросы, для коррекции фраз.
Я тоже занялся своим распознаванием речи. То что примитивны, не спорю, потому что работают по структуре вопрос-ответ, я же делаю другое. Да и моя система уже умеет управлять физическими устройствами, светом и т.д. Да и планирую подключить OpenCV.
Когда вы пытаетесь объяснить принцип работы системы "на пальцах", получается очень размыто и только больше запутывает. Не обязательно выкладывать код, опишите общепринятыми терминами и формулами математические модели, которые вы используете и вопросы отпадут. Сейчас статья скорее подходит для Geektimes.
Планируете ли открывать исходный код?
Зачем программа ломится к вам на сервер, зачем нужна какая-то регистрация? Собственно без регистрации ничего и не работает — не люблю я такие программы, чтобы просто попробовать нужно еще слить свой email куда-то — бред.
Код самого клиента не особо интересен, а вот «Мозга» системы, уже интересен, но пока не планирую, потому что всё сыро.
Регистрация нужна для создания уникального профиля, где хранится информация имени, интересов и т.д. пользователя, так как вся логика работает в облаке. Ранее была возможность без регистрации, так сказать гостевой вход, как бы урезанный фнукционал тогда получается, пока отключен. Плюс облачной системы в том, что я планирую так-же запустить эту систему на Ардуино платформе.
Возможно как-то уменьшить время ожидания?
Мощную нейронную сеть с глубоким обучением без крупных ресурсов не заюзать, к сожалению,
обычному смертному, либо это будет что-то примитвное. Можно посмотреть в сторону анализа текста на основе работ Апресяна (на них же базируется разработка этап-3)
Хотелось бы деталей по архитектуре, если можно. Пока соглашусь с остальными — разработка примитивна и кроме архитектурного решения в ней пока нет ничего интересного. У Вас, к сожалению, нет кучи ресурсов чтобы наделить кучей простых функций вашу систему, как, например, Алекс от Амазона, или Сири.
Мне кажется, Вам нужно идти немного в другую сторону, иначе, конкурентов просто не переиграть (
Желаю удачи в проекте
Время ожидания 1-3 секунды, зависит от интернета, настроек и доступностью серверов.
Сразу скажу, конкурентов у меня и нету, так как я иду другим путём, может быть на первый взгляд этого и не видно.
Это не у Вас нет конкурентов, это Вы не конкурент этим самым конкурентам.
А так у Вас такой же корявый путь как и у всех (ИМХО) — все в облаке, нет инета — нет облака и вся ваша система накрывается медным тазом, все ваши управляемые ардуинки сдуваются и ничего не работает.
Про гигантов вроде Google и Amazon все понятно, почему они идут таким путем, но зачем Вам идти по облачному пути мне не понятно, только не говорите эту заезженую фразу… пардон, вы её уже сказали
>>создания уникального профиля, где хранится информация имени, интересов и т.д. пользователя, так как вся логика работает в облаке.
почему это нельзя сделать в офлайне? только не говорите, что не хватит мощности моего компа чтобы посчитать все по вашему супер-пупер-алгоритму, эта старо, придумайте что получше.
Создать оффлайн систему можно, но она будет мало знать, это как закрыть человека в пустой тёмной комнате. При этом оффлайн распознавание не будет таким хорошим как онлайн.
Пароль имеет чувствительность к регистру, password и PassWOrD, это разные пароли.
Регистрация нужна для создания профиля с данными пользователя, где хранятся имя, дата рождения, интересы и т.д., это делалось для создания кроссплатформенности.
для создания профиля с данными пользователя, где хранятся имя, дата рождения, интересы
Это я читал уже в ответе выше. Но регистрация только чтобы попробовать, слегка работающее приложение-прототип — по-моему, перебор. Т.е. получается только ваша прихоть что-то хранить о пользователе… а не требование облака.
это делалось для создания кроссплатформенности.
А вот этот тут причем? Как я понимаю, в облаке просто сервисы, а приложение их дергает, причем здесь кроссплатформенность?
Из Вики берётся информация как описание чего то
Ну естественно, речь и шла о базе знаний. По сути и Уотсона пропогандировали изначально как удобную экспертную систему с языковым интерфейсом. Ну это к тому, что бы ЭЛИС могла знать, что такое бумага и из чего ее делают =)
Офлайновыми никто такие системы делать не будет.
В любом случае, я предпочту цепь из одного звена (мой компьютер) цепи из звеньев «компьютер — канал — провайдер — канал — поставщик — сервер». Ясно же, что в реальности любого мира первое куда надёжнее.
Работаю над электронной очередью на выставке кошек. Это такое мероприятие, когда снимается в аренду помещение на сутки, ставится свое оборудование и из коммуникаций есть только электричество. Да, сейчас, есть мобильные модемы, но это очень ненадежно.
Итого имеем, каждые мин 7 нужно синтезировать речь для приглашения следующего участника выставки. И риск, что соединения оборвется или скорость будет ниже плинтуса.
В торговый центрах как правило провайдер-монополист и больше ничего. Да, интернет есть, но проблемы с каналом тоже бывают. Арендаторы изобретают велосипеды с подключение резервного провайдера и автоматическим переключением в случае падения.
Вчера хотел оплатить коммуналку, у управляющей компании даже сайта нет для автоматизации. На двери радостная надпись «Касса не работает. Нет связи.»
Вы, наверное, живете в другой реальности. В моей же, интернета может не быть.
Демонстрационное видео.
https://www.youtube.com/watch?v=mRflfrGhFE8
А тут за любой ответ ставят минус, могу сказать, такое могут делать только неудачники и обиженные, которые не могут по другому ничего сделать.
Здесь полно статей про "Умный дом", где управление через телефон, где тут Умный дом??? Кто Вам сказал, что интеллектуальная система, значит это разум? Для тех кто в танке!!!
Интеллектуа́льная систе́ма (ИС, англ. intelligent system) — это техническая или программная система, способная решать задачи, традиционно считающиеся творческими, принадлежащие конкретной предметной области, знания о которой хранятся в памяти такой системы.
А какие из решаемых вами задач "традиционно считаются творческими"?
Мне не о чем говорить с хейтерами. Ставьте дальше минуса.
Надеюсь вы знаете как работают персептроны, фраза делится на массив слов, далее идёт поиск в базе по большей вероятности.
на вход подается действительный вектор, вычисляется линейная комбинация и берется нелинейность
а как вы подаете в персептрон слова? вы из как то кодируете в действительные числа? а поиск по базе вероятностей это часть персептрона?
А почему слова нельзя сравнивать, чем они отличаются например от пикселей двумерного массива?
Как мило: приписать оппоненту выгодное вам поведение, записать его в хейтеры — и на этом основании отказаться отвечать на вопрос по теме поста. Ну-ну.
Общее впечатление — статья на хабре для сбора денег на https://planeta.ru/campaigns/elis
Вы уж меня простите ))
ИИ на регулярках? Серьёзно?
Тогда добро пожаловать обратно в 2000-й к асечному боту «Болтун». Он тоже на регулярках был написан.
Выложите код на github, наконец, (под CC NC BY или GPL например ) и минусовщики будут довольны.
К разговору об обучаемости. Вот у вас в ролике есть диалог: "из чего сделана бумага — из дерева". Окей, предположим, система обучилась. Что теперь будет, если я спрошу, что сделано из дерева?
Или вот тоже. Предположим, я, идя на кухню, говорю: "я иду на кухню, выключи свет". Где система выключит свет? "Я иду на кухню, включи свет" — где система включит свет? Наконец, если я каждый вечер говорю то одно, то другое, то "научится" ли система, рано или поздно, когда я ухожу из комнаты, гасить в ней свет, и включать его на кухне, пока я туда иду? И если да, то какие действия с моей стороны для этого нужны?
Интеллектуальная система ЭЛИС