Pull to refresh

Comments 4

Ну, получилось практически как у DeepBach (послушать), хотя принцип генерации у него несколько другой. Странно, что авторы на него не ссылаются.

Впрочем, все эти модели страдают немузыкальностью — проще говоря, отсутствием какой-либо осмысленности на масштабах более крупных, чем соседние созвучия/обороты.

Собственно, такая же проблема у LSTM-сгенерированных фраз. Слова там обычно правильные и даже более или менее сочетаются друг с другом, но в целом смысл текста неясен. Так и здесь: отдельные обороты благозвучны и более или менее логично соединяются с соседними, но общая гармоническая логика отсутствует.

Впрочем, есть одно смягчающее обстоятельство: словесный бред заметен любому, кто умеет читать, а музыкальный бред оставляет смутное впечатление «вроде всё красиво, но что-то тут не так», если только слушатель не занимается музыкой профессионально.
все эти модели страдают немузыкальностью — проще говоря, отсутствием какой-либо осмысленности на масштабах более крупных, чем соседние созвучия/обороты.

Действительно, в сгенерированных мелодиях нет "общей картины", фрагменты какие-то. Может, было недостаточно памяти в LSTM, или паттерны, соответствующие "общим картинам" мелодий, подавались при обучении реже.


музыкальный бред оставляет смутное впечатление «вроде всё красиво, но что-то тут не так», если только слушатель не занимается музыкой профессионально.

Совершенно не занимаюсь музыкой, но в том опросе BachBot угадал 5/5. Не уверен, что угадаю повторно — очень похоже (но, субьективно, ни то, ни то не понравилось). Вероятно, сказалась нацеленность на поиск нестыковок в образцах, и сразу было подозрение, что LSTM-сеть не сможет гармонично увязывать дальние фрагменты.

Интересно применение технологии для обучения игре. Например на фортепиано. Собираем статистику за некоторое время, определяем проблемные паттерны и генерируем персональные упражнения.
… и получаем сборник этюдов :-)
Sign up to leave a comment.