Pull to refresh

Comments 27

Black SEO, например. В генерации текстов для дорвеев это очень популярная тема. А для остальных людей это just for fun.
Главная книжка по теории генерации сказок — классический труд Проппа «Морфология волшебной сказки». Там описаны все известные (на начало XX века) паттерны сюжетов сказок.
UFO just landed and posted this here
UFO just landed and posted this here
«Весь известный на начало XX века паттерн» :D
а что ещё есть почитать полезного по предмету? кто-то ещё паттерны других жанров/сущностей исследовал и систематизировал после Проппа?
UFO just landed and posted this here
Для игры нужно составить достаточно большое кол-во диалогов на заданную тему.
Есть ли шанс с помощью этих технологий автоматизировать хотя бы часть этой трудоемкой работы?
Всё просто и сложно одновременно, очень много в русском языке неоднозначности, а руками составлять шаблоны которых бесконечное множество — недостижимая цель. Я шаблоны на основе корпуса + словаря Даля генерирую, для поиска текстов осмысленно связанных с запросом хватает, для автоматического рерайта пока шаблонов немного маловато.
т.е. не удается из ограниченного количества шаблонов получить бесконечное количество текстов?
А если комбинировать шаблоны?
Не у меня задача была рерайт любого текста, похожие по шаблону строить несложно.
Очень мало подробностей в статье, ожидал увидеть больше практики и теории по тем же цепям Маркова, а не литературную фантазию…
«Пять лет назад в России была впервые в мире опубликована книга, написанная компьютерной программой: любовный роман в стиле Мураками, но с персонажами из «Анны Карениной». Специально созданная для этих целей усилиями восьми программистов компьютерная программа PC Writer 1.0 трудилась три дня, а потом текст прошёл через тщательную литературную обработку усилиями, опять же, восьми редакторов. В целом, в произведение было вложено больше человеческого труда, чем в обычную «человеческую» книгу, и обошлась она дороже, чем гонорар автору, сказал директор издательства «Астрель-СПб», так что эксперимент оказался не совсем честным.»

www.xakep.ru/post/59860/default.asp

Уж что удалось найти навскидку…
Вспомнилось бессмертное
www.elsewhere.org/pomo/

Ну и как-то писал клон вот этого dev.null.org/dadaengine/

А студентом написал генератор матюков произвольной этажности, боюсь в интернет выкладывать, загадят им все…
:-)

Интересно на самом деле, запускать в социалки такое и пусть роботы с роботами разговаривают, флиртуют и троллят друг друга.
:-)
Я нечто похожее делал. Правда называл это: генерация текста по скелетам. Собирал скелеты ( шаблоны ) предложений и потом заменял в них слова.
Вот пример на одном скелете:
Отказ, это пардон на полемику поликлиники в заклинаем кипарисе прецедентов. 
Развал, это моль на лату бляшки в перелистываем коридоре мышеев. 
Стетоскоп, это телевизор на подворотню коже в ограничиваем квартале чесноков. 
Обыск, это трус на корку явке в моем автомате лендроверов. 
Котик, это рукомойник на рознь переписки в формируем формате просторов. 
Дивизион, это легион на требу параллели в переворачиваем ультразвуке хлоридов. 

и второй скелет:
Невдалеке буду на волшебстве усиливать. 
Итого буду на главном плести. 
Шустро буду на хладнокровии стоить. 
Озабоченно буду на неразглашеньи процеживать. 
Дотошно буду на восстановлении запоминать. 
Страшно буду на должном ведать. 
Внимательно буду на преобладаньи укреплять. 
Сторицей буду на мочеиспусканье растить. 
Круто буду на благоразумьи селить. 


Но мой вариант был очень простой, без весов, соединений предложений итд… Так как нужны была скорость.
Да, вот это, кстати, похоже на правду! Следует отталкиваться от теории языка, а не математики. От схем предложений, частей речи и типов словосочетаний.
Единственная проблема в том, что у Вас своеобразные паттерны — я не могу придумать никакого нормального предложения с такой структурой, или из этого набора слов. А как размечали, если не секрет?
В первом случае проблема, скорее всего, была в том, что 8-е слово ошибочно приняли за глагол (возможно, в оригинале это было «моём», которое превратилось в «мОем»). Но где программа взяла «мышеев», объяснить трудно.
UFO just landed and posted this here
По аналогичной схеме реализовывал свой аналог системы Wpoison.
Скрипт (доступный по невидимой ссылке на главной странице) при обращении генерировал 50 поддельных почтовых адресов, которые укладывал в MySQL-базу и отображал на странице.

Каждый почтовый адрес на генерируемой странице, в свою очередь, отображался как ссылка на этот же скрипт (на самого себя). Т.е. бот-коллектор, зашедший на эту страничку, уже не мог с не уйти по содержащимся в ней ссылкам. Адреса каждый раз генерировались новые.

Эту же базу читал почтовый агент (MTA Exim) и, в случае прихода письма на такой поддельный почтовый адрес, отдавал «550 Spamtrap hit» со сбросом (drop) SMTP-сессии и занесением IP в локальный блеклист (не перманентно, лишь на некоторое время).
Это хорошо.
А чего Вам на данный момент не хватает для реализации? Скажем, у меня есть платформа и генератор тестов из крупных блоков: жанр-тема-номер блока-начальное и конечное состояние. Разметить внутри структурных блоков смысловые, а в них — состав предложений — это вопрос времени.
С другой стороны, если у Вас есть наработки по последнему уровню, можно объединить усилия.
— Пусть он напишет рассказ о солнце с лирико-меланхолическим уклоном, и пусть все слова в этом рассказе начинаются с «с», — сказал я. Тотчас же мой спутник дал АТИЛЛе творческую программу, и тот заурчал и замигал своими зенками.
— Ну, друг АТИЛЛА, на этот раз не подведи, — ласково сказал Писатель-Ихтиолог в рупор. — Подушевнее, полиричнее сотвори. Вскоре АТИЛЛА выполнил задание. Листок этот, ровно как и два предыдущих, и поныне хранится в моем архиве.

СОЛНЕЧНЫЙ САБАНТУЙ

Светозарное солнышко справляло свой сабантуй, светило сказочно светло, сияло самозабвенно. Самоцветно синела садовая сирень, старались сладкогласные соловьи, стрекотали стрекозы, струилось ситро, сахарился сладкий сливовый сироп. Серебристым симпатичным смехом синхронно смеялись совершенно счастливые супруги. Седовласая стерлядь скандировала стройные строфы сонета.
Солнце стало склоняться севернее, сгущались сизые сумерки. Смеркалось.
— Сукин сын! Слюнтяй! Солдафон! Стервец! — сказала сому строгая соленая святейшая селедка, сиротливо скучавшая среди салаки, скумбрии, семги.
— Сама скотина, склочница, симулянтка! Свинские слова слышу! — смачно сплюнув, свирепо сказала сумасбродной соседке седоусая сметливая свежепросоленная сардинка, спокойно спавшая среди сетей.
— Собаки! Стрекулисты! Спекулянты! Сплетники! Сычи сонные! Сидни сидячие! Самодуры сиволапые! Скандалисты! Святотатцы! Скобари! Скопидомы! Скряги! Саботажники! Сутяги! — степенно сказала совершеннолетняя
самостоятельная севрюга, слушавшая спор.
Солнышко село, скапутилось, смылось, съежилось. Стало совсем сумрачно.
Скоропостижно скончался сиг.
Сотворил АТИЛЛА
Любопытно, возможно ли сотворить подобное на английском, или наш язык всё таки величавее и мощнее?
На английском проще, за счет большей простоты языка.
>Оцениваю, что для генерации произвольного объема теста таких шаблонов понадобится не так и много.
и на чем эта оценка базируется?

Имхо шаблон — самое сложное. Навесить на него украшательства с весами можно, а вот хороший шаблон дорого стоит.
Sign up to leave a comment.

Articles