Открыть список
Как стать автором
Обновить

Честные глаза плагиатора, или еще один взгляд на будущее систем обнаружения заимствований

Блог компании «Антиплагиат»ПрограммированиеМашинное обучениеМикросервисыNatural Language Processing
Всего голосов 13: ↑13 и ↓0 +13
Просмотры2.4K
Комментарии 12

Комментарии 12

Перефразировка, перевод, скрытый текст, незаметные пробелы, встроенные объекты, – миллион вариантов «повышения оригинальности».

У меня вот этот абзац вызвал вопросы. А именно первые 2 слова. Если исходный текст был перефразирован, т. е. фактически пересказан своими словами — какой же это плагиат? Аналогично и при переводе: если переводить "слово-в-слово", поправляя грамматику, то это будет плагиат, а если использовать исходник творчески, без прямого перевода, а фактически опять же пересказывая его, то это плагиатом являться не должно.

Степень «творчества» при парафразе и переводе вопрос открытый. В реальной жизни вопрос решается экспертизой. Думаю, что если вы возьмете главу из Гарри Поттера и переведете/перефразируете его, то это все равно будет плагиат.
Как учебное упражнение по AI может быть и годно. Промышленное применение более чем сомнительно. Нет, технически и технологически всё в порядке. Сомнение вызывает сама идея. Для выяснения, кто и у кого какую фразу стянул, напрягать AI нелепо.
Так AI у нас уже «напрягается» и не первый год. Переводные, парафраз, много вспомогательных задач — это все AI. Ну и реальные новинки на подходе. Что называется, следите за новостями.
Здесь действительно нет ничего неосуществимого. Основное препятствие в реализации — это наши представления о том, что правильно, а что нет.
Дело не в правильности и неправильности, а в целесообразности. Нет смысла напрягать AI для того, чтоб выяснить цвет нижнего белья соседки.

Ага. Вот и мне всегда интересно: зачем морочиться на определение плагиата, кто у кого и что позаимствовал, правильно или неправильно цитировал. Я знаю, что один из показателей "ученых-моченых" это индекс цитируемости. Но сам этот индекс, принципы цитируемости, принципы накопления знаний, принципы научного развития знаний сейчас очень устаревшие и примитивные. Эту проблему хорошо описал много десятков лет назад Станислав Лем в своей повести "Осмотр на месте". Игнорантика — вот наше все.
Можно использовать мощные средства для поиска плагиата, можно ломать копья о проблему "лженауки" (демаркация научности знания). Только главный прикол в том, что такой проблемы, как демаркация научности знания уже давно нет. Кончилась. Может и с всякими плагиатами и подобной байдой то же самое? Просто ещё не знают, что не актуально?

Я думаю, что вы путаете причину и следствие. Не буду погружаться сейчас в дебри использования наукометрии в принятии решений (хотя и здесь есть выработанные разумные решения, до использования которых наши научные власти пока не доросли).
Вопрос стоит не в демаркации научности, а выявления подмены. Тех случаев, когда учебу и науку заменяют копи-пастой. Если даже эту проблемку удастся побороть, то буду считать, что жизнь удалась. А там глядишь и до демаркации кто-то доберется (имхо, тоже не все безнадежно).
Благо дарю за ответ!
С научностью знаний все запутано, но лучший вариант звучит примерно так: «Наука — это все, что считается таковым какой-то уважаемой группой людей.» Конечно же, все упирается в определения и значения слов «наука» и «научный». В разные времена определяли по-разному, вот и критерии разные. От Поппера до Лакатоса.
Ну да фиг с ними, игнорантика интереснее.
Тут ведь как: ИГНОРАНТИКА — Научная дисциплина, изучающая развитие знаний о том, чего не знают на данный момент.
То есть не поиск плагиата, повторений и заимствований. А определение кластера знаний, о котором нет знаний в имеющихся текстах.
Это более важная задачка, хотя и очень не простая.
Критерий может быть размытым: то, о чем мало знаний, мало исследований. Но что может дать практическую пользу.
Если приложение с такими возможностями установят себе на телефон несколько десятков миллионов человек, то очень даже есть ;)
Несколько десятков миллионов человек, по доброй воле занимающихся выявлением плагиата ..? Возможно только в одном случае: когда приложение внесено в реестр обязательных для установки. Сомнительно, хотя и возможно. Я такой телефон точно покупать не стану. И опять же, изначальную нелепость цели это не отменяет. Если конечно цель — не протащить приложение в реестр 'строго обязательного'.
Ответ относился к предложению выяснить цвет белья соседки ;)
Применять AI для выяснения цвета нижнего белья также нелепо, как и плагиата. К тому же юридический смысл данного понятия размыт. Такой телефон я тоже покупать не стану. А о цвете белья легче спросить саму соседку. Или 'не спортивно'? :-)
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Информация

Местоположение
Россия
Сайт
www.antiplagiat.ru
Численность
51–100 человек
Дата регистрации

Блог на Хабре