Pull to refresh

Компьютерный алгоритм выбирает самых значимых авторов прошлых лет

CopyrightPopular scienceArtificial Intelligence


1 января каждого года — не только день, когда все мы внезапно оказываемся в следующем году (у кого-то такой переход сопровождается типичной головной болью). Это еще и день, когда многие произведения различных авторов попадают в общий доступ. 50 или 70 лет (зависит от страны) права на то либо иное произведение принадлежат авторам или издательствам. По прошествии этого времени произведение можно свободно использовать: перепечатывать, оцифровывать и даже изменять. Под «авторами» подразумеваются писатели, поэты, художники и прочие представители мира искусства.

Так вот, каждый год доступными для всех становятся тысячи, десятки тысяч произведений. И только малое количество печатных работ оцифровываются. Все потому, что возможности команд оцифровщиков ограничены. Плюс ко всему, выбирать наиболее значимых авторов очень сложно.

Для того, чтобы упростить процесс выбора, Аллен Риддер из Дартмутского колледжа (Нью-Хемпшир) создал компьютерную программу, алгоритм, способный оценивать значимость различных авторов. Для начала работы программы нужно ввести дату (год), и машина выберет наиболее значимых авторов (по оценке машины), на чьи произведения уже не распространяются авторские права.

Другими словами, при помощи алгоритма можно выбрать автора и произведения, которые необходимо оцифровать в первую очередь. Оценка значимости проводится по большому количество факторов, включая упоминание авторов в Вики, цитируемость авторов, количество просмотров статей на Википедии с описанием биографии автора или его произведений и других данных.

Для работы алгоритма используется две базы данных. Первая — список из миллионов книг Университета Пенсильвании. Вторая — Википедия, о чем уже говорилось выше.

Свою систему оценки автор назвал «public domain ranking», протестировать работу алгоритма можно на одноименном сайте. Алгоритм позволяет провести ранжирование всех авторов, упоминание которых есть в Википедии (англоязычной). Результаты получаются интересными. К примеру, писательница Вирджиния Вулф получает 1081 баллов из 1011304 возможных. А художник Джузеппе Амисани, умерший в один год с Вирджинией Вулф, получил 580363 балла. Чем меньше число баллов — тем значимей автор.

Согласно этой оценке, организации типа Project Gutenberg должны оцифровать работы Вирджинии Вулф, а потом уже — картины художника.

Среди наиболее значимых авторов, чьи работы станут доступными для оцифровки 1 января 2015 года, первое место, по оценке алгоритма, занимает Томас Стернз Элиот. Также доступными станут работы Уинстона Черчилля, Малкольма Икс и некоторых других известных людей.

По словам разработчика алгоритма, оценки машины зачастую совпадают с оценками людей. Но, конечно, эту оценку нельзя принимать за аксиому, особенно с учетом того, что для ранжирования используется только один источник информации об авторе — Википедия.

Кстати, много лет назад я читал какой-то научно-фантастический рассказ по схожей проблеме. Тогда непризнанный никем литератор создал машину для оценки произведений писателей и поэтов. Само собой, он надеялся, что первое место достанется его поэме. Но нет, первое место досталось «Справочнику по радиотехнике». Машины такие машины.
Only registered users can participate in poll. Log in, please.
Могут ли машины корректно оценивать значимость авторов?
31.63% Да, конечно 99
43.45% Может быть, со временем, но не сейчас 136
11.5% Никогда 36
13.42% Если да, то это будет уже не машина 42
313 users voted. 55 users abstained.
Tags:авторынаследиекомпьютерные алгоритмыписатели
Hubs: Copyright Popular science Artificial Intelligence
Total votes 10: ↑9 and ↓1 +8
Views4.8K

Comments 6

Only those users with full accounts are able to leave comments. Log in, please.

Popular right now

Data Scientist
from 70,000 to 120,000 ₽DDoS-GUARDРостов-на-ДонуRemote job
Data Science Cloud Administrator (remote)
from 200,000 to 300,000 ₽Bergmann InfotechRemote job
Middle / Senior Data Science
from 160,000 to 285,000 ₽СеверстальRemote job
Data Science Cloud Engineer (remote)
from 200,000 to 300,000 ₽Bergmann InfotechRemote job

Top of the last 24 hours