21 августа 2019

Опубликована база учёных, которые активно цитируют сами себя. Украина и Россия в лидерах

Data MiningНаучно-популярное


Российские и украинские лидеры в рейтинге самоцитирования

Авторитет в научном сообществе определяется количеством ссылок в научных статьях (индекс цитирования). Самые цитируемые в мире — небольшая группа учёных, в которую входят нобелевские лауреаты и выдающиеся исследователи. Однако к ним примыкает ряд менее известных персонажей. Например, Сундарапандиан Вайдьянатан из Индии.

Этот исследователь в области теории хаоса, декан R&D частного технологического института Vel Tech в Ченнае — соавтор сотен научных работ и абсолютный мировой рекордсмен по саморекламе: 94% (!) ссылок на его научные статьи поставлены им самим или соавторами, пишет Nature.

Он не одинок. Недавно в журнале PLOS Biology опубликован набор данных по 100 тыс. учёным со всего мира. Как показал анализ, у более чем 250 человек доля цитат от себя и соавторов превышает 50%. Средний уровень самоцитирования составляет 12,7%.

Исследование поможет выявить тех, кто злоупотребляет цитированием для повышения рейтинга, а также потенциальные «цитатные фермы», в которых кластеры учёных массово цитируют друг друга, говорят исследователи: «Я думаю, что фермы самоцитирования гораздо более распространены, чем мы полагаем, —считает Джон Иоаннидис (John Ioannidis) из Стэнфордского университета, ведущий автор научной работы. — Те, у кого самоцитирование превышает 25%, не обязательно участвуют в неэтичном поведении, но может потребоваться более тщательное их изучение».

На сегодняшний день это самая большая коллекция показателей самоцитирования из когда-либо опубликованных. И она опубликована как раз вовремя, потому что сейчас финансирующие агентства и научные журналы уделяют больше внимания потенциальным проблемам из-за чрезмерного самоцитирования. В июле Комитет по этике научных публикаций (Committee on Publication Ethics, COPE), консультативный орган для научных издательств, назвал экстремальное самоцитирование одной из основных форм манипуляций.

Хороший показатель цитирования помогает учёному привлечь финансирование и помогает в карьерном росте. Но слишком большое внимание к этой метрике представляет собой проблему, потому что такое отношение стимулирует самоцитирование.

В прошлом году министр образования Индии вручил Вайдьянатану премию в размере 20 000 рупий (280 долларов США) как одному из лучших исследователей страны по показателям производительности и цитируемости. Сам учёный, декан научно-исследовательского центра Vel Tech, в комментариях на Quora отрицал факт умышленной накрутки метрик для себя и своего института.

Многие учёные согласны, что чрезмерное самоцитирование является проблемой, но нет единого мнения, что с этим делать. И вообще, какой показатель самоцитирования считать нормальным. У исследователей действительно много законных оснований ссылаться на собственные работы и работы соавторов. Иоаннидис предупреждает, что его исследование не призвано очернить конкретных исследователей, потому что показатели самоцитирования сильно варьируются между разными научными дисциплинами и этапами карьеры: «Оно просто даёт полную, прозрачную информацию. На его основании нельзя выносить вердикт, кто плохой учёный», — говорит он.

Рейтинг самоцитирования — лишь часть исследования, которое провели Иоаннидис с соавторами. Оно включает в себя множество стандартизированных показателей для 100 000 наиболее цитируемых исследователей за 1996−2017 годы в 176 научных областях. Данные получены из базы Scopus издательского дома Elsevier.

Но метрики самоцитирования — самая интересная часть работы. В принципе, количество ссылок на собственные работы учёного и так можно посмотреть в специализированных базах, таких как Scopus и Web of Science. Но данное исследование позволяет провести более глубокий анализ, сравнивая учёных и выявляя неочевидные схемы, похожие на умышленные манипуляции.


В 2011 году четыре бразильских научных журнала опубликовали семь научных статей с сотнями ссылок на предыдущие исследования (2009-2010 гг) друг у друга. Это повысило рейтинг каждого журнала. Описание «бразильский схемы» см. здесь

Кроме декана индийского частного института, в топ по самоцитированию вошли:

  • Теодор Симос (Theodore Simos), математик, на сайте которого указана работа в Университете Короля Сауда (Эр-Рияд, Саудовская Аравия), Уральском федеральном университете (Екатеринбург) и Университете Фракии им. Демокрита (Комотини, Греция) — 76% самоцитат;
  • Клаудиу Супуран (Claudiu Supuran), медицинский химик из Университета Флоренции, Италия, который тоже указал принадлежность к Университету Короля Сауда — 62% самоцитат.

Оба учёных в прошлом году вошли в список 6000 «исследователей мирового класса, отобранных за выдающуюся исследовательскую работу»: список составлен американской аналитической компанией Clarivate Analytics, которая ведёт базу Web of Science. Сейчас компания заявила, что знает о проблеме и собирается скорректировать методологию для расчёта.

Проблема самоцитирования изучается давно. В последние годы проведён ряд исследований. Например, в 2016 году выяснилось, что мужчины цитируют собственные статьи, в среднем, на 56% больше, чем женщины. Хотя последующий анализ позволяет предположить, что это может быть следствием более высокого самоцитирования среди продуктивных авторов любого пола, у которых больше прошлых работ для цитирования.

В 2017 году исследование показало, что итальянские учёные стали более активно ссылаться друг на друга после введения в 2010 году спорных правил, которые требуют от учёных соответствовать пороговым показателям производительности, чтобы иметь право на повышение научного звания.

А в прошлом году министерство исследований Индонезии, которое использует формулу на основе цитирования для выделения средств на исследования и стипендии, заявило, что некоторые учёные манипулируют метриками, используя неэтичные методы, включая чрезмерное самоцитирование и цитирование друг друга. Министерство заявило, что прекратило финансирование 15 исследователей и планирует исключить из формулы ссылки на собственные статьи (источники Nature говорят, что этого ещё не произошло).

В 2017 году Джастин Флатт из Цюрихского университета предлагал публиковать индекс самоцитирования учёных (s-индекс), по аналогии со стандартным показателем производительности (h-индекс). Формула такая же: индекс 20 означает, что исследователь опубликовал 20 работ с не менее чем 20 цитатами. Смысл в том, чтобы публиковать эти индексы параллельно для более объективной оценки.

Важно отметить, что в нынешнем исследовании учитываются ссылки не только на собственные работы учёного, но и на работы соавторов, чтобы более эффективно выявлять «цитатные фермы», хотя такой подход и раздувает оценку. Например, в физике элементарных частиц и астрономии часто встречаются статьи с сотнями или даже тысячами соавторов, что сильно повышает средний показатель самоцитирования в конкретной научной дисциплине.

Некоторые перекосы можно объяснить, сравнивая исследователей со средним показателем по стране, по этапу карьеры и дисциплине. Например, на раннем этапе карьеры у исследователей часто повышенный процент самоцитирования: их работы ещё не успели достаточно распространиться, чтобы их заметили коллеги (см. диаграмму ниже).



Так, директор по аналитике издательского дома Elsevier Йерун Баас (Jeroen Baas) провёл похожее исследование (ещё не опубликовано) для 7 млн авторов, то есть для всех, кто опубликовал более пяти работ. Оказалось, что у них показатели самоцитирования выше: 15,5%, а у 7% авторов — более 40%, потому что у многих из этих 7 миллионов исследователей всего только несколько цитат в целом или они находятся в начале своей карьеры.

Йерун Баас отметил, что высокими медианными показателями самоцитирования отличаются Россия и Украина (1 и 2 место в мире). На иллюстрации ниже видно, что в этих странах индекс гораздо выше среднего.



По индексу сильно выделяются некоторые научные дисциплины, такие как ядерная физика, физика элементарных частиц, астрономия и астрофизика, благодаря большому количеству соавторов.



Джон Иоаннидис считает, что его работа полезна и вообще необходимо часто проводить такие исследования: «Люди в любом случае сильно полагаются на индивидуальные метрики, — говорит он. — Вопрос в том, как сделать их максимально точными и тщательно, систематически собирать информацию. Показатели цитирования не могут и не должны исчезать. Следует наилучшим образом использовать их, полностью признав многочисленные ограничения».

База данных в формате .xlsx (34,2 МБ) опубликована 6 июля 2019 года в онлайновой версии журнала PLoS Biology (doi:10.17632/btchxktzyw.1).
Теги:индекс цитированиянаучные статьисамоцитированиенакрутка рейтингацитатные фермы
Хабы: Data Mining Научно-популярное
+30
20,7k 18
Комментарии 77
Лучшие публикации за сутки