Динамическая цитируемость и количество ученых

Павел Плечов, докт. геол.-мин. наук, профессор геологического факультета МГУ
Павел Плечов, докт. геол.-мин. наук, профессор геологического факультета МГУ

Перед обсуждением стратегий спасения и развития науки в России важно определиться с принципиальным вопросом: «А сколько активных ученых в России занимается фундаментальными исследованиями?» Однако ответ на этот вопрос зависит от понятийной базы и потребует определения критериев выделения множеств «фундаментальные исследования», «активные ученые» и «в России». Для приблизительной оценки интересующего нас количества активных ученых воспользуемся следующими определениями и ограничениями.

Будем считать, что:

Фундаментальные исследования — экспериментальная или теоретическая деятельность, направленная на получение человечеством новых знаний об основных закономерностях строения, функционирования и развития человека, общества, окружающей природной среды. Деятельность, направленная на получение прибыли, обслуживание коммерческих, политических или идеологических интересов какой-либо группы, к фундаментальной науке не относится, даже если она осуществляется научными (наукоемкими) методами.

Основным продуктом деятельности активного ученого является научная публикация. Стиль жизни «удовлетворение собственного любопытства за государственный счет» в 1970-х и 1980-х не подразумевал публикации результатов, что привело к низкому КПД советских научных организаций и явилось одной из причин быстрой деградации советской науки при уменьшении финансирования. Никто не будет против, если богатые люди часть своего времени, подобно лорду Кавендишу или сэру Сорби, будут посвящать научным исследованиям в по-строенных на собственные деньги лабораториях. Такие люди имеют полное право публиковать или не публиковать результаты собственных исследований. Однако людям, получающим государственное финансирование, необходимо доказать свое право на свободный научный поиск. В сложившейся практике это право доказывается значимыми научными публикациями, список которых сопровождает анкеты и заявки на гранты любого ученого.

Для поставленной задачи важно разделить ученых, постоянно работающих в России (не обязательно русскоязычных), и представителей русскоязычных диаспор в различных странах мира. Общепринятая практика рекомендует разделение по принадлежности ученого к какой-либо научной организации (affliation). В данной статье используется коэффициент, определенный по выборке в тематической области, хорошо знакомой автору. Оба способа оценки (no affliation или по выборке лично знакомых ученых) достаточно условны и дают лишь приблизительную оценку, но второй менее трудоемок.

Бывшими учеными (в отличие от активных ученых) будут называться люди, которые по каким-либо причинам (например, из-за перехода на административную или преподавательскую работу) перестали публиковать значимые научные результаты. Разумным временным интервалом оценки (в существующих условиях) можно принять пять лет. Если за пять лет не вышло ни одной значимой публикации автора, то, скорее всего, он прекратил заниматься наукой.

Методика анализа

Для статистических оценок мной использовалась база «Корпус экспертов» (www.expertcorps.ru/), в которой собраны необходимые данные по высокоцитируемым русскоговорящим ученым. Поскольку эта база ограничена естественно-научными дисциплинами, то и приведенные оценки касаются только естественных наук.

Методы оценки значимости научных публикаций далеки от идеала. Во многих университетах (в частности, в МГУ) используется критерий импакт-фактора журнала, в котором опубликована статья, а ученых ранжируют по количеству статей в высокоимпактных журналах за последний год.

Такой способ является очень косвенным, так как не отражает качества самой публикации, а позволяет только оценить потенциальную цитируемость статьи. Даже в журналах с очень высоким импакт-фактором присутствуют статьи с малой цитируемостью или вообще нецитируемые. С другой стороны, в журналах с низким импакт-фактором встречаются статьи очень высокого качества и с высокой цитируемостью. В один и тот же номер журнала могут попасть статьи, которые будут в дальнейшем различаться по цитируемости на один-два порядка.

Одной из лучших предложенных количественных оценок научной активности и значимости публикаций ученого является динамическая цитируемость за определенный период (показатель CI7). Считается CI7 очень просто — суммируются ссылки на все статьи ученого, в которых он является автором или соавтором, за последние 7 лет.

Предположим, что ученый за промежуток с 2007 по 2014 год участвовал в написании 7 статей (по одной в год), при этом на каждую статью ссылаются 2 раза в год. Тогда у статьи 2007 года будет 14 ссылок, 2008-го — 12, а у статьи 2014 года — 0 ссылок. В таком случае показатель CI7 составит 112. Если ученый продолжит свою деятельность с той же продуктивностью, то его CI7 останется неизменным, так как старые статьи будут постепенно исключаться из подсчета, а новые, еще не набравшие ссылочную массу, добавляться.

При просмотре списка видно, что среди выдающихся ученых, которых знает практически каждый, затесались участники так называемых «братских могил». «Братскими могилами» называются статьи с очень большим количеством авторов (иногда исчисляемого сотнями), создаваемые в рамках больших международных проектов. При этом среднее количество авторов на одну статью по использованной выборке — 5,8, а с фильтрацией «братских могил» — около 5.

Рассматриваемые обитатели «братских могил» почти не имеют собственных (с небольшим количеством соавторов) цитируемых публикаций, а в списках авторов часто находятся далеко в конце. Эти люди и занимают закономерное место в конце рейтинга, если вместо CI7 мы будем использовать удельный CI7, который складывается из количества ссылок, разделенных на количество авторов для каждой статьи за последние 7 лет.

Это наглядно видно при сравнении двух графиков (рис. 1). При использовании простого CI7 для оценки активности ученых в верхнюю часть рейтинга попадают обитатели «братских могил», среднее количество авторов в их статьях превышает наше воображение. При использовании удельного CI7 этот «хвост» смещается в гораздо более закономерную область (рис. 1).

176-0020176-0021
Рис. 1. Зависимость среднего количества авторов в статьях высокоцитируемых ученых от CI7 и удельного CI7. среднее количество авторов рассчитывалось как Ci7, деленное на удельный CI7

Как практически любые количественные рейтинговые показатели, удельный CI7 может быть описан степенной функцией. На рис. 1 хорошо видно, что исследуемую выборку удовлетворительно описывает уравнение CI7 = 10 000* (место в рейтинге) -0,67. А количество ученых, преодолевших определенный порог цитируемости, может быть посчитано по формуле: (количество ученых) = 10^(4-lg(Ci7 )/0,67).

Отклонения данных выборки из «Корпуса экспертов» от идеальной зависимости в левой части графика (рис.2) объясняются малым числом очень высокоцитируемых ученых и более пристальным вниманием к ним. Отклонения в правой части графика связаны с отсутствием в выборке представительных данных в низкоцитируемой области (часть графика с удельным CI7 < 20 формируется за счет попавших в выборку бывших ученых и участников «братских могил», о которых писалось выше).

Рис. 2. Зависимость удельного динамического цитирования (удельный CI<sub>7</sub>) от количества ученых, преодолевших заданный порог цитируемости. Зелеными кружочками показана выборка; синяя линия — аппроксимирующее уравнение
Рис. 2. Зависимость удельного динамического цитирования (удельный CI7) от количества ученых, преодолевших заданный порог цитируемости. Зелеными кружочками показана выборка; синяя линия — аппроксимирующее уравнение

Выводы

Пользуясь выявленной зависимостью и задавая значение необходимого порога удельного CI7, мы легко можем оценить количество ученых в данной категории. В качестве примера можно предложить следующие категории активных ученых по удельному CI7:

  1. Диапазон 10–25 — около 22 тыс. человек. В этот диапазон попадают как начинающие ученые, так и, наоборот, ученые, заканчивающие свою карьеру.
  2. 25–100 — активные ученые, работающие на мировом уровне, их количество в нашей стране оценивается в 6–7 тыс. человек.
  3. 100–500 — активные ученые, звезды мировой величины. Их всего около 850 человек.
  4. >500 — активные ученые, крупные звезды мировой величины. Именно к этой категории относятся потенциальные лауреаты Нобелевских премий. Их всего 86, а в России из них работают только 23 человека (около 27%).

В выборке по моей специальности, науки о Земле (geo), оказалось 230 человек [1]. Из них только 25 человек (около 11%) работают за границей, тогда как 89% выборки постоянно живут и работают в России (хотя и активно сотрудничают с зарубежными коллегами). Таким образом, к вышеуказанным цифрам можно ввести поправочный коэффициент 0,89 или просто пренебречь им в надежде, что русскоязычная диаспора рано или поздно вернется работать на родину.

Приведенная оценка достаточно условна, она только дает представление о количестве активных русскоязычных ученых. Более точная оценка возможна только при дополнительной работе, которая может быть выполнена коллективом в 10–15 человек за 2–4 месяца (например, с привлечением создателей «Корпуса экспертов») и с дополнительно определенными критериями разделения российских ученых и русскоязычных ученых, живущих за рубежом.

1. http://expertcorps.ru/science/whoiswho/by_branch/geo-all

Подписаться
Уведомление о
guest

27 Комментария(-ев)
Встроенные отзывы
Посмотреть все комментарии
Пипеткин
Пипеткин
9 года (лет) назад

лишить направления финансирования нельзя потому, что в отличие от торговли сотовыми телефонами, это самое любое направление требует десятков ато и сотен лет развития. А исчезает оно за несколько месяцев. И нанимать будет совершенно некого, если через всего лишь 1-2 года окажется, что такие люди нужны.

Андрей Летаров
Андрей Летаров
9 года (лет) назад

Некоторое лукавство есть в ваших числовых придержках. У меня удельный семилетний индекс что-то около 42, но во многом — благодаря двум обзорам, написанным в соавторстве с 1 и с 3 коллегами. Если нормально работающий ученый в нашей области, публикующийся в среднем в 1 статье в год в журнале с импактом 3-4 (а это большинство молодых ученых), то в среднем они будут иметь 15-50 цитирований за 7 лет (обычно пятилетний импакт журнала лишь немного выше двухлетнего, так что приведенная в статье оценка на основе равномерного цитирования 2 раза в год в среднем слишком оптимистична; хорошие статьи в хороших (не супер-топовых) журналах набирают по 5-15 цитирований за все время их жизни). Ну так вот, в нашей науке в экспериментальных статьях по 7-10 авторов. Причем, как это описано выше, часто многие из них вносят весьма ограниченный вклад — допустим, что-то измеряют или делают какие-то конструкции, которые нет средств заказывать за деньги. В итоге у активно работающего ученого, который раз в 2 года порождает статью, где он сделал 60-70% и еще одну, где просто внес важный вклад, средний CI7 будет 2-10.

Алексей
Алексей
9 года (лет) назад

С понятийной базой определиться всегда полезно.

И если «активный ученый» — это тот, кто занимается «фундаментальными исследованиями», а «фундаментальные исследования — это экспериментальная или теоретическая деятельность, направленная на получение человечеством новых знаний…», то что является «основным продуктом деятельности активного ученого»? Очевидно, что правильный ответ — это новые знания или новые результаты.

Только как их, результаты, оценить? Трудно это! И возникает неправильный ответ — «основным продуктом деятельности активного ученого является научная публикация». Ну, дальше цитирование, индексы, только всё это уже вне логики.

trackback

[…] роли женщин в науке и образовании! Хотя только в РФ свыше 20 тысяч только активно печатающихся в профильных изданиях […]