О.В. Михайлов
НОВЫЙ ИНДЕКС ЦИТИРУЕМОСТИ ДЛЯ ОЦЕНКИ
ЭФФЕКТИВНОСТИ НАУЧНОЙ ДЕЯТЕЛЬНОСТИ ИССЛЕДОВАТЕЛЯ1
Ключевые слова: цитируемость; ^-индекс; научная деятельность.
Keywords: citation; h*-index; scientific activity.
Аннотация: Дано описание нового параметра личной цити-руемости h*, который можно рассматривать как некое усовершенствование h-индекса (индекса Хирша). Это усовершенствование состоит в использовании долевой цитируемости, определяемой как частное от деления валовой цитируемости на число соавторов в данной публикации. Такой индекс, несмотря на его определенную искусственность и формализм, позволяет более объективно оценивать личную цитируемость исследователя по сравнению с популярным h-индексом.
Abstract: A description of the new parameter personal citation researchers h*, which can be regarded as some improvement of the h-index (Hirsh index). The meaning of this improvement is to use the so-called share citation defined as the quotient of the gross citations by co-authors in this publication. It is suggested that such an index, despite its artificiality and certain formalism, allows more objectively evaluate personal quoted researchers as compared to the currently popular h-index.
1 Настоящая статья подготовлена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 14-06-00044).
В 2005 г. работавший в то время в университете г. Сан-Диего (штат Калифорния) американский физик Хорхе Хирш (Jorge E. Hirsch) в статье [1], опубликованной в журнале «Proceedings of the National academy of sciences», предложил оценивать научную деятельность любого отдельно взятого исследователя с использованием весьма оригинального наукометрического показателя, получившего название индекс Хирша (h-индекс). Он весьма прост по своему определению. Как писал сам Х. Хирш, «ученый имеет индекс h, если h из его N статей цитируются как минимум h раз каждая, в то время как оставшиеся (N - h) статей цитируются не более, чем h раз каждая». Характеризуя предлагаемый им показатель личной цитируемости, Х. Хирш особо отмечал, что рассматривает его как легко вычисляемую величину, которая дает оценку важности, значимости и масштаба влияния совокупного вклада ученого в науку. С его точки зрения, «этот показатель может служить полезным средством для сравнения различных лиц, конкурирующих за один и тот же ресурс, когда критерием оценки являются научные достижения» [1, с. 15670].
В поддержку своего утверждения Х. Хирш привел в этой же статье данные анализа h-индекса лауреатов Нобелевской премии (и отдельно членов Национальной академии наук США), отметив при этом, что члены этих групп, как правило, имеют высокие значения h-индекса. По его мнению, «два человека, имеющие одинаковую величину h, сопоставимы с точки зрения их научного вклада, даже если их общее число статей или их общее число цитирований разные. И наоборот, из двух ученых (одного и того же научного возраста) с одинаковым количеством работ или одинаковым количеством цитирований тот, у которого h больше, вероятно, является специалистом более высокого уровня» [1, с. 15671].
Утверждение это весьма дискуссионно, тем более что последующие исследования показали: прямой корреляции между суммарной цитируемостью (и тем более - востребованностью цитируемых работ) среднестатистического исследователя в любой отрасли интеллектуальной деятельности и h-индексом нет. Спустя 10 лет с момента появления индекса Хирша у него было обнаружено немало недостатков (не отрицаемых даже самим Хиршем!). И тем не менее этот индекс с поразительной быстротой приобрел поистине планетарную популярность. В настоящее время он фигурирует во всех сколько-нибудь значимых базах данных по цитируемости отдельных авторов, включая «Scopus» и «Web of Science».
Не последнюю роль в этом сыграло то обстоятельство, что связанные с ним цифры просты для понимания, видны всем и дают
на первый взгляд простой ответ на вопрос о том, каков конкретный вклад данного исследователя в ту или иную отрасль науки. H-индекс, особенно в России, нередко используют не только для оценки научного престижа ученого, но и для определения размеров материально-финансового стимулирования [2]. Индекс Хирша настолько сильно «прижился» в наукометрии, что «изгнать» его из нее ни сейчас, ни в обозримом будущем, вероятно, не удастся. А раз так, то имеет смысл пойти по пути его совершенствования, нацеленного на всемерное устранение присущих ему недостатков. Такие попытки неоднократно предпринимались, в том числе и самим Х. Хиршем [3-12]. В частности, им были предложены m-индекс, получаемый в результате деления h-индекса на период времени, прошедший с момента выхода в свет первой публикации исследователя [3], и h-индекс, который учитывает наличие соавторов в публикации и их «старшинство» по величине h-индекса, однако не их число [12]. Для расчета h необходимо знать h-индексы всех соавторов данного исследователя, что не всегда возможно (тем более, что они изменяются со временем).
В статьях [13; 14] уже обращалось внимание на то, что суммарное число ссылок на работы любого исследователя, приводимое в современных базах данных по цитируемости, никак не учитывает того весьма важного обстоятельства, что цитируемые работы, как правило, имеют то или иное количество соавторов. Никак не учитывает этого обстоятельства и h-индекс. В связи с этим напрашивается мысль о введении нового индекса цитирования исследователя, аналогичного индексу Хирша, учитывающего феномен соавторства, который мог бы весьма просто рассчитать любой человек, имеющий доступ к материалам той или иной базы данных цитируемости.
В соответствии с логикой, изложенной в [15], каждому автору такой статьи, где число соавторов два или более, де-юре принадлежит лишь соответствующая часть этой статьи, но не статья целиком. Аналогичное положение должно иметь место и для ссылок на нее, независимо от того, где и кем эта статья процитирована. А потому для каждого автора по каждой его i-й статье должно подсчитываться не общее число цитирований, а долевая цитируе-мость, которая будет определяться как частное от деления общего числа ссылок на нее (Ntotai)i на число соавторов в ней ni, т.е. как (Ntotai)i/ni. Заметим в связи с этим, что в наиболее авторитетной международной базе по цитируемости - «Web of Science» - с недавнего времени уже введено в действие определение данного
показателя. В базе РИНЦ такого показателя пока нет, но любой зарегистрированный в ней пользователь на персональной странице соответствующего автора может найти данные по общей цитируе-мости любой его статьи, полный список ее авторов и рассчитать для каждой из них вышеуказанный показатель (Ном)/^. Далее надо лишь расположить все статьи в порядке убывания этого показателя, придав каждой из них соответствующий порядковый номер (без пропусков) и определить, до какого порядкового номера статьи в этом списке будет превосходить номер статьи в этом списке. Числовое значение этого номера и есть модифицированный индекс Хирша (условно обозначим его как И*). Правда, личная «долевая» цити-руемость почти всякой статьи окажется не целым числом, но это обстоятельство не имеет принципиального значения и определению И*-индекса препятствовать ни в коей мере не будет.
Продемонстрируем только что сказанное на конкретных примерах для трех исследователей А, В и С с И-индексами 27, 24 и 22 соответственно, данные по цитируемости 30 наиболее цитируемых работ каждого из которых представлены в табл. 1 (по понятным причинам имена тех, к кому относятся эти данные, здесь не называются). Данные взяты из базы РИНЦ. В табл. 1 № - порядковый номер статьи по убыли валовой цитируемости, N^1 - валовая цитируемость конкретной статьи, п - число соавторов, (Но1а1/п) -долевая цитируемость автора в данной статье. Номера статей, входящих в «ядро Хирша», для каждого из исследователей выделены курсивом.
Картина получится иной, если расставить по убыванию долевые цитируемости (Н^Уп каждого из указанных авторов А, В и С (табл. 2).
Как нетрудно заметить даже при беглом взгляде на представленные в табл. 2 цифровые данные, ситуация в случае учета соавторства в статьях каждого из указанных исследователей радикально меняется. Исследователь С, в публикациях которого соавторов значительно меньше, чем у исследователей А и В (а целый ряд достаточно высокоцитируемых работ - и вовсе с одним автором), по величине И* (19) далеко превзошел обоих своих коллег, у каждого из которых этот показатель составляет лишь 8. Перечень 30 наиболее значимых статей по величине долевой цитируемости у исследователей А и С отличается от перечня 30 наиболее цитируемых статей этих же авторов. Так, у исследователя А вторая по долевой цитируемости статья с (Н^/п) = 20.00 занимает лишь 41-ю позицию в списке наиболее цитируемых его работ, восьмая -
с (Ноы/п) = 10.00 - 42-ю, десятая - с (Н1о1а1/п) = 8.50 - 60-ю, четырнадцатая - с (Н^/п) = 7.00 - 76-ю. Именно поэтому И*-индекс будет точнее отражать личный вклад исследователя в его научные публикации по сравнению с классическим И-индексом.
Таблица 1
Наиболее цитируемые работы авторов А, В и С с учетом числа соавторов
А В С
№ НМа1 п (Нм/п) № ^оЫ п (Ноы/П) № НоЫ п (Ноы/п)
1 75 9 8.33 1 179 15 11.93 1 92 1 92.00
2 70 6 11.67 2 112 8 14.00 2 49 1 49.00
3 62 2 31.00 3 75 8 9.38 3 43 1 43.00
4 59 8 7.38 4 61 7 8.71 4 37 18.50
5 54 10 5.40 5 58 4 14.50 5 34 1 34.00
6 49 8 6.13 6 57 7 8.14 6 34 1 34.00
7 44 3 14.67 7 56 6 9.33 7 33 1 33.00
8 43 12 3.58 8 52 7 7.43 8 32 1 32.00
9 40 5 8.00 9 42 3 14.00 9 31 1 31.00
10 40 9 4.44 10 41 4 10.25 10 30 1 30.00
11 39 2 19.50 11 40 9 4.44 11 27 13.50
12 34 4 8.50 12 35 4 8.75 12 27 1 27.00
13 33 7 4.71 13 34 7 4.86 13 26 1 26.00
14 32 13 2.46 14 33 5 6.60 14 26 1 26.00
15 32 7 4.57 15 32 13 2.46 15 25 1 25.00
16 31 6 5.17 16 32 6 5.33 16 24 4 6.00
17 31 7 4.43 17 32 6 5.33 17 24 2 12.00
18 30 6 5.00 18 31 8 3.88 18 23 4 5.75
19 30 7 4.29 19 29 8 3.63 19 23 1 23.00
20 30 9 3.33 20 28 10 2.80 20 23 1 23.00
21 28 5 5.60 21 27 3 9.00 21 22 1 22.00
22 28 10 2.80 22 26 7 3.71 22 22 1 22.00
23 27 4 6.75 23 25 5 5.00 23 21 1 21.00
24 27 7 3.86 24 25 6 4.17 24 20 1 20.00
25 27 9 3.00 25 24 4 6.00 25 20 4 5.00
26 27 7 3.86 26 24 5 4.80 26 19 5 3.80
27 27 2 13.50 27 24 5 4.80 27 19 2 9.50
28 26 2 13.00 28 20 7 2.86 28 19 4 4.75
29 26 10 2.60 29 18 7 2.57 29 18 2 9.00
30 26 5 5.20 30 18 4 4.50 30 17 2 8.50
Таблица 2
Цитирование авторов A, B и C с учетом соавторства
A B C
№ (Ntotal/n) № (Ntotal/n) № (Ntotal/n)
1 31.00 1 14.50 1 92.00
2 20.00* 2 14.00 2 49.00
3 19.50 3 14.00 3 43.00
4 14.67 4 11.93 4 34.00
5 13.50 5 10.25 5 34.00
6 13.00 6 9.38 6 33.00
7 11.67 7 9.33 7 32.00
8 10.00* 8 9.00 8 31.00
9 8.50 9 8.75 9 30.00
10 8.50* 10 8.71 10 27.00
11 8.33 11 8.14 11 26.00
12 8.00 12 7.43 12 26.00
13 7.38 13 6.60 13 25.00
14 7.00* 14 6.00 14 23.00
15 6.75 15 5.33 15 23.00
16 6.13 16 5.33 16 22.00
17 5.60 17 5.00 17 22.00
18 5.40 18 4.86 18 21.00
19 5.20 19 4.80 19 20.00
20 5.17 20 4.80 20 18.50
21 5.00 21 4.50 21 14.00*
22 5.00 22 4.44 22 13.50
23 5.00 23 4.17 23 13.00*
24 4.75 24 3.88 24 12.00*
25 4.75 25 3.71 25 12.00*
26 4.71 26 3.63 26 11.00*
27 4.57 27 2.86 27 11.00*
28 4.44 28 2.80 28 11.00*
29 4.43 29 2.57 29 11.00*
30 4.29 30 2.46 30 10.00*
* Данная статья не входит в число 30 наибол ее цитируемых статей указанного автора, но входит в число 30 наиболее значимых его статей по величине долевой цитируемости.
Литература
1. Hirsch J.E. An index to quantify an individual's scientific research output // Proceedings of the National academy of sciences. - N.Y., 2005. - Vol. 102, N 46. -P. 16569-16572.
2. Шамов А.Г., Михайлов О.В., Абдуллин И.Ш. О системе стимулирования авторов по результатам их научной деятельности в Казанском национальном исследовательском технологическом университете // Вестник Казанского технологического университета. - Казань, 2013. - Т. 16, № 7. - С. 279-282.
3. Hirsch J.E. Does the h-index have predictive power? // Proceedings of National academy of sciences. - N.Y., 2007. - Vol. 104, N 49. - P. 19193-19198.
4. Antonakis J., Lalive R. Quantifying scholarly impact: IQp versus the Hirsch h // Journal of the American society for information science and technology. - N.Y, 2008. - Vol. 59, N 3. - P. 956-969.
5. Is it possible to compare researchers with different scientific interests? / P.D. Batista, M.G. Campiteli, O. Kinouchi, A.S. Martinez // Scientometrics. - Berlin: Springer science + business media, 2006. - Vol. 68, N 1. - P. 179-189.
6. Bornmann L., Daniel H.D. What do we know about the h-index? // Journal of the American society for information science and technology. - N.Y., 2007. - Vol. 58, N 5. - P. 1381-1385.
7. Bornmann L., Mutz R., Daniel H.D. Are there better indices for evaluation purposes than the h-index? A comparison of nine different variants of the h-index using data from biomedicine // Journal of the American society for information science and technology. - N.Y., 2008. - Vol. 59, N 3. - P. 830-837.
8. Egghe L. Theory and practice of the g-index. // Scientometrics. - Berlin: Springer science + business media, 2006. - Vol. 69, N 1. - P. 131-152.
9. Egghe L. Mathematical theory of the h- and g-index in case of fractional counting of authorship // Journal of the American society for information science and technology. - N.Y., 2008. - Vol. 59, N 6. - P. 1608-1616.
10. Ruane F., Tol R. Rational (successive) h-indices: An application to economics in the Republic of Ireland // Scientometrics. - Berlin: Springer science + business media, 2008. - Vol. 75, N 2. - P. 395-405.
11. Sidiropoulos A., Katsaros D., Manolopoulos Y. Generalized Hirsch h-index for disclosing latent facts in citation networks // Scientometrics. - Berlin: Springer science + business media, 2007. - Vol. 72, N 1. - P. 253-280.
12. Hirsh J.E. An index to quantify an individual's scientific research output that takes into account the effect of multiple coauthorship // Scientometrics. - Berlin: Springer science + business media, 2010. - Vol. 85, N 2. - P. 741-754.
13. Михайлов О.В. Блеск и нищета «индекса цитирования» // Вестник Российской академии наук. - М., 2004. - Т. 74, № 11. - С. 1025-1029.
14. Mikhailov O.V. Splendors and miseries of the «citation index» // Herald of Russian academy of sciences. - M., 2004. - Vol. 74, N 6. - P. 627-631.
15. Mikhailov O.V. A new citation index for researchers // Herald of Russian academy of sciences. - M., 2012. - Vol. 82, N 5. - P. 403-405.