ЭКОНОМИКА НАУКИ
2015.03.029. РУКОВОДСТВО ПО НАУКОМЕТРИИ: ИНДИКАТОРЫ РАЗВИТИЯ НАУКИ И ТЕХНОЛОГИИ / М.А. Акоев, В.А. Маркусова, О.В. Москалева, В.В. Писляков; Под. ред. М.А. Акоева. - Екатеринбург: Изд-во Уральского университета, 2014. - 250 с.
Ключевые слова: наукометрия; история наукометрии; история науковедения; Ю. Гарфилд; индекс Хирша; публикационная активность; классифицация наук; картирование наук.
Современные информационные ресурсы и инструменты призваны раскрывать потенциал национальных наук. Советские и российские ученые давно проявляют интерес к продуктам таких организаций, как Институт научной информации (Филадельфия, США), а позже медиакомпании «Thomson Reuters». Но в СССР новые информационные ресурсы были практически недоступны, тогда как сегодня тысячи ученых могут составлять свои аналитические отчеты на основании продукта «Thomson Reuters Web of Science». Реферируемая книга дает полное представление о методах измерения науки и технологий.
Книгу предваряет введение, подготовленное заведующей отделением научно-информационного обслуживания РАН и регионов России ВИНИТИ РАН В.А. Маркусовой и посвященное истории развития науковедения. Первому выпуску Указателя цитированной литературы (УЦЛ) (Science Citation Index) в 2014 г. исполнилось 50 лет. В середине XX в. объем знаний настолько увеличился, что ученым потребовались новые механизмы обработки знания, помогающие ориентироваться в нем. Кроме того, стали возникать новые, мультидисциплинарные области знания, имеющие стратегическое значение.
Свою карьеру по разработке методов машинной обработки научной информации Ю. Гарфилд начал в медицинской библиотеке Университета Дж. Гопкинса в качестве ассистента. Значительную роль в создании нового метода сыграло знакомство Ю. Гарфилда с У. Адейром, предложившим использовать метод цитирования для индексирования медицинской литературы. Свою собственную фирму, издающую еженедельники с библиографической информацией в области фармацевтики и биомедицины, Ю. Гарфилд организовал в 1956 г. Ю. Гарфилдом была воплощена идея верификации фамилии автора и организации. Принцип отбора наиболее престижных научных журналов был основан на использовании «закона рассеяния», сформулированном английским библиографом С. Брэдфордом в 1930-х годах. С. Брэдфорд исходил из того факта, что по любому научному направлению можно выделить определенное количество «ядерных» журналов, наиболее важных в данной области, смежных журналов, превышающих по численности ядерные журналы, и многочисленную третью группу журналов, в которые редко попадают статьи данной области. Количество журналов в этих трех областях выглядит как 1: n: n2, где n - постоянная, зависящая от области знания.
Первый выпуск УЦЛ, изданный в 1963 г., состоял из указателя источников, указателя ссылок, пермутационного указателя (указатель ключевых слов) и указателя организаций. Новая система индексирования литературы была основана на особом понимании научной ссылки как своего рода символа научного вклада предшественников. Была разработана общая схема причин цитирования литературы: признание вклада, определение методов, корректирование своей работы или работы других, критика предыдущих работ, указание дополнительной литературы, отрицание предыдущих работ, подтверждение данных, оказание уважения. Как видно, эти причины охватывают процессы не только влияния, но и отрицания научного вклада других авторов. Выполненные в Институте научной информации исследования показали, что негативное цитирование в определенной области знания не превышает 5% и поэтому считается статистической случайностью. При этом различаются «цитирование» (citation) и упоминание в списке литературе (references). Благодаря УЦЛ исследователь может узнать не только фамилию предшественника, но и фамилии других людей, которые также счи-
тают этого ученого предшественником. Влияние указателя на жизнь ученых оказалось столь велико, что психологи и социологи науки начали изучать его как отдельную научную проблему.
Одним из первых выполнил исследование на массиве библиографических ссылок выдающийся американский историк науки Д. Прайс. Он обнаружил, что изучение связей между документами по их цитированию позволяет описывать структуру науки в географических терминах. На основании сети цитирования Д. Прайс разработал математическую модель роста сетей и сформулировал закон Прайса о старении научной литературы.
С 1975 г. впервые в библиографическом указателе был опубликован список 100 наиболее цитируемых публикаций. Публикация списка наиболее цитируемых статей текущего года (hot papers) стала еще одной информационной услугой. Эти списки обновляются каждые два месяца и в настоящее время доступны пользователям в Интернете.
Работа по индексированию ссылок полезна потому, что позволяет обнаружить отсроченный интерес к тем или иным научным открытиям. Например, за открытый в 1910 г. вирус рака автор этого открытия П. Ройс получил Нобелевскую премию только в 1966 г., потому что только после 1951 г. работа П. Ройса была оценена по достоинству другими исследователями.
Важной частью развития показателей научной продуктивности стала разработка библиометрическим сообществом нормализованных указателей, позволяющих сопоставлять различные области знания. Для различных направлений науки характерно различное среднее цитирование одной статьи и средний импакт-фактор журнала.
Первое кумулятивное издание УЦЛ появилось в ВИНИТИ АН СССР в 1965 г. Детальное описание принципов его работы было осуществлено А. И. Михайловым, А. И. Черным и Р. С. Гилярев-ским в книге «Основы научной информации» (1965).
В 1965 г. Ю. Гарфилд организовал службу избирательного распределения информации (Selective dissemination of information), которая позволила удовлетворять индивидуальные информационные запросы пользователей. Редакторы журналов и отдельные пользователи могли получать через эту службу библиографические подборки работ, цитирующих их журнал или научные статьи.
Идея создания УЦЛ была очень популярна в СССР. Проф. Р. Гиляревский (ВИНИТИ РАН) пытался создать экспериментальный массив для будущего индекса цитирования отечественной литературы. В 1973 г. Азербайджанский институт НТИ и технико-экономических исследований Госплана Азербайджанской ССР выпустил УЦЛ-нефть и УЦЛ-экономика. На основе журнала «Научно-техническая информация» за период 1964-1973 гг. был выпущен УЦЛ-информатика. В 2001 г. у инициативной группы (А.Н. Либ-кинд, В.А. Минин, И.А. Либкинд) появилась идея создать УЦЛ на основе данных о публикациях участников проектов Российского фонда фундаментальных исследований (РФФИ). Этот проект поддерживался с 2001 по 2009 г.
В Институте научной информации (ИНИ) существует свой аналитический отдел, который с начала 70-х годов возглавлял Г. Смолл. Именно он разработал и применил метод создания фронтов научных исследований на основе ко-цитирования (совместного цитирования двух документов). В России разработкой этого метода на небольшом массиве статей (по лазерам) занималась И.В. Мар-шакова. Изучение сетей цитирования и ко-цитирования привело к созданию в ИНИ в 1987 г. нового вида обзорно-справочных изданий - Атласа науки. Этот же метод лежит в основе известной базы данных «Индикаторы науки и техники».
До начала 1980-х годов основным способом оценки новых научных проектов было экспертное мнение специалистов. Выполненный специально по заказу Национального научного фонда (ННФ) США анализ показал, что рекомендации экспертов на 50% можно считать выполненными наугад. Именно это исследование подтолкнуло руководство фонда включить библиометрические показатели в экспертную оценку при рассмотрении новых проектов. Сегодня библиометрические показатели широко используются в аналитической деятельности таких крупнейших мировых организаций, как ОЭСР, Европейская комиссия, Министерство экономики, торговли и промышленности Японии, в системе оценки качества исследований в университетах Великобритании и т.д.
Первая глава книги подготовлена заместителем директора Центра мониторинга науки и образования Уральского федерального университета им. первого президента России Б.Н. Ельцина и посвящена возможностям наукометрии в процессе принятия управ-
ленческих решений. Автор главы рассматривает вопрос о том, почему наукометрические методы настолько востребованы при оценке труда ученых. Скорее всего это связано с тем, что управляющие наукой чиновники вынуждены судить о будущем научном результате на основании текущих успехов ученого, его научной активности и продуктивности. Не в последнюю очередь следует учитывать ограниченность финансовых ресурсов, выделяемых на науку, особенно когда речь идет о России.
При принятии решения о распределении ресурсов можно пользоваться экспертными оценками, однако сам поиск экспертов и организация опроса связаны с немалыми затратами. К тому же по некоторым направлениям экспертов может не оказаться или лучшими экспертами окажутся сами претенденты на грант или финансовую поддержку. Для того чтобы удешевить процедуру поиска экспертов, допустимо при их отборе пользоваться наукометрическими показателями, подтверждающими высокий научный статус потенциальных экспертов.
В главе подробно рассматривается ситуация (характерная для России) утери специалистов, а также знаний в некоторых научных областях. Автор отмечает, что науковедческий анализ не способен помочь в прогнозировании подобных процессов, но, как правило, может их констатировать. В ситуации сокращения объема поддерживаемых направлений и утери (естественной или в результате миграционных процессов) носителей фундаментальных знаний по этим направлениям важно уделить внимание сохранению корпуса экспертов по всем научным областям, с тем чтобы они в случае необходимости могли определить имя иностранного специалиста и поддерживать общий образовательный уровень молодых людей.
Автор приводит данные, основанные на самостоятельных расчетах, показывающие, какова стоимость одной научной публикации в России и других странах ОЭСР: стоимость в России (1071,6 долл.) превышала средний уровень для стран ОЭСР (934,1 долл. в 20082012 гг.) (с. 65). Среднее число публикаций на одного занятого в исследованиях в России намного ниже среднего показателя для стран ОЭСР (0,35 и 1,36 соответственно в 2008-2012 гг.). Эти данные рассчитываются с учетом расходов на науку в каждой из стран.
Особое внимание в главе уделено интерпретации больших количественных данных. Аналитик, занятый этой деятельностью,
должен уметь предложить правильные сценарии с учетом имеющейся цифровой информации. Например, поиск единомышленников по всему миру может помочь маленькому коллективу сократить издержки на обсуждение новых идей, поскольку маленькие коллективы всегда можно объединить в один большой.
Вторая глава книги написана заместителем директора библиотеки НИУ «Высшая школа экономики» В.В. Писляковым и посвящена вопросу о грамотном и корректном использовании биб-лиометрических данных. Дается полное представление о характере данных, которые можно извлечь из основной коллекции Web of Science (Web of Science Core Collection), а также о возможностях аналитических инструментов Journal Citation Reports (JCR), Essential Science Indicators и InCites.
Термин «импакт-фактор» журнала описывает частоту цитирования статей данного журнала в последующие один или два года после его выхода. Однако такая процедура, эффективная в отношении естественнонаучных журналов, мало подходит для гуманитарных изданий, поэтому для последних в базе данных JCR существует пятилетний импакт-фактор. Показатель, фиксирующий цитирования того же года, называется «индексом немедленного цитирования» (immediacy index).
Особое внимание уделено проблеме самоцитируемости. Подсчитать импакт-фактор журнала без учета самоцитируемости также позволяет аналитическое приложение JCR. Два российских гуманитарных журнала «Социологические исследования» и «Вопросы психологии», входящих в базу данных WoS, имеют крайне высокий уровень самоцитируемости (71 и 75% соответственно). Система обладает возможностями учитывать самоцитирование и для отдельных авторов, а также фиксирует случаи, когда автор цитирует своих соавторов.
В главе подробно рассмотрены относительные, или нормализованные, показатели: относительный импакт-фактор журнала, представляемый как отношение импакт-фактора журнала к агрегированному импакт-фактору для данной дисциплины. К этой же группе относится средняя цитируемость статьи в вузе или организации относительно средней цитируемости статьи в дисциплине. Для вычисления медианы цитируемости по определенной дисцип-
лине проблему составляет выбор референтной группы, на которой рассчитывается этот показатель.
При оценке университета или многопрофильного института аналитик всегда будет сталкиваться с такой сложностью: ему одновременно нужно будет оценить и нормализовать результаты деятельности ученых разных научных областей. Для оценки факультета референтной группой будет вуз, а для оценки продуктивности вуза целиком референтной группой будут считаться все вузы без исключения, включая и сам изучаемый вуз, или весь мир, т.е. весь имеющийся поток публикаций. При такой оценке реальные показатели подразделения сопоставляются с «ожидаемым числом ссылок» (рассчитывается в InCites). Однако недостаток этого метода заключается в том, что небольшое число высокоцитируемых статей может существенно исказить картину в среднем.
Если у организации нормализованная относительная цити-руемость - 0,5, а у всей России - 0,67, это не означает, что данная организация работает хуже, чем вся Россия в среднем. Значение 0,67 могло возникнуть в результате наличия более качественных публикаций, например в физике, тогда как изучаемый институт занимается исследованиями в области химии. Нормализацию можно проводить как по дисциплинам, так и по средней цитируемости журналов, в которых опубликованы статьи сотрудников. Показатели при этом могут существенно отличаться. В случае если цити-руемость данного автора оказывается выше средней цитируемости журнала, в котором он публикуется, ему, возможно, стоит задуматься о выборе более престижного журнала.
Изучать можно не только медианы, т.е. средние показатели, но и крайние точки, т.е. наилучших и наихудших в науке. В мире каждая сотая статья является высокоцитируемой, поэтому, если 1% научных статей считается высокоцитируемым, можно сказать, что деятельность ученых этого учреждения соответствует мировому уровню.
Со временем специалисты по наукометрии научились «взвешивать» не только дисциплинарный оттенок научных ссылок, но и их престиж или влияние. Для журнала этот показатель называется «собственный фактор», а для статьи (собственный фактор, нормированный на число статей) - «индекс влияния статьи». В этом случае математическим образом учитывается не только количество
ссылок на определенный журнал, но и характер этих ссылок. Показатели улучшаются, если ссылки приходят из часто цитируемых журналов. Собственный фактор рассчитывается еще и по-другому.
Каждому журналу назначается начальный престиж равный единице. Свой престиж журнал делит между всеми своими ссылками. Соответственно «вес» каждой из ссылок определяется их количеством. Чем больше количество, тем меньше вес. Процедура повторяется несколько раз. Такими способами специалисты, развивающие наукометрию, борются с пагубным увеличением среднего числа ссылок в научной статье. Взвешенные показатели позволяют обнаружить островки научного самоцитирования и исключить их из научного поиска.
В главе также рассмотрены такие показатели, как И-индекс, Иа-индекс, g-индекс, их математический смысл и преимущества, а также показатели хронологического распределения ссылок.
Третья глава подготовлена советником директора Научной библиотеки им. М. Горького Санкт-Петербургского государственного университета О.В. Москалевой. Глава посвящена научным журналам как средству научной коммуникации. Под научными автор подразумевает журналы, в которых статьи проходят предварительное рецензирование. Таких на сегодняшний день в мире насчитывается около 70-100 тыс., и их число постоянно увеличивается. Для научных журналов полностью применим закон Парето, который означает, что только около 20% журналов публикуют стоящую научную информацию (80% результата).
Общемировой рост числа научных журналов и журнальных статей сопровождается и увеличением численности соавторов, что означает, что продуктивность одного ученого не увеличивается.
Наукометрические показатели зависимы от конкретной научной области, поэтому чрезвычайно важно применять правильную методику их классификации. Любая классификация научной информации должна отвечать двум разнонаправленным задачам: описание потока научных публикаций и соответствие запросам пользователей. При этом применяется фасетный или иерархический принцип. Сущность фасетной классификации, разработанной в 1933 г. Ш.Р. Ранганатаном, заключается в установлении родовых связей понятий и связи между разделами. Российский ГРНТИ
представляет собой комбинирование иерархического и фасетного классификаторов.
Верхний уровень классификации научных областей ОЭСР включает шесть разделов: 1) естественные науки; 2) техника и технология; 3) медицинские науки; 4) сельскохозяйственные науки; 5) общественные науки; 6) гуманитарные науки. На втором уровне классификация содержит уже 42 позиции. При этом классификация создавалась с целью совместить наиболее распространенные классификации в мире.
Различные ресурсы на платформе WoS имеют свои классификаторы. Наиболее распространенные классификаторы - исследовательские области (Research areas - RA) и категории WoS (WoS categories - WoSC). Оба они нашли применение в WoS Core Collection. В аналитическом ресурсе ESI используется классификатор Research fields (RF). В RA 151 исследовательская область поделена на пять крупных направлений: 1) искусство и гуманитарные науки; 2) науки о жизни и биомедицина; 3) физические науки; 4) социальные науки; 5) технологии. WoSC используется для определения тематической принадлежности журнала в JCR. Поскольку JCR не рассчитывает импакт-факторы для гуманитарных журналов, 28 категорий, относящихся к этой области, сюда не включены. Однако и остальные рубрики в обоих классификаторах не совпадают. Рубрикация RF включает 22 направления. Соответственно, в зависимости от того, какой рубрикатор используется для поиска, результаты поиска будут отличаться.
Автор дает важные рекомендации по аналитическому поиску в WoS. Например, поиск по одной и той же фамилии на платформе WoS и в базе данных WoSC дает существенно отличающиеся результаты. Это связано с тем, что платформа WoS включает в себя множество баз данных, в том числе специализированные базы по биологии и медицине, и все они будут индексироваться при поиске. Большое значение имеет уровень доступа к базам данных, поскольку условия подписки у разных организаций не совпадают. Планируется разместить Российский индекс научного цитирования на платформе WoS, поэтому будущим пользователям этого ресурса следует учитывать все указанные тонкости.
Особое внимание в главе уделено способам оценки публикаций, отличным от анализа цитирования. В 2010 г. был запущен
проект «Альтметрика», призванный предоставить ученым альтернативные методы быстрой оценки популярности научных идей. Новая методика учитывает закрузки статей, их упоминание в социальных сетях и научных блогах, обсуждения на сайтах журналов. Эта система позволяет отделить значимость статьи от престижа журнала, в котором она опубликована. В 2014 г. появился особый проект «Альтметрика для учреждений».
Последняя глава книги также написана М.А. Акоевым и посвящена вопросам картирования науки и технологии, а также прогнозированию развития. Картирование науки может осуществляться по геопространственному, темпоральному, сетевому или тематическому принципу. Тематическое картирование строится путем использования ключевых слов. Альтернативой облаку ключевых слов является инструмент картирования на основе модели векторного пространства, примером которого является построение патентных ландшафтов. В основе построения патентного ландшафта лежит метод измерения расстояния между двумя патентными семействами. Тематические области не изолированы друг от друга, например область гражданского строительства может граничить с материаловедением, электроникой и полупроводниками. Карты науки позволяют на микроуровне понять, какие связи существуют (и существуют ли) между дисциплинами. Она может быть построена в том числе и методом ко-цитирования.
Подобное картирование может пригодиться в странах с недофинансированной наукой. Анализ перспективных направлений позволит более бедным странам использовать достижения более продвинутых в ожидании появления прикладной тематики для использования своих возможностей. Это помогает экономить скудные ресурсы и не тратить их на развитие уже продвинутых направлений.
Монография дополнена переводами нескольких статей Ю. Гарфилда.
А. Э. Анисимова