Научная статья на тему 'Проектирование онтологии наукометрических терминов с учётом эволюции наукометрических баз'

Проектирование онтологии наукометрических терминов с учётом эволюции наукометрических баз Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
227
53
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / ОНТОЛОГИЧЕСКАЯ МОДЕЛЬ / НАУКОМЕТРИЯ / ЭВОЛЮЦИЯ / РЕЙТИНГ / НАУКОМЕТРИЧЕСКАЯ БАЗА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тронин Вадим Георгиевич, Фирулина Мария Михайловна

Проанализированы наиболее крупные наукометрические базы и термины с учётом хронологии появления новых терминов и связей между ними. На основе собранных данные впервые построена онтология по предметной области «наукометрия» в формате OWL с учётом терминов иностранных и отечественных наукометрических баз, проведено её описание и выявлены недостатки. Предложена доработка представления онтологий с точки зрения развития и происхождения элементов и связей. Разработанная онтология и модели могут быть применены в проектировании системы мониторинга и оценки результатов научных исследований, формировании Semantic Web.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проектирование онтологии наукометрических терминов с учётом эволюции наукометрических баз»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

УДК 519.711.3

В. Г. ТРОНИН, М. М. ФИРУЛИНА

ПРОЕКТИРОВАНИЕ ОНТОЛОГИИ НАУКОМЕТРИЧЕСКИХ ТЕРМИНОВ С УЧЁТОМ ЭВОЛЮЦИИ НАУКОМЕТРИЧЕСКИХ БАЗ

Проанализированы наиболее крупные наукометрические базы и термины с учётом хронологии появления новых терминов и связей между ними. На основе собранных данные впервые построена онтология по предметной области «наукометрия» в формате OWL с учётом терминов иностранных и отечественных наукометрических баз, проведено её описание и выявлены недостатки. Предложена доработка представления онтологий с точки зрения развития и происхождения элементов и связей. Разработанная онтология и модели могут быть применены в проектировании системы мониторинга и оценки результатов научных исследований, формировании Semantic Web.

Ключевые слова: онтология, онтологическая модель, наукометрия, эволюция, рейтинг, наукометрическая база.

Введение

Вопрос об измерении научного потенциала учёного, научного издания, организации или даже целой страны является важным для определения текущего состояния науки и построения тенденции последующего развития. Количество публикаций в настоящее время таково, что эксперты не могут ознакомиться со всем массивом информации по предметной области (ПрО) и необходимы вспомогательные инструменты для анализа, основанные на измеряемых количественных показателях. Данная проблема является предметом дисциплины «наукометрия». Наукометрическими лабораториями создаются показатели для различных целей (поиск наиболее важной информации по тематике, сравнение журналов, оценка результативности), для различных целевых групп (исследователи, организации, государственные структуры, фонды) на основе баз данных научной информации.

В наукометрии, как и в любой другой ПрО, накопленные знания представляются в виде слабоструктурированных информационных ресурсов. Информационные ресурсы представляют собой набор сущностей, описывающих предметы и явления проблемной области. Систематизация сущностей ПрО является основной задачей онтологического исследова-

© Тронин В. Г., Фирулина М. М., 2017

ния, которое позволяет представить рассматриваемую область в виде набора терминов и их отношений [1].

Целью исследования является построение онтологии по ПрО «наукометрия». Разработка онтологии нужна для структурирования знаний по ПрО, анализа и оценки публикационной активности учёных, научных групп, организаций, научных изданий и ресурсов. Также онтология востребована экспертами, учёными, библиотекарями для совместного использования и аннотирования информации в области наукометрии. Это связано с увеличением потока публикаций, развитием различных баз и появлением большого числа терминов, их модификаций и интерпретаций в различных системах.

Задачи исследования:

- анализ информационных ресурсов, посвя-щённых ПрО «наукометрия», извлечение из них терминологического аппарата ПрО;

- построение таксономии классов ПрО «наукометрия»;

- определение связей между классами ПрО «наукометрия»;

- рассмотрение свойств терминов, важных именно для ПрО.

Статья содержит описание основных групп терминов ПрО «наукометрия», построенной онтологии и выводы по развитию представления онтологической модели по наукометрии.

1. Эволюция наукометрической онтологии

1.1. Развитие библиографических баз данных

Библиография как научная дисциплина обеспечивает систематизированное описание книг, составление их списков, указателей, обзоров литературы и представляет собой основу систематизации науки и играет значительную роль в её развитии. Собранные вместе и размещённые в хронологическом порядке научные публикации позволяют отслеживать динамику научных исследований, всплески интереса к той или иной области или, наоборот, его угасание. Библиографические описания цитируемых статей учёных собираются в наукометрические базы данных. Самые крупные международные политематические наукометрические базы данных Web of Science (компания Thomson Reuters) и Scopus (издательство Elsevier).

Концепция платформы Web of Science (WoS) была предложена Юджином Гарфилдом в 1955 году и послужила основой для количественного анализа развития науки.

База Scopus создана в 2004 году и уже через восемь лет опередила Web оf Science по охвату научных публикаций.

В отдельных областях знаний наиболее качественную информацию предоставляют специализированные базы. Рассмотрим базы (по данным с их официальных сайтов), где публикации, индексируемые в соответствии с письмом ВАК «О перечне рецензируемых научных изданий от 01.12.2015 №13-6518», считаются входящими в Перечень по отраслям науки, соответствующим их профилю.

Springer Science+Business Media — международная издательская компания, специализирующаяся на издании академических журналов и книг, второе по величине издательством в мире после Elsevier в области «STM» (science, technology, medicine). С 2006 г. открыто электронное хранилище издаваемых компанией публикаций с платным доступом.

Astrophysics Data System (ADS) - электронная база для исследователей в области астрономии и физики, разработанная NASA, в эксплуатации с 1992 года. Содержит, в том числе препринты, полный доступ по платной подписке.

PubMed - база данных медицинских и биологических публикаций на основе раздела «биотехнология» Национальной медицинской библиотеки США, доступна с 1996 года, доступ бесплатный.

Математические Базы MathSciNet и Zentralblatt MATH предоставляют для матема-

тиков более полную информацию, чем базы WoS и Scopus, доступ осуществляется по платной подписке.

Chemical Abstracts Service (CAS) -подразделение Американского химического общества, издающее реферативный журнал Chemical Abstracts (с 1907 года), публикующий рефераты научной литературы по химии и смежным темам. Реестр CAS - всеобъемлющая база данных по химическим соединениям, каждое соединение получает уникальный номер и уникальное название.

AGRIS (International System for Agricultural Science and Technology) - международная информационная система по сельскому хозяйству и смежным отраслям, некоммерческая, создана в 1974 г.

В базе данных GeoRef, ведущейся Институтом геологических наук США с 1966 года, обеспечивается доступ к прикладным наукам о Земле, в открытом доступе демоверсия.

Важнейшим источником данных являются патентные базы. Например, через сервис Google (http://www.google.com/patents) возможен поиск по базе Патентного ведомства США (USPTO) с целью массового обеспечения бесплатного публичного доступа к данным о патентах и торговых марках.

Российский индекс научного цитирования (РИНЦ), созданный в 2005 году, во многом копирует подходы, применённые в WoS. Отличием РИНЦ является максимально широкий набор источников данных (журналы, конференции любого уровня, патенты, учебные пособия, монографии, диссертации), преимущественно российских, отсутствие интеграции с российскими базами (например, электронной библиотекой Российской государственной библиотеки, информационными ресурсами ФГБУ «ФИПС» по объектам интеллектуальной собственности). Наполнение РИНЦ в настоящее время не предусматривает экспертизы, поэтому среди наиболее рейтинговых авторов по показателям РИНЦ присутствуют как признанные в своей области знаний учёные, так и искусственно нарастившие свои количественные показатели авторы [2].

В связи с массовым размещением научных публикаций в Интернете, появилась возможность более оперативно анализировать интерес к различным материалам с помощью альтернативных традиционным

(альтметрик). Альтметрики реализованы в РИНЦ, базах крупных издательств (Springer). Научные социальные сети ResearchGate, Academia.Edu, Google Scholar имеют наилучшие

реализации альтметрик [3]. Альтметрики позволяют учитывать интерес научного сообщества к ещё не опубликованным данным (препринтам), не прошедшим рецензирование альтернативным гипотезам и научным данным; качественный интерес (полезно или неполезно, понравилось или не понравилось, согласен или не согласен), налаживать горизонтальные научные связи [4].

К альтернативным показателям можно отнести:

- количество скачиваний,

- количество просмотров,

- количество комментариев,

- количество подписчиков,

- количество лайков.

1.2. Появление модификаций наукометрических показателей

Помимо базовых показателей, таких как количество публикаций и количество цитирований, было предложено большое количество показателей, учитывающих различные аспекты публикационной активности.

Широко известный индекс Хирша ^-индекс) предложенный в 2005 году, позволяет выделять продуктивных авторов, длительное время работающих в своей ПрО. Недостатки индекса Хирша связаны с тем, что в нём не учитывается то, насколько превышен порог цитирований в ядре Хирша, игнорируется количество публикаций, не вошедших в ядро, и уровень их цитирования. Для компенсации этих недостатков предложены более тридцати модификаций индекса Хирша. Наиболее заметными и широко используемыми являются g-индекс и ^индекс, предложенные в 2006 году. G-индекс также рассчитывается на основе распределения цитирований публикаций, но имеет иной алгоритм расчёта. При условии равенства ^индекса величина g-индекса будет больше у того исследователя, у которого на самые цитируемые статьи приходится больше цитирований. 1-индекс используется для оценки публикационной активности научной организации и имеет более высокое значение в тех организациях, в которых много продуктивных учёных. Поскольку часто важно отметить оценку публикаций научным сообществом, можно отбросить ссылки авторов на свои статьи. Таким образом, существует оценка индекса Хирша как с учётом, так и без учёта самоцитирования, без учета цитирования соавторами. Sh-индекс позволяет учитывать степень приближения к следующему уровню индекса Хирша [5].

Для оценки рейтинга журнала используется импакт-фактор. Импакт-фактор с 1960 года ежегодно рассчитывается по базе Web of Science и публикуется в журнале Journal Citation Report (JCR). Он показывает, сколько раз в среднем цитируется каждая опубликованная в журнале статья в течение двух последующих лет после выхода. Могут учитываться публикации только из журналов, индексируемых в этой базе, а могут и из всех источников (материалов конференций). Импакт-фактор даёт адекватную оценку для сравнения журналов, близких по тематике. Для сравнения качества журналов из разных научных областей он малопригоден из-за сильных отличий в традиционном уровне цитирования.

В JCR рассчитываются дополнительные показатели журналов.

- Пятилетний импакт-фактор - удобен для областей знаний с низким уровнем цитирований.

- Immediacy Index - рассчитывается по цитированию статей журнала в том же году, в котором они опубликованы. Целесообразно рассчитывать для журналов, имеющих большое количество выпусков в год.

- Cited half life - показывает, за какой период времени статьи, опубликованные в журнале, собирают половину ожидаемых цитирований.

- Eigenfactor Metrics - учитывает не только количество цитирований за пять лет, но и источник цитирования, без учёта самоцитирований [6].

В базе Scopus применяется показатель SCImago Journal Ranking (SJR), который учитывает рейтинг источника помимо количества цитирований. Показатель обладает значительным преимуществом: доступность на специальном веб-ресурсе, содержащем динамику значений по всем журналам [7].

Если оплата труда учёного напрямую зависит от значений импакт-фактора журналов, в которых он публикуется, и его персонального индекса Хирша, то возникает высокая вероятность искусственного увеличения данных показателей авторами. Так называемое «китайское» избыточное самоцитирование, взаимообмен цитированиями по договорённости. И если просмотреть динамику такого показателя, как средний размер списка литературы в публикациях журналов в РИНЦ, то мы увидим его значительное увеличение в последние два года. При этом показатели публикационной активности являются обязательной составной частью оценки как конкретного учёного, так и организации [8].

1.3. Агрегирование показателей, нормирование показателей для разных областей

В попытке обойти ограничения стандартных наукометрических показателей создаются показатели, учитывающие различные стороны публикационной активности, сглаживающие различия между сложившейся практикой в разных областях знания.

Базы Web of Science и Scopus активно используют такие понятия, как квартили и децили. Квартили - разбиение списка журналов на четыре части от высшего к низшему значению импакт-фактора внутри ПрО. Соответственно более престижные журналы находятся в первом квартиле. Дециль высчитывается через разбиение на 10 частей по уровню цитируемости публикаций внутри ПрО.

Наиболее продвинутый интегрированный показатель, используемый в Scopus - SNIP, учитывает уровень цитирований в каждой научной области и может применяться для сравнения публикаций в разных научных направлениях с учётом ссылок текущего года на статьи трёх предыдущих лет. Типы документов одинаковы для всех этапов подсчёта показателя. Введено специальное определение окружения журнала - все статьи, опубликованные в текущем году (в любом издании), которые хотя бы однажды цитировали выпуски журнала, вышедшие за последние десять лет. Для определения потенциала цитирования подсчиты-вается среднее число ссылок в статьях, составляющих «окружение журнала». И далее SNIP рассчитывается как отношение числа цитирований к потенциалу цитирований [7].

При построении рейтинга российских научных журналов используется показатель, рассчитываемый в системе Science Index. Интегральный показатель учитывает различия в практике цитирования для различных направлений, повышает рейтинг тех журналов, которые публикуют публикации авторов из разных организаций (индекс Херфиндаля).

Обобщим тенденции развития наукометрических показателей:

- использование комбинации индикаторов вместо одного показателя;

- набор процентилей вместо среднего значения или «экстремальных показателей»;

- применение альтметрик - упоминания в соцсетях, число загрузок читателями, рейтинги на сайтах продаж [9].

2. Построение формальной модели онтологии предметной области

Онтология - это попытка формализации некоторой ПрО с помощью концептуальной схемы. Таким образом, структуризация ПрО является путём к построению онтологии. Информационные ресурсы выступают источником такой структуризации, они отражают свойства, характерные сущностям конкретной ПрО [10].

Можно выделить два направления, в рамках которых развивались онтологические исследования. Одно связано с представлением онтологии как формальной системы, основанной на математически точных аксиомах. Другое развивалось в рамках компьютерной лингвистики и когнитивной науки. Там онтология понималась как система абстрактных понятий, существующих только в сознании человека, которая может быть выражена на естественном языке.

Примитивной моделью онтологии может служить словарь терминов ПрО с определениями. Простейшие онтологии строятся на основе построения иерархии терминов, основанной на принципе наследования. Такие онтологии принято называть таксономией.

Также возможно построение онтологии на основании отношений часть-целое, которые позволяют сформировать партономию.

Существуют модели с широким набором отношений. Такие модели могут как иметь, так и не иметь атрибутов понятий и представлений свойств в виде фреймов [11].

В настоящее время не существует единой формальной модели онтологии. В рамках проекта Karlsruhe Ontology framework [12] было сформировано одно из таких представлений.

Ядро с аксиомами представляется следующей структурной моделью:

O:= (C, <с, R, a, <R, A), (1)

состоящей из

- двух непересекающихся множеств C и R, элементы которых представляют собой идентификаторы понятий и идентификаторы отношений соответственно,

- частичного порядка <C на С, называемого таксономией, иначе говоря, иерархией понятий,

- функции о : R ^ C+, называемой сигнатурой,

- частичного порядка <R на R, называемого иерархией отношений,

- множества логических аксиом A.

Согласно Lotfi Zadeh [13], онтология есть

краткое описание структуры ПрО:

O= <T, R, D>, (2)

включающее:

- множество терминов ПрО T,

- множество отношений R,

- множество определений этих терминов и отношений.

Наиболее формально модель онтологии можно представить следующим образом [14]:

O = {C, R, T, D, A, F, Axj, (3)

где С = {Cu, C2, ... Cn} - конечное непустое множество классов, описывающих понятия данной ПрО;

R = {Ri, R2, ... Rm}, CхC 3Rb R = {RT, Rp}URA - конечное непустое множество бинарных отношений, заданных на классах, понятиях:

- RT - нерефлексивное, асимметричное, транзитивное бинарное отношение наследования, задающее частичный порядок на множестве понятий С,

- RP - бинарное транзитивное отношение включения,

- RA - конечное множество ассоциативных отношений.

Т = {tu, t2, ... tn} - конечное непустое множество стандартных типов;

D = {du, d2, ... dk} - множество доменов;

TD = Tu D — обобщённый тип данных, включающий множество стандартных типов и множество доменов;

A = A с U Ar = {a1, a2, ... an} - конечное множество атрибутов, описывающих свойства понятий и отношений;

F - множество ограничений на значения атрибутов понятий и отношений;

Ax - множество аксиом, определяющий семантику отношений онтологии.

В целом стоит отметить, что с усложнением моделей онтологий усложняются и средства их выразительного представления. Для описания формализованных онтологий применяются различные логики (логика предикатов первого порядка, дескриптивные логики, модальные логики) и языки описания онтологий, среди которых можно выделить наиболее часто используемые: OWL, KIF, Common Logic, CycL, DAMN+OIL [15].

Для формирования онтологии по наукометрии был выбран формат OWL, на котором уже создано достаточно большое количество онтологий с перспективным формированием базы онтологий для Semantic Web [16]. Для разработки выбрана среда Protégé, которая поддерживается значительным международным сообществом учёных, использующих его для решения задач, связанных со знаниями.

3. Описание сформированной онтологии в формате OWL

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Наукометрия имеет целью создание вспомогательного инструмента мониторинга научных результатов через разнообразные измерения и статистическую обработку. Наукометрические данные обычно дополняются экспертными оценками. Наукометрия оперирует к настоящему времени достаточно большим количеством терминов, у каждого имеется область применения.

Разрабатываемая онтология должна охватывать как высокоуровневые абстракции научной деятельности в целом, так и более узкоспециализированные термины,

специфичные для рассматриваемой ПрО. Область наукометрии и научной деятельности в целом очень обширна и включает в себя огромное количество понятий, категорий и свойств.

Разработанная онтология рассматривает основные термины и определения, составляющие ПрО наукометрии. Онтология включает 150 классов, описывающих понятия, которыми оперирует дисциплина. Для описания взаимодействий между описанными классами были разработаны 150 свойств, 75 из которых обратные.

На рисунке 1 представлен фрагмент построенной в редакторе Protégé онтологии.

Иерархия классов строится путём добавления подклассов либо в класс Thing, либо в другие классы онтологии. Инструмент позволяет строить онтологии любой глубины вложенности.

Class hierarchy: Российский_индекс_научного_4итироБания

П t И

Альгаетрики

t ê Библиографическаябаза = Индексцитирования Scopus

WebofScience_

Росси11скш1_индекс_научного_цитирования

▼■■■■§ Библиографические_ресурсы AuthorID

Digital_Object_Identifier EndNote_Web

О pe n_Resea rcher_and_C ontri butor_ID ResearcherID Взаимобмен_цитированиям Влиятельность_журнала Высшая_аттестационная_комиссия_России Доступность_научного_издания Индекс_цитирования е Библиографическая_база Индексирование Инс™тут_научной_информации Инсштут_рецензирования * Щ Инструменты_оценки_и_анализа_научного_содержания ISI_EssMitial_Science_Indicators IS[_JDurMal_Citation_Report5_Dn_the_Web

Рис. 1. Фрагмент таксономии классов построенной онтологии

Согласно методике построения онтологии в формате OWL строится именно таксономия, то есть все термины организованы по принципу наследования. Например, если Показатель рейтинговости является Наукометрическим показателем, а Импакт-фактор является Показателем рейтинговости, то, естественно, Импакт-фактор является и Наукометрическим показателем. Нарушение данного правила говорит о том, что нарушена логика в построении онтологии, и она является некорректным описанием ПрО.

Инструмент Protégé кроме таксономии классов позволяет также строить таксономии свойств. Это могут быть свойства объектов, свойства типа данных, свойства аннотации.

На рисунке 2 представлен фрагмент таксономии отношений построенной онтологии.

Object property hierarchy: ol^hhБается в

Ti » *

▼■■■■■ topObjectProperty

[ * в_отношении_составлян>т

[......■для_вклн>чения_привлекает

Рис. 2. Фрагмент таксономии отношений построенной онтологии

Таксономия свойств в OWL строится по тем же принципам наследования, что и таксономия классов. Свойства объектов представляют собой отношения между классами онтологии. Отношения имеют домены и диапазоны. Домен - это исходный класс, в который входит индивид, а диапазон - это класс, в который входит индивид, связанный отношением с первым индивидом.

Определение для отношений доменов и диапазонов позволяет создавать связи между классами, которые могут быть использованы для

создания определений терминов, классификаций и построения аксиом с помощью логического вывода.

В онтологии описаны основные верхне-уровневые термины, такие как Наука, Эволюция науки, Научная единица, Инфометрия, Наукометрия.

В результате чего было выяснено, что Наукометрия возникла как подкласс дисциплины Инфометрия, используется для оценки выполнения и финансирования Научных единиц и изучает Эволюцию науки, что было выражено в построенной онтологии посредством классов и отношений между ними.

Другая возможность построения онтологии научных публикаций заключается в формирования иерархии по тематическим рубрикам публикаций и вхождению различных терминов в публикации, свойственные для определённой области [17]. Возможно формирование онтологии с позиции генерации новых знаний по базам патентов с применением таксономии типовых изобретательских приёмов [18]. Патентные базы являются важным источником накометрических данных для технических вузов [8], предполагается в дальнейшем дополнить онтологию по данному направлению.

В составленной онтологии отражено, что наукометрическая оценка научной единицы может производиться несколькими способами: рецензирование, оценка наукометрических показателей, оценка альтернативных метрик (альтметрик). В класс Наукометрический показатель были включены термины, традиционно используемые для оценки научных изданий, авторов, организаций. Альтернативные метрики вынесены в отдельный класс Альтметрика, так как исторически создавались в противовес традиционным. А Рецензирование является одним из методов Экспертной оценки.

Наукометрические показатели в свою очередь разделились на показатели, используемые для оценки журнала (исследователя, научной группы, организации) и для оценки уровня цитирования.

В рамках ПрО «наукометрия» рассмотрены основные библиографические базы данных, такие как: Web of Science, Scopus, РИНЦ, а также перечень ВАК.

На рисунке 3 представлена схема фрагмента системы классов онтологии, имеющих отношение к основным политематическим библиографическим базам. Рассмотрены основные составляющие данных баз, наукометрические показатели, используемые в них, критерии включения в данные индексы

Рис. 3. Схема фрагмента системы классов онтологии

научного цитирования, а также набор классов, которые помогают путём связывания основных терминов с ними составить определения данных терминов.

На схеме представлены основные ресурсы, наукометрические показатели и аналитические системы, используемые рассматриваемыми библиографическими базами данных. Так Web of Science использует для оценки Импакт-фактор, предоставляет ресурсы ResearcherID и EndNote Web и ежегодно формирует Journal Citation Report, который содержит информацию о Числе статей, Времени полужизни статей, Числе ссылок и Immediacy Index. Созданный позднее Scopus предоставляет для поиска AuthorID, ввёл и использует для своих оценок показатели SCImago Journal Rank, Source Normalized Impact per Paper, Impact per Publication. РИНЦ же в своих оценках опирается на интегрированный показатель Science Index, представляющий из себя целую аналитическую систему.

4. Предложения по расширению формальной модели онтологии и доработки существующих средств выразительного представления онтологии

Средства создания OWL онтологий позволяют рассматривать иерархии терминов только с точки зрения классов и подклассов, но не позволяют хранить иерархии терминов с точки зрения их развития, не позволяют

составить некое генеалогическое дерево для предметной области. Конечно, можно создавать иерархию с точки зрения возникновения, тогда сущность, послужившая основой для развития другой сущности, могла бы быть подклассом, а тот в свою очередь подклассом. Однако это было бы искусственно и не достоверно, так как OWL следует принципам наследования согласно объектно-ориентированному подходу, а не с точки зрения родственных отношений. Это можно считать существенным недостатком существующих онтологических средств, который следует доработать.

Наиболее формальная модель онтологии (см. формулу 3) включает множество классов, множество бинарных отношений, множество стандартных типов, множество доменов, множество свойств понятий, множество ограничений и множество аксиом. Множество бинарных отношений в свою очередь включает следующие подмножества: множество отношений наследования, множество отношений типа «часть-целое», множество ассоциативных отношений.

Среди описанных множеств нет множеств, описывающих отношения типа «предок-потомок». Включение данного множества в формальную модель представления онтологии могло бы позволить рассматривать предметную область более детально и глубоко, проследить развитие данной области, её сущностей и категорий.

Таким образом, с учётом вышеописанной доработки множество бинарных отношений можно было бы представить следующим образом:

R = {Ri, R2, ... Rm}, Cx C=>RV R =

= {Rt, RP, RG}URA, (4)

где Rg - множество отношений типа «предок-потомок».

Все множества нужно привязать непосредственно к тематике онтологии.

O = {HT, In, Res ...R}, (5)

где HT — множество классов верхнеуровневой терминологии; In — множество классов наукометрических показателей, индексов; Res — множество классов тематических интернет-ресурсов типа Google Shcolar, ResearchGate; R — множество отношений между объектами классов.

Многие факты, содержащиеся в состоянии модели, представляют события, которые связываются друг с другом темпоральными отношениями («раньше», «позже», «одновременно», «в течение» и т. п.). В модель могут быть добавлены темпоральные переменные и темпоральные кванторы [19].

Заключение

Рассмотрена ПрО наукометрии, разные термины, особенности крупных наукометрических баз, наукометрических показателей. Создана онтологическая модель ПрО в одном из распространённых форматов OWL. Рассмотрены основные направления эволюции наукометрических показателей, отмечено, что большинство показателей имеет особенности расчёта в различных базах. Выявлен недостаток OWL онтологий, которые используют объектно-ориентированный подход в создании иерархии терминов и не позволяют хранить иерархии с точки зрения развития и происхождения элементов и связей. Приведено классическое описание онтологической модели и предложена её доработка для более полного представления информации в рассматриваемой ПрО.

Разработанная онтология может использоваться экспертами для совместного использования и аннотирования информации в области наукометрии, для выявления связей между терминами по ПрО и понимания общих закономерностей развития наукометрии.

СПИСОК ЛИТЕРАТУРЫ

1. Загорулько Г. Б. Разработка онтологии для Интернет-ресурса поддержки принятия решений в слабоформализованных областях // Онтология проектирования. — 2016. — №4 (22). — С.485—500.

2. Фрадков А. РИНЦ учит врать // Троицкий вариант - наука [Электронный ресурс] http://trv-science .ru/2015/10/06/risc-uchit-vrat/

3. Butler J. S. et al. The Evolution of Current Research Impact Metrics: From Bibliometrics to Altmetrics? / J. S. Butler //Clinical Spine Surgery. -2017.

4. Сафиуллин А. Р., Тронин В. Г. Сотрудничество и научно-исследовательские сети в экономике знаний // Проблемы теории и практики управления. - 2015. - №2. - С. 104-111.

5. Штовба С. Д., Штовба Е. В. Обзор наукометрических показателей для оценки публикационной деятельности учёного //Управление большими системами: сборник трудов. - 2013. -№44. - С. 262-278.

6. Писляков В. В. Библиометрические индикаторы в ресурсах Thomson ReutersZ/Руководство по наукометрии: индикаторы развития науки и технологии. - Екатеринбург: Изд-во Урал. ун-та, 2014. - С. 75-109.

7. Сайт Scimago Journal & Country Rank [Электронный ресурс] http://www.scimagojr.com

8. Ярушкина Н. Г., Тронин В. Г. Рейтинги оценки деятельности инженерного вуза // Высшее образование в России. - 2014. - №5. -С. 72-79.

9. Писляков В. В. Эволюция библиометриче-ских индикаторов: история, перспективы // Science Online XX электронные информационные ресурсы для науки и образования. 21-28 мая 2016 г., Испания.

10. Гаврилова, Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем: учебное пособие. - СПб. : Питер, 2000. - 384 с.

11. Ярушкина Н. Г. Онтологический и нечёткий анализ слабоструктурированных информационных ресурсов / Т. В. Афанасьева, В. С. Мошкин, А. М. Наместников, И. А. Тимина, Н. Г. Ярушкина ; под науч. ред. Н. Г. Ярушкиной. - Ульяновск : УлГТУ, 2016. - 130 с.

12. Stumme G. Semantic Web Mining. State of the art and future directions/ G. Stumme, F. Hotho, B.Berendt // Web Semantics: Science, Services and Agents on the World Wide Web. - №4. - 2006. -Р. 124-143.

13. Zadeh, Lotfi A. Toward a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic. / Lotfi A. Zadeh // Fuzzy Sets and Systems,Vol. 90. - 1997. - Р. 111-127.

14. Боровикова О. И., Загорулько Ю. А. Подход к представлению знаний в многоязычных информационных системах // Одиннадцатая национальная конференция по искусственному интеллекту КИИ-2008 с международным участием : труды конференции. - Т. 3. - М. : ЛЕНАНД, 2008.- C. 154-163.

15. Хорошевский В. Ф. Обработка естественно-языковых тестов: от моделей понимания языка к технологиям извлечения знаний // Новости искусственного интеллекта. - СПб. : Питер, 2002. - №6. - С. 16-26.

16. Narock T. Linked data scientometrics in semantic e-Science/ T. Narock, H. Wimmer //Computers & Geosciences. - 2017. - Т. 100. -С. 87-93.

17. Кузнецов О. П., Суховеров В. С. Онтологический подход к оценке тематики научного текста // Онтология проектирования. - 2016. -Т. 6, №1 (19). - С. 55-66.

18. Гришин М. В., Тронин В. Г. Источники данных для разработки системы поддержки ТРИЗ на основе онтологий // Известия Самарского научного центра Российской академии наук. - 2016. - Т. 18, №1-2. - С. 386-389.

19. Плесневич Г. С., Нгуен Тхи Минь Ву. Спецификация темпоральных отношений в системе «бинарная модель знаний» // 0STIS-2015. -С. 275-280.

Тронин Вадим Георгиевич, кандидат технических наук, начальник научно-исследовательского отдела управления научных исследований (НИО УНИ), доцент кафедры «Информационные системы» УлГТУ. Сфера научных интересов - наукометрия, моделирование вычислительных сетей на прикладном уровне, управление проектами.

Фирулина Мария Михайловна, магистрант кафедры «Информационные системы» УлГТУ.

Поступила 29.08.2017 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.