Научная статья на тему 'СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДА СЕТЕВОГО АНАЛИЗА НАУЧНЫХ ПУБЛИКАЦИЙ И МЕТОДА АНАЛИЗА ИЕРАРХИЙ ПРИ ВЫБОРЕ ИСТОЧНИКОВ ИНФОРМАЦИИ'

СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДА СЕТЕВОГО АНАЛИЗА НАУЧНЫХ ПУБЛИКАЦИЙ И МЕТОДА АНАЛИЗА ИЕРАРХИЙ ПРИ ВЫБОРЕ ИСТОЧНИКОВ ИНФОРМАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
метод анализа иерархий / сетевой анализ / сеть цитирования / статья / ранжирование по важности / hierarchy analysis method / network analysis / citation network / article / ranking by importance

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ольгина Инна Геннадьевна, Андреева Елена Григорьевна, Янишевская Анна Генриховна, Федоров Владимир Кузьмич

В данной статье рассмотрена задача, связанная с принятием решения при выборе научных публикаций в определенной тематической области, которые являются источниками информации на этапе исследования в любой научной деятельности. Применен метод анализа иерархий для нахождения предпочтительного варианта из предложенных альтернатив – важной статьи. Полученные результаты эксперимента сравниваются с результатами разработанного метода ранжирования научных публикаций на основе анализа сетей цитирования. Доказана адекватность разработанной математической модели определения важности узла сети цитирования на основе схождения результатов, полученных с помощью рассмотренных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ольгина Инна Геннадьевна, Андреева Елена Григорьевна, Янишевская Анна Генриховна, Федоров Владимир Кузьмич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARATIVE ANALYSIS OF THE METHOD OF NETWORK ANALYSIS OF SCIENTIFIC PUBLICATIONS AND THE METHOD OF HIERARCHY ANALYSIS IN THE SELECTION OF INFORMATION SOURCES

This article considers the problem of making a decision when choosing scientific publications in a certain the-matic area, which are sources of information at the research stage in any scientific activity. The method of hierarchy analysis is applied to find the preferred option from the proposed alternatives – an important article. The experimental results ob-tained are compared with the results of the developed method of ranking scientific publications based on the analysis of cita-tion networks. The adequacy of the developed mathematical model for determining the importance of a citation network node based on the convergence of the results obtained using the considered methods is proved.

Текст научной работы на тему «СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДА СЕТЕВОГО АНАЛИЗА НАУЧНЫХ ПУБЛИКАЦИЙ И МЕТОДА АНАЛИЗА ИЕРАРХИЙ ПРИ ВЫБОРЕ ИСТОЧНИКОВ ИНФОРМАЦИИ»

effective use and successful in-depth analysis of hardware and software. Such research can be used to enhance cyber security, transition to 5G and 6G technologies, pilot-free transport management and virtual reality augmentation, etc. Based on the analysis, abstract synthesis, minimization and structural synthesis, an original model of joint design of hardware and software for the Mile and Moore automata is advisable due to the classification of control modes by a team of algorithms and a team of neural network automata and robots based on the experience of domestic computers. As a result, the developed software in the form of an expert system will allow using not only the SBIS 1879VM8U Neuro Matrix family of neuroproces-sors [5-6], but also ELBRUS [11], Baikal [12], etc. in order to create automated systems as a powerful platform for implementing various architectures of the organization of multicore neural network automata and robots on a chip.

Key words: set-theoretic, expert, equivalence, collective of algorithms, collective of robots, crystal, speed, flexibility of management, principles of organization, rigid, self-organizing, hierarchical, intelligence of the system, neuropro-cessor, universal cores, structural synthesis, conceptual model, collective of algorithms, collective of automata, neuronetwork automaton, tensor robot, NM module.

Ruchkin Vladimir Nikolaevich, doctor of technical sciences, professor, [email protected], Russia, Ryazan, Witte Moscow State University,

Grigorenko Dmitry Vladimirovich, general designer, [email protected] , Russia, Ryazan, CJSC Ryazanpribor,

Fulin Vladimir Andreevich, head of the department of distance education projects, [email protected], Russia, Ryazan, Ryazan State University named after S.A. Yesenin,

Ruchkina Ekaterina Vladimirovna, candidate of historical sciences, docent, ek-ruchkina@yandex. ru, Russia, Ryazan, Ryazan State Radio Engineering University named after V. F. Utkin,

Gromov Alexander Alexandrovich, postgraduate, [email protected], Ryazan, Russia, Ryazan State University named after S.A. Yesenin,

Gorshkov Pavel Viktorovich, postgraduate, [email protected], Russia, Ryazan, Ryazan State University named after S.A. Yesenin

УДК 519.234.6 + 004.942

DOI: 10.24412/2071-6168-2024-9-484-485

СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДА СЕТЕВОГО АНАЛИЗА НАУЧНЫХ ПУБЛИКАЦИЙ И МЕТОДА АНАЛИЗА ИЕРАРХИЙ ПРИ ВЫБОРЕ ИСТОЧНИКОВ ИНФОРМАЦИИ

И.Г. Ольгина, Е.Г. Андреева, А.Г. Янишевская, В.К. Федоров

В данной статье рассмотрена задача, связанная с принятием решения при выборе научных публикаций в определенной тематической области, которые являются источниками информации на этапе исследования в любой научной деятельности. Применен метод анализа иерархий для нахождения предпочтительного варианта из предложенных альтернатив - важной статьи. Полученные результаты эксперимента сравниваются с результатами разработанного метода ранжирования научных публикаций на основе анализа сетей цитирования. Доказана адекватность разработанной математической модели определения важности узла сети цитирования на основе схождения результатов, полученных с помощью рассмотренных методов.

Ключевые слова: метод анализа иерархий, сетевой анализ, сеть цитирования, статья, ранжирование по

важности.

Введение. Отбор источников информации для осуществления научно-исследовательской деятельности важный и трудоёмкий процесс. Помимо подписных международных и российских баз данных публикаций существуют репозитории открытого доступа, обеспечивающие доступ к научной информации. Большинство из них содержат несколько миллионов научных публикаций из самых разных областей науки. Согласно статистическим данным OpenDOAR (https://v2.sherpa.ac.uk/opendoar/) - глобального каталога репозиториев с ресурсами открытого доступа, в мире насчитывается 5936 открытых архивных систем; в 2022 г. их число составляло 5804, в 2021 г. - 5575. О возрастающем количестве репозиториев свидетельствуют данные крупнейших каталогов и агрегаторов, таких как: ScienceOpen (https://www.scienceopen.com/), CORE (https://core.ac.uk/), DOAJ (https://doaj.org/), «КиберЛенинка» (https://cyberleninka.ru/) и др.

Для определения важных источников информации разработан метод ранжирования научных публикаций, основанный на анализе сетей цитирования с помощью определенного набора метрик [1]: центральность по степени связности (degree centrality), центральность по близости к другим узлам (closeness centrality), центральность по посредничеству (betweenness centrality), центральность по авторитетности (authority centrality), центральность по информативности (hub centrality). В основу метода заложена математическая модель определения важности узла сети цитирования. На основе данного метода упрощается отбор публикаций, которые в первую очередь стоит рассмотреть на этапе исследования предметной области.

Основная задача данного исследования заключается в сравнении разработанного метода с известным. Для сравнения выбран метод анализа иерархий (МАИ), который используется для разнообразных задач сравнительного анализа, оптимального выбора и принятия решений.

Постановка задачи. В качестве источников информации будут рассматриваться научные публикации, а именно статьи. В работе [1] представлены результаты анализа статей разработанным методом на основе данных международной базы цитирования Scopus. Полученная сеть цитирования содержит 850 статей, изданных по 2023 год. Из данных о цитировании публикаций базы данных Scopus осуществлена выборка по ключевому слову «Network Science». Ниже в таблице 1 представлены пять научных статей [2-6], занимающие наивысшие ранги по результатам анализа. С целью анализа результатов, полученных разработанным методом, для оценки данных статьей рационально применить метод анализа иерархии.

Таблица 1

Список рассматриваемых статей__

Обозначение Автор Название Год публикации

S1 Andrea Baronchelli Networks in cognitive science 2013

S2 Elisabeth A. Karuza Local patterns to global architectures: influences of network topology on human learning 2016

S3 Hannah M. Merseal Representing melodic relationships using network science 2023

S4 Yoed N. Kenett Editors' Introduction to Networks of the Mind: How Can Network Science Elucidate Our Understanding of Cognition? 2022

S5 Michael S. Vitevitch Using network science in the language sciences and clinic 2015

Необходимо доказать адекватность математической модели определения важности узла сети цитирования (1), на основе которой предложен метод ранжирования научных публикаций, путем сравнения результатов выбора при помощи метода анализа иерархий.

п

Ch(v) = ^fchfi£(v), (1)

1= 1

где Ch - мера центральности по важности соответствующего профиля исследования; v - узел сети; Ri - ранг i-го показателя; n - число показателей; fch - индекс релевантности i-го показателя, 0 <kh< 1, fch е Q; h - профиль исследования.

Для удобства проведения экспериментов в данной работе индекс релевантности khi, соответствующий весу показателя, принимается равным 1, если данный показатель соответствует профилю исследования, и 0, если не принимается во внимание, т.е. fch £ {0, 1}.

Результаты эксперимента. При выборе статьи в нужной тематической области, следует учесть значение мер центральностей узлов сети цитирования (сетевых метрик), отобранных в работе [2], необходимых для определения важности статьи по нужной тематики. Содержательная интерпретация данных сетевых метрик следующая: центральность по степени связности (Cd) - количество цитирований и ссылок; центральность по близости к другим узлам (Ce) - оценка близости по исследуемой тематике; центральность по посредничеству (Cb) - важность статьи по управлению информацией в контексте развития и взаимодействия тематических сообществ; центральность по авторитетности (Cau) - важная статья, которая цитируется во многих статьях с высоким показателем информативности; центральность по информативности (Chu) - важная статья, которую цитируют много статей с высокой степенью авторитетности. На рисунке 1 отображена соответствующая иерархия, на первом уровне которой находится цель «Важная статья», на втором пять факторов (сетевые метрики), уточняющих цель, и на последнем уровне пять статей из таблицы 1, которые должны быть оценены по отношению к критериям второго уровня.

Рис. 1. Иерархия выбора важной статьи

Матрица парных сравнений критериев приведена в таблице 2.

Вычисление векторов приоритетов (КОВ) производилось приближенным способом: перемножением всех элементов каждой строки и извлечением корня соответствующей степени с последующей нормализацией полученных величин. Нормализация производилась путем деления всех элементов столбца (Ь) со значениями корня по каждой строке на , где п - количество критериев. Таким образом, получился нормализованный собственный вектор - вектором приоритетов или КОВ.

По отношению к общей цели первого уровня все пять факторов равнопредпочтительны, и матрица парных сравнений заполняется единицами и имеет одно собственное значение (таблица 2). Для сравнения всех статей потребуется уже не одна, а пять матриц, поскольку необходимо сравнить статьи друг относительно друга по каждому качеству. Матрицы парных сравнений рассматриваемых статей (Бт, где т - количество рассматриваемых статей) будут иметь несколько собственных значений, так как рассматриваемые статьи принимают разные значения по каждому критерию. Эти матрица приведены в таблицах 4-8. Парные сравнения проводились в терминах доминирования одного элемента над другим. Полученные суждения выражались в целых числах с учетом девятибалльной шкалы [7]. В таких случаях следует оценить однородность суждений экспертов. Для этого необходимо использовать отклонение величины максимального собственного значения Атах , от порядка матрицы п.

В силу того, что для обратно-симметричных положительных матриц всегда выполняется Атш > п, индекс согласованности или индекс однородности (ИО) будет определяться отношением — . ИО является показателем близости этой матрицы к согласованной. Однородность суждений будет оцениваться отношением однородности ОО = ^^ , где

М(ИО) - среднее значение индекса однородности случайным образом составленной матрицы парных сравнение, которое основано на экспериментальном материале и представлено в таблице 3. В качестве допустимого используется значение ОО < 0,1.

Таблица 2

Матрица приоритетов качеств статьи___

Критерии 1 2 3 4 5 Произв. Корень КОВ

Центральность по степени связности 1 1 1 1 1 1 1 0,2

Центральность по близости к другим узлам 1 1 1 1 1 1 1 0,2

Центральность по посредничеству 1 1 1 1 1 1 1 0,2

Центральность по авторитетности 1 1 1 1 1 1 1 0,2

Центральность по информативности 1 1 1 1 1 1 1 0,2

Сумма по столбцам 5 5 5 5 5 5

Произведение сумм КОВ 1 1 1 1 1

Атах 5

М(ИО) 1,12

ИО 0,00

ОО 0,00

Таблица 3

Среднее значение индекса однородности____

N 1 2 3 4 5 6 7 8 9 10

М(ИО) 0,00 0,00 0,58 0,90 1,12 1,24 1,32 1,41 1,45 1,49

Матрица сравнения по критерию Св

Таблица 4

Св 8, 82 8з 84 85 Произв. Корень КОВ

8, 1 2 3 4 2 36 2,0477 0,3682

82 0,50 1 2 2 1 2 1,1487 0,2065

8з 0,33 0,50 1 1 0,50 0,0833 0,6084 0,1094

84 0,33 0,50 1 1 0,50 0,0833 0,6084 0,1094

85 0,50 1 2 2 1 2 1,1487 0,2065

Сумма по столбцам 2,67 5,00 9,00 9,00 5,00 5,5618

Произведение сумм КОВ 0,98 1,03 0,98 0,98 1,03

Атах 5,02

М(ИО) 1,12

ИО 0,004

ОО 0,004

Матрица сравнения по критерию Сс

Таблица 5

Сс 8, 82 8з 84 85 Произв. Корень КОВ

8, 1 0,50 0,25 0,25 2 0,0625 0,5743 0,0898

82 2 1 0,33 0,33 3 0,6667 0,9221 0,1441

8з 4 3 1 1 5 60 2,2679 0,3544

84 4 3 1 1 5 60 2,2679 0,3544

85 0,50 0,33 0,20 0,20 1 0,0067 0,3671 0,0574

Сумма по столбцам 11,50 7,83 2,78 2,78 16,00 6,3994

Произведение сумм КОВ 1,03 1,13 0,99 0,99 0,92

Атах 5,05

М(ИО) 1,12

ИО 0,01

ОО 0,01

Таблица 6

Матрица сравнения по критерию Св ___

Св 8, 82 8з 84 85 Произв. Корень КОВ

8, 1 0,25 0,50 1,00 1,00 0,1250 0,6598 0,1089

82 4 1 3 4 4 192 2,8619 0,4724

8з 2 0,33 1 2 2 2,6667 1,2167 0,2008

84 1 0,25 0,50 1 1 0,1250 0,6598 0,1089

85 1 0,25 0,50 1 1 0,1250 0,6598 0,1089

Сумма по столбцам 9,00 2,08 5,50 9,00 9,00 6,0579

Произведение сумм КОВ 0,98 0,98 1,10 0,98 0,98

Атах 5,03

М(ИО) 1,12

ИО 0,01

ОО 0,01

Таблица 7

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Матрица сравнения по критерию Сли ___

Сли Si S2 S3 S4 S5 Произв. Корень КОВ

5, 1 1 3 2 0,50 3 1,2457 0,2134

52 1 1 3 2 0,33 2 1,1487 0,1968

5з 0,33 0,33 1 2 0,25 0,0556 0,5610 0,0961

54 0,50 0,50 0,50 1 0,33 0,0417 0,5296 0,0907

& 2 3 4 3 1 72 2,3522 0,4030

Сумма по столбцам 4,83 5,83 11,50 10,00 2,42 5,8372

Произведение сумм КОВ 1,03 1,15 1,11 0,91 0,97

^шах 5,17

М(ИО) 1,12

ИО 0,04

ОО 0,04

Таблица 8

Матрица сравнения по критерию Chu ___

Сни Si S2 S3 S4 S5 Произв. Корень КОВ

5, 1 4 2 3 6 144 2,7019 0,4190

52 0,25 1 0,33 0,50 3 0,1250 0,6598 0,1023

5з 0,50 3 1 2 5 15 1,7188 0,2666

54 0,33 2 0,50 1 4 1,3333 1,0592 0,1643

& 0,17 0,33 0,20 0,25 1 0,0028 0,3081 0,0478

Сумма по столбцам 2,25 10,33 4,03 6,75 19,00 6,4478

Произведение сумм КОВ 0,94 1,06 1,08 1,11 0,91

^шах 5,09

М(ИО) 1,12

ИО 0,02

ОО 0,02

Далее вычисляются глобальные приоритеты элементов второго и третьего уровней иерархии. Вторым уровнем являются критерии качеств статьи (элементы их вектора приоритета умножаются на единицу, т.е. на вес единственной цели самого верхнего уровня). Третий уровень иерархии - перечень статей. Каждый элемент этого уровня (относительный вес каждой статьи по сравниваемому качеству) перемножается на приоритет данного качества среди прочих, затем полученные произведения складываются (таблица 9).

Таблица 9

Глобальные приоритеты рассматриваемых статей__

Cd Ce Cb Cau Chu Глобальные приоритеты

КОВ критериев качеств 0,2 0,2 0,2 0,2 0,2

Si 0,368 0,090 0,109 0,213 0,419 0,23986

S2 0,207 0,144 0,472 0,197 0,102 0,22443

S3 0,109 0,354 0,201 0,096 0,267 0,20546

S4 0,109 0,354 0,109 0,091 0,164 0,16554

S5 0,207 0,057 0,109 0,403 0,048 0,16471

Вычислив приоритеты всех рассматриваемых статей, можно сделать вывод о предпочтительности первой

статьи (5;).

Сравнение результатов метода анализа иерархий и метода ранжирования научных публикаций на основе анализа сетей цитирования. Произведено сравнение результатов ранжирования научных статей разработанным методом с результатами, полученными методом анализа иерархий. На основе полученных значений глобальных приоритетов МАИ проранжированы статьи-кандидаты. В таблице 10 приведены значения ранжирования статей по результатам двух методов, где Кс - ранг статьи разработанного метода, ЯМАИ - ранг статьи метода анализа иерархий.

Таблица 10

Результаты ранжирования статей_

Статьи Rc RMAM Глобальные приоритеты

e1 1 1 0,23986

e2 2 2 0,22443

e3 3 3 0,20546

e.4 4 4 0,16554

es 5 5 0,16471

Из таблицы 10 видно, значения рангов Кс и КМАИ равны, следовательно, ранжирование разработанным методом проведено правильно.

Заключение. Проведенные исследования позволили установить, что использование метода сетевого анализа научных публикаций для ранжирования статей является эффективных подходом. Полученные результаты позволяют оценить согласованность рангов статей сравниваемых методов.

Метод сетевого анализа позволяет работать с большим числом публикаций, что дает возможность улавливать более сложные закономерности и зависимости данных. Таким образом, очевидно преимущество применения этого метода на больших выборках в отличие от МАИ. Метод анализа иерархий имеет ограничения в применении на больших выборках, так как для учёта всех критериев решения необходимо получать очень большие объёмы точной и достоверной информации. МАИ в данном эксперименте применен для сравнения результатов анализа пяти статей, что является достаточным для получения правильных выводов.

В дальнейшем планируется рассмотреть возможность использования метода сетевого анализа научных публикаций для ранжирования по убыванию приоритета обзорных статей. В этом случае расчет показателя важности (Ch) узла сети цитирования будет осуществляться с учетом только исходящих связей, таких как полустепень исхода, центральность по близости к другим узлам в режиме out, центральность по информативности.

Список литературы

1. Ольгина И.Г. Программные и алгоритмические средства сетевого анализа для определения важности научных публикаций // Электронные библиотеки. 2023. №. 5. С. 646 - 672. DOI: https://doi.org/10.26907/1562-5419-2023-26-5-646-672.

2. Networks in cognitive science / A. Baronchelli, R. Ferrer-i-Cancho, R. Pastor-Satorras [et al.]. // Trends in cognitive sciences. 2013. Vol. 17, no. 7. P. 348-360. DOI: 10.1016/j.tics.2013.04.010.

3. Karuza E.A. Local patterns to global architectures: influences of network topology on human learning / E.A. Karuza, Sh.L. Thompson-Schill, D.S. Bassett // Trends in cognitive sciences. 2016. Vol. 20, no. 8. P. 629-640. DOI: 10.1016/j.tics.2016.06.003.

4. Representing melodic relationships using network science / H. M. Merseal, R. E. Beaty, Y. N. Kenett [et al.] // Cognition. 2023. Vol. 233. P. 105-362. DOI: 10.1016/j.cognition.2022.105362.

5. Kenett Y.N., Hills T.T. Editors' Introduction to Networks of the Mind: How Can Network Science Elucidate Our Understanding of Cognition? // Topics in Cognitive Science. 2022. Vol.14, no. 1. P. 45-53. DOI: 10.1111/tops. 12598.

6. Vitevitch M.S., Castro N. Using network science in the language sciences and clinic // International Journal of Speech-Language Pathology. 2014. Vol. 17, no. 1. P. 13-25. DOI: 10.3109/17549507.2014.987819.

7. Саати Т. Принятие решений: Метод анализа иерархий / Т. Саати; Пер. с англ. Р.Г. Вачнадзе. Москва: Радио и связь, 1993. 314 с.

Ольгина Инна Геннадьевна, старший преподаватель, inna_olgina@mail. ru, Россия, Омск, Омский государственный технический университет,

Андреева Елена Григорьевна, д-р техн. наук, профессор, lenandr02@yandex. ru, Россия, Омск, Омский государственный технический университет,

Янишевская Анна Генриховна, д-р техн. наук, профессор, anna-yanish@mail. ru, Россия, Омск, Омский государственный технический университет,

Федоров Владимир Кузьмич, д-р техн. наук, профессор, omgtuyan@yandex. ru, Россия, Омск, Омский государственный технический университет

COMPARA TIVE ANALYSIS OF THE METHOD OF NETWORK ANALYSIS OF SCIENTIFIC PUBLICATIONS AND THE METHOD OF HIERARCHY ANALYSIS IN THE SELECTION OF INFORMATION SOURCES

I.G. Olgina, E.G. Andreeva, A.G. Yanishevskaya, V.K. Fedorov

This article considers the problem of making a decision when choosing scientific publications in a certain thematic area, which are sources of information at the research stage in any scientific activity. The method of hierarchy analysis is applied to find the preferred option from the proposed alternatives - an important article. The experimental results obtained are compared with the results of the developed method of ranking scientific publications based on the analysis of citation networks. The adequacy of the developed mathematical model for determining the importance of a citation network node based on the convergence of the results obtained using the considered methods is proved.

Key words: hierarchy analysis method, network analysis, citation network, article, ranking by importance.

Olgina Inna Gennadevna, senior lecturer, inna_olgina@mail. ru, Russia, Omsk, Omsk State Technical University,

Andreeva Elena Grigorevna, doctor of technical sciences, professor, lenandr02@yandex. ru, Russia, Omsk, Omsk State Technical University,

Yanishevskaya Anna Genrihovna, doctor of technical sciences, professor, [email protected], Russia, Omsk, Omsk State Technical University,

Fedorov Vladimir Kuzmich, doctor of technical sciences, professor, omgtuyan@yandex. ru, Russia, Omsk, Omsk State Technical University

i Надоели баннеры? Вы всегда можете отключить рекламу.