Научная статья на тему 'Оценка возможностей прогнозирования данных в РИНЦ с применением сервиса анализа временных рядов'

Оценка возможностей прогнозирования данных в РИНЦ с применением сервиса анализа временных рядов Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
255
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ВРЕМЕННЫХ РЯДОВ / НАУКОМЕТРИЯ

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Тронин Вадим Георгиевич, Галныкина Ксения Сергеевна, Стенина Анна Сергеевна

Приведено описание тестирования методов оценки данных для прогнозирования наукометрической информации в Российском индексе научного цитирования (РИНЦ) с помощью сервиса TSAS (Time-series analysis system) Системы анализа временных рядов (ВР), разработанной на кафедре «Информационные системы» УлГТУ, сформулированы выводы о работе сервиса анализа временных рядов и предложены доработки РИНЦ

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оценка возможностей прогнозирования данных в РИНЦ с применением сервиса анализа временных рядов»

Они разделены на три группы: балансировочные баки (4 в около фюзеляжной части крыла, имеющей максимальную стреловидность, и 1 в задней части фюзеляжа), резервные баки (4 в крыле) и основные баки (6 в крыле и 2 в нижней средней части фюзеляжа).

Разделение внутреннего пространства каждого крыла на семь отдельных топливных ёмкостей - кессонов требуется для обеспечения по возможности минимальных перемещений центра тяжести самолёта в результате расходования топлива и для управления его положением в зависимости от условий полёта. На взлёте, подъёме и околозвуковом полёте передние балансировочные баки заполнены целиком, а задний бак пуст. При переходе от дозвуковых к сверхзвуковым скоростям полёта топливо из передних баков перекачивается в задний бак. В результате центр тяжести самолёта перемещается назад, т. е. движется вслед за центром давления. При переходе от сверхзвуковых к дозвуковым скоростям полёта топливо перекачивается в обратном направлении. В зависимости от времени полёта (количества израсходованного топлива) из балансировочных баков топливо может перекачиваться в основные баки.

Решая оптимизационную задачу численным методом, учитывая все вышеописанные конструктивные решения и подставив полученные

значения в формулу 2, получим кривую рис. 12. Из рисунков видно, что в результате оптимизационных решений, описанных выше, значение

К 'М 1п (согласно формуле 2) увели-

m,

чивается.

БИБЛИОГРАФИЧЕСКИМ СПИСОК

1. Житомирский, Г. И. Конструкция самолётов : учебник для вузов / Г. И. Житомирский. — 3-е изд. — М. : Машиностроение,2005. - 406 с.

2. Проектирование самолётов: учебник для вузов / под ред. С. М. Егера. - М. : Логос, 2005. - 648 с.: ил.

3. Mathcad 14 для студентов и инженеров: русская версия. - СПб.: БХВ-Петербург, 2009. -521 с.: ил.

Вольсков Дмитрий Геннадьевич, кандидат технических наук, доцент кафедры «Самолётостроение» УлГТУ. Имеет монографию, научные статьи в журналах ВАК, методические пособия.

УДК 004.6 + 001.8

В. Г. ТРОНИН, К. С. ГАЛНЫКИНА, А. С. СТЕНИНА

ОЦЕНКА ВОЗМОЖНОСТЕЙ ПРОГНОЗИРОВАНИЯ ДАННЫХ В РИНЦ С ПРИМЕНЕНИЕМ СЕРВИСА АНАЛИЗА ВРЕМЕННЫХ РЯДОВ

Приведено описание тестирования методов оценки данных для прогнозирования наукометрической информации в Российском индексе научного цитирования (РИНЦ) с помощью сервиса TSAS (Time-series analysis system) - Системы анализа временных рядов (ВР), разработанной на кафедре «Информационные системы» УлГТУ, сформулированы выводы о работе сервиса анализа временных рядов и предложены доработки РИНЦ.

Работа выполнена при поддержке РФФИ №14-07-00247. Ключевые слова: анализ временных рядов, наукометрия.

В настоящее время наукометрические данные (прежде всего индексы цитирования и Хирша) широко используются для различного рода

© Тронин В. Г., Галныкина К. С., Стенина А. С., 2014

отчётности научных организаций и отдельных учёных. Наукометрические данные могут быть дополнены прогнозом их будущего изменения на основе анализа временных рядов. Рассмотрим такую возможность на основе РИНЦ, где

представлено наибольшее количество исходных данных для анализа [1].

Сервис TSAS размещён на Интернет-ресурсе http://tsas.ulstu.ru и предназначен для экспресс-анализа состояния организации на основе экономических показателей публичной отчётности и прогнозирования её состояния на основе нового метода нечёткого моделирования. Предполагается, что используемые математические методы и функционал сервиса возможно доработать для прогнозирования временных рядов наукометрической информации.

Функционал сервиса TSAS включает в себя:

- Вход, редактирование, графический вывод и хранение временных рядов экономических показателей предприятий в базе данных;

- Преобразование исходных временных рядов по формулам с привязкой к статьям бухгалтерской отчетности;

- Комплекс методов интеллектуального анализа временных рядов экономических показателей, генерирующих многоуровневый прогноз в числовой, графической и лингвистической формах оценки состояния и динамики развития;

- Совокупность правил, используемых для резюмирования (вывода лингвистической интерпретации многоуровневого прогноза) состояния предприятия по данным экспресс-анализа [2].

Для целей анализа временных рядов, характеризующихся высокой степенью неопределённости, гетерогенностью, вариабельностью длины и поведения, активно развиваются методы Time Series Data Mining. Для получения прогноза сервис TSAS использует два основных метода: F-преобразование и метод нечётких тенденций. Нечёткое сглаживание временных рядов на основе нечёткого преобразования (F-преобра-зования) - методика, разработанная И. Перфильевой, которая может быть отнесена к методикам нечёткого приближения. Нечёткое преобразование представлено для непрерывных функций и функций на ограниченном наборе точек [3].

Для анализа наукометрической информации исходные данные должны носить временной характер. В качестве объектов исследования выбраны публикационная активность автора и организации.

Для анализа и прогнозирования публикационной активности организации и авторов были использованы данные eLIBRARY.ru - российского информационного портала в области науки, содержащего рефераты и полные тексты более 18 млн научных статей и публикаций. На платформе eLibrary.ru доступны данные о пуб-

ликациях более 8 тыс. российских научно-технических журналов, около 8 тыс. журналов с полными текстами [4].

Для сравнения выбраны Ульяновский государственный технический университет (УлГТУ), Ульяновский государственный педагогический университет имени И. Н. Ульянова (УлГПУ), Московский государственный университет экономики, статистики и информатики (МЭСИ). Для оценки деятельности организаций рассмотрены ряды: «Распределение публикаций организации по годам», «Распределение публикаций по числу цитирований», «Распределение публикаций по числу соавторов».

При анализе временного ряда «Распределение публикаций организации по годам» были найдены данные по каждой из организаций на ресурсе eLIBRARY.ru (рис. 1).

РАСПРЕДЕЛЕНИЕ ПУБЛИКАЦИЙ ОРГАНИЗАЦИИ ПО ГОДАМ

УЛЬЯНОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ Ульяновск

Год Публикаций , 1

2013 245

2012 614 т ■

2011 695

201D 534

2009 557 ■

2008 595 ■

200 7 529 ■

2006 229

200 5 377 в

2004 257

Рис. 1. Распределение публикаций организации по годам. УлГТУ

Затем с помощью ресурса http://tsas.ulstu.ru был осуществлен прогноз временного ряда, а также приведена его лингвистическая оценка (рис. 2).

После оценки каждого вуза по отдельности был построен сводный график временного ряда «Распределение публикаций организации по годам» (рис. 3). По прогнозу, количество публикаций на 2016 год для УлГТУ составит 450-500, а для МЭСИ - 600 публикаций. Количество публикаций в УлГПУ стабильно растёт, но значительно меньше, чем в других рассмотренных университетах.

Для рассмотрения временных рядов, связанных с конкретным автором, используем показатели по исследователям портала eLibrary.ru.

С помощью РИНЦ по интересующему исследователю или группе исследователей можно получить значения большого количества наукометрических показателей. В том числе показатели,

Рис. 2. Прогноз ряда «Распределение публикаций организации по годам. УлГТУ»

Рис. 3. Распределение публикаций организации по годам. Все вузы

значения которых представляют собой временные ряды: распределение публикаций по годам, распределение цитирующих публикаций по годам, распределение цитирований по годам цитирующих публикаций, распределение цитирований по годам цитируемых публикаций.

Авторы УлГТУ были классифицированы по группам:

- ведущие профильные авторы - исследователи, занимающиеся профильной для вуза областью знаний (технические науки);

- молодые профильные авторы - начинающие исследователи в профильной области знаний вуза. В данной группе авторы классифицируются не по возрасту, а по времени начала научной деятельности;

Таблица 1

Исходные данные по выделенным группам для автора N

Год Распределение публикаций по годам Распределение цитирующих публикаций по годам Распределение цитирований по годам цитирующих публикаций Распределение цитирований по годам цитируемых публикаций

2013 4 14 46

2012 2 21 29 2

2011 3 15 39 5

2010 5 14 19 5

2009 5 8 17 4

2008 11 17 31 37

2007 5 7 14 30

2006 2 6 18 14

2005 4 4 12 8

2004 2 1 1 8

2003 - - - 7

Дата Тренд Лингвистическая оценка интенсивность изменения в лингвистической форме элементарная тенденции

2013-01-01 3.333 ниже среднего

2011-01-01 3.25 ниже среднего средний рост

2009-01-01 6.5 больиое малый стабильность

2007-01-01 5.75 Еыше среднего малый рост

2005-01-01 3.0 малое большой спад

2003-01-01 2.666 малое малый стабильность

Прогноз

Дата Предполагаемая интенсивность изменении Предполагаемое изменение

2013-02-01 рост малым

Рис. 4. Прогнозирование временного ряда по автору (вариант ввода данных №1)

- ведущие непрофильные - исследователи, занимающиеся непрофильной для вуза областью знаний (гуманитарные науки);

- молодые непрофильные авторы - начинающие исследователи в непрофильной области знаний вуза.

Исходные данные по выделенным группам были отобраны по автору N — ведущему профильному автору (представлены в таблице 1).

Для прогнозирования временных рядов собранные исходные данные были загружены в сервис Т8Л8. В случае с анализом временных рядов наукометрической информации отсутствует привязка к статьям бухгалтерской отчётности, поэтому анализ проводился с помощью функций простого ввода в двух вариациях.

Динамика временных рядов в сервисе Т8Л8 может иметь следующие уровни интенсивности: малый, средний, большой при росте, спаде или стабильности.

По автору N при «Простом варианте ввода №1» наблюдается рост малой интенсивности (рисунок 4). Максимальное количество статей зафиксировано в 2008 году - 11. Минимальное значение - в 2004, 2006 и 2012 годах - 2. Максимальное значение тренда (6,5) наблюдается в 2009 году, минимальное - в 2003 (2,66). Это означает, что в период с 2003 по 2013 года количество статей автора в год непрерывно возрастало. Прогнозируется, что к 2015 году количество публикаций автора продолжит возрастать без резких увеличений.

После эксперимента с первым способом ввода данные были введены в «Простой ввод 2». Отличие двух вариантов, на первый взгляд, заключается только в способе ввода информации. В первом варианте предоставляется возможность ввода сразу трёх значений, во втором варианте - одного. Однако при детальном рассмотрении результатов прогнозирования выяснилось, что разные способы дают разный прогноз. В первую очередь это различие показывает лингвистическая оценка.

Аналогичным образом проанализированы все авторы различных групп.

В ходе анализа сделаны следующие выводы по ограничениям на вводимые временные ряды:

- Если исходный временной ряд имеет длину менее 11 значений, то построение анализа невозможно.

- Необходимость ввода точной даты. В анализе рассматривался годовой период, поэтому дата была выставлена на начало года.

- Невозможность получения прогноза при подряд идущих 4 одинаковых значениях.

- Ограничение на поле ввода даты. Значение показателя не может быть зафиксировано ранее 1993 г.

Для актуальности прогноза необходимы следующие доработки РИНЦ:

- наличие данных в РИНЦ по организациям, авторам минимум за 11 временных интервалов (лет);

- на настоящий момент ведётся интенсивное пополнение базы новыми типами данных, например, материалами конференций, и резкое увеличение количества публикаций учёного может быть связано не с изменением его публикационной активности, а с изменением доли его публикаций, загруженных в систему;

- в РИНЦ должен быть встроен интерфейс, позволяющий напрямую выгружать данные из РИНЦ в программы-надстройки для анализа данных.

Наукометрическая информация, представленная в РИНЦ, может быть дополнена прогнозом значений показателей при выполнении ряда доработок в системе анализа временных рядов и представлению в РИНЦ данных.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Тронин, В. Г. Электронная научная библиотека в оценке эффективности научных исследований /В. Г. Тронин // Вестник УлГТУ. -2013. - №2 (62). - С. 6-8.

2. Разработка INTERNET-сервиса, интегрирующего нечёткое моделирование и анализ нечетких тенденций временных рядов / Н. Г. Ярушкина, И. Г. Перфильева, А. Г. Игонин, А. А. Романов, Т. Р. Юнусов, В. В. Шишкина // Автоматизация процессов управления / НПО «Марс». - 2010. - №2. - С. 64-69.

3. Афанасьева, Т. В. Моделирование нечётких тенденций временных рядов / Т. В. Афанасьева. - Ульяновск : УлГТУ, 2013. - 215 с.

4. Интернет-ресурс: http://elibrary.ru/ defaultx. asp. (дата обращения: 21.05.2014).

Тронин Вадим Георгиевич, кандидат технических наук, начальник научно-исследовательского отдела УлГТУ, доцент кафедры «Информационные системы». Сфера научных интересов -наукометрия, моделирование вычислительных сетей на прикладном уровне, технологии эффективного управления.

Галныкина Ксения Сергеевна, магистрант специальности «Программная инженерия», УлГТУ. Стенина Анна Сергеевна, магистрант специальности «Программная инженерия», УлГТУ.

i Надоели баннеры? Вы всегда можете отключить рекламу.