Научная статья на тему 'Структурно-лингвистический подход к анализу временных рядов'

Структурно-лингвистический подход к анализу временных рядов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
90
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТРУКТУРНО-ЛИНГВИСТИЧЕСКИЙ ПОДХОД / ВРЕМЕННОЙ РЯД / TIME SERIES / ДИНАМИКА ЗАБОЛЕВАЕМОСТИ / DYNAMICS OF MORBIDITY / НЕЧЕТКОЕ МОДЕЛИРОВАНИЕ / АНАЛИЗ НЕЧЕТКИХ ТЕНДЕНЦИЙ / ANALYSIS OF FUZZY TENDENCIES / ПРОГНОЗИРОВАНИЕ / FORECASTING / STRUCTURALLY LINGUISTIC METHOD / FUZZY SIMULATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Антонова И. В., Чикина Н. А.

В работе рассматриваются вопросы, связанные с применением структурно-лингвистического подхода к анализу временных рядов, характеризующих динамику заболеваемости в Украине различными кожными патологиями. Нечеткое моделирование реализуется на основе анализа нечетких тенденций временного ряда. Такая модель позволяет получить качественную информацию о динамике показателей для использования ее в задачах прогнозирования. Ил.: 2. Библиогр.: 11 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Structurally linguistic method of the analysis of time series

The problems, linked with the use of the structurally linguistic method of the analysis of time series, which characterize the morbidity dynamics in Ukraine by different skin pathologies, are considered. Fuzzy simulation is realized on the basis of fuzzy tendencies analysis of time series. Such model allows getting quality information about the dynamics of the indexes to use it in the tasks of forecasting. Figs.: 2. Refs.: 11 titles.

Текст научной работы на тему «Структурно-лингвистический подход к анализу временных рядов»

УДК 519.246.8 БО1: 10.20998/2411-0558.2018.24.11

И. В. АНТОНОВА, канд. техн. наук, доц., НТУ "ХПИ",

Н. А. ЧИКИНА, канд. техн. наук, доц., НТУ "ХПИ"

СТРУКТУРНО-ЛИНГВИСТИЧЕСКИЙ ПОДХОД К АНАЛИЗУ

ВРЕМЕННЫХ РЯДОВ

В работе рассматриваются вопросы, связанные с применением структурно-лингвистического подхода к анализу временных рядов, характеризующих динамику заболеваемости в Украине различными кожными патологиями. Нечеткое моделирование реализуется на основе анализа нечетких тенденций временного ряда. Такая модель позволяет получить качественную информацию о динамике показателей для использования ее в задачах прогнозирования. Ил.: 2. Библиогр.: 11 назв.

Ключевые слова: структурно-лингвистический подход; временной ряд; динамика заболеваемости; нечеткое моделирование; анализ нечетких тенденций, прогнозирование.

Постановка проблемы. Как правило, динамика социально-биологических систем характеризуется слабоструктурированным случайным процессом, а соответствующие им временные ряды (ВР) обладают высокой степенью неопределенности. Одной из причин этой неопределенности является слабовыраженная или отсутствующая тенденция в динамике развития. При статистическом подходе к моделированию таких ВР не удается построить модель, которая адекватно описывала имеющийся ВР и давала бы приемлемую точность прогнозирования. Еще один недостаток статистических моделей состоит в том, что такие модели не предполагают лингвистической интерпретации как самих данных, так и прогнозных значений. Уровень требований, предъявляемых к результатам анализа ВР с высокой степенью неопределенности, способствует развитию нечеткого подхода к задаче прогнозирования. В случаях, когда прогнозное значение невозможно получить с требуемым уровнем точности, становится важной с практической точки зрения информация об ожидаемых тенденциях в динамике системы. Это делает актуальным анализ ВР с применением структурно-лингвистического подхода, реализующего анализ нечетких тенденций.

Анализ литературы. В представленной работе рассматриваются вопросы, связанные с анализом временных рядов, характеризующих динамику заболеваемости в Украине различными кожными патологиями. Источником информации о состоянии здоровья населения являются данные, содержащиеся в официальной статистической отчетности МОЗ

© И В. Антонова, Н А. Чикина, 2018

Украины [1]. В исследованиях [2] отмечалось отсутствие тренда в динамике показателей заболеваемости некоторыми кожными патологиями, что делает практически невозможным прогнозирование уровня заболеваемости статистическими методами.

Наличие указанных свойств в поведении ВР, описывающего динамику объекта изучения, определяет причины, по которым исследование рядов проводится методами нелинейной динамики (фрактальная геометрия, теория хаоса [3, 4] и др.). Наиболее известным приложением теории нелинейных систем с хаотическим поведением является прогнозирование динамики порождаемых ими ВР.

Обозначенная авторами проблематика тесно связана с задачами извлечения знаний из ВР на основе интеллектуальных технологий. Нечеткие модели ВР не претендуют на высокую точность прогнозирования. Они ориентированы на достаточно простое получение качественной информации о динамике изучаемой системы.

Нечеткое моделирование поведения сложных систем по имеющемуся ВР базируется на модели нечеткого динамического процесса, получившей название нечеткий ВР (НВР). Математическую основу НВР составляет, в частности, знаменитая теорема FAT (Fuzzy Approximation Theorem), доказанная Kosko B., в соответствии с которой любая функциональная зависимость, заданная на компактном множестве, может быть аппроксимирована нечеткой моделью [5]. Практически одновременно в [6] Wong L. показал, что нечеткие модели вида "Если-То" являются универсальным аппроксиматором, т.е. модель может приближать любую непрерывную функцию с произвольной точностью. Однако, доказательства аппроксимирующих свойств нечетких систем являются чисто теоретическими, поскольку не дают конструктивного метода построения нечеткой модели с требуемой точностью. Лингвистическим нечетким правилам соответствуют аппроксимирующие нечеткие модели Мамдани, точность в которых может быть повышена при условиях, указанных в [7].

Song Q. и Chissom B., Sah M. и Degtiarev K.Y. в работах [8, 9] предложили прогнозные модели НВР первого порядка, нечеткие значения которого представляют фаззифицированные первые разности исходного ВР. Таким образом был введен в изучение новый объект НВР - нечеткая тенденция, выражающая изменения в динамике системы в нечетких значениях ВР.

Целью настоящих исследований является изучение вопросов, связанных с построением модели временного ряда на основе анализа нечетких тенденций, позволяющей получить качественную информацию

о динамике показателя заболеваемости некоторым классом кожных патологий в Украине для использования ее в задачах прогнозирования.

Основной раздел. Под моделью ВР будем понимать формализованную процедуру, позволяющую по прошлым значениям

х(^.), г = 1, п ВР прогнозировать его будущие значения У(V), V > 1п.

Метод представления ВР в виде НВР основан на предположении о реальной возможности построения лингвистической интерпретации

значений х(^-) г = 1, п ВР, соответствующей понятию нечеткого

множества. При этом НВР формируется в результате интервального качественного оценивания уровней ВР. Изменения в НВР рассматриваются как результат значимого или незначимого влияния факторов, в общем случае исследователю неизвестных. Значимые влияния факторов приводят к качественному изменению (нечетким приращениям) поведения ВР, которые получили название нечеткие тенденции.

Моделирование таких нечетких объектов, как значения исходного ВР и нечетких тенденций, основано на следующих положениях [10]:

1) модель НВР представлена распределением нечеткости с помощью лингвистической переменной с заданным количеством нечетких термов;

2) результат моделирования ВР: НВР значений (а) и НВР нечетких тенденций (б);

3) каждому значению ВР (а) и (б) соответствует определенный нечеткий терм.

Нечеткая тенденция содержит информацию о ВР, выраженную в значениях лингвистической переменной, таких как "Рост", "Снижение", "Стабильность" и др. Последовательность нечетких тенденций НВР порождает НВР с нечеткой тенденцией.

Пусть задан скалярный эквидистантный временной ряд {х)}П=1,

х(^-) е X ^ Я, г = 1, п, измерения которого х(^-) в моменты наблюдений

, г = 1, п , характеризуют заболеваемость в Украине некоторым классом кожных патологий [1].

Главной частью модели прогноза НВР является база знаний, получаемая на основе анализа и обработки имеющихся данных в ВР

X (V )={х4 )}п=1.

Для нечеткой входной переменной X ) - уровня заболеваемости -определим терм-множество со значениями: низкий (Н), средний (С),

высокий (В). Для прогнозируемого (выходного) параметра Y (t), который также является нечеткой переменной, определим пятиуровневую градацию с таким терм-множеством: значительное уменьшение (ЗУ), уменьшение (У), стабильность (С), рост (Р), значительный рост (ЗР). Такой уровень градации значений выходного параметра обеспечивает достаточный уровень дифференциации прогноза.

Нечеткие шкалы терм-значений X (t) изучаемого показателя динамики заболеваемости и терм-значений прогнозируемого показателя Y(t) строятся на основе экспертных оценок.

Для иллюстрации метода обнаружения нечетких тенденций выберем ВР, характеризующий уровень заболеваемости в Украине различными кожными патологиями, изображенный на рис. 1.

Рис. 1. Динамика показателя заболеваемости кожными патологиями в Украине

Алгоритм обнаружения нечетких тенденций НВР, используемый авторами, состоит в следующем [11]. Интервал наблюдения ВР с помощью нечетких ассоциативных правил разбивается на т интервалов

, к = 1, т монотонности [^ , ti ], при этом ti = а tim = , т.е.

интервалов его монотонного убывания или возрастания. Обозначим через А1, А2, ..., Ат длины интервалов монотонности, т.е.

А к = ti - ti , к = 1, т .

к ь+1 ь' '

На каждом из этих интервалов сок (к = 1, т) отрезок ВР аппроксимируется прямой Тк (к = 1, т).

Тангенс угла наклона прямой T^ к положительному направлению оси OX характеризует величину тренда ВР на участке ш k, длина Ak участка шk монотонности ВР - его продолжительность. Один из вариантов такого разбиения представлен на рис. 2.

Л (U о u о о 2 S u К es

я о

« s

Ю о CS о

со ^ g

170 - А 1 \A aV Л 8

130 - A

90 -

50 - A А

10 \ A а / ^

'Л лв^м^на!

1 6 11 16 21 26 31 36 41 46 51 56 61 66

1, годы

Рис. 2. Разбиение ВР на интервалы монотонности и соответствующие им аппроксимации прямыми линиями

Для формализации введенных признаков определим нечеткие переменные - "Тренд" и "Продолжительность". Нечеткой переменной "Тренд" соответствуют нечеткие термы а1з а2,...,ат - тангенсы углов

переменной

наклона прямых 1к, к = 1, т , а нечеткой "Продолжительность" - нечеткие термы Дь А2,..., Ат.

Единицей представления информации о ВР на каждом промежутке

монотонности и ' , t: ], к = 1, т является нечеткое высказывание вида:

1 1к' 'к+1 ' ^

!к ^. ^к+1 )Ф ' ^ )= а к )П ^ - ^ = Дк). С1)

Смысл этого высказывания состоит в следующем: на временном интервале ^ 1к, t 1к+1 ] с нечеткой продолжительностью Ак наблюдается

тренд ВР с нечетким значением ак. Это высказывание имеет также и геометрическую интерпретацию: информация о ВР представляет собой

нечеткое множество векторов ÄikÄik , характеризующих тренд

временного ряда на интервалах \ti , tik + ], к = 1, m .

Прогнозирование НВР осуществляется на основе алгоритма нечеткого логического вывода. База знаний формируется по промежуткам

&к, к = 1, m интервала наблюдения [ti, tn ]. Единицей представления

знаний в модели являются нечеткие правила вида:

"Если Ii и I2 и ... и Im , то Y(tp) = Im+1 (tn, tp)", (2)

где Ik, к = 1, m +1 - нечеткое высказывание вида (1), tp - точка прогноза.

Следует отметить, что наибольшими проблемами исследователя в реализации алгоритма нечетких тенденций являются выбор интервала наблюдения ВР, в наибольшей степени характеризующего динамику изучаемой системы, и выбор точек изменения нечетких тенденций.

Выводы. Идея использования аппарата нечеткой логики является перспективной для оценки информации, содержащейся во ВР. Метод прогнозирования нечетких тенденций ВР динамики показателей заболеваемости различными кожными патологиями в Украине обеспечивает получение более точных результатов прогноза и может быть рекомендован для проведения краткосрочных прогнозов.

Моделирование ВР с нечеткими тенденциями позволит прогнозировать не только числовые значения ВР, но и направления их изменения, а также получить информацию о поведении ВР в лингвистической форме.

Такой подход позволит обнаружить новые закономерности изучаемого случайного процесса и извлечь из ВР информацию, недоступную другим подходам к моделированию.

Список литературы:

1. Показники ткувально-профшактично! допомоги хворим шшрними i венеричними захворюваннями в Укра!ни у 2015 рощ / вщповвдальний за випуск М. В. Голубчиков; ДЗ "Центр медично! статистики МОЗ Укра!ни". - К., 2016. - 113 с.

2. Волкославская В.Н. О квазипериодичности в динамике заболеваемости сифилисом и основных направлениях организации борьбы с ИППП в Украине / В.Н. Волкославская, А.Л. Гутнев, Н.А. Чикина // Труды науч.-практ. конф. "Актуальные проблемы дерматологии и венерологии". - Одесса: ОГМУ, 2003. - С. 25-26.

3. Антонова И.В. Применение методов фрактального анализа к исследованию временных рядов / И.В. Антонова, Н.А. Чикина // Вестник НТУ "ХПИ". Серия: Информатика и моделирование. - Харьков: НТУ "ХПИ", 2015. - № 32 (1141). - С. 4-10.

4. Антонова И.В. Применение характеристик квазициклов фазовых портретов в предпрогнозном анализе временных рядов / И.В. Антонова, Н.А. Чикина // Вестник

ISSN 2079-0031 (Print) ISSN 2411-0558 (Online)

НТУ "ХПИ". Серия: Информатика и моделирование. - Харьков: НТУ "ХПИ", 2017. -№ 21 (1243). - С. 5-13.

5. Kosko B. Fuzzy Systems as Universal Approximators / B. Kosko // IEEE Trans. on Computers, 1994. - Vol. 43. - № 11. - P. 1329-1333.

6. Wang L.X. Fuzzy systems are universal approximators / L.X. Wang // Proc. of the IEEE Int. Conf. on Fuzzy Systems. San Diego, 1992. - P. 1163-1169.

7. Кукса П.П. Обеспечение точности в нечетких системах / П.П. Кукса // Информатика и системы управления в XXI веке. - М.: МГТУ им. Н.Э. Баумана, 2004. - С. 152-156.

8. Song, Q. Fuzzy time series and its models / Q. Song, B. Chissom // Fuzzy sets and Systems, 1993. - № 54. - P. 269-273.

9. SahM. Forecasting Enrollment Model Based on First Order / M. Sah, K.Y. Degtiarev // Proct. Int. Conf. Computational Intelleigence (ICCI), 2004. - P. 375-378.

10. Афанасьева Т.В. Моделирование нечетких тенденций временных рядов / Т.В. Афанасьева. - Ульяновск: УлГТУ, 2013. - 215 с.

11. Тукаева З.М. Модель прогнозирования нечетких данных для решения бизнес задач предприятий ТЭК / З.М. Тукаева, И.З. Мухаметзянов // Управление экономическими системами: электронный научный журнал, 2013. - № 56, available at: www.uecs.ru/ uecs56-562013/item/2299-2013-08-27-07-57-10 (accessed data 02.05.2018).

References:

1. Golubchikov, M.V. (2016), "Indexes of medical and preventive help to the patients with skin and venereal diseases at Ukraine in 2015", state establishment "Center of medical statistics of ministry of health Ukraine", Kyiv, 113 p.

2. Volkoslavskaya, V.N., Gutnev, A.L., and Chikina, N.A. (2003), "About quasi periodicity in the dynamics of the syphilis morbidity and basic directions of organization of fight with IPPP in Ukraine", Actual problems of dermatology and venereology, Proceedings of the Science and Practical Conference, Odessa, pp. 25-26.

3. Chikina, N.A., and Antonova, I.V. (2015), "Application of fractal analysis methods to the study of time series", Herald of NTU "KhPI", Series: Informatics and modeling, Kharkov, NTU "KhPI", No 32 (1141), pp. 4-10.

4. Chikina, N.A., and Antonova, I.V. (2017), "Application of quasi-cycle characteristics of phase portraits in the prediction of time series analysis", Herald of NTU "KhPI", Series: Informatics and modeling, Kharkov, NTU "KhPI", No 21 (1243), pp. 5-13.

5. Kosko, B. (1994), "Fuzzy Systems as Universal Approximators", IEEE Trans. on Computers, Vol. 43, No. 11, pp. 1329-1333.

6. Wang L. X. (1992), "Fuzzy systems are universal approximators", Proc. of the IEEE Int. Conf. on Fuzzy Systems, San Diego, pp. 1163-1169.

7. Kouxa, P.P. (2004), "Approximation Accuracy of Fuzzy Systems", Informatics and Control Systems in 21st century, Moscow, BMSTU Press, pp. 152-156.

8. Song, Q., and Chissom, B. (1993), "Fuzzy time series and its models", Fuzzy sets and Systems, No 54, pp. 269-273.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Sah, M., and Degtiarev, K.Y. (2004), "Forecasting Enrollment Model Based on First Order", Proct. Int. Conf. Computational Intelleigence (ICCI), pp. 375-378.

10. Afanas'yeva, T.V. (2013), Simulation offuzzy tendencies of time series, Ulyanovsk, 215 p.

11. Tukaeva, Z.M. and Mukhametzyanov, I.Z. (2013), "Model of forecasting of fuzzy data for a decision of business tasks of TEK enterprises", Management of the economic systems: electronic scientific magazine, available at: www.uecs.ru/uecs56-562013/item/2299-2013-08-27-07-57-10 (accessed data 02.05.2018).

Статью представил д-р техн. наук, проф. НТУ "ХПИ" Поворознюк А.И.

Поступила (received) 07.05.2018 Повторно 14.05.2018

Antonova Irina, PhD Tech., Associate Professor

National Technical University "Kharkiv Polytechnic Institute"

Str. Kirpicheva, 21, Kharkov, Ukraine, 61002

Tel.: (057) 707-60-87, e-mail: [email protected]

ORCID ID: 0000-0002-1268-8223

Chikina Natalia, PhD Tech., Associate Professor National Technical University "Kharkiv Polytechnic Institute" Str. Kirpicheva, 21, Kharkov, Ukraine, 61002 Tel.: (057) 707-66-93, e-mail: [email protected] ORCID ID: 0000-0002-1746-1271

УДК 519.246.8

Структурно-лшгвктичний пщхщ до aHani3y часових ряд1в / Антонова 1.В., Чжша Н.О. // Вiсник НТУ "ХШ". CepiH: 1нформатика i моделювання. - Харюв: НТУ "ХП1". - 2018. - № 24 (1300). - С . 130 - 138.

У робот розглядаються питання, пов'язаш i3 застосуванням структурно-лшгвютичного пiдходу до аналiзу часових рядiв, що характеризують динамiку захворюваностi в Укра1ш рiзними шкiрними патологiями. Неч^ке моделювання реалiзуeться на основi аналiзу нечiтких тенденцiй часового ряду. Така модель дозволяе отримати якiсну шформащю про динамiку показникiв для використання И в завданнях прогнозування. 1л.: 2. Бiблiогр.: 11 назв.

Ключовi слова: структурно-лiнгвiстичний пiдхiд; часовий ряд; динамша захворюваностi; нечiтке моделювання; аналiз нечiтких тенденцiй; прогнозування.

УДК 519.246.8

Структурно-лингвистический подход к анализу временных рядов / Антонова И.В., Чикина Н.А. // Вестник НТУ "ХПИ". Серия: Информатика и моделирование. - Харьков: НТУ "ХПИ". - 2018. - № 24 (1300). - С. 130 - 138.

В работе рассматриваются вопросы, связанные с применением структурно-лингвистического подхода к анализу временных рядов, характеризующих динамику заболеваемости в Украине различными кожными патологиями. Нечеткое моделирование реализуется на основе анализа нечетких тенденций временного ряда. Такая модель позволяет получить качественную информацию о динамике показателей для использования ее в задачах прогнозирования. Ил.: 2. Библиогр.: 11 назв.

Ключевые слова: структурно-лингвистический подход; временной ряд; динамика заболеваемости; нечеткое моделирование; анализ нечетких тенденций; прогнозирование.

UDC 519.246.8

Structurally linguistic method of the analysis of time series / Antonova I.V., Chikina N.A. // Herald of NTU "KhPI". Series: Informatics and modeling. - Kharkov: NTU "KhPI". - 2018. - No. 24 (1300). - P. 130 - 138.

The problems, linked with the use of the structurally linguistic method of the analysis of time series, which characterize the morbidity dynamics in Ukraine by different skin pathologies, are considered. Fuzzy simulation is realized on the basis of fuzzy tendencies analysis of time series. Such model allows getting quality information about the dynamics of the indexes to use it in the tasks of forecasting. Figs.: 2. Refs.: 11 titles.

Keywords: structurally linguistic method; time series; dynamics of morbidity; fuzzy simulation; analysis of fuzzy tendencies; forecasting.

i Надоели баннеры? Вы всегда можете отключить рекламу.