УДК 506+510
Ю.М. Селш, 1.В. Баклан
МАТЕМАТИЧНИЙ АПАРАТ ДЛЯ ПРОГНОЗУВАННЯ ЧАСОВИХ РЯД1В ЕКОНОМ1ЧНОГО ТА ЕКОЛОГ1ЧНОГО ТИП1В, ЩО МОЖУТЬ БУТИ ПТДДАНТ ЗОВН1ШН1М ВПЛИВАМ
Постановка проблеми. Проблема прогнозування часових рядiв була i залишаеться актуальною, особливо останнiм часом, коли стали доступними потужнi засоби для збору i обробки шформаци. Разом з цим пiдвищилися вимоги до процесу прогнозування i ускладнилися залежностi часових рядiв.
Проблема прогнозування вщноситься до слабо структурованих проблем, тому до кожно! задачi потрiбно пiдходити окремо, що зумовлюе велику рiзноманiтнiсть методiв прогнозування. Але число базових методiв прогнозування, як1 в тих чи iнших варiацiях повторюються в шших методах, набагато менше. Багато з цих «методiв» належать до окремих прийомiв або процедур прогнозування, iншi вiдрiзняються ввд базових або один ввд одного шльшстю приватних прийомiв i послiдовнiстю !х застосування.
Рiзноманiтнi данi в технiцi, економщ, соцюлоги, медицинi та iнших сферах надходять у виглядi часових рядiв. Вони е, як правило, нестацюнарними, оск1лькн !х основнi характеристики змшюються в часi. Основою для прогнозування служить вторична iнформацiя, що збертаеться в iнформацiйних сховищах у видi часових рядiв. Якщо можна побудувати математичну модель i знайти шаблони, що адекватно вiдбивають цю динашку, е iмовiрнiсть, що з !х допомогою можна передбачати i поведшку системи в майбутньому. Прогнозування часових послщовностей дозволяе на основi анал1зу поведiнки часових рядiв оцiнити майбутш значення прогнозованих змiнних.
Прогнозування на основi часових рядiв - один iз самих популярних пiдходiв до прогнозування розвитку економiчних процесiв, об'емiв торгових операцiй, об'емiв виробництва та накопичення продукцп на складах, ощнювання альтернативних економiчних стратегiй, формування бюджепв шдприемств та держави, прогнозування та менеджмент економiчних i фiнансових ризишв та iнше. Загалом методи прогнозування можна роздшити на два широк! класи: 1) методи прогнозування на основi використання часового ряду одте! змшно1, тобто, на основi авторегреси, авторегреси з ковзним середнiм (АРКС) та АРКС плюс модель тренду; 2) методи прогнозування на основi використання часових рядiв дешлькох змшних .
В останньому випадку ендогенна змiнна, що прогнозуеться, залежить ввд дек1лькох регресорiв або екзогенних змшних у правш частинi рiвняння. Очевидно, що в загальному випадку метод прогнозування може поеднувати у собi 2-3 наведених вище методи.
Аналiз публiкацiй за темою дослiдження. Але майже всi вiдомi методи прогнозування часових рядiв будь-яко! природи базуються на вну^шнш природi поведiнки процесу. Виходять з внутршшх закономiрностей. Ц методи не дозволяють враховувати так зваш «зовшшш впливи», що можуть призводити до змiн поведiнки процесу (змшу характеристик ряду, тренду i таке iн.). Тобто за сво!ми як1сними характеристиками поведiнку таких часових рядiв можна цiлком вести на засадах феноменолопчних пiдходiв[1]. До такого типу часових рядiв можна вщнести ряди економiчних показник1в, або ряди спостережень за еколопчними процесами. Для економiчних рядiв, це,наприклад, курси цшних паперiв, або валют, цiни на баншвсьш метали, iндекси дшово! активность Для часових рядiв такого роду зовшшшми впливами можуть бути шсайдерська iнформацiя, що може вплинути на курси цшних паперiв, або заяви державних дiячiв, що можуть привести до рiзкого стрибка курсу мюцево! валюти вiдносно резервних валют. Для еколопчних процесiв, це можуть бути аномальш явища, що погано описуються за допомогою динашко-аналиичних пiдходiв, а через ввдсутшсть сталих перiодiв пропкання, стае неможливим використання статистичних пiдходiв. Але 1хш прояви можуть суттево впливать на навколишне середовище. Це так природнi явища як цунаш, землетруси, виверження вулканiв, зсуви та ш. Тож постае необхiднiсть визначення математичного апарату, що можна застосовувати для прогнозування такого типу часових рядiв навиъ при наявностi зовтшшх впливiв.
Для прогнозування поведiнки часових рядiв, що е чутливими до зовшшшх впливiв, пропонуеться застосовувати методи прогнозування часових рядiв, що в змозi враховувати цi впливи. Такими математичними засобами е методи прихованих марк1вських моделей [2], подiбних траекторш [3], лiнгвiстичного моделювання [4]. Але б№ш точним методом прогнозування представляеться комбiнований або гiбридний метод: лшгвютичне моделювання - прихованi марковськ1 моделi [5].
Мета статтi. Сто!ть задача визначення щодо математичного апарату для прогнозування часових рядiв економiчного та екологiчного типiв, що можуть бути шддаш зовнiшнiм впливам.
Приховаш марк1вськ1 моделi. Дiаграма, подана нижче (рис. 1), показуе загальну структуру ПММ. Овали - це змшш з випадковим значенням. Випадкова змшна вiдповiдае значенню приховано! змшно! в момент часу /. Випадкова змшна у(1.) - це значення змiнноl, за якою ми спостертаемо, в момент
часу ?. Стршки на дiаграмi символiзують умовнi залежностi. 1з дiаграми можна дiзнатись, що значения приховано! змшно! х(/) (в момент часу ?) залежить тiльки ввд значення приховано! змшно! х(? -1) (в момент ? -1). Це називаеться властивiстю Маркова. Хоча в той же час значення змшно! у(?), за якою ми спостертаемо, залежить лише ввд значення приховано! змшно! х(?) (в момент часу ?).
Рис. 1. Загальна схема функцiонування приховано! Марковсько! моделi Ймовiрнiсть спостерiгати послвдовшсть Y = >"(0), >"(1),... ,y(L -1) довжини L дорiвнюe: P(Y) P(Y\X )P(X )
X
тут сума npo6irae по bcíx можливих послiдовностях прихованих вузлiв X = х(0), х(1),... ,x(L -1) Основш прихованi марковськ! моделi можна описати за допомогою таких змшних:
N - шльшсть станiв T - шльшсть спостережень
0¿=j N - параметр для спостереження за зв'язками м1ж станами ®í=i,...n, j=1,-N - ймовiрнiсть переходу Í3 стану i до стану j &i=j ...,N - N -мiрний вектор, що складаеться Í3 ©i>1 .. .,N xt=1 t - стан спостереження за час t yt=1 T - результат спостереження за час t
F(y \ в) - функцiя розподiлу ймовiрностi спостережень, параметризованих по в.
Метод подiбних траeкторiй. 1дея методу полягае в наступному. Маемо ряд спостережень еколопчного процесу, що !х зроблено за якийсь час {>(1);y(2);...;y(n) }, графiк якого наведено на рис.2.
Рис.2. Динамша ряду спостережень
Змшна y(i), i = 1, N тут представленафiзичнимизначеннямивiдповiдногопроцесу (наприклад, сила вiтру, iнтенсивнiсть стоку води, сила тдземних поштовхiв).
За обраним критерiем обираеться дiлянка траекторп "найближча" до дiлянки, яка передуе прогнозованiй точцi. Надалi оцiнюеться прогноз за формулою y(n +1) = y(i + p) , де
I = y(j + i-1)-y(n-p + i)\ } J = 1,2,...n-P ;
J = min \ y(i + j-1)-y(n)\
i = I,I + 1,...,I + p-1.
Формалiзувати метод можна наступним чином. Нехай ми маемо HacTynHi вектори спостережень
TT т т
Yi = Oi-y2,--yp) ,Y2 = (У2=Уз^-У^О ,-YYK = (y^-,-?N = (y«-p+i'y«-p+2,---,y«) Знаходимо найближчу точку i3 умови мшмально! вщсташ
Yk = arg min d Y ,Yj) •
j
£ й iншi способи пошуку найближчо! точки, наприклад, найбiльш поширена метрика - квадрат евклвдово! вiдстанi
d(Yk Yn ) = (Yk - Yn )T (Yk - Yn ) • Лiнгвiстичне моделювання
За певними правилами числовi значення послiдовностi замiнюються символами [7]. Прогнозування вiдбyваеться шляхом пошуку ланцюжк1в символiв i спiвставлення !х з ланцюжками з бази даних спостережень. Отримаш символи утворюють алфавiт, з якого, в свою чергу, формуються слова. Таким чином маемо:
Е : - множина термiнальниx символiв
N : - множина нетермшальних символiв
V = Е U N: словник граматики (множина всix термшальних та нетермiнальниx символiв). При цьому пiд граматикою (або формальною граматикою) розyмiеться спосiб опису формально! мови, тобто видшення деякого шдмножини з безлiчi всix слiв деякого кшцевого алфавiтy.
Для прогнозування використовують стохастичну контекстно-вiльнy граматику [8]. Стохастична контекстно-в№на граматика (СКС) - це контекстно-в№на граматика, в як1й кожному правилу виводу вiдповiдае ймовiрнiсть.
Контекстно-вiльнаграматика G цечетвiрка (N, T, P, S):
• S е N
• N та T сшнченшмножини, що не перетинаються
• P скiнченнапiдмножина N х (N U T)*
При цьому, використовують так1 назви: N — множина нетермшальних символiв, T — множина термшальних символiв, P — множина правил виводу S початковий символ. Правила (а,,ß) е P записують як а ^ ß .
В лiвiй частиш правила виводу мае знаходитись одна змшна (нетермшальний символ). Формально, мае виконуватись а е N,ß е (N UT) ,| ß|> 1 .
В стохастичнихкониекстновшьнихграматиках правилам виведення спiвставляють йомвiрнiсть використання: р: P ^ R де ^p(Pr) = 1
prePr
Стохастичш контекстно вiльнi граматики розширюють контекстно вшьт граматики так само, як приховаш маркiвськi моделi розширюють регулярш граматики.
Гiбридний метод: лiнгвiстичне моделювання - приховаш марковськ моделi. Основними принципами гiбридизацii е: принцип неоднорщносп, принцип плюралiзму, принцип системного аналiзу неоднорiдного завдання, принцип конструктора, принцип прюритету знань, принцип поступовостi, перший та другий принцип спадкування, принцип самооргашзацп агрегованоi' моделi, принцип повноти зниження продуктивностi агреговано! моделi. Ц принципи певним чином узагальнюють свггову практику дослвджень розробки гiбридних штелектуальних систем прийняття рiшень. Використання цих принцишв дозволить робити агрегованi моделi там де це доцiльно, такими яш вони мають бути, та функцюнуючими згiдно з очiкуванням.
Класичш гiбриднi системи комбiнують аналоговi та дискретш моделi, Агрегативнi системи моделюють аналiтико-статистичнi закономiрностi бiхаверiстики складних систем. Методолопя iнтелектуальних експертних систем дозволяе перебороти недолши символьного пiдходу за рахунок комбiнування iз традицiйними шформацшними та технологiями штучного iнтелекту. У кожному iз цих випадкiв мова йде про становлення ново! шформацшно! методологи моделювання складних процесiв i явищ шляхом побудови i застосування моделей-гiбридiв. Зазначимо що iснують рiзнi шляхи для досягнення поставлено! мети.
Використання наведено1' пбридно1' ЛМ-ПММ моделi дозволяе враховувати зовнiшнi впливи, що можуть призводити до 3MÎH характеристик часового ряду, його тренду тощо.
Заключення. До недолiкiв наведеного математичного апарату можна ввднести загальний недолж всiх методiв, де використовуються статистичш данi - брак iсторичноï шформаци. В такому разi прогнозування вщбуваеться на основi суджень, тобто, прогнозування, що грунтуеться на суб'ективних судженнях (оцiнках), iнтуïцiï, поглиблених знаннях конкретно!' областi та iншiй iнформацiï, що мае вщношення до прогнозованого процесу - це так зване передбачення. В разi вiдсутностi достатньо1 кшькосл таких даних, необх1дно використовувати методи системного аналiзу [6]. Методи системного аналiзу е найбiльш унiверсальнi i адекватнi сучасним вимогам засоби дослщження. У свою чергу це дае можливють особi, що приймае ршення, одержати максимально повну, достовiрну i головне, своечасну iнформацiю про можливi зовнiшнi впливи. Використання системного аналiзу також дае можливiсть враховувати зовшшш впливи на поведшку вщповщних процеав..
Висновки та перспективи подальших дослiджень. Математичний апарат для прогнозування поведшки часових рядiв вже достатньо розвинутий. Але наявнiсть зовнiшнiх впливiв вимагае застосування таких пiдходiв, що дають можливiсть враховувати невидимi чинники, як1 вносять свое збурення. Визначено напрямок для подальших дослвджень запропонованих методiв прогнозування часових рядiв, що можуть тддаватися зовнiшнiм впливам.
ЛИТЕРАТУРА:
1. Гуссерль Э. Логические исследования.[Текст] Т. 2. Исследования по феноменологии и теории познания./ Гуссерль Э. — М.: ДИК, 2001.. — 470 с.
2. Баклан 1.В. Класифжащя моделей Марковського типу [Текст] Наукова монографiя/ Баклан 1.В., Степанкова Г. А. - К.: НАУ, 2012. - 84 с.
3. Баклан 1.В. Структурний пвдхщ до розтзнавання образiв у системах безпеки / 1.В. Баклан, Ю.М. Селш, О.О. Петренко //Нацюнальна Безпека Украши: стан, кризовi явища та шляхи 1'х подолання. М1жнародна науково-практична конференцiя (Киïв, 7-8 грудня 2005 р.). Збiрка наукових праць. - К.: Нацюнальна академiяуправлiння - Центр перспективних сощальних дослiджень. 2005. - С.375-380.
4. Баклан 1.В. Лiнгвiстичне моделювання: основи, методи, деяш прикладнi аспекти. [Текст] / 1.В. Баклан // Системные технологи. Региональный межвузовский сборник научных трудов. -Выпуск 3(74) - 2011, с.10-19.
5. Баклан 1.В. Iмовiрнiснi моделi для аналiзу та прогнозування часових рядiв [Текст] / 1.В. Баклан, Г.А. Степанкова // Штучний iнтелект. — 2008. — № 3. - С.505-515.
6. Згуровский М. З., Панкратова Н. Д. Системный анализ. Проблемы. Методология. Применение. -Кшв. - Науково-виробниче шдприемство «Наукова думка» НАН Украши, 2011.- 726 с.
7. Селш Ю.М. Системне ощнювання i прогнозування аномальних природних процесiв марковського типу [Текст] : дис. кандидата техн.. наук : 01.05.04 / Селш Юрш Миколайович. -К., 2009. - 176 с.
8. Clark, A. (2001). "Unsupervised Language Acquisition: Theory and Practice" (PhD thesis) [Електроннийресурс].Режим доступу: http://arxiv.org/abs/cs/0212024v1
БАКЛАН 1гор Всеволодович - к.т.н., доцент, завщувач кафедри штелектуальних систем Нацюнально1' академiï управлiння. Науковi штереси:
- лiнгвiстичне моделювання, прихованi марковсьш моделi.
СЕЛ1Н Юрiй Миколайович - к.т.н., доцент кафедри штелектуальних систем Нацюнально1' академи управлiння.
Науковi штереси:
- лшгвютичне моделювання, прихованi марковсьш модель