Научная статья на тему 'Моделирование экономических систем с применением нейронных сетей'

Моделирование экономических систем с применением нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
509
541
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кравченко Мария Леонидовна, Грекова Татьяна Ивановна

В работе рассматривается применение нейронных сетей для построения моделей экономических систем и сравнение результатов с традиционными методами построения трендовых моделей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Моделирование экономических систем с применением нейронных сетей»

М.Л. Кравченко, Т.И. Грекова

МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ СИСТЕМ С ПРИМЕНЕНИЕМ НЕЙРОННЫХ СЕТЕЙ

В работе рассматривается применение нейронных сетей для построения моделей экономических систем и сравнение результатов с традиционными методами построения трендовых моделей.

Построение модели, наряду с информационными и экспертно-логическими системами, представляется в настоящее время неотъемлемым инструментом теоретической и практической экономики. Модели, как правило, строятся с целью: 1) ретроспективного анализа, 2) прогнозирования поведения экономической системы.

В настоящее время наряду с традиционными математическими способами построения моделей систем разработаны современные методы, к которым относится аппарат нейронных сетей.

Нейронные сети [4] позволяют решать задачи, с которыми не могут справиться традиционные методы, они способны успешно решать задачи, опираясь на неполную, зашумленную, искаженную информацию. Нейронная сеть -это система, состоящая из многих простых вычислительных элементов (нейронов), определенным образом связанных между собой. Наиболее распространенными являются многослойные сети, в которых нейроны объединены в слои. Слой, в свою очередь, - это совокупность нейронов, на которые в каждый такт времени параллельно поступает информация от других нейронов сети, т.е. выходы нейронов соединяются с входами других нейронов. Так сигнал от одного элемента передается другим. После того как определено число слоев и число элементов в каждом из них, нужно обучить сеть, т.е. найти значения для весов и порогов сети, которые минимизировали бы ошибку прогноза, выдаваемого сетью. Для этого существуют алгоритмы обучения. Ошибка для конкретной конфигурации сети определяется путем прогона через сеть всех имеющихся наблюдений и сравнения реально выдаваемых выходных значений с желаемыми (целевыми) значениями. По сути, процесс обучения представляет собой подгонку модели, которая реализуется сетью, к имеющимся обучающим данным.

Рассмотрим задачу аппроксимации ряда динамики (РД), т.е. построения модели по конечному набору точек на конкретных примерах об объеме экспорта товаров и производстве электроэнергии за три года [3]. Данные приведены графически по месяцам с июля 2001 г. по июнь 2004 г. на рис. 1 и 2. Объем выборки N = 36.

Рассмотрим решение задачи построения модели экономического процесса с применением аппарата нейронных сетей. Приступая к разработке нейросете-вой модели, как правило, сталкиваются с проблемой выбора структуры нейронной сети. Задачи аппроксимации экспериментальных данных можно решать с помощью сетей следующих типов: многослойного персептрона, сетей с радиально-базисными функциями, обобщенно-регрессионных, линейных сетей [4].

Решим поставленную задачу с помощью нейронных сетей типа радиально-базисная (КБР) и обобщенно-регрессионная (ОЯМ№) сети.

КБР-сеть имеет промежуточный слой из радиальных элементов, каждый из которых воспроизводит гауссову поверхность отклика /(я) = ехр(-52/2ст2),

где параметр ст определяет радиус влияния каждой базисной функции и быстроту стремления к нулю при удалении от центра (рис. 3).

Рис. 1. Объем экспорта товаров

Рис. 2 Объем произведенной электроэнергии

Рис. 3. Радиальная базисная функция

Так как эти функции нелинейные, то достаточно одного промежуточного слоя, необходимо лишь взять нужное число радиальных элементов. Остается решить вопрос о том, как следует скомбинировать выходы скрытых радиальных элементов, чтобы получить из них выход сети. Оказывается, что достаточно взять их линейную комбинацию (т.е. взвешенную

сумму гауссовых функций). Сеть КБ Б имеет выходной слой, состоящий из элементов с линейными функциями активации (рис. 4).

Рис. 4. Структура радиально-базисной сети

Процесс обучения RBF-сетей включает две стадии: процесс настройки центров базисных функций и обучение нейронов в скрытом слое.

Чтобы решить поставленную задачу, для сравнения были созданы по две RBF-сети для каждого из двух рассматриваемых РД. Моделирование проводилось с применением пакета MATLAB. При создании сети использовались следующие функции пакета:

- net = newrb (t, y, e, с) - создание радиально-базисной сети с обучением. Здесь t = 1, N - время; y - исходный РД; e - допустимая среднеквадратическая ошибка (возьмем равной 0,1); с - радиус влияния (возьмем равным 1 и 0,5).

- y_oc = sim (net, t) - моделирование сети.

В результате моделирования радиальной базисной сети для реальных данных были получены аппроксимирующие функции, представленные графически на рис. 5 - 8, где точками обозначены исходные данные, сплошной линией - аппроксимирующая функция.

Обобщенно-регрессионная нейронная сеть в качестве первого промежуточного слоя имеет радиальнобазисный слой, второй промежуточный слой - линейный (рис. 9). GRNN-сеть копирует внутрь себя все обучающие наблюдения и использует их для оценки отклика в произвольной точке. Окончательная выходная оценка сети получается как взвешенное среднее выходов по всем обучающим наблюдениям, где величины весов отражают расстояние от этих наблюдений до той точки, в которой производится оценивание, и, таким образом, более близкие точки вносят больший вклад в оценку. Второй промежуточный слой содержит элементы, которые помогают оценить взвешенное среднее. Для этого используется специальная процедура. Каждый выход имеет в этом слое свой элемент, формирующий для него взвешенную сумму. Чтобы получить из взвешенной суммы взвешенное среднее, эту сумму нужно поделить на сумму весовых коэффициентов. Последнюю сумму вычисляет специальный элемент второго слоя. После этого в выходном слое производится собственно деление (с помощью специальных элементов «деления»). Таким образом, число элементов во втором промежуточном слое на единицу больше, чем в выходном слое.

Рис. 5. Аппроксимация нестационарного РД

с помощью RBF-сети с а = 1

Рис. 6. Аппроксимация нестационарного РД

с помощью RBF-сети с а = 0,5

Рис. 7. Аппроксимация стационарного РД с помощью RBF-сети с с = 1

Рис. 8. Аппроксимация стационарного РД с помощью RBF-сети с с = 0,5

Рис. 9. Структура обобщенно-регрессионной сети

Как правило, в задачах регрессии требуется оценить одно выходное значение, и соответственно второй промежуточный слой содержит два элемента.

Процесс обучения GRNN-сети аналогичен обучению RBF-сети. Первоначально настраиваются центры базисных функций, затем обучается выходной слой. Обобщенно-регрессионная сеть имеет единственный управляющий параметр обучения, значение которого должно выбираться пользователем, - степень сглаживания.

Для создания GRNN-сетей используются следующие функции пакета MATLAB:

- net = newgmn (t, y, sp) - создание радиальнобазисной сети с обучением. Здесь t=1, N - время; y -исходный РД; sp - коэффициент сглаживания.

- y_oc = sim (net, t) - моделирование сети.

Для решения поставленной задачи были смоделированы GRNN-сети с коэффициентами сглаживания sp, равными 1 и 0,5.

Результаты аппроксимации данных с применением обобщенно-регрессионной нейросети приведены на рис. 10 - 13. На графиках точками обозначены исходные данные, сплошной линией - аппроксимирующая функция. Из графиков видно, что с увеличением значения параметра sp кривые становятся более гладкими.

Сравним полученные результаты с результатами, полученными при построении трендовых моделей рассматриваемых динамических рядов.

Динамический ряд, приведенный на рис. 1, является периодическим рядом с линейной тенденцией развития. Ряд, приведенный на рис. 2, является стационарным периодическим рядом, т.е. общей тенденции развития нет, но явно выделяется циклическая сезонная составляющая временного ряда. И первый и второй РД, естественно, включают случайную составляющую. Поэтому для сглаживания данных РД были использованы в качестве модели тренда ряды Фурье [5]:

y(k) = a0 +Yja1 cos{Nkj + ¿6¿ sin{Nk), (1)

где N - объем выборки; n - число гармоник; a0, ai, bi -неизвестные параметры, которые надо оценить.

Рис. 10. Аппроксимация нестационарного РД с помощью GRNN-сети с sp =1

Рис. 11. Аппроксимация нестационарного РД с помощью GRNN-сети с sp = 0,5

Рис. 12. Аппроксимация стационарного РД с помощью GRNN-сети с sp =1

Рис. 13. Аппроксимация стационарного РД с помощью GRNN-сети с sp = 0,5

Для идентификации параметров ряда Фурье с применением традиционного метода наименьших квадратов (МНК) получены следующие формулы для оценок параметров ряда [4]:

N N

2 ^ y(k )cos(4nik / N) 2 ^ y(k)sin(4ik/N)

^ k—1 L. k—1

ai —-------------------------------------------; b —-, (2)

г N г N

где i = 1,...,n; n - число гармоник.

Подставляя формулы (2) в формулу (1), получим выровненные значения РД:

y _oc(k) — a0 + ¿a cos^2Nik) + X b sin(Nk). (3)

В случае нестационарного ряда достаточно хорошее качество аппроксимации достигается при числе гармоник n, равном 10, в случае стационарного - при n, равном 8.

Кроме МНК, для решения задачи идентификации широко применяется фильтр Калмана - Бьюси [2], который позволяет получить оптимальную в смысле минимума ошибки оценку в текущий момент времени на основании информации об оцениваемом процессе только в предыдущий момент времени. На рис.14 и 15 приведены графически модели исходного процесса y(k), полученные с применением ряда Фурье с оцениванием его параметров по МНК (сплошная линия) и фильтру Калмана (пунктирная линия).

Оценить качество построенных моделей можно с помощью коэффициента детерминации [6]:

Е (у (к) - y _ ос(к))2

R2 = 1 - ±-

Е (у(к) - у)

к

(4)

который отражает адекватность построенной модели реальным данным. Здесь у - выборочное среднее; у(к) - исходные данные; у_ос(к) - данные, полученные в результате моделирования.

к

Рис. 14. Аппроксимация нестационарного РД

к

Рис. 15. Аппроксимация стационарного РД

Коэффициенты детерминации для различных моделей приведены в таблице (близость коэффициента детерминации к единице говорит о высоком качестве модели).

Опираясь на данные таблицы, можно сделать вывод о том, что нейронные сети ничуть не уступают традиционному методу построения трендовых моделей с применением рядов Фурье. Поэтому нейросете-вые модели могут использоваться для анализа и прогнозирования дальнейшего поведения рассматриваемых процессов.

Модель Коэф. детерминации (R2) Применение ряда Фурье PBF GRNN

Способ оценивания параметров Значение параметра Значение параметра

МНК фильтр Калмана 0,5 1,0 0,5 1,0

Случай стационарного ряда 0,9508 0,6657 0,9978 0,9997 0,9980 0,9471

Случай нестационарного ряда 0,9386 0,7564 0,9976 0,9974 0,9975 0,9443

ЛИТЕРАТУРА

1. Мкртчян С.О. Нейроны и нейронные сети. М.: Энергия, 1971. 231 с.

2. Вестник экономики. М.: Изд-во М.8Ь.РИА «Новости», 2004. № 15. С. 98.

3. Толстов Г.П. Ряды Фурье. М.: Наука, 1980. 381 с.

4. Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1977.

5. Браммер К., Зиффлинг Г. Фильтр Калмана - Бьюси. М.: Наука, 1982.

6. Хеннан Э. Анализ временных рядов. М.: Наука, 1964. 215 с.

7. Кравченко М.Л. Построение моделей экономических систем с применением нейронных сетей // II Междунар. конф. студентов и молодых ученых «Перспективы развития фундаментальных наук». Томск, 2005.

Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию «Кибернетика» 14 июня 2005 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.