Научная статья на тему 'Устойчивость многослойных рекурсивных нейронных сетей'

Устойчивость многослойных рекурсивных нейронных сетей Текст научной статьи по специальности «Математика»

CC BY
136
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / РАЗНОСТНЫЕ МАТРИЧНЫЕ УРАВНЕНИЯ / УСТОЙЧИВОСТЬ РАЗНОСТНЫХ УРАВНЕНИЙ / МНОГОСЛОЙНЫЕ СЕТИ / NEURAL NETWORKS / DIFFERENCE MATRIX EQUATIONS / STABILITY OF DIFFERENCE EQUATIONS / MULTILAYER NETWORK

Аннотация научной статьи по математике, автор научной работы — Иванов Сергей Александрович, Блеес Ирина Игоревна

Получены численные критерии устойчивости многослойных дискретных нейронных сетей. Построены области устойчивости в пространстве параметров для таких сетей. Задача сводится к проблеме устойчивости матричных разностных уравнений высоких порядков с запаздыванием. Основным средством решения проблемы являются конусы устойчивости.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STABILITY OF MULTILAYER RECURSIVE NEURAL NETWORKS

Numerical stability criteria are described for multilayer discrete-time neural networks. Stability domains in the space of parameters are built. The problem reduces to the stability problem for difference matrix equations of a higher order with delay. Stability cones are major tolls for problem solution.

Текст научной работы на тему «Устойчивость многослойных рекурсивных нейронных сетей»

Математика

УДК 517.96

устойчивость многослойных рекурсивных

нейронных сетей

С.А. Иванов\ И.И. БлееС

Получены численные критерии устойчивости многослойных дискретных нейронных сетей. Построены области устойчивости в пространстве параметров для таких сетей. Задача сводится к проблеме устойчивости матричных разностных уравнений высоких порядков с запаздыванием. Основным средством решения проблемы являются конусы устойчивости.

Ключевые слова: нейронные сети; разностные матричные уравнения; устойчивость разностных уравнений; многослойные сети.

Введение

В статье рассмотрены многослойные нейронные сети с одинаковыми запаздываниями во взаимодействии между нейронами в сети. Такие модели имеют широкое применение в различных областях знаний.

В работе [1] изучалась нелинейная дискретная модель многослойных сетей. В этой работе даны достаточные условия глобальной устойчивости таких моделей. Наша задача другая - изучение локальной устойчивости и полное описание областей устойчивости в пространстве параметров.

Связи трехслойной сети с тремя нейронами в каждом слое изображены на рис. 1.

В результате линеаризации вокруг стационарного решения уравнений многослойной нейронной сети получается линейное матричное разностное уравнение

Х5 =у1х3_1 + Вх3_к, 5 = и..., где х5 - вектор сигналов нейронов в момент 5. Вектор х5 - размерности пр характеризует отклонения сигналов нейронов от стационарных, I - единичная прх пр матрица, у - коэффициент затухания колебаний нейронов (0 £у< 1), В - матрица размера прхпр, характеризующая взаимодействия между нейронами в сети, к - запаздывание во взаимодействии между нейронами, п - число нейронов в каждом слое, р - число слоев в сети.

Уравнение (1) принадлежит классу матричных разностных уравнений вида:

Х5 = ^Х5_1 + Вх5_к, 5 = 1,2. , (2)

которые обладают важным для нас свойством: матрицы А, В могут быть приведены к треугольному виду одним преобразованием. Поэтому мы имеем возможность применить метод конуса устойчивости [2] для анализа устойчивости этих уравнений.

Матрица В, например, трехслойной сети, состоящей из шести нейронов, имеет следующий

вид:

Рис. 1. Трехслойная нейронная сеть

(1)

в=

(0 0 a a 0 01

0 0 a a 0 0

b b 0 0 a a

b b 0 0 a a

0 0 b b 0 0

ч 0 0 b b 0 0,

(3)

1 Иванов Сергей Александрович - доцент, кафедра системного программирования, Южно-Уральский государственный университет. E-mail: [email protected]

2 Блеес Ирина Игоревна - магистр, кафедра системного программирования, Южно-Уральский государственный университет.

Математика

где а - сила воздействия нейронов одного слоя на следующий слой, Ь - сила обратного воздействия.

Мы ставим задачу изучить область устойчивости системы (1) в пространстве параметров а, Ь при разных значениях у, п, р и к .

Конус устойчивости для диагностирования устойчивости нейронных сетей

В работах [2, 3] введены конусы устойчивости для диагностирования устойчивости систем вида (2) с матрицами A, B, одновременно приводимыми к треугольному виду. Для решения поставленной задачи устойчивости многослойных нейронных сетей нам понадобится техника конусов устойчивости, которую мы здесь изложим.

Определение 1. Конусом устойчивости для уравнения вида (2) для данного k мы называем

множество точек M = (u1, u2, u3)е R3, такое, что

u1 + iu2 = exp(ikw) - h exp(i(k - 1)w), u3 = h, (4)

где параметры h, a связаны соотношениями

sin ka

_....... p p

0 < h <-,--<w<-.

sin(k - 1)w k k

(5)

Теорема 1 [3]. Пусть A,B,Se RnpXnp и S"1 AS = AT,S~1BS = BT, где AT,BT треугольные матрицы с диагональными элементами 1j,ßj соответственно (1 < j< np). Построим точки

Mj = (u1 j, u2 j, u3 j) e R (1 < j < np) так, что

u1 j + iu2 j = mj exp(-ikarg 1j), u3 j = Ц . (6)

Тогда уравнение (2) асимптотически устойчиво, если и только если все точки Mj лежат

внутри конуса устойчивости (4), (6) для данного k . Если некоторая точка Mj лежит вне конуса

устойчивости, то уравнение (2) неустойчиво.

Теорема 1 сводит задачу диагностирования устойчивости системы (2) порядка (np X np) к

геометрической задаче в R3: асимптотическая устойчивость системы равносильна условию, что все точки Mj (1 < j < np) лежат внутри конуса устойчивости (4), (6) для данного k .

Для применения теории конусов устойчивости необходимо знать собственные числа матрицы B. Введем следующие обозначения:

L =

где матрица Ь размера (р х р), матрица V размера (пх п).

Заметим, что матрица Ь представляет собой матрицу сил запаздывающих взаимодействий нейронной сети линейной конфигурации. Собственные числа таких матриц и области устойчивости линейных нейронных сетей изучены в [4, 5].

Матрицу можно представить в виде произведения Кронекера следующим образом:

В = Ь ® V.

Для произведения Кронекера справедлива следующая теорема.

Теорема 2 [6]. Пусть собственные значения квадратных матриц А и В равны а1,...,ат и Р1,...,Рт . Тогда собственные числа А ® В равны aipj.

(0 a 0 ••• 0 ^ (1 1 1 ... Л

b 0 a ... 0 1 1 1 ... 1

0 b 0 ... 0 ; V= 1 1 1 ... 1

•. a

V 0 0 0 b 0 у v1 1 1 1 1

Собственные числа матрицы L порядка p равны Я, = 2\/ab• cos

p• j P+1

, j = 1... p. Собст-

венные числа матрицы V порядка п равны ¡11 = №2 = "' = 0; №п = п. Согласно теореме 2 для мат-

Иванов С.А., Блеес И.И.

Устойчивость многослойных рекурсивных нейронных сетей

рицы B порядка np собственные числа равны e11 = e12 = ••• = epn—1 = 0 ; e jn = Imfab ■

"jn

cos

p j p+1

Л

j=1... p.

Диагностирование устойчивости двухслойной сети

Определение 2. Овалом устойчивости для уравнений вида (2) для запаздывания k > 1 и параметра у мы называем кривую M (w) = (u1 (w), u2 (w)), такую что

u1 (w) + iu2 (w) = exp(ikw) -1 g exp(i(k -1)w), где we (—w, w), где w - есть наименьший положительный корень уравнения

.i sin kw sin(k — 1)w

Овал устойчивости для данного запаздывания k и данного у это сечение конуса устойчивости (см. Определение 1) плоскостью u3 = |g . На основании Теоремы 1 и свойств матрицы B для диагностирования устойчивости уравнения (1) достаточно проверить две точки

M(u1 j, u2j) = u1 j + iu2 j = ±2n\[ab ■ cos

1 j

2 j

P

P + 1

(1 < j < 2). Поэтому имеют место следующие теоре-

J

мы.

Теорема 3. Пусть даны произвольные п,ке 2+,к > 1. Пусть 0 <у< 1. Построим в Я2 овал устойчивости (см. Определение 2) для данных к, у. Построим точки М^ = (и1 j, и2 j) е Я (1 < j < 2) так, что

u1 j + iu2 j = ±2n\[ab ■ cos

( P ^

P +1

Если обе точки М^ (1 < j < 2) лежат внутри овала устойчивости, то система (1) асимптотически устойчива. В противном случае система (1) неустойчива. Введем обозначение

q = 2n ■ cos

( P >

P +1

Теорема 4. 1. Если g> 1, то система (1) неустойчива.

2. Если g< 1 и 0 < ab<

1 — g

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

то система (1) асимптотически устойчива при любом запаз-

дывании k . Если g< 1 и ab >

(1—g^2

3. Если g< 1 и ab< 0 и lab <

то система (1) неустойчива при любом запаздывании k .

ч 2

F (g, k)

то система (1) асимптотически устойчива при дан-

ном значении k . Если g< 1 и ab< 0 и |ab >

( F(g, k) ^

, то система неустойчива при данном

ir, cv n sinw(g) запаздывании k . Здесь F(g,k) =-, где w(g) есть наименьший неотрицательный ко-

cos(k — 1)w(g)

рень уравнения g

cos kw

С08(к -1)®

Области устойчивости системы (1) отражены на рис. 2, 3.

Полученные результаты не противоречат известным результатам. Можно сделать вывод о динамике областей устойчивости в пространстве параметров. Область устойчивости стягивается в крест только с ростом числа нейронов в каждом слое. Увеличение числа слоев в нейронной сети с сохранением числа нейронов в каждом слое не стягивает область устойчивости в крест. При

2

q

q

Математика

фиксированном количестве нейронов n имеется область в пространстве параметров, в которой гарантируется устойчивость независимо от запаздывания (delay-independent stability). Для сохранения устойчивости выгоднее увеличивать число слоев в многослойных сетях, чем наращивать число нейронов в каждом из слоев.

Рис. 2. Область устойчивости системы (1) в плоскости (а,Ь) при фиксированных у= 0,4,к = 3, п = 4 и переменном числе слоев р

Рис. 3. Область устойчивости системы (1) в плоскости (а,Ь) при фиксированных у= 0,4, р = 3, п = 5 и переменном запаздывании к

Литература

1. Barabanov, N.E. Stability analysis of discrete-time recurrent neural networks // N.E. Barabanov, D.V. Prokhorov. - IEEE Transactions of Neural Networks. - 2002. - V. 13(2). - P. 292-303.

2. Kipnis, M.M. The stability cone for a matrix delay difference equation. International // M.M. Kipnis, V.V. Malygina. - J. of Mathematics and Mathematical Sciences. - 2011. P. 1-15. ID 860326.

3. Ivanov, S.A. The stabiliry cone for a difference matrix equation with two delays // S.A. Ivanov, M.M. Kipnis, V.V. Malygina. - ISRN J. Applied Mathematics. - 2011. - P. 1-19. ID 910936.

4. Ivanov, S.A. Stability analysis of discrete-time neural networks with delayed interactions: torus, ring, grid, line / S.A. Ivanov, M.M. Kipnis. - International Journal of Pure and Applied Math. - 2012. -Vol. 78(5). - P. 691-709

5. Khokhlova, T.N. Numerical and qualitative stability analysis of ring and linear neural networks with a large number of neurons / T.N. Khokhlova, M.M. Kipnis. - International Journal of Pure and Applied Math. - 2012. - Vol. 76(3). - P. 403-419.

6. Прасолов, В.В. Задачи и теоремы линейной алгебры / В.В. Прасолов. - М., 2008 - 536 с.

Поступила в редакцию 26марта 2015 г.

Иванов С.А., Блеес И.И.

Устойчивость многослойных рекурсивных нейронных сетей

Bulletin of the South Ural State University Series "Mathematics. Mechanics. Physics" _2015, vol. 7, no. 3, pp. 5-9

STABILITY OF MULTILAYER RECURSIVE NEURAL NETWORKS

S.A. Ivanov\ I.I. Blees2

Numerical stability criteria are described for multilayer discrete-time neural networks. Stability domains in the space of parameters are built. The problem reduces to the stability problem for difference matrix equations of a higher order with delay. Stability cones are major tolls for problem solution.

Keywords: neural networks; difference matrix equations; stability of difference equations; multilayer network.

Referemces

1. Barabanov N.E., Prokhorov D.V. Stability analysis of discrete-time recurrent neural networks. IEEE Transactions of Neural Networks. 2002. Vol. 13(2). pp. 292-303

2. Kipnis M.M., Malygina V.V. The stability cone for a matrix delay difference equation. International J. of Mathematics and Mathematical Sciences. 2011. pp. 1-15. ID 860326.

3. Ivanov S.A., Kipnis M.M., Malygina V.V. The stabiliry cone for a difference matrix equation with two delays. ISRN J. Applied Mathematics. 2011. pp. 1-19. ID 910936.

4. Ivanov S.A., Kipnis M.M. Stability analysis of discrete-time neural networks with delayed interactions: torus, ring, grid, line. International Journal of Pure and Applied Math. 2012. Vol. 78(5). pp.691-709.

5. Khokhlova T.N., Kipnis M.M. Numerical and qualitative stability analysis of ring and linear neural networks with a large number of neurons. International Journal of Pure and Applied Math. 2012. Vol. 76(3). pp. 403-419.

6. Prasolov V.V. Zadachi i teoremy lineynoy algebry (Problems and theorems of linear algebra). Moscow, 2008. 536 p.

Received 26 March 2015

1 Ivanov Sergey Alexandrovich is Associate Professor, System Programming Department, South Ural State University. E-mail: [email protected]

2 Blees Irina Igorevna is a Master Student, System Programming Department, South Ural State University.

i Надоели баннеры? Вы всегда можете отключить рекламу.