Научная статья на тему 'Оптимизация параметров экстраполятора векторного случайного процесса'

Оптимизация параметров экстраполятора векторного случайного процесса Текст научной статьи по специальности «Математика»

CC BY
66
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оптимизация параметров экстраполятора векторного случайного процесса»

- определения в новой ситуации допустимых пределов изменения по каждому параметру в отдельности;

- перераспределения допусков на параметры с целью достижения заданных требований к качеству функционирования системы и ее элементов.

В качестве критерия функционирования технологического агрегата можно рассматривать вероятность нахождения выходной величины У в заданном поле допуска при фиксированных значениях входных переменных Хь 1= 1,т, определенных через параметры Оу- Требования к результату функционирования агрегата в этом случае задаются неравенством

Р{Уе[Л,Б]!Х1} > Ро, (8)

где Р0 - заданная вероятность, величина которой больше, например, 0,7.

Тогда задача коррекции допусков сводится к отысканию в моменты времени 1 такой области

п

чтобы ХеБх = ПОж(У|) и выполнялось условие (8).

1=1

Пусть Р(У(Х^) - плотность распределения выходных параметров технологического агрегата. Тогда при выполнении предположения о нормальном законе распределения можно записать условие (8) в следующем виде:

|аьР(У(Х0МУ =

(V-^ж)

2

1

ау > Р,

0 .

(9)

с у л/2П

Таким образом, задача коррекции параметров модели комплексов с переменными параметрами сводится к коррекции моделей отдельных агрегатов типа Х2, Хт), решению уравнения (8) и к последующей аппроксимации полученной области гиперпараллелепипедом.

Список литературы

1. Метт М.С., Нуриев М.Н. К вопросу определения параметров моделей текущего планирования нефтеперерабатывающего предприятия. // Изв. вузов. Нефть и газ. - 1975. - №4. -С. 88-92.

2. Зенков В.В., Соркин Л.Р. Построение и использование диапазонных моделей. // УСИМ. - 1978. - №4. - С.216-221.

3. Зенков В.В. Диапазонные модели участков производства для АСУП. // Изв. АН СССР: Техническая кибернетика. -1975. - №5. - С.57-63.

4. Виноградов Г.П., Кузнецов В.Н., Торбин С.И. Алгоритм многоуровневой оптимизации производственного комплекса с переменными параметрами. // Матер. 3-й Всесоюзн. конф.: Математические методы в химии. Т.4. Оптимизация. -М.: ЦНИИТЭИнефтехим. - 1980. - С.13-19.

5. Абрамов О .В., Бернацкий Ф.И., Здор В.В. Параметрическая коррекция систем управления. - М.: Энергоиздат, 1982.

с

ОПТИМИЗАЦИЯ ПАРАМЕТРОВ ЭКСТРАПОЛЯТОРА ВЕКТОРНОГО СЛУЧАЙНОГО ПРОЦЕССА

И.В. Абраменкова

При решении слабоструктурированной задачи, связанной с прогнозированием векторного случайного процесса с использованием искусственной нейронной сети (НС), возникают проблемы с выбором топологии сети, оптимизацией ее параметров и т.п. [1-3].

Принимая во внимание проблемы, связанные с использованием НС в задачах прогнозирования, остановимся на предлагаемых в данной статье методах их решения. Прежде всего, наиболее эффективный подход к решению задачи прогнозирования (экстраполяции) в нейросетевом логическом базисе заключается в том, что топология и алгоритмы оптимизации параметров сети разработаны на основе решаемой задачи, а не в результате «подгона» задачи под одну из стандартных парадигм. В статье предлагается архитектура специализированной многослойной НС и алгоритмы настройки ее структуры, предназначенные для прогнозирования и диагностики временных рядов произвольной природы.

Структура экстраполятора. В соответствии с известными теоремами о полноте [1,4], а также с известным следствием [1] для построения экстраполя-

тора выберем из них НС с одним скрытым слоем типа многослойного персептрона с сигмоидальными функциями активации нейронов как скрытого, так и выходного слоев сети.

Предлагаемый экстраполятор представляет собой НС типа многослойного персептрона, охваченную обратной связью, которая реализует некоторую нелинейную зависимость вида

+а = ФЙ1+а-1> +а-2,•••, +1., (1)

где \1 - векторные значения процесса; а - так называемая глубина погружения.

Данная модель может быть проиллюстрирована рисунком 1, где через 2"1 обозначен оператор задержки на один такт, то есть = ^.ь а через НС -используемая (однослойная) НС с Ь нейронами скрытого слоя.

К сожалению, упомянутая выше теорема о полноте и следствие из нее мало применимы в задачах экстраполяции рассматриваемых процессов: они не указывают оптимальное число нейронов Ь скрытого слоя. Неизвестным, вообще говоря, является и оптимальная глубина погружения а. Очевидно, структура

31

используемой НС будет полностью определена только при задании Ь и а.

Остановимся на этом подробнее. Запишем вначале выражения для определения прогнозируемых значений на 1,2, ... тактов вперед:

11+1 = ф(1 1, 11-1,—, 11-а+2,11-а+1),

11+2 = ф(11+1,11,—, 11-а+з, 11-а+2),

11+з = Ф(1и-2,11+1,—, 11-а+4,11-а+з),

(2)

Предполагается, что по данным обучающей выборки и при заданных Ь и а НС реализует функцию ф(-) и позволяет реализовать соотношения (2).

Очевидно, при т=а на основании (2) имеем

1иа = Ф(1иа-ъ 1иа-2,-, 11). (3)

Выбирать значения глубины прогноза т больше, чем глубина погружения а, не имеет смысла, поскольку последующие предсказанные значения будут зависеть только от предыдущих, что делает такой прогноз весьма ненадежным.

Таким образом, для а должно выполняться неравенство:

(4)

Покажем, что верхняя граница рассматриваемого параметра зависит от объема выборки экспериментальных данных, используемой для обучения сети и от количества нейронов Ь в ее скрытом слое.

Вначале приведем известное [1] соотношение для рекомендуемого числа Ь:

1 тс— „ 1

пс + тс 1 + log2Nl

-< Ь <-

пс + тс

• (—"+1>

-1 + 1|(пс + тс +1)+тс

(5)

где пс - число входов сети; тс - число ее выходов; — - объем обучающей выборки. В нашем случае

Щ; = П, Пс = П-а, (6)

а значение — определяется следующим образом.

Пусть исходные экспериментальные данные составляла выборка \ 2,..., \ -', где

-' = (0.5 ^ 0.7)-, (7)

а N - общее количество элементов вектора

Первая строка таблицы обучающей выборки будет образована элементами векторов ^1,|2,—, 1а+1) , а последняя - элементами векторов ^м+ъ ^ч)

Нетрудно видеть, что общее число обучающих примеров (равное числу строк таблицы обучающей выборки) равно при этом Ч'-а, то есть

ч^ч'-а. (8)

Подставляя теперь (8) и (6) в левую часть соотношения (5), получим

1 п(—- а)

Ьщ

п(а+1) 1 + а)

1 —-а

(9)

1+^2(—-а) а+1

Физически наименьшее значение Ь,^п=1 (скрытый слой содержит только один нейрон), поэтому

1 —-а.

> 1.

(10)

1+^2(—-а) а+1

Можно показать, что при фиксированном — увеличение а приводит к уменьшению левой части последнего неравенства, поэтому его можно использовать для нахождения верхней границы глубины погружения атах.

Аналитическое решение (10) относительно а невозможно, численные же выкладки позволяют получить примерное значение для атах:

Г — 1 (11)

а„

= ¡п1

10

где ¡п1{-} - функция выделения целой части числа.

Таким образом, возможное значение для глубины погружения а удовлетворяет двойному неравенству

т < а < ¡п1< — . (12)

10

Возвращаясь теперь к выражению (5), найдем в нем наибольшее значение его правой части. Подстановка в нее (6) и (8) дает:

1

п(а+1)

+ 1|(пс + Щ; +1)+ т, пс • а )

+1 |(п+п • а+1)+п

1

а+1

—-а

п • а 1

(13)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[ —^+1|(п+п • а+1)+1

Учитывая, что в соответствии с (11) а<<— последнее соотношение можно несколько упростить и привести к виду

1

а +1

—-а

п • а

+1 |(п+п • а+1)+1

—+1| • п+[—+1| п ) I п ) а+1

(14)

откуда следует, что с ростом а правая часть (9) убывает и, таким образом,

1 < Ь < Ьт

-'-а„

1

п • а„

аmin +1 ^ +1 |(п + п • аm¡n +1) +1

(15)

Полученные неравенства (12) и (15) дают границы изменения значений параметров Ь и а, но не их

т

п„ + т

1

п

т

32

оптимальные значения. Для получения этих оптимальных значений можно воспользоваться следующим подходом.

Будем предполагать, что точность прогноза можно оценить, используя некоторую тестовую или контрольную выборку экспериментальных данных.

Очевидно, средний квадрат ошибки прогноза для примеров этой выборки будет являться функцией как d, так и L, то есть E=E(d,L). При выборке в качестве критерия E(d,L) оптимальные значения dopt, Lopt являются решением оптимизационной задачи

(d0pt,L0pt) = min E(d,L). (16)

dmin ^d^dmax

Вид функциональной зависимости E(d,L), естественно, неизвестен, но можно полагать, что данная функция при ограничениях (12), (15) имеет только один минимум и может быть аппроксимирована квадратичной формой:

E(d, L) я b0 + b1d + b2L + b3dL +

+ b4d2 + b5L2

Коэффициенты b0-b5 этой формы могут быть найдены следующим образом.

В области возможных значений параметров d и L, определяемых (12), (15), проводится эксперимент, каждый i-й опыт которого заключается в создании, обучении и тестировании НС с заданными di, Li. Результатом (откликом) опыта является величина среднего квадрата Ei=E(di,Li). Очевидно, при числе таких опытов M, равном или большем шести, коэффициенты модели (17) определяются однозначно методом наименьших квадратов (МНК):

b = (FT • F)-1 • FT • Y ,

\T

где

b = (bo,bi,...,b5)', Y = (Ei,E2,...,Em ) 1 di Li diLi 1 d2 L2 d2L2

F =

d2

L1

,,2 d2

т 2

L2

,,2 dM

L2 LM

(18)

(19)

1 ам Ьм амЬм

Точки (а1,Ь1) можно задавать по определенному плану. Пример плана такого эксперимента при М=9 приведен на рисунке 2.

d 2 3

dmax i4 «5 , ,6

dmin 7 8 9

L

Lmax

Рис. 2. Точки возможного плана эксперимента при М=9

Значения а , Ь , минимизирующие выбранный критерий, находятся как решения системы уравнений

(d) [b0 + b1d + b2L + b3dL + b4d2 + b5L2 | = ( d- [b0 + b1d + b2L + b3dL + b4d2 + b5L2 | = 0

d(d) d

dL

откуда получаем

b2b3 - 2b1b5

d* = -

L =

4b4b5 - Ьз2

b1b3 - 2b2b4

(20)

4Ь4Ь5 - Ьз

Однако найденное решение (после округления) будет давать оптимальные (точнее, квазиоптимальные) значения

dopt = round(d ) Lopt = round(L*)

(21)

только в том случае, если а , Ь удовлетворяют неравенствам (12), (15). Если же одно (или оба) данных

- Л* I *

неравенства для найденных значений а , Ь не выполняются, точку (а*, Ь*), обеспечивающую минимум принятого критерия, следует искать на границе области определения а, Ь, то есть на границе прямоугольника, приведенного на рисунке 2, включая угловые точки прямоугольника.

В этом случае нахождение а„рЬ Ьор1 сводится к достаточно тривиальной задаче одномерной оптимизации, на которой останавливаться не будем.

Предложенный метод нахождения оптимальных значений параметров (а„рЬ Ь„р1) является приближенным, поскольку изложенная задача оптимизации относится к задачам дискретного программирования, и для поиска точных решений используются алгоритмы, учитывающие дискретный характер переменных а, Ь [5], например, динамическое программирование, метод ветвей и границ и др.

Достоинства и недостатки (в основном громоздкость вычислений) этих методов хорошо известны [6,7]. Между тем, учитывая конкретные особенности рассмотренной задачи (два оптимизируемых параметра при небольшом числе возможных дискретных значений), можно предложить еще два, как представляется, достаточно перспективных алгоритма ее решения.

Метод направленного перебора. Данный метод является дискретным аналогом алгоритма Гаусса-

Зайделя (другое название - метод покоординатного спуска) [8] (рис. 3).

Предположим, что минимизируемая функция является функцией двух дискретных аргументов, то есть Е=Е(Ь, а), возможные значения которых на рисунке 3 отображены точками. Каким-либо об-

d 3

I2 • •<—• • •

1 ' 0

• • < ч

• • 1 1 1 » •

*L

Рис. 3. Пояснение метода

направленного перебора

33

разом (случайно или исходя из какой-то априорной информации) выбирается начальная точка, для которой определяется значение функции Е(Ь0, а0). Затем находятся значения функции в четырех соседних точках (Ь0 -1, а0), (Ь +1, а0), (Ь0,а0 -1), (Ь0,а0 +1), и выбирается точка, для которой значение меньше, чем в начальной - на рисунке 3 такой точкой принята точка 1 с координатами (Ь1,а1) = =(Ь0-1,а0). Далее повторяется «осмотр» точек, ближайших к точке 1 (ранее «осмотренные» точки пропускаются), осуществляется переход к следующей точке и так до тех пор, пока не найдется точка, для которой все соседние будут иметь большие значения минимизируемой функции.

Использование генетических алгоритмов [9,10]. Здесь каждый оптимизируемый параметр кодируется двоичным числом разрядности, достаточной, чтобы отобразить все возможные дискретные значения параметра. Совокупности таких чисел для всех параметров объединяются в одно двоичное слово, отображающее хромосому. Далее поиск минимума оптимизируемой функции проводится по известным [9,10] процедурам. Отметим, что генетические алгоритмы в действительности представляют собой, скорее, подход, чем единый алгоритм. Они часто требуют «содержательного наполнения» для решения рассматриваемой задачи. Чтобы рассчитывать на получение хорошего результата, необходимо учесть и предусмотреть большое количество факторов, таких как объем и структура популяции, отбор особей для выживания и/или скрещивания, обеспечение сходимости процедуры поиска, исключение нежелательных мутаций и т.д.

С учетом сделанных выше замечаний генетический алгоритм был реализован в своем «классическом» варианте.

Для оценки эффективности трех рассмотренных алгоритмов был проведен программный эксперимент. В результате выявлены и отмечены недостатки всех трех предлагаемых алгоритмов, самыми существенными из которых является факт «застревания» программы в точках локального минимума (для первых двух алгоритмов), невозможность полного исключения «нежелательных» мутаций и большие

временные затраты на выполнение процедуры поиска (для третьего алгоритма).

Предлагаемые алгоритмы оптимизации параметров эктраполятора на основе НС с обратной связью позволяют для разработанной специальной структуры сети осуществлять «оперативную» подстройку параметров сети на основе решаемой задачи, а не подгонять задачу под одну из стандартных структур. Проведенный программный эксперимент подтверждает эффективность такого промежуточного этапа оптимизации.

Предложенная методика нахождения d0pt, L0pt отражает наличие внешней обратной связи НС. Отметим, что оптимальные значения d и L взаимосвязаны друг с другом и не могут находиться с помощью соответствующих пакетных функций системы MATLAB.

В процессе реализации машинного эксперимента автором была отработана недокументированная в известных источниках методика построения программных комплексов и GUI-приложений в среде MATLAB в сочетании с использованием имеющегося базового набора функций специализированных пакетов расширений.

Список литературы

1. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. - М.: Горячая линия - Телеком, 2001.

2. Дли М.И., Круглов В.В., Осокин М.В. Локально-аппроксимационные модели социально-экономических систем и процессов. - М.: Наука. Физматлит, 2000.

3. Дьяконов В.П., Абраменкова И.В., Круглов В.В. MATLAB 5.3.1 с пакетами расширений. - М.: Нолидж, 2001.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. - Новосибирск: Наука, 1996.

5. Корбут А.А., Филькельштейн Ю.Ю. Дискретное программирование. - М.: Наука, 1969.

6. Кузин Л.Т. Основы кибернетики. Т.1: Математические основы кибернетики. - М.: Энергия, 1972.

7. Коршунов Ю.М. Математические основы кибернетики. -М.: Энергоатомиздат, 1987.

8. Васильков Ю.В., Василькова Н.Н. Компьютерные технологии вычислений в математическом моделировании. - М.: Финансы и статистика, 1999.

9. Курейчик В.М. Генетические алгоритмы. Обзор и состояние. // Новости искусственного интеллекта. - 1998. - №3. - С. 26-35.

10. Базы данных. Интеллектуальная обработка информации. / В.В. Корнеев, А.Ф. Гареев, С.В. Васютин, В.В. Райх. - М.: Нолидж, 2000.

ОБЩИЕ ПРИНЦИПЫ АВТОМАТИЗАЦИИ РАЗРАБОТКИ КОМПЬЮТЕРНЫХ УЧЕБНЫХ ПОСОБИЙ В КОМПЛЕКСЕ EDUCAD

В.В. Романенко

На кафедре автоматизированных систем управления Томского государственного университета систем управления и радиоэлектроники уже в течение нескольких лет коллектив разработчиков занимается проектированием и созданием различных компью-

терных учебных пособий (КУП). Возникла необходимость в специализированной среде разработки КУП [1,2].

В состав комплекса ЕйиСЛВ входят следующие

автоматизированные системы (АС):

34

i Надоели баннеры? Вы всегда можете отключить рекламу.