Об одной методологии автономного адаптивного управления1
А. А. Жданов, С. В. Арсеньев (Москва, ИСПРАН),
В.А. Половников (Киров, ВятГТУ)
Аннотация
В статье рассматриваются основные положения методологии построения управляющих систем на имитационных принципах, которая названа методом автономного адаптивного управления
(ААУ). Из общих для всех нервных систем свойств: дискретности строения и принципа действия, высокой неопределенности начальных знаний и приспособленности аппаратно-программной компоненты к окружающей среде, а также необходимости осуществления управления и обучения в одном процессе выводятся принцип действия и строение управляющей системы. Предлагаются конкретные решения, позволяющие строить практически
действующие управляющие системы, работающие с сравнительно простыми знаниями. Решения описывают способы построения формальных нейронов,
подсистем формирования и распознавания образов, базы знаний, принятия решений и аппарата эмоций. Описаны примеры нескольких практических приложений. Проведено сравнение предлагаемого подхода с альтернативными направлениями систем искусственного интеллекта. Показано, что предлагаемый подход может составить новое направление, которое целесообразно назвать "системы автономного искусственного интеллекта".
1. Введение
Задача моделирования живого мозга всегда вызывала повышенный интерес. Однако осознание чрезвычайной сложности объекта моделирования и выполняемых им функций ставила и продолжает ставить исследователей в тупик. Достаточно сказать, что мозг человека состоит из 1011 нервных клеток, соединенных 1014 связями, что средний размер нейрона менее
0.1 мм, а длина его отростка - аксона может превышать один метр при толщине в несколько микрометров, что один нейрон может быть соединен с сотнями и тысячами
других нейронов при отсутствии какой-либо очевидной регулярности, чтобы представить трудности, которые стоят на пути решения данной задачи. Функции, выполняемые мозгом, также поражают своей сложностью. Задачи, которые решаются нервной системой даже самых простых организмов, например, задача управления движением тела, могут быть воспроизведены в искусственных системах только с использованием таких сложных инструментов, как дифференциальное и интегральное исчисление, методов оптимизации и т. д., а решение их в реальном времени требует применения компьютеров. И уже за пределами понимания лежит тот факт, что этот же мозг одновременно легко решает и такие задачи, как формирование и распознавание образов, обучение и адаптация, генерирование целей и планов их достижения, принятие решений, в том числе на основе прогнозирования альтернативных вариантов и
моделирования ситуаций в коллективе себе подобных посредством языка, а также другие задачи, которые в настоящее время получили лишь частичные и не связанные друг с другом решения.
Можно констатировать следующее: 1) в полной мере принцип действия мозга в настоящее время остается непонятным и не воспроизводится технически, 2) имеющиеся в настоящее время методы решения задач, соответствующих некоторым функциям мозга, не имеют, по всей видимости, ничего общего с тем, как эти задачи решаются мозгом.
Основания для вывода (1) состоят в следующем: а) сегодня еще нельзя
построить устройство, состоящее из 1011 параллельно работающих искусственных нейронов, каждый из которых осуществляет довольно сложную обработку информации; б) в настоящее время не существует убедительной функциональной модели нейрона, а также способов построения нейросетей, решающих задачи,
1 Работа выполнена при поддержке РФФИ грант № 97-01-00137
свойственные мозгу; в) логическая организация мозга не понятна, даже на идейном уровне отсутствует представление о существе таких проявлений мозга, как сознание, эмоции; г) передаваемая посредством генного аппарата информация отражает опыт предыдущих поколений и обеспечивает начальную
приспособленность аппаратной,
программной и информационной компонент мозга и всего организма к условиям его обитания, без которой невозможно решение задач выживания, управления, адаптации, накопления знаний. Вызывает сомнение, что длительный эволюционный отбор на протяжении уникальной истории можно заменить единовременным актом оптимизации системы при ее синтезе. Развитая методика организации эволюционного отбора также отсутствует.
Основания для вывода (2) состоят в следующем. Точные науки и составляющие их объекты являются абстрактными образами, возникшими в человеческом мозге в результате развития его
способностей к прогнозированию и выработке умственных моделей. Эти
модели только отражают некоторые свойства природы и являются не более, чем инструментом, помогающим человеку найти и использовать закономерности природы. В реальной природе не существовало таких объектов, как
дифференциалы, интегралы и т.п. Тем самым, это есть новые объекты в природе, способные дать альтернативное решение некоторым задачам, ранее доступным только природе. Например, цапля обучается балансировать, стоя на одной ноге. Ее мозг решает задачу обучения и управления посредством нервных процессов, происходящих в сети нейронов, с участие органов чувств и мышечного аппарата. Создав математический аппарат, человек получил возможность смоделировать это явление на основе дифференциального исчисления и построить искусственное устройство, способное балансировать на одной опоре. Теперь в природе имеется уже два объекта, способных решать эту сложную задачу балансировки - мозг и искусственное устройство. Но принцип работы у них совершенно разный. В мозге цапли дифференциальные уравнения не решаются ни в процессе управления, ни на этапе обучения. Несмотря на успехи математического моделирования,
возможности построения управляющих систем на этой основе ограничены. Если в
примере с цаплей одновременно потребуется воспроизвести и такие ее способности, как умение летать, решать навигационные задачи в длительных перелетах, общаться в стае, воспитывать
потомство и т.д., то заведомо можно
сказать, что точные науки тут не помогут из-за резкого усложнения математической модели.
Однако в настоящее время в природе появился третий объект, способный
балансировать на одной опоре. Это
устройство, управляемое нейросетью. Нейросеть - это пока еще очень простая модель небольшого фрагмента мозга. Тем самым - это принципиально новое явление в природе - искусственная нервная система. От управляющей системы, построенной на основе классических математических наук, нейросеть отличается тем, что она без переделок может быть обучена и другим задачам, например, управлению полетом, распознаванию речи и т.п.
Очевидно, что задача приближения свойств современных нейросетей к свойствам мозга требует дальнейшего осмысления принципов работы мозга, его структуры как цельной системы, функций отдельных его подсистем и элементов. Этим определяется предмет исследования настоящей работы. Практическая актуальность создания таких систем связана с возрастающим спросом на системы управления для объектов с плохо формализуемыми свойствами, требующими адаптации непосредственно в процессе управления.
В этом направлении получено много теоретических и практических результатов. Успехи прагматического направления исследований по искусственному интеллекту отодвинули в последние два десятилетия на второй план исходную задачу изучения управления в живых организмах, о которой говорил Н. Винер
[1]. Имитационное направление, которому уделяли внимание такие исследователи, как У. Кеннон [2], П. К. Анохин [3], А. А. Ляпунов [4], М. Мессарович [5] и многие другие, всегда являлось источником радикальных идей, которые прагматическое направление доводило в эволюционном порядке до практически полезных реализаций. Обратное возадействие прагматики на имитацию также является плодотворным, поскольку привносит новый математический и технический
инструментарий, позволяющий строить и исследовать математические модели систем.
Отметим также, что, на наш взгляд, в настоящее время после пятидесятилетнего развития в прагматическом направлении формальных моделей нейрона и нейросети, предложенных У. Маккалоком и У. Питтсом в 1943 году [6] и Ф. Розенблаттом в 1953 году [7] (направление получило название "искусственные нейронные сети (ИНН)") наступает необходимость перехода к более адекватным действительности моделям нейрона, нервной системы и мозга. С одной стороны, накопился груз претензий к используемым в ИНН сильно упрощенным моделям нейрона и нейросети, претендующим, в лучшем случае, на простую модель небольшого регулярного участка нервной системы. С другой стороны, складывается впечатление, что в научном сообществе уже наработан и достаточно развит новый идейный, математический и программно-аппаратный инструментарий, который в совокупности может придать решению проблемы имитации новый импульс.
2. Имитационный метод автономного адаптивного управления
Здесь коротко представим основные положения концептуальной модели нервных систем, названной методом “автономного адаптивного управления” (ААУ) [8-21].
Пусть под управляющей системой (УС) понимается моделируемая нервная система, погруженная в организм - объект управления (ОУ), под системой пусть понимается совокупность УС, ОУ и среды.
Примем следующие четыре исходных условия, характерных для нервных систем.
1. "Условие автономности" под которым
будем понимать только то обстоятельство, что УС является подсистемой ОУ, т. е. УС находится на борту ОУ и осуществляет управление на основе знаний, добываемых
самостоятельно, взаимодействуя со своим окружением посредством блока датчиков (БД) и исполняющего органа (ИО). Тем самым УС с ОУ с Среда = Система, УС и БД и ИО = ОУ.
2. "Условие дискретности", которое
отражает дискретность структуры УС (конечное множество нейронов, связей, датчиков, исполнителей) и способов ее функционирования (дискретность
нервных импульсов, образов - как элементов информации, моментов
времени). При этом возможен
непрерывный характер изменения некоторых параметров, таких как размеры синапсов, частотные характеристики импульсных
последовательностей.
3. "Условие максимальной начальной
приспособленности" отражает наличие приспособленности ОУ и УС к усредненным условиям жизни ОУ в данной среде в результате действия механизмов типа естественного отбора, что определяет типы датчиков и исполнителей, классы потенциально возможных в данной системе образов, оценки качества важнейших для ОУ образов, и т.п. При синтезе ОУ и УС процесс естественного отбора, возможно, может быть заменен максимальным использованием
априорной информации.
4. "Условие минимума исходных знаний"
отражает наличие информационных пространств, которые должны быть заполнены знаниями, найденными УС в процессе функционирования в реальной системе. Это условие соответствует наличию максимальной
неопределенности свойств системы, в момент начала функционирования УС.
Целевыми функциями УС должны быть
а) выживание ОУ и б) накопление знаний. Эти две целевые функции взаимосвязаны в том отношении, что достижение одной из них повышает вероятность достижения другой.
Срепа і /
ОЫ \ —и
И ьЛ
т.-Л УС
й Г іЧ ¿У ! \
п',__
/ !к
Рис. 1. Представление о системе Из сказанного вынужденно следует представление о системе (рис.1), в котором можно видеть ОУ, погруженным в среду, УС погруженной в ОУ, а также все возможные маршруты распространения воздействий в системе (помеченные
буквами стрелки на рисунке) [8]. Пусть каждый из этих макрообъектов оказывает воздействия на систему через свой выход, каждый из макрообъектов пусть воспринимает воздействия системы через свой вход. Кроме того, в системе важно наличие источников случайных
воздействий (белые кружки на рисунке -"истоки") и мест поглощения воздействий (черные кружки на рисунке - "стоки").
Очевидно, что для достижения своих целевых функций УС должна найти те из воздействий к, которые образуют цикл "управляемого взаимодействия" к -— ё -— / -— а -— к -— ..., зафиксировать
информационное отображение цикла управляющего воздействия (УВ) в своей памяти - базе знаний (БЗ), оценить полезность тех или иных элементов знаний и использовать эти знания для выживания, одновременно прилагая усилия для получения и накопления новых знаний. Здесь а - это информационный процесс в УС, к - процесс преобразования информационных команд в физические воздействия, ё это различные процессы в окружающей среде, I - процесс преобразования части входных воздействий в информационные входные сигналы для УС. Наличие в системе истоков и стоков вносит в управляемое взаимодействие многочисленные случайные компоненты и приводит к потерям информации. Накапливая знания, УС стремится к уменьшению неопределенности в своем отображении управляемого взаимодействия
[9].
Подобное макроописание позволяет понять задачу, которую должна решать УС. В общем виде можно видеть следующую ее постановку. На заданное множество входных полюсов УС V], V2, ..., V, ,..., У„ (например, это п бинарных выходов БД) поступает входной поток информации. Пусть, например, это будет эквидистантная во времени последовательность двоичных векторов Уа^]), УЪ@2),..., Уо^к),..., У/0, где / - текущий момент времени. Если
последовательность не эквидистантная, то должны быть средства синхронизации потоков данных. Согласно рис. 1,
семантически каждый вектор Уо^к) может содержать информацию, пришедшую ко входу УС по маршрутам /', Ъ и/или р. Здесь /'
- это информация, поступившая с датчиков, Ъ - информация, отражающая действия, совершенные УС, р - это незакономерные помехи от истоков в ОУ (информация от / и Ъ также содержит случайные компоненты). Информация, поступающая по маршрутам /,
Ь и р, может отображаться на определенные подмножества компонент вектора Ус(ґі).
Ш У/с)
51010000110110101001 V, 31010010011110000010 Уг Э1НШ1010110101010
пршоюююю V,
1>Ш110000010100100 300011000!^^®1000 V,.
прообразы
сформированных
образов
Рис. 2. Примеры образов
Первая задача, которую должна и может решать УС, состоит в нахождении неслучайных регулярных пространственновременных комбинаций компонент в потоке входных векторов Уа(1]), УЪ(^,..., У^к),..., Уйф. Произвольные примеры трех таких образов показаны на рис. 2.
Если УС обнаруживает наличие такой регулярности, то УС должна: а)
запомнить информацию о ней как самостоятельный объект - образ [9,10], б) уметь распознавать прообраз этого образа во входной информации (регулярность, которая привела к формированию образа) при его последующих появлениях, в) при накоплении достаточной статистической надежности - уметь распознавать образ соответствующий протяженному во времени прообразу раньше, чем закончится его наблюдение на входных полюсах, а также распознавать при наличии помех, г) оценить соответствие этого образа целевой функции выживания ОУ.
Путь к решению последней задачи мы видим в организации в УС специальной подсистемы, которая эквивалентна аппарату эмоций в живом организме. Это многофункциональная подсистема, основная задача которой - соотносить отвлеченные информационные сигналы, например, сигналы о распознавании образов, отображающих текущие состояния ОУ, с объективной полезностью или опасностью их прообразов для выживания ОУ. Безусловно, такая оценка для важнейших состояний ОУ (температура среды, количество поглощенной пищи и т.п.) может быть найдена опытным путем в эволюционной предыстории предков ОУ, а для искусственных ОУ - выведена из априорной информации. Оценки для образов, которые связаны с конкретными условиями существования данного ОУ, могут быть найдены УС опытным путем
посредством корреляционного анализа фактов распознавания этих образов и значений некоторой текущей интегральной оценки состояния ОУ, которую обозначим $. В свою очередь, текущее значение оценки $ зависит от оценок всех распознанных в текущий момент образов. Формальное описание способов получения таких оценок (фактически - аппарата эмоций) дано в [11]. Здесь обратим внимание на две важных функции аппарата эмоций. Это закрепленное в УС стремление к получению все более высоких оценок Б‘, что является причиной постоянной активности УС, направленной на достижение обеих указанных целевых функций. Кроме того, текущее значение оценки $ определяет целесообразную глубину просмотра базы знаний при принятии решений в текущей ситуации (для быстрого принятии решения в угрожающей ситуации можно не анализировать второстепенные последствия выбираемого действия - образы с меньшими оценками).
Пусть УС сформировала некоторый образ, запомнила его в памяти сформированных образов в виде объекта, который обозначим Ок, и в некоторый момент t распознает его, что обозначим как О\ =] (если сформированный образ Ок не распознан в момент t, то полагаем О1к =0). Пусть, например, прообразом данного образа является некоторый
пространственно-временной процесс
длительностью Т тактов, но УС распознала образ уже через Т’ тактов после его начала tks, и Т < Т. Если семантически прообраз данного образа в векторах Уа^к!), УЪ(^+]),..., Уорь+Т’),---, УА+Т) представлял собой отображение информации, пришедшей на вход УС по маршруту /' (см. рис.1), то это сравнительно простой случай, интересный в основном тем, что УС имеет прогноз, в частности, изменения оценки своего состояния $ к моменту, когда завершится наблюдение всего прообраза.
Одновременно может быть распознано некоторое множество образов. Однако ситуация становится более интересной, если в прообразе распознанного образа имел место хотя бы один вектор Уф, отражающий информацию, пришедшую к УС по маршруту Ъ, т.е. в прообраз входило некоторое действие, совершенное УС (например, это сигнал от рецепторов о том, что была сокращена такая-то мышца в результате соответствующей команды). Обозначим такое действие символом 7/. Тогда прообраз можно разбить на три последовательных во времени
составляющих: 1) информация о ситуации а, И) информация о действии I, ш) информация
о ситуации Ъ. Поскольку, по определению, прообраз сформированного образа - явление не случайное, то данную тройку можно интерпретировать как импликацию "условие
— действие — следствие". Очевидно, что в данной ситуации могло быть распознано два или более образов (рис. 3), имеющих
одинаковое условие (ситуацию а), разные действия (действие т) и, возможно, разные следствия (ситуацию о).
момент принятия распознанные решения образы
/ Т время о
входной вектор
текущий момент
Рис. 3. Несколько образов с одним условием
Итак, если в некоторый момент а) УС одновременно распознает несколько временных образов, при этом б) распознавание наступило раньше окончания наблюдения прообразов, в) в составе прообразов ожидаются альтернативные действия, ведущие к альтернативным последствиям, г) распознанные образы имеют свои оценки, то появляется возможность принятия решения на основании сравнения ожидаемых приращений интегральной оценки качества состояния $ для альтернативных действий
[10,11].
Если будущий результат действия, предвидимый УС в текущий момент, влечет распознавание образов, которые могут быть распознаны по результатам планируемого действия, т.е. причинно-следственная цепочка образов и действий продолжается на несколько шагов в будущее, а УС при этом обладает языковыми средствами для манипулирования с этими образами и действиями из своей базы знаний, то появляются основания говорить об интеллекте [13].
Поскольку происходит формирование новых образов, то возможна ситуация, когда альтернативные действия, приносившие ранее одинаковый конечный результат -распознавание одинаковых образов, начнут
различаться в отношении новых сформированных образов, т.е. - более тонких последствий выбираемого действия. Учет этих различий делает действия УС со временем все более точными, а их последствия - все более предсказуемыми
[9,11]. Это одна из возможностей саморазвития УС.
Рассмотренная интеллектуальная
управляющая система обладает
следующими основными свойствами.
• Поведение УС мотивируется,
определяется, направляется и оценивается аппаратом эмоций, целевая функция которого содержит в себе явно или неявно цели выживания и накопления знаний.
• УС обладает внутренней активностью, направленной на расширение знаний, повышающих вероятность выживания.
• УС обладает свойствами адаптивности и саморазвития. Формируются и оцениваются новые образы, формируются и уточняются новые действия, увеличивается глубина прогнозирования последствий альтернативных вариантов действий и тд.
• Знания УС сильно зависят от ее индивидуального опыта, в том числе от случайных событий, т.е. УС обладает своей индивидуальностью.
3. Проблемы создания систем ААУ и пути их реализации
Как видно из сделанного качественного описания рассматриваемых систем, их реализация сопряжена с необходимостью решения задач, некоторые из которых здесь перечислим.
1. Задача формирования и распознавания образов (ФРО) в потоке входной многоканальной информации [10,11]. В общем случае на вход ОУ поступают непрерывные воздействия различной физической природы (зрительные, звуковые и т. д.). Аппарат ФРО должен в процессе самообучения сформировать множество дискретных образов, соответствующих классам пространственно-временных
регулярностей и далее распознавать такие образы. Распознаваемые образы порождают формирование образов над образами, т.е. образов более высокого порядка. Переход от континуальных величин к дискретным должен происходить уже в БД. В нетривиальных случаях при отсутствии априорного алфавита классов такого рода задача является трудной. В некоторых условиях для построения БД и/или начальных трактов аппарата ФРО возможно
применение персептронов и генетического подхода, либо использование аппарата эмоций в качестве учителя. Напомним, что задача распознавания образов даже таких простых регулярностей как периодические компоненты во временных рядах требует применения сложного математического аппарата анализа временных рядов. Мы полагаем, что поиск неслучайных составляющих во входном многоканальном потоке входных данных должен основываться на аппарате корреляционного анализа, тогда решение о формировании нового образа может приниматься при накоплении достаточных статистических оснований.
Ш
Рис. 4. Основная модель нейрона
В естественных системах аппарат ФРО строится на основе нейронов. Очевидно, что нейрон должен и может накапливать статистику по наблюдаемым входным
векторам, изменять свой способ
функционирования при появлении
достаточных статистических оснований, говорящих о неслучайной природе
прообраза, т.е. формировать образ, и быстро распознавать уже сформированный образ. Нами разработано несколько формальных нейронов с такими свойствами [12,14,15,17,18]. Описание основной модели нейрона (рис. 4) состоит в следующем.
На вход нейрона Пу, в момент ґ поступает двоичный вектор Х = (х1, Хъ ... , Х, ... , хт) и
сигнал . В момент ґ+1 нейрон
у-'ъ Ґ+1 ^ Ґ+1
производит выходные сигналы О^ и
ґл ґ+1
согласно логическим выражениям Ow =
- < * ((ЬІ&О VО I) и Б 2 = ЬІ&
і‘ч,& gtw. Значение сигнала ЬМ1 в точке "Ь" определяется зависимостью ЬМ1 = 1, если к^,/т > = р(Ыґ), и ЬМ1 = 0 в других случаях. Здесь к w есть число таких компонент х і вектора Xґ , которые имеют значение 1 в
момент t; Nt есть число событий btw = 1 в предыстории этого нейрона от t=0 до t; p(N) есть сигмоидальная функция. Последняя определена для значений N = 0, 1, ... , и уменьшается от некоторого значения p(0) =
Р max, Р max < = 100%, д° значения Р(х>) =
Р mm, Р mm < Р max. Кроме P(M) =
PM, Р mm < РМ < Р max , Где M есть
константа. ЗначенИЯ Р max , Pм, Р mm и М задаются для каждого нейрона априори.
Переменная l W показывает состояние элемента l w в момент t и может принимать значения 0 или 1, согласно условию: fw = 0, если Nt < М, и ltw = 1 иначе.
Элемент T подобен триггеру, который переключается сигналом (btw & fw)=1 (см. точку "с" на рис. 4) в состояние, при
w s-'l t+1
котором выходной сигнал Ow становится
равным 1, и сигналом SW = 1
переключается в состояние, при котором
t+1
выходной сигнал O w принимает значение
0. Переменная gW определяется условием:
gtw = 0, если Z t < L, и gtw = 1 иначе, где
t
Z есть число единичных сигналов, наблюдавшихся в точке "с" в течение предыстории. Константы L определены для каждого нейрона.
Векторы Xt , для которых btw = 1, ’’обучают” нейрон (число N увеличивается). Число М для нейрона подобрано так, чтобы N не превысило М за время жизни нейрона,
если такие векторы Xt есть случайные явления. С другой стороны, число N достигнет величины M в случае, если этот вектор есть неслучайное явление в системе (с заданной вероятностью ложной тревоги).
Если событие Nt = М случится с нейроном n w, то мы говорим, что нейрон n w обучен и образ O w сформирован начиная с этого момента t. Необратимый процесс роста N от 0 до М в нейроне n w есть процесс обучения нейрона n w и, тем самым, процесс формирования образа O w. Если образ сформирован, то он не может уже быть "расформирован" (переучивание УС происходит за счет доучивания; память о прежних образах и знаниях сохраняется в обученных нейронах). Сформированный образ может быть распознан в текущий
момент (O^1 =1) или может быть не
распознан (O w =0). Несформированный образ не может быть распознан.
Рис. 5. Модификация модели нейрона
Сигнал О м1 =1 может быть отключен
сигналом =1 только после того, как информация этого сигнала будет использована УС (см. рис 5.).
Итак, эта модель нейрона содержит три необратимо обучаемых элемента, именно К м> , і V, и gw, и один триггерный элемент Тч/. Выходной сигнал нейрона
генерируется на следующем такте после получения входного вектора. Поскольку в общем случае нейрон может быть соединен не со всеми нейронами предыдущего слоя (см. ниже рис. 6), то прообразом образа является пространственно-временная
последовательность сигналов на входе нейросети. Входы данного нейрона могут не иметь весов, в этом случае нейрон различает только единичные векторы с учетом полноты их состава, задаваемой функцией р(Щ. Нейрон обучается под воздействием единичных (с учетом функции р(М)) входных векторов, другими словами, нейрон способен обнаружить коррелирующие единичные сигналы, если они подаются на входы нейрона.
На рис.5 показана модификация данного нейрона, учитывающая синаптические и другие возможные задержки Д- на отдельных синапсах, а также актуальную длительность Ті сигнала, которая может быть связана, например, с шириной и скоростью прохождения волны
деполяризации в месте аксонного холмика, и другими причинами, определяющими характерную длительность импульса, воспринимаемого элементом Км, как единичный сигнал. Будем полагать, что характерная длительность возбуждения, соответствующая единичному выходному сигналу Уі=1 триггерного элемента Т,
поддерживается не дольше, чем в течение времени т. Величины задержек Ді и ті задаются при синтезе УС. Обучаться будет тот нейрон, у которого величины задержек совпадают с характером входного сигнала.
Следующая модификация нейрона связана с моделированием известного факта ускорения роста тех синапсов, по которым приходят коррелирующие входные сигналы [17]. Это позволяет нейрону реагировать не только на единичный вектор, но на любую неслучайную комбинацию единичных входных сигналов.
сигналов от распознанных образов и сигналов оценки $ текущего состояния ОУ
[11]. Поэтому эту задачу также можно решать с помощью сети из указанных нейронов.
Рис. 6. Фрагмент сети
Итак, сеть, собранная из рассмотренных нейронов (небольшой фрагмент сети
показан на рис. 6), способна решать задачу ФРО. При этом априорная информация определяет топологию сети, а
неопределенность требует
соответствующего избытка нейронов. В сети обучатся те нейроны, на которые отображаются пространственно-временные закономерности входного потока информации.
2. Построение базы знаний и аппарата
принятия решений. Поскольку
рассмотренный нейрон фактически обнаруживает коррелирующие сигналы, то на его основе можно построить БЗ, где отдельный нейрон фиксирует
рассмотренную выше тройку "образ условия - образ действия - образ следствия" [9,11,12,14-17,20]. В
элементарном случае БЗ может быть представлена трехмерной матрицей нейронов, измерения и размерности которой соответствуют образам указанной тройки множеств. Принятие решения осуществляется обученными нейронами, что становится возможным при уменьшении порога р(М).
3. Построение аппарата эмоций. Идея определения оценок качества образов также основана на корреляционном анализе
Рис. 7. Схема УС
В целом УС, построенную по методу ААУ, в упрощенном виде можно изобразить схемой, показанной на рис. 7.
Заметим, что предложенная схема допускает весьма простые решения. Так, в указанной тройке множеств "множество образов условия - множество образов действия - множество образов результатов" каждое из распознаваемых множеств может быть представлено, например, всего одним образом [20]. Даже такое простое решение позволяет строить практически полезные приложения [16]. Круг приложений систем ААУ будет расширяться по мере нахождения способов сокращения необходимого избытка нейронов. Пути решения проблемы избытка мы видим в: а) разработке методики задания оптимальной топологии нейронных подсетей УС на основе использования априорной информации об объекте управления, б) использовании генетических алгоритмов для выращивания сетей УС, в) применении известных методов поиска для динамического построения и перестроения сетей УС, а также использовании элементов других технологий.
4. Примеры практических приложений на основе метода ААУ
Рассмотрим теперь несколько примеров построения УС в соответствии с рассмотренным принципом. Следует понимать, что всякое конкретное
приложение обязательно дает возможность
того или иного упрощения общего подхода, в соответствии с наличием априорной информации.
4.1. "Пилот" - адаптивная система стабилизации углового движения автоматического космического аппарата
В связи с усложнением научных экспериментов, проводимых на борту автоматических космических аппаратов (АКА), в связи с использованием АКА в качестве ретрансляторов и т.п. причин, повышаются требования к точности управления угловым положением АКА. Применение метода ААУ для построения управляющей системы может
сопровождаться большей точностью управления, по сравнению с традиционными подходами [16].
Рис. 8. Схема АКА как объекта
управления
На рис. 8 показана схема АКА, как объекта управления. Коротко рассмотрим традиционный способ управления. В некотором приближении полагается, что АКА представляет собой твердое тело (корпус АКА) с закрепленными на нем упругими нелинейными осциллирующими элементами (антенны, солнечные батареи, навесное научное и т.п. оборудование). С корпусом АКА связана система координат хуіО с центром О в центре масс тс. Имеется некоторая заданная система координат ХЇ2О с центром также в центре масс. Требуется, чтобы системы координат хуіО и ХЇ2О были совмещены, в этом будем полагать целевую функцию управления. На АКА могут воздействовать возмущающие моменты различной физической природы: магнитное и
гравитационное поле, утечки газа, солнечный ветер и другие. Возмущающие моменты вызывают рассогласования связанной и заданной систем координат.
Рассогласования регистрируются
посредством датчиков, измеряющих через интервал времени Лt (в рассматриваемом примере Лt=0.] сек) углы отклонения рр) и угловые скорости р() относительно системы координат ху2О. Обнаружив рассогласование по углу и/или по угловой скорости, система управления,
реализованная на бортовой ЦВМ (БЦВМ), обращается к своей памяти, где в табличной форме записан "закон управления", указывающий, какой управляющий момент следует развить приводу, чтобы устранить данное рассогласование. Для воздействия на угловое положение АКА используется так называемая инерционная система управления, состоящая из трех лежащих на осях Ох, Оу и О2 маховиков и пошаговых электродвигателей в качестве привода. Раскручивая соответствующий маховик с некоторым ускорением, можно создать определенной величины управляющий момент Му относительно одной из осей Ох, Оу или О2. Для устранения больших рассогласований могут использоваться и другие более сильные, но менее точные приводы.
"Закон управления" Му^+1) = К(р) кр + рЩ кр) рассчитывается аналитически исходя из так называемой "динамической схемы" - математической модели углового движения АКА, представляющей собой систему нелинейных дифференциальных уравнений второго порядка, описывающих угловое движение корпуса АКА - твердого тела и некоторых основных осцилляторов. Численные значения параметров, закладываемых в математическую модель АКА, рассчитываются по результатам наземных стендовых испытаний АКА и его узлов.
Точность, достижимая при данном способе управления, обусловлена
соответствием математической модели АКА свойствам реального объекта.
Причины несоответствия модели и свойств реального АКА в полете вызваны
следующими основными упрощениями: корпус АКА не есть твердое тело; учитываются не все осциллирующие
элементы; параметры, измеренные в
наземных стендовых испытаниях, не точно соответствуют их значениям в условиях реального полета в космосе, поскольку на стенде трудно воспроизвести невесомость, глубокий вакуум, резкие перепады
температуры; возможны изменения свойств элементов конструкции АКА в течении полета. Указанные причины ограничивают возможную точность управления
некоторыми границами. В рассматриваемом примере традиционная система управления обеспечивает точность по углу +/- 0.1 угловой секунды и по угловой скорости +/-
0.01 угловой секунды в секунду времени.
Применение метода ААУ для управления данным объектом состоит в следующем. Будем использовать УС ААУ только в той области пространства признаков, в которой традиционный способ управления неэффективен - для углов и угловых скоростей в пределах точности традиционного управления. За пределами этого пространства будем использовать обычное управление. Из априорной информации известно, что наблюдаемость и управляемость данного ОУ обеспечиваются при наблюдении за такими параметрами, как угол р) и угловая скорость р'ф= с1р/Л и воздействиях на ОУ с помощью управляющих моментов, не превышающих некоторой заданной величины, | Му | < Мз. В рассматриваемом варианте приложения ограничимся только этим минимальным набором параметров, но заметим, что в управление по методу ААУ может вовлекаться и другая наблюдательная информация. Итак, ограничим
пространство поиска в пространстве признаков - фазовой плоскости (р),р()) -областью заданных значений | р(^ | < р3 и | р() | < р(. (рис. 9). Будем полагать, что при выходе параметров за заданные границы значений управление передается внешней системе управления, устраняющей рассогласование в течение некоторого отрезка времени, по завершении которого параметры рф,р'ф принимают случайные значения, в пределах границ пространства. Такие отрезки времени, когда управление осуществляется не УС ААУ, мы будем исключать из рассмотрения.
Согласно методу ААУ, в БЗ управляющей системы фиксируются закономерные связи между
сформированными образами и выходными воздействиями УС. Поскольку здесь мы ограничиваемся наблюдениями только за cp(t) и cp'(t), а управлять будем посредством Му, то можем сразу отделить в подсистемах ФРО и БЗ те множества образов, действий и их связей, для которых только и могут быть найдены закономерности. Очевидно, что эти простейшие закономерности будут состоять в том, что из некоторого состояния (p(t),p'(t)) под воздействием управляющего момента Муф ОУ может перейти к моменту времени t+1 в состояние, описываемое некоторым множеством значений (p(t+1),p'(t+1)}. Поэтому в блоке ФРО следует задать условия для формирования образов, семантически соответствующих возможным состояниям (p(t),p'(t)) и (p(t+1),p'(t+1)}.
При определении семантики образов удобно использовать некоторые элементы подхода к формализации семантики информации, описанные в работе [22]. Так, в образах можно видеть соответствие понятию "сведение". Согласно [22], на множестве сведений может быть установлено отношение общности, и выделяются более общие сведения и менее общие сведения. В этом смысле образы, соответствующие состоянию
(p(t+1),p'(t+1)} являются более общими сведениями, чем образы, соответствующие состоянию (p(t),p'(t)).
Поскольку УС, как дискретное устройство, обладает конечными множествами элементов памяти, входных и выходных полюсов, то число образов должно быть ограниченным. Введем дискретизацию наблюдаемых значений p(t) и p'(t) по уровню. Разобьем диапазон наблюдаемых значений p(t) на интервалы следующим способом (рис. 9). Диапазон (-рз < p(t) < pp разобьем, например, на N1 равных интервалов, которые пронумеруем номерами р=2,3,..., N1-1. Открытому диапазону p(t) < - рз присвоим номер p =
1. Открытому диапазону p(t) > рз
присвоим номер p = N1. Аналогичным способом разобьем на интервалы диапазон возможных значений p'(t) и пронумеруем интервалы номерами r = 1,2,...,N2. Тем самым поисковое пространство (p(t),p'(t)) разбивается на N = N1 ■ N2
непересекающуюся подобласть. Каждую такую подобласть будем полагать образом Ot , номер i=1,2,...,N которого есть номер
1 1 2 3 4 5 6 nt) 7 8 9 10 11 р ■ it
2 3 : . , ]ti . . . 1 1
4 5 I *TT «.
“71
... 1
7 ... "ТГ" п i 5 • J 1” *(t)
8 \ I 1 \| 1 1 I t 4\
j ! 3
10 2
11 1 1 1
г А £
Рис. 9. Пространство поиска
подобласти и определяется выражением / = N2 х (р - 1) + г. Процедуру формирования этих образов О, ¡=1,2,...,Ы, упраздняем, поскольку эти образы известны априори и здесь нет необходимости в наборе статистики. Процедура распознавания этих образов тоже крайне проста - блок ФРО должен определить координаты г и р и номер I подобласти, покрывающей текущие значения (фф,ф'($). Например, пусть на рисунке 9 в момент t распознан образ О47 (на фазовой плоскости ему соответствует подобласть, помеченная буквой А).
Образы, соответствующие таким более общим сведениям о состоянии ОУ, как множества {ф($,ф'($}, могут быть
определены разными способами. Для нас здесь удобны сведения, описывающие состояния ОУ в связи с целевой функцией. Определим образы множеств {ф($,фЩ} как подмножества различимых УС состояний, имеющих равные оценки качества. Пусть на фазовой плоскости (рис. 9)
концентрические рамки с номерами Е = 1,2,...,Етах будут соответствовать равным оценкам качества состояния ОУ.
Центральная рамка с наибольшим номером Етах совпадает по своему положению в
пространстве признаков с целевой
функцией управления. Присвоим таким
образам очередные порядковые номера О, ¡=N+1, N+2, ..., Ы+Етах (в порядке,
соответствующем Е = 1,2,..., Етах ). При развитии УС можно формировать и другие образы с очередными номерами, семантика которых определяется априорной информацией, либо имеет случайный
характер, если априорная информация отсутствует.
Блок оценивания качества состояний ОУ, идея которого подробно описана в [11], в данном приложении может отрабатывать очень простую функцию, поскольку здесь мы используем только заранее
сформированные образы с заранее известными оценками качества. Пусть оценка качества состояния ОУ, как и оценка качества всякого образа,
определяется номером Е той рамки на фазовой плоскости, которая покрывает образ, описывающий данное состояние ОУ. Так, на рис. 9 образы О47 и О124 имеют одинаковую оценку Е=3.
В блоке формирования БЗ, согласно методу ААУ, определяются и фиксируются закономерные связи между воздействиями, образами и оценками качества. В момент t совокупность распознанных и
нераспознанных образов по условию С({Ор)}) = 1 отделяет раздел БЗ,
содержащий истинные в данных условиях знания, и время Лт принятия решения. Далее УС в отделенном разделе БЗ находит действие Ук, которое, согласно имеющимся знаниям, приведет к наибольшему улучшению состояния ОУ. В
рассматриваемом приложении наиболее простые закономерности, которые могут быть найдены при использовании определенных выше образов, состоят в следующем. Условие С({О())=1 есть (Ор)=1, ¡е (1,2, ...М); раздел БЗ,
соответствующий этому условию, содержит знания в виде У() — (О0+1)=1, ¡е (N+1, N+2,..., N+Emш)), где действие Ук ф состоит из некоторого множества {п} номеров выходных воздействий. Выходное
воздействие с номером п дает приводу команду развить определенный
управляющий момент. Поскольку из состояния, соответствующего образу
(О^+1)=1, ¡е (N+1, N+2,..., ^Етах )), нельзя будет обнаружить дальнейших закономерных переходов, то дальнейших закономерностей искать не будем. Время Лт принятия решения в данном приложении должно соответствовать циклу БЦВМ и быть постоянной величиной (в общем виде Лт находится в функциональной зависимости от оценки состояния ОУ).
К \ і 1 2 N
1 Ею=1 - ЕІЬ=!
2 ЕК=3 Е>Л=6 Еіе=3
Г*т - ЕіГ2 Е»=2
Рис. 10. Информационная структура для представления знаний
В процессе обучения УС должна находить статистически достоверные знания рассмотренного вида, что возможно при анализе предыстории, т.е. при рассмотрении последовательностей вида ((0,(ґ-1)=1) | Ук(Г-1)) -+ (00=1) -+ Е/Ґ) , где і є (1,2,...,Ы), ¡є (N+1, N+2,..., М+Етах)), кє (1,2,...Мт). По мере обнаружения неслучайных последовательностей УС должна представлять их в БЗ. В рассмотренном простом случае подходящей информационной структурой для представления знаний может быть простая таблица (рис. 10). Столбцам таблицы БЗ соответствуют номера і є (1,2,...^) образов 0і(ґ-1), строкам таблицы соответствуют номера кє (1,2,...^т действий У(-1). В клетку (і,к) таблицы БЗ записывается номер ¡є (N+1, N+2,..., ^Етсо) образа (0(і)=1), а
также его оценка качества Е'. В рассматриваемом случае достаточно записывать только оценку Е'.
В процессе принятия решений УС интерпретирует записи БЗ как последовательности вида ((О^)=1)\ук(ф
— (О^+1)=1) — Е^+1) . Распознав образ Ор) с номером ¡, УС выбирает действие с таким номером к, которому соответствует большая ожидаемая оценка Е^+1). При этом УС удовлетворяет требованиям целевой функции, предусматривающей стремление к улучшению состояния ОУ. Если в БЗ имеется несколько альтернативных вариантов (здесь -несколько одинаковых максимальных оценок Е' или отсутствие записей), то УС выбирает один из них случайным способом, чем обеспечивается удовлетворение второй целевой функции, предусматривающей стремление к получению новых знаний. Тем самым, процедура принятия решений содержит и детерминированную и случайную компоненты, как этого требует метод ААУ.
Рис. 11. Управление при трех стадиях наполнения БЗ
По мере накопления знаний в БЗ, качество управления возрастает. Рис. 11
демонстрирует управление при трех стадиях наполнения БЗ. Количественно степень наполнения БЗ можно характеризовать отношением числа заполненных клеток БЗ к общему объему БЗ.
4.2. Прототип адаптивной системы поддержки принятия решений при управлении социальными объектами
В органах социального управления каждое лицо, принимающее решения (ЛИР), или соответствующий орган, по своей сути является системой ААУ. В этом случае, как и в других рассматриваемых случаях, система состоит из УС, исполняющего органа (ИО), среды и блока датчиков (БД). Здесь УС - это ЛИР, БД - это люди и технические средства, подготавливающие данные к виду, который воспринимается ЛПР; ИО - это средства, обеспечивающие реализацию команд, поступающих от ЛПР, например, органы исполнительной власти; среда - это та социальная структура, которой управляет ЛПР. Четких границ между функциями, которые можно относить к ИО, БД и среде, определить невозможно, а в соответствии с методологией ААУ, в этом и нет необходимости. Будем полагать, что УС управляет всей системой, которая объединяет в себе ИО, БД и среду, входы которой есть входы ИО, а выходами являются выходы БД.
Будем рассматривать сравнительно простой случай [16], ориентируясь на следующие нестрогие условия:
• свойства среды плохо известны, но стационарны в некотором смысле;
• акты управления эквидистантны во времени;
• ЛПР способно контролировать не слишком большое число параметров;
• набор возможных решений ЛПР конечен и может быть перенумерован.
Блок датчиков пусть представляет собой систему подготовки данных для ЛПР в виде, например, временного ряда числовых данных х(1) и к(1) (рис. 12). Пусть каждое число х(1) есть агрегированная интегральная рейтинговая оценка, полученная с помощью экспертов и характеризующая состояние тех параметров ОУ, которые интересуют ЛПР. На множестве значений х(1) ЛПР может определить целевую функцию своего управления. Например, пусть ЛПР стремится к уменьшению значений х(1) на рисунке 12. Временной ряд к(1) пусть представляет номера решений
(воздействий), посредством которых управляет ЛПР.
БД
x(t)
Ср*да S ЛПР УС ААУ
ИО r(t+D x(t+l)
Рис. 12. Включение в систему УС ААУ в систему параллельно с ЛПР
Включим УС ААУ в систему
параллельно с ЛПР (рис. 12). В процессе
работы системы УС ведет наблюдение за данными, поступающими с БД, и за решениями, принятыми ЛПР.
В УС на этапе обучения следует отключить аппарат принятия решений, и подавать в УС информацию о решениях, принятых ЛПР. В остальном обучение осуществляется так, будто решения принимаются самой УС. О степени
обученности УС можно судить по
наполнению БЗ, либо по специальным тестам. Когда объем знаний в БЗ достигнет необходимого уровня, можно разрешать УС принимать управляющие решения. В этом режиме УС наблюдает информацию хф, предоставляемую БД, сопоставляет ее с эмпирическими знаниями своей БЗ и принимает решение 1$+1). Однако решение, принятое УС, не передается непосредственно ИО, а поступает к ЛПР, которое принимает окончательное решение у^+1). Информация о решении у^+1) поступает к УС для дальнейшего ее обучения. ЛПР может направить УС запрос q на выдачу объяснений принятому решению.
При разработке прототипа системы, названного системой "Тактик", необходимо было располагать математической моделью объекта управления (объединяющей в себе модели ИО, среды и БД) для отладки системы, быстрого ее обучения, тестирования и исследования свойств. Требования к соответствию такой модели свойствам реального ОУ могут быть самыми простыми - наличие нелинейных функциональных зависимостей выходной информации от входных воздействий при возможной помехе. Это соответствует условию высокой неопределенности исходных знаний о свойствах ОУ и расчетам на оговоренную выше универсальность УС. Пример обучения и управления одной из таких моделей ОУ показан на рис. 13-15. УС наблюдала за имитацией "интегральной рейтинговой оценки" (вторая сверху кривая) и управляла
процессом при помощи управляющих воздействий (третья сверху кривая). Целью управления было - прижать рейтинговую оценку к нулевому уровню значений. Можно видеть, что по мере накопления знаний в БЗ качество управления повышается от рис. 13 к рис. 15. Здесь система "Тактик" работала в полностью автоматическом режиме.
Tact 93
KB Fill -0°о
Рис. 13. Пример обучения и управления одной модели ОУ (1)
Tact 3224
■ ' ’ • —— ———
*
V —
t
КВ Fill- 1.5 °о
Рис. 14. Пример обучения и управления одной модели ОУ (2)
Очевидно, что одна из проблем использования метода ААУ в этом приложении состоит в большом времени, необходимом для накопления знаний, достаточных для качественного
управления, поскольку характерное время цикла управления имеет порядок суток или даже недель. В таких условиях необходимо использовать предварительное обучение БЗ. Предусматривались две возможности предварительного обучения. Первая из них
состоит в обучении по адекватной математической модели данной социальной системы, как ОУ. При этом задача построения такой модели выделяется в отдельную проблему, которую здесь мы рассматривать не будем. Вторая возможность предварительного обучения состоит в использовании архивной информации, описывающей реальный процесс управления данным ОУ, если таковая имеется.
Тае! 130255
КВ КШ = 60 «о Соп1го1 Ьаи
м1№
-
И Ага»" ■
1! !г • ■ ■
Рис. 15. Пример обучения и управления одной модели ОУ (3)
1 4 7 10 13 16 1) 22 25 21 31 34 V 40 43 48 4) (2 8$ $1 (1 (4 87 19 73 Т( 7» 12 К 81 91
Рцд 1 ■ воздействия. рекомендованные системой 'Тактик"
Ряд 2 - негативная компонента архивных данных Рад 3 - позитивная компонента архивных данных
Рис. 16. Предварительные результаты работы системы "Тактик"
Проверка возможностей обучения УС ААУ по архивным выборкам данных показала применимость такого подхода. На рис. 16 представлены предварительные
результаты работы системы "Тактик" на обучающей выборке реальных данных. Верхний график есть управляемый процесс, качество состояния оценивается тем выше, чем меньше значения величин. Нижний график отражает управляющие
воздействия. Система "Тактик" несколько раз просматривала эти данные объемом 90
точек, после чего эта же выборка предъявлялась в качестве реальной ситуации. Анализируя процесс, УС выдавала рекомендации по управляющим воздействиям, показанные квадратиками. Однако очевидно, что УС не могла влиять на архивный процесс, а о качестве управления можно судить, сравнивая решения, принятые УС, с зафиксированными в архиве решениями, реально принятыми ЛПР. Можно видеть, что в данном примере в 37% случаев решения, принятые системой "Тактик", совпадают с реальными решениями ЛПР, в 15% случаев решения близки, а в 19% случаев система "Тактик" приняла решения, представляющиеся более правильными. Например, в начале выборки, когда управляемый процесс ухудшался, УС рекомендовала более активные действия, чем те, которые принимало ЛПР, и которые не смогли быстро остановить ухудшение процесса. Или в нескольких случаях, когда управляемый процесс улучшался, УС принимала решения не совершать
управляющих воздействий, что могло бы привести к экономии средств на реализацию управляющих воздействий по сравнению с реальными затратами,
имевшими место.
Таким образом, предварительное
обучение УС представляется возможным несколькими способами и целесообразным. При этом предварительные знания могут пополняться и уточняться при последующем управлении в реальном времени.
Необходимо также пояснить отличия метода ААУ от известных нейросетевых подходов. Как было сказано выше, современные нейросетевые системы предназначены в основном для решения задачи обучения распознаванию. В этом качестве они могут использоваться для управления, если заранее известно, какие действия следует предпринимать при распознавании того или иного образа (в случае ААУ такая информация может отсутствовать), либо если требуется решить задачу прогнозирования (система ААУ решает задачу прогнозирования как одну из своих подзадач, идя дальше, и предлагая управляющие решения). На рис. 17 на примере той же выборки данных показано, как применяется обычная нейросетевая программа. После многократного просмотра выборки, нейросетевая программа просматривает выборку в режиме предсказания, и в случае, когда она распознает ситуацию, выдает свой прогноз
управляемого процесса (показано квадратиками на рис. 17). Таким образом, обычная нейросеть прогнозирует, каким будет значение управляемого процесса в текущих условиях и при совершенном управляющем воздействии. Напротив, УС в методе ААУ в этой же ситуации идет дальше и сразу указывает лучший вариант управляющего воздействия (рис. 16).
1 4 7 10 « 16 1» 22 28 20 31 34 37 40 43 4« 4» $2 К 5Є 61 64 67 70 73 76 70 02 0$ 01 »1
Рад 1 - результат прогнозирования нейросетевой программы Рад 2 - негативная компонента архивных данных Рад 3 • позитивная компонента архивных данных
Рис. 17. Применение обычной нейросетевой программы
Как можно видеть, в этом приложении УС ААУ работает не в обычном для нее автоматическом режиме, а в режиме полуавтоматическом, выполняя роль экспертной системы. При этом, в отличие от экспертной системы, УС ААУ работает на своего рода "рефлекторном уровне", набирая статистику по прецедентам пространственно-временных вариаций наблюдаемой информации и их связям с выходными воздействиями, не вдаваясь в содержательный смысл найденных закономерностей.
4.3. Использование метода ААУ для управления финансовыми операциями
Рассмотренный выше прототип системы поддержки принятия решений "Тактик" может быть использован и для поддержки принятия решений в экономической сфере.
Пусть ОУ есть некоторая рыночная
система. ЛПР отслеживает интересующий его параметр и пытается обнаружить закономерности его временного хода. В зависимости от результатов своего
прогнозирования развития ситуации ЛПР принимает очередное решение, например, о купле или продаже ценных бумаг. От предыдущего случая данная система может отличаться тем, что воздействия ЛПР не в состоянии повлиять на ОУ в силу относительной слабости такого
воздействия. В этом случае воздействие ЛПР влияет только на его собственную
прибыль и зависит от того, угадало ЛПР тенденцию поведения ОУ или не угадало. Тем не менее, метод ААУ может использоваться и в таком приложении, при этом основная нагрузка ложится на подсистему ФРО и ее способности отыскивать закономерности, в том числе в процессе их агрегирования, а также на свойства ААУ адаптироваться к изменениям свойств ОУ, что характерно для таких объектов, как финансовые системы.
4.4. Адаптивное управление активной подвеской
Если подвеска технического устройства (например, транспортного средства) обладает активными элементами, позволяющими воздействовать на вертикальное перемещение к корпуса устройства, то появляется возможность стабилизации положения корпуса. Однако точно формализовать реакцию данного технического устройства на управляющее воздействие активных элементов подвески заранее крайне трудно, поскольку эта реакция будет зависеть от многих индивидуальных особенностей. Например, для транспортного средства это: состояние амортизаторов, характер груза и его распределение в корпусе, характер дорожного покрытия, погодные условия и т.п. УС ”Пилот” может обеспечить адаптацию к текущим условиям, характеру и распределению нагрузки, состоянию амортизаторов. В результате адаптации реакция Мс активной подвески на возмущения Ма будет оптимальной и качество стабилизации увеличится (сплошная кривая к на рис. 18).
Рис. 18. Увеличение качества
стабилизации
4.5. Обрабатывающие станки
4.5.1 Прокат фольги
Вращающиеся валки прокатного стана имеют собственные частоты поперечных колебаний, возникающих при изменении
прилагаемых к валкам усилий (рис. 19а). Включение УС ААУ в контур управления валками позволит УС адаптироваться к колебательным характеристикам валков и управлять с учетом выявленных свойств, что позволит нейтрализовать колебания валков и улучшить качество проката (рис. 19б).
Рис. 19. Включение УС ААУ в контур управления валками
4.5.2 Токарная обработка
При подводе резца к обрабатываемой на токарном станке детали возникают биения детали с собственной частотой,
характерной для данной детали. В результате этого эффекта снижается качество обработки поверхности детали (рис. 20а). Включение УС ААУ в контур управления резцом позволит УС адаптироваться к колебательным свойствам обрабатываемой детали и управлять усилиями на резец так, чтобы уменьшить биения детали и улучшить качество обработки (рис. 20б).
Рис. 20. Улучшение качества токарной обработки
4.5.3 Стабилизация тока и напряжения источников энергии
Каждая конкретная совокупность потребителей электроэнергии имеет свои динамические характеристики,
определяющие их реакции на перепады тока и напряжения в сети. УС ААУ, введенная в состав системы управления источником энергии (блоки питания радиоаппаратуры, энергетические
установки, электростанции и т.п.), может адаптироваться к свойствам потребителей и стабилизировать параметры электроэнергии в соответствии с найденными свойствами.
Результатом использования УС ААУ будет являться большая стабильность параметров электроэнергии.
4.5.4 Стабилизация параметров энергосистем
Предприятия, потребляющие тепловую и электроэнергию, и управляющие ее распределением по своим потребителям, заинтересованы в снижении убытков, возникающих в связи с неоптимальным распределением энергии. На основе УС ААУ может быть построена система управления, которая уменьшит эти убытки за счет адаптации к свойствам потребителей.
5. Сравнительный анализ метода автономного адаптивного управления и альтернативных подходов
Приведенное выше краткое описание метода ААУ позволяет определить круг альтернативных подходов, с которыми следует сравнить предлагаемый метод. Однако прежде выскажем несколько общих положений.
• Всякий подход имеет свою историю, он
был задуман с некоторой определенной целью, нашел удачное практическое применение в некотором определенном направлении, имел какие-то более или менее продвинутые и удачные варианты и модификации, приспосабливающие его для решения других задач. Очень часто исходные идеи, содержание
теоретической проработки, круг
наиболее широко используемых
реализаций и инновационные
модификации существенно различны. Поэтому при сравнении методов надо иметь в виду все эти аспекты.
• Все подходы, которые будут упомянуты ниже, некогда имели свое начало в задаче имитации живого мозга. Затем эти подходы сильно разошлись под влиянием их успехов в соответствующих им практических приложениях, более того, каждое из них породило свой спектр вариантов направлений. Сегодня это расхождение достигло таких степеней, что часто абсолютно утрачено общее понимание постановок задач, методов решения, языков формального описания, критериев оценки получаемых результатов и понимание перспектив. Однако нам представляется, что в множестве спектров направлений, на которые распался каждый из подходов, возможно пересечение, связанное с
возвращением к исходной задаче имитации живого мозга. Те
исследователи из разных направлений, которые озадачатся целью понять и смоделировать принцип действия мозга, в отдаленной перспективе придут хотя и своими путями, но к схожим решениям, поскольку имеют в виду один и тот же объект моделирования - мозг. В настоящее же время такие тенденции можно только с большим трудом угадывать.
• Развивая свой подход ААУ, мы не стремились изобрести новый способ управления, но шли от попыток понять способ управления, существующий в природе. Главным критерием в теоретическом осмыслении для нас являлось соответствие биологическим оригиналам, тем их свойствам, которые понимались нами, как наиболее важные. Естественно, что в практических приложениях приходится часто опираться на прагматические решения, при этом при необходимости мы упрощали идеи метода ААУ, но не меняли их на другие искусственные подходы, не соответствующие методу.
5.1. Метод ААУ и нейросети
Одним из возможных способов реализации управляющей системы, построенной в соответствии с методологией ААУ, является нейросетевая реализация на основе специально разработанных для данной системы нейроноподобных элементов и сетей. Тем самым появляются основания для анализа системы ААУ с позиций теории искусственных нейросетей (ИНС).
В своем традиционном виде ИНС были задуманы для решения задачи обучения распознаванию с учителем. С этой целью они и используются в настоящее время наиболее широко. Назначение же системы ААУ - автономное (без учителя) адаптивное управление. Задача обучения распознаванию является только одной из подзадач управляющей системы ААУ. В последнее время в теории ИНС говорят о необходимости перехода ИНС к "управляющей парадигме", что, собственно, и реализовано в методе ААУ, если ее построить на нейросетях.
ИНС можно использовать тогда, когда имеется обучающая выборка, состоящая из двух множеств, одно из которых содержит векторы входных данных, а другое -соответствующие векторы выходных данных. Если ИНС использовать как управляющую систему, то входные векторы
можно интерпретировать как образы ситуаций, а выходные векторы можно интерпретировать как коды действий, которые необходимо совершать при распознавании соответствующих ситуаций. Соответствие входов (образов ситуаций) и выходов (действий) для обучающей выборки должно быть известно заранее. Кроме того, над собственно нейросетью должно иметь место внешнее устройство, настраивающее веса соединений нейронов. Систему ААУ можно использовать для управления в случаях, когда а) закономерности во входной информации (образы ситуаций) заранее неизвестны и их следует найти, б) даже если образы будут обнаружены, то неизвестно, какие действия следует совершать при их распознавании, в) в управляющей системе имеется аппарат оценивания качества состояний объекта управления и целевые функции. Например, если для некоторого робота заранее известно, какие действия следует совершать при наблюдении определенных классов ситуаций, то ИНС можно обучить давать команду на выполнение этих действий при распознавании класса ситуации. Систему ААУ целесообразно применять, когда заранее неизвестны ни классы ситуаций, ни оптимальные способы поведения при их наблюдении. Система ААУ могла бы делать бы следующее: самостоятельно
формировать классы (образы) наблюдаемых ситуаций, оценивать степень качества (опасности, полезности) этих образов, находить адекватные способы воздействия на прообразы этих образов, находить оптимальные способы реагирования на распознаваемые ситуации и все это осуществлять в режиме реального управления. Поскольку качество управления в системе ААУ повышается по мере накопления ею знаний, то возможно достижение состояний, когда будет получено более высокое качество управления, чем то, которое было зафиксировано в обучающей выборке для ИНС.
ИНС представляют собой, как правило, регулярные однородные сети с полносвязными соединениями нейронов соседних слоев. Управляющая система ААУ состоит из нескольких подсетей с разным функциональным назначением и различным характером связей. При этом отдельный нейрон может быть связан с нейронами из разных слоев. В методе ААУ отдельный нейрон связан с отдельным образом, в ИНС - нет.
Формальные нейроны в методе ААУ существенно отличаются от формальных нейронов в ИНС. Нейрон в методе ААУ более сложен функционально. Он автоматически накапливает статистику в нескольких своих узлах и меняет свое функционирование при обнаружении определенных закономерностей. В нейронах ИНС этого нет. Нейрон ААУ имеет и учитывает временные задержки, что принципиально важно для обнаружения причинно-следственных связей в системе. Нейроны и сети ИНС непосредственных временных задержек не имеют.
Роль "учителя" в методе ААУ играет аппарат эмоций - важная
многофункциональная подсистема,
обеспечивающая внутреннюю активность, целеполагание, оценку качества состояний системы и объектов знаний, которая работает параллельно с основным контуром обработки внешней входной информации. В теории ИНС только появляются предложения о введении в сеть дополнительной подсети, обеспечивающей целеполагание.
Видимо, наиболее близким аналогом системы ААУ в области ИНС являются сети Хопфилда [23], имеющие обратные связи. Однако даже обученная сеть Хопфилда способна только реагировать на предъявленную ситуацию, в то время как система ААУ имеет внутреннюю активность, заставляющую ее даже в благоприятных условиях совершать некоторые действия, направленные на поиск новых знаний. Это принципиально иной способ поведения.
Преимущество ИНС перед
распознающей нейросетью системы ААУ состоит в удобстве перехода от континуальных величин к дискретным. Поэтому ИНС можно использовать, например, в роли блока датчиков для системы ААУ, а, возможно, и в других подсистемах.
Сближение подходов ИНС и ААУ будет происходить по мере внесения в ИНС как минимум следующих положений: 1)
переход к "управляющей парадигме"; 2) дополнения ИНС, как распознающего блока, другими блоками, выполняющими получение и представление знаний, моделирование эмоций, принятие решений, т.е. блоками, в совокупности образующими автономную адаптивную управляющую систему; 3) переход от обучения с учителем к самообучению; 4) уход от однородности и полносвязности сети; 5) внесение
временного параметра в работу нейросетей;
6) переход к формальным нейронам, более адекватным биологическим нервным клеткам в отношении их способности к автоматической самонастройке. Со стороны системы ААУ сближение возможно при развитии в методе ААУ подходов к работе с континуальными параметрами, описывающими границы классов. Это может быть введение непрерывных весов в состав формальных нейронов ААУ, либо использование традиционных ИНС для реализации различных подсистем системы ААУ.
5.2. Метод ААУ и экспертные системы
При описании структуры управляющей системы ААУ, в ней при желании можно выделить отдельно систему, которую можно назвать базой знаний (БЗ). К БЗ можно отнести совокупность нейронов, сформировавших такие образы, в прообразы которых входила информация о действиях, совершенных самой
управляющей системой (см. разд. 2), т.е. прообразы, которые можно
интерпретировать как импликацию "условие ^ действие ^ следствие". Не все множество нейронов в управляющей системе обладает такими свойствами (отметим, что в мозге локализовать такую отдельную подсистему не удается, она является распределенной). Если при анализе системы ААУ все-таки выделить БЗ как отдельную подсистему, то можно говорить, что система ААУ есть система автоматического получения, накопления и использования знаний в реальном времени управления. Тем самым появляются основания для сравнения системы ААУ с экспертными системами (ЭС) [24].
Различия удобно объяснить при сравнении данных направлений и систем по их целям, назначению, содержанию используемых в системе знаний, степени автоматизации и способам реализации.
Целью, стоящей перед разработчиками ЭС, является, по определению, создание прикладных интеллектуальных систем, предназначенных для оказания
консультационной помощи специалистам, работающим в некоторых предметных областях. Целью методологии ААУ является построение концептуальной модели нервной системы и мозга, что относится к разряду фундаментальных проблем.
С точки зрения назначения систем, ЭС предназначена для представления в ЭВМ знаний, накопленных человеком-экспертом, для дальнейшего их тиражирования и
использования в режиме поддержки принятия решений другими специалистами в данной предметной области.
Если знания, накопленные в мозге человека, ранжировать по их сложности, комплексности, абстрактности, то ЭС, по их первоначальному определению,
предназначены для работы с вербализованными посредством
человеческого языка знаниями из области высокоинтеллектуальной профессиональной деятельности человека-специалиста. В свою очередь, система ААУ оперирует с диапазоном знаний, начинающимся от элементарной информации, поступающей в двоичном виде от датчиков-рецепторов, и рассматривает процесс ее последующего агрегирования и усложнения.
Диапазон знаний, обрабатываемых системой ААУ, может расширяться до пересечения с диапазоном знаний, обрабатываемых ЭС, при соответствующем количественном расширении УС ААУ и использовании указанных возможностей формирования языка, вербализующего элементы знания. Система ААУ работает на своего рода "рефлекторном уровне", набирая статистику по прецедентам пространственно-временных вариаций наблюдаемой информации и их связям с выходными воздействиями, не вдаваясь в содержательный смысл найденных закономерностей, а только оценивая их влияние на целевую функцию. Видимо, здесь уместна аналогия с ситуацией в нервной системе ребенка, когда он, например, осваивает езду на велосипеде, находя закономерные связи
пространственно-временных образов,
оценивая их качество, и запоминая полученные знания в своей памяти, затем использует их для управления.
Применение ЭС в диапазоне знаний, соответствующих процессам на уровне рецепторов и нейронов нервных систем, вряд ли целесообразно, так как выходит из сферы предназначения ЭС по их определению и неэффективно по реализации.
С точки зрения уровня автоматизации систем, система ААУ по своей идее полностью автоматическая автономная система, работающая без участия человека и реализующая в реальном времени процесс обучения и управления. ЭС по своей идее -средство автоматизации представления знаний, накопленных человеком-экспертом, и использования этих знаний человеком в режиме консультирования.
С точки зрения способов реализации, наиболее органичным для системы ААУ способом является нейросетевой подход в его аппаратном воплощении, наиболее адекватном строению естественных нервных систем. Подходы к реализации ЭС по способам "представления знаний" и "рассуждений" ориентированы на программные реализации.
Общие черты в системе ААУ и ЭС можно увидеть в наличии в составе обеих систем блоков распознавания образов, представления знаний, принятия решений, что характерно для многих автоматических или полуавтоматических управляющих систем и интеллектуальных систем.
Сближение подходов ЭС и ААУ будет происходить по мере появления в ЭС следующих свойств: способности работать в автоматическом режиме и в режиме реального времени, ориентации на работу с элементарной сенсорной информацией, переходу к автономным способам использования, что, вообще говоря, входит в противоречие с исходным назначением ЭС. Системы ААУ могут приближаться к свойствам ЭС, если разрушить их автоматический принцип действия и перевести на полуавтоматический режим работы в качестве системы поддержки принятия решений.
5.3. Метод ААУ и системы нечеткой логики
В последнее время широкое развитие получают управляющие системы на основе нечеткой логики (fuzzy logic), т.е. логики, в которой используются нечеткие квантификаторы. Системы принятия решений на этой основе используют рассуждения (т.е. способы получения заключений или новых знаний) с подобными квантификаторами с помощью специальных приемов. Системы с использованием нечеткой логики были специально разработаны для решения плохо определенных задач и задач с использованием неполной и недостоверной информации. Обоснованием такого подхода является подмеченное свойство мозга, состоящее в том, что человек в процессе принятия решений почти всегда пользуется именно неполной и недостоверной информацией. Это свойство мозга заключено, по-видимому, в свойствах самих нейронов и их сети. Обученный нейрон способен противостоять помехе во входном векторе и, тем самым, пользуется неполной и недостоверной входной информацией для принятия решения о генерации выходного сигнала - спайка.
Аналогами нечетких квантификаторов, по всей видимости, являются размеры синапсов, пропорциональные частоте использования данного входного сигнала, и косвенно отражающие его достоверность. В формальных нейронах в методе ААУ (см. часть 1) используется порог, определяющий полноту входного вектора, достаточную для его восприятия нейроном (этот порог уменьшается с накоплением статистики по данному сигналу). По сути, наличие этого порога приводит к тому, что сеть таких нейронов в системе ААУ работает в режиме определенной нечеткой логики.
Таким образом, те свойства нервных систем, которые явились объектом моделирования в системах нечеткой логики, присутствуют в сетях нейронов системы ААУ. Безусловно, наработки теории нечеткой логики могут быть использованы в системе ААУ в отдельных ее подсистемах, особенно при создании приложений.
Заметим, что как и в случае ИНС, системы нечеткой логики выделяют и эксплуатируют только одно из свойств мозга. Целью методологии ААУ является построение концептуальной модели нервной системы как целого.
Заключая данный раздел, необходимо отметить следующее. Как было показано выше, всякая управляющая система находится в цикле управляемого
взаимодействия с объектом управления и средой (см. рис.7). Управляющая система, которая претендует на имитацию мозга, должна состоять из определенных
подсистем - аппарата формирования и распознавания образов, базы знаний,
аппарата эмоций, аппарата принятия решений, которые принадлежат названному циклу прохождения информации. Очевидно, что в разных приложениях в зависимости от условий имеются возможности сильного упрощения отдельных подсистем такой полной управляющей системы или их замены "заглушками", при этом сам цикл управляемого взаимодействия может сохраняться. Соответственно, центральная задача о построении автономной адаптивной системы управления в общем виде существенно изменяется и возникают частные постановки задач и планы их решений.
1. Если априори достоверно известно, как следует управлять в той или иной ситуации, а вся проблема состоит только в правильном распознавании ситуации,
то УС можно построить на основе системы распознавания, разработка которой и потребует основных усилий. Роль остальных подсистем в УС (рис. 7) становится элементарной. Здесь для построения УС потребуются знания
теории распознавания образов. Если при этом задача распознавания плохо формализуется, но имеется обучающая выборка, то можно использовать нейросети. Бытует соответствующее
мнение, что вся проблема управления может быть сведена к проблеме распознавания.
2. Если для управления требуется только
использовать удобным образом представленные знания, накопленные ранее, а все остальные подзадачи решены и данные определены, то в составе УС на первое место выдвигается база
знаний, а остальные подсистемы вырождаются. Проблема сводится к способам представления знаний,
автоматизации вывода новых знаний из уже имеющихся, интерпретации
полученных выводов и т.д. В этом случае УС можно построить на основе экспертной системы с соответствующим упором на решение проблем получения, представления и использования знаний.
3. Если ни задача распознавания, ни задача
получения и представления знаний в управляющей системе не актуальны, т.е. все данные и решения для этих блоков УС определены, а проблема состоит только в принятии оптимальных
решений на основе текущей информации и имеющихся знаний, то проблема построения УС превращается в задачу выбора и принятия решений с
применением соответствующих
подходов. В частности, при чрезмерной сложности строгих процедур принятия решений, возможно применение робастных подходов или систем нечеткой логики. Если зависимости не слишком сложны, но вид их известен, а надо только найти подходящие значения параметров, используются параметрические подходы к построению адаптивных
систем управления, возможны и непараметрические случаи для зависимостей произвольного вида.
4. Если известны все данные и все
возможные решения для всех подсистем УС, заданы некоторые критерии,
определяющие требования к УС и ее качество, и ставится задача добиться наибольшего качества работы системы, то появляется необходимость в
применении методов оптимизации
системы.
Заметим, что названные здесь отдельные задачи к настоящему времени очень глубоко осмыслены и имеют свои решения. На основе этих решений строятся очень эффективные системы. Некоторые из предложенных решений не имеют никакого отношения к моделированию мозга и нервных систем, некоторые имеют, но относятся к так называемому "программнопрагматическому направлению",
моделирующему только конечный результат (например, распознающие системы, экспертные системы, системы нечеткой логики), некоторые относятся к "имитационному" направлению,
моделирующему и результат и принцип решения (например, нейросети). Однако даже системы, моделирующие деятельность мозга, вычленяют только какое-то одно его частное свойство, хотя моделирование этого свойства может оказаться настолько полезным, что на его основе удается строить действующие технические
системы, эффективно решающие
некоторый соответствующий им класс задач. Можно утверждать, что для любого подхода такого рода всегда найдется приложение, в котором этот подход даст оптимальное решение. Сравнение таких решений даже с решениями мозга человека часто оказывается не в пользу последнего. Например, автопилот способен
пилотировать самолет более качественно, чем летчик, но только в отдельных
режимах. Система принятия решений может лучше человека играть в шахматы, но решать только эту задачу. Экспертная система может обладать знаниями в некоторой предметной области, которые превосходят знания любого специалиста. Система логического вывода может лучше человека доказывать теоремы. Но каждая из таких систем по принципу действия, а также по своим функциям не соответствует мозгу как таковому. Вопрос о моделировании мозга остается открытым. Целью методологии ААУ является построение именно концептуальной модели нервной системы.
В каждом из этих частных решений, подменяющих задачу построения автономной адаптивной системы управления в общем виде задачей построения только одной из ее подсистем, присутствуют определенные исходные данные, заслоняющие и подменяющие собой все другие подсистемы. Теперь
представим ситуацию, когда не определены или плохо определены данные для всех подсистем УС. Например, УС "видит" входные данные, но не видит в них никаких закономерностей, а если какие-то закономерности обнаружила, то не понимает, хорошо это для нее или плохо, не видит разницы между вариантами действий, выполнение которых она может инициировать, не видит связи между своими действиями и поступающей на вход информацией, а если видит, то не умеет использовать, а если умеет, то не понимает с какой целью, а если понимает, то не всегда успевает, и т. д. (читатель может проанализировать свой собственный опыт, когда он оказывался в незнакомых условиях, что типично для всех биологических систем). Анализ именно этой ситуации, а также поиск решений и есть предмет исследования методологии ААУ. По видимому, эта задача комплексного построения системы, работающей в названных условиях, отличается от задач, перечисленных выше в пунктах 1-4 и не сводится к ним. Как минимум, речь идет о поиске взаимосогласованного решения всего комплекса названных задач. Отсюда можно сделать вывод, что вопрос о сравнении системы ААУ и перечисленных выше "альтернативных" систем аналогичен попытке сравнить некоторую цельную систему, собранную из подсистем, с каждой из таких подсистем взятых отдельно.
В завершение необходимо сказать, что при постановке задачи построения системы автономного адаптивного управления в общем виде имеется проблема философского плана. Нужны ли такие управляющие системы, где может понадобиться искусственная нервная система? В научно-техническом развитии набрана большая инерция разработки и использования именно частных случаев управляющих систем. От автоматических устройств требуется только быть точными исполнителями строго определенных заданий. Нужна ли кому-нибудь
саморазвивающаяся, имеющая собственное целеполагание и внутреннюю активность, совершающая пробные поисковые движения, обладающая собственными эмоциями, зависящая от случайностей в своей предыстории управляющая система? Чтобы оценить возможности практического использования искомой совершенной модели какой-либо нервной системы в случае ее создания (например, нервной системы мыши), достаточно представить
себе возможности практического использования оригинала - живой мыши. Поиск сферы практического использования таких систем в их полном виде нетривиален.
Системы, обладающие свойствами рассмотренных систем ААУ, не
соответствуют общепринятому пониманию и назначению систем искусственного интеллекта (ИИ), к которым сегодня относят экспертные системы,
распознающие системы, нейросети,
лингвистические процессоры и
робототехнику. Поэтому предлагается
выделить системы с подобными свойствами в отдельное направление "Системы автономного искусственного интеллекта" (АИИ) [13]. Если основное назначение систем ИИ - быть исполнителями заданий, поступивших извне от пользователя, то назначение систем АИИ - выживать и накапливать знания, подчиняясь более свободному от внешних управляющих
воздействий внутреннему целеполаганию. Помимо теоретического интереса, прагматическое значение систем АИИ, имитирующих естественные организмы, может состоять в их способности к выживанию, работе и накоплению знаний в плохо формализуемых условиях,
требующих адаптации и саморазвития.
6. Заключение
В настоящей работе был с минимальным математическим формализмом изложен
возможный подход к решению фундаментальной проблемы построения имитационной модели нервной системы, названный методологией автономного
адаптивного управления (ААУ).
Прагматическое значение рассмотренного подхода состоит в том, что он позволяет строить действующие, хотя и со сравнительно небольшим пока числом (—104-105) образов, но практически
полезные быстродействующие адаптивные управляющие системы, пригодные для управления объектами, плохо
поддающимися формализации. Приведены примеры простых прототипов практических приложений систем. Показано, что по мере увеличения возможного числа
эмулируемых нейронов, а также по мере решения проблем перехода от континуальных величин к дискретным, "интеллект" системы ААУ может существенно возрастать. Проведен сравнительный анализ систем ААУ с альтернативными подходами к построению управляющих систем. Утверждается, что
системы ААУ могут составить самостоятельное направление "системы автономного искусственного интеллекта (АИИ)", имеющее свое назначение и сферу применения.
6.1 Направления дальнейших исследований
Дальнейшее развитие метода ААУ планируется вести по следующим трем основным направлениям: имитационному, прагматическому и прикладному.
1. В имитационном (бионическом)
направлении предполагается: а)
развитие общей структуры управляющей системы и структуры ее подсистем; б) развитие возможностей преобразования континуальных параметров в дискретные с помощью нейроноподобных
подсистем; в) развитие формальных нейронов с целью приближения их свойств к свойствам биологических нейронов.
2. В прагматическом направлении
предполагается: а) исследование
представляемости функций с помощью нейроноподобных сетей из описанных формальных нейронов. В частности, представляемость пространственновременных прообразов нейросетевой подсистемой формирования и распознавания образов (ФРО) и представляемость знаний нейросетевой базой знаний (БЗ) управляющей системы ААУ; б) разработка методики построения управляющей системы ААУ на основе априорной информации об объекте управления. В частности, выработка точных правил определения топологии и параметров нейросетей, образующих управляющую систему.
3. В прикладном направлении
предполагается разработка практических приложений в различных отраслях и разработка методики создания систем.
В разработке отдельных вопросов и приложений метода ААУ принимали участие С.В. Яговкин, В.Н. Полунин, А.Н. Винокуров, А.В. Рядовиков.
Литература
1. Винер Н. Кибернетика, пер. с англ., 2 изд.
М., 1968.
2. Cannon, W.B. Bodily Changes in Pain, Hunger, Fear and Rage.// Appleon-Century, 1929.
3. Анохин П.К. Теория функциональной системы. Тр. международного симпозиума по техническим и биологическим проблемам управления (Ереван, 24-28 сент.1968 г.). Общие вопросы
физиологических механизмов. Анализ и моделирование биологических систем// М.: Наука, 1970.
4. Ляпунов А.А., Беликова М.А. О кибернетических вопросах биологии. - В кн.: О некоторых вопросах кодирования и передачи информации в управляющих системах живой природы// Новосибирск, 1971.
5. Mesarovic M.D. Conceptual basic for a mathematical theory of general systems// Kybernetes, 1, 1972.
6. McCulloch W.S., Pitts W. A logical calculus of the ideas immanent in nervous activity// Bull. Math. Biophys. 1943, 5. [Русс. пер.:
Маккалок У., Питтс У. Логическое исчисление идей, относящееся к нервной активности. - В сб. Автоматы.-М.: ИЛ,
1956.]
7. Розенблат Ф. Принципы нейродинамики//
М.: Мир, 1965.
8. Жданов А.А. О подходе к моделированию управляемых объектов. Пpепpинт ВЦ РАН СССР, М., 1991.
9. Zhdanov A.A.. Application of Pattern Recognition Procedure to the Acquisition and Use of Data in Control.// Pattern Recognition and Image Analisis vol.2, N2,1992. (ISSN: 1054-6618).
10. Zhdanov A.A.. A principle of Pattern Formation and Recognition.// Pattern Recognition and Image Analisis vol.2, N3,1992. (ISSN: 10546618).
11. Жданов А. А. Об одном имитационном подходе к адаптивному управлению. Сб. "Вопросы кибернетики". Научный совет по комплексной проблеме "Кибернетика" РАН. Вып. 2. М., 1996.
12. Жданов А. А. Формальная модель нейрона и нейросети в методологии автономного адаптивного управления. Сб. "Вопросы кибернетики". Научный совет по комплексной проблеме "Кибернетика" РАН. Вып. 3. М., 1997.
13. Жданов А.А. О понятии автономного искусственного интеллекта // Сб. научн. тр. Искусственный интеллект в технических системах. - М.: Гос.ИФТП. 1997.
14. Zhdanov A. A. About an Autonomous Adaptive Control Methodology. ISIC/CIRA/(ISAS'98), NIST, Gaithersburg, Maryland. September 1417, 1998.
15. Zhdanov A. A. The Mathematical Models of Neuron and Neural Network in Autonomous Adaptive Control Methodology. WCCI’98(IJCNN’98), IEEE World Congress on Computational Intelligence, Anchorage, Alaska, May 4-9, 1998.
16. Жданов А. А., Норкин Н. А., Гуриев М. А. Некоторые практические приложения метода автономного адаптивного управления // Сб. научн. тр. Искусственный интеллект в технических системах. Вып. 19.- М.: Гос.ИФТП. 1998.
17. Жданов А. А., Винокуров А. Н. Система проектирования и исследования нейронных сетей "СПИНС" в методологии автономного
адаптивного управления // Сб. научн. тр. Всероссийской научн.-техн. конференции "Нейроинформатика-99", ч. 1. - М.: МИФИ. 1999.
18. Рядовиков А. В., Жданов А. А., О некоторых формальных моделях нейронов. // Сб. научн. тр. Всероссийской научн.-техн. конференции "Нейроинформатика-99", ч. 1. - М.: МИФИ. 1999.
19. Жданов А. А., Арсеньев С.В. О некоторых приложениях принципа автономного адаптивного управления // Сб. научн. тр. Всероссийской научн.-техн. конференции "Нейроинформатика-99", ч. 3. - М.: МИФИ. 1999.
20. Жданов А. А., Винокуров А. Н. О нейросетевом методе "Автономного адаптивного управления", Сб. докл. Пятой Всероссийской конференции "Нейрокомпьютеры и их применение (НКП-99)". М., 17-19 февраля 1999.
21. http://www.ispras.ru/~zhdanov/
22. Чечкин А.В. Математическая информатика.
- М.: Наука, 1991.
23. Hopfield J.J. Neural networks and physical systems with emergent collective computational abilities. Proc. of the National Academy of Science 79: 2554-58. 1982.
24. Bernold T., Expert Systems and Knowledge Engineering. Elsevier, Science Publishers, 1986.