Научная статья на тему 'Категорные методы адаптивного формирования многомодельных комплексов в информационных системах анализа состояния сложных технических объектов'

Категорные методы адаптивного формирования многомодельных комплексов в информационных системах анализа состояния сложных технических объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
47
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛОЖНЫЕ ТЕХНИЧЕСКИЕ ОБЪЕКТЫ / МНОГОМОДЕЛЬНЫЕ КОМПЛЕКСЫ / АЛГОРИТМЫ ЛОГИЧЕСКОГО ВЫВОДА / COMPLEX TECHNICAL OBJECTS / MULTI-MODEL SYSTEMS / LOGICAL DEDUCTION ALGORITHMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Батищев Виталий Иванович, Губанов Николай Геннадьевич, Косарев Дмитрий Николаевич

Работа посвящена методам автоматической структуризации данных и формирования категорных моделей баз знаний, построению и исследованию методов формирования многомодельных комплексов, основанных на синтезе дедуктивных и индуктивных методов логического вывода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Батищев Виталий Иванович, Губанов Николай Геннадьевич, Косарев Дмитрий Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Kategoring Methdological the Constructing of the Infomation Systems Analysis State on the Complex Objects

The methods of constructing the kategoring models of complex objects on the basis of inductive logical conclusion are given. The practical application questions of models data in the analytical systems are examined.

Текст научной работы на тему «Категорные методы адаптивного формирования многомодельных комплексов в информационных системах анализа состояния сложных технических объектов»

Системный анализ, управление и автоматизация

УДК 519.816+519.876.5

КАТЕГОРНЫЕ МЕТОДЫ АДАПТИВНОГО ФОРМИРОВАНИЯ МНОГОМОДЕЛЬНЫХ КОМПЛЕКСОВ В ИНФОРМАЦИОННЫХ СИСТЕМАХ АНАЛИЗА СОСТОЯНИЯ СЛОЖНЫХ ТЕХНИЧЕСКИХ ОБЪЕКТОВ'

В.И. Батищев, Н.Г. Губанов, Д.Н. Косарев2

Самарский государственный технический университет,

443100, Самара, ул. Молодогвардейская, 244

Работа посвящена методам автоматической структуризации данных и формирования категорных моделей баз знаний, построению и исследованию методов формирования многомодельных комплексов, основанных на синтезе дедуктивных и индуктивных методов логического вывода.

Ключевые слова: сложные технические объекты, многомодельные комплексы, алгоритмы логического вывода.

Создание комплексной методологии анализа и построения информационноаналитических систем оценки состояния сложных технических объектов является актуальной в русле современных тенденций к интеграции информационноизмерительных систем, систем имитационного моделирования, систем интеллектуального анализа данных, а также подсистем управления базами данных и базами знаний. Данный факт подтверждается активными работами над созданием, внедрением и техническим сопровождением автоматизированных систем четвёртого поколения, которые характеризуются как адаптивные интегрированные пространственно-распределенные неоднородные системы обработки данных с перестраиваемыми структурами [1]. Необходимость разработки подобных методологий обусловлена возрастающей сложностью и стоимостью объектов анализа - сложных технических объектов, когда число оцениваемых параметров исчисляется десятками тысяч, а также накладываются топологические, структурные аспекты при обработке информации, необходимость вычислений в реальном масштабе времени. Кроме того, объекты анализа данного класса характеризуются единичностью изготовления, разнородностью, неполнотой, а зачастую противоречивостью, с одной стороны, данных об объекте, а с другой - информационной избыточностью. Указанные свойства обуславливают ряд объективных проблем в вопросах эффективного принятия решений

1 Работа выполнена в рамках фанта РФФИ 09-08-00459-а.

2 Батищев Виталий Иванович - доктор технических наук, профессор.

Губанов Николай Геннадьевич - кандидат технических наук, доцент.

e-mail: [email protected] Косарев Дмитрий Николаевич - аспирант.

на этапах целевого использования объекта анализа. Специалисты [2] указывают на неточность исходных данных в качестве основной причины неточности анализа состояния сложных систем. Неполнота и противоречивость данных о системе обусловлена дороговизной, неэффективностью, а зачастую и невозможностью получения полной информации об объекте и среде его функционирования, разнородностью информации об объекте в виде точечных замеров и значений параметров; допустимых интервалов их изменения; статистических законов распределения для отдельных величин; нечетких критериев и ограничений, полученных от специалистов-экспертов.

В качестве некоторого обобщения основных источников, формирующих информационное пространство, можно назвать: данные на выходе ИИС; известные закономерности, заложенные в техдокументации, где данными являются объективные законы реального мира, накопленные в фактографических и документальных системах; выявленные закономерности, в частности имитационные модели. Каждый из источников в настоящее время является информационной основой для соответствующих направлений системного анализа, моделирования и управления сложными системами. Однако каждый вид ресурса обладает рядом принципиальных ограничений, существенно сужающих область его применения, в то же время имеют место существенные предпосылки для системной интеграции перечисленных ресурсов. Применение комбинации подходов правдоподобного и достоверного вывода позволит получать новые нелинейные эффекты при синтезе информационноаналитических систем.

Возникает необходимость в конструктивном формальном аппарате, инвариантном к представлению и обработке разнородной информации из вышеперечисленных источников.

При построении систем анализа, как правило, встают вопросы выбора методов формализации информационных ресурсов, формирования правил построения структур, а также проблемы анализа и построения на данных структурах алгоритмов генерации и отбора альтернатив решений. Конструктивным подходом к интеграции различных видов моделей объекта является применение методов категорно-функторного анализа. Данный подход позволяет сохранить целостность представления объекта за счёт инвариантности способа полимодельного описания объекта и свести исследования задач одного вида к задачам другого вида, а согласование разнородных моделей осуществлять на основе анализа принадлежности к заданной категории. Предложены алгоритмы автоматического формирования категорных структур, базирующиеся, в частности, на основе анализа мер близости. В рамках данного подхода разработаны правила формирования полимодельных структур на основе операций наследования и композиции.

Практика показала эффективность синтеза различных подходов вывода в системах анализа. В основе построения баз знаний используют синтез индуктивных и аб-дуктивных методов логического вывода. Абдукция, как процесс формирования объясняющей гипотезы, служит методологической основой построения алгоритмов правдоподобного вывода. Функционально абдуктивный вывод заключается в принятии решения по выбору оптимального объяснения наблюдения на основе заданной теории. Для данного исследования абдукция интересна как средство решения следующих классов задач: задача распознавания целей и стратегий деятельности субъекта, задача формирования моделей наблюдения за объектом, задача накопления и усвоения знаний.

Алгоритм функционирования систем для пересматриваемой аргументации заключается в выполнении последовательности следующих процедур [3]: определение аргумента как дерева выводов, основанного на посылках, либо как дедукции; определение конфликта между аргументами, которые идентифицируются как опровержение аргумента; определение поражения аргумента формированием бинарного отношения на множестве аргументов; оценка аргументов по параметрам, определяемым спецификой предметной области.

Отмечается [4,6], что до настоящего времени количественная оценка гипотез и, соответственно, сравнение и отбор закономерностей во многом являются нерешённой проблемой. Проблемы построения абдуктивного вывода заключаются в выборе критерия оценки варианта объяснения, характеризующего степень его правдоподобия. Общая оценка качества абдукции основана на ряде подходов: подходы, основанные на покрытии множеств, предполагающие порождение и отбор подмножества гипотез, представляющих наилучшее объяснение для наблюдения; подходы, основанные на логике; подход на уровне знаний, рассматривающий абдукцию на уровне неявных убеждений; подходы, основанные на логических моделях.

Индуктивный вывод, позволяющий в сложных системах строить обобщенные модели знаний, основан на построении некоторого общего правила и анализа конечного множества наблюдаемых фактов. Качество обобщённых моделей зависит от полноты набора фактов, которым метод пользуется при формировании гипотез. Процедурно процесс индуктивного вывода сложноформализуем и заключается в машинном построении новых гипотез на основе наблюдаемых фактов. Индукционный вывод позволяет решать следующие классы задач: задача индуктивного формирования понятий с целью выделения наиболее общих или характерных фрагментов знания при избавлении от случайной несистемной информации; задача машинного обучения, где на основе анализа обучающей выборки даётся прогноз о новых объектах; задача распознавания, заключающаяся в формировании решающего правила, относящего объект к определённому классу.

В настоящее время существуют конструктивные методы автоматического формирования алгоритмов мониторинга и управления структурной динамикой сложных технических объектов (СТО) [1,6], которые базируются на оперативном формировании операторных цепочек, последовательного отображения измерительных и вычислительных параметров СТО для достижения цели анализа или управления. Данные технологии, в частности, базируются на обобщённых вычислительных моделях, являющихся развитием недоопределённых моделей.

На принципах индуктивного логического вывода, статистической обработки информации, а также информационных технологиях DM, OLAP, KDD основан целый класс аналитических систем, которые, по мнению аналитиков рынка программных продуктов, составляют существенную часть стоимости СТО в целом. Полученные современные результаты и алгоритмы, позволившие автоматизировать решение таких задач, как синтез схем программ; задача доказательства теоремы в формальнодедуктивной системе; методология проверки на модели (model checing); алгоритмы распараллеливания вывода; определение критерия качества моделей в индуктивном выводе на основе теоретико-информационного подхода в русле принципа минимальной длины описания через понятие алгоритмической сложности, показывают перспективность использования в рамках одной системы комплексного подхода, включающего абдукции для получения гипотез, которые объясняют наблюдения за параметрами системы состоянием среды, индукции для формирования и оценки правил вывода и

дедукции для прогнозирования перспективного состояния системы.

Приняв во внимание, что составляющие системы - программные объекты и взяв за основу систему продукций, рассмотрим следующую формальную модель Р, = (М,А/',/?,,0(), где в качестве множества заданных литералов М, продукционной системы и множества формируемых литералов м' продукционной системы определены обобщённые вычислительные модели; R, - множество продукций /-того вида, О, - множество процедур присвоения /-того вида; M = (A,FU),

где А = {«,,/ = 1,—,/7} - конечное множество параметров состояния объекта, FM - конечное множество отношений на множестве параметров из А; F = (/,i = \,...,к\ае А) - отношение на множестве параметров / = ^A,gr(/)^. Множество всех отображений со для всех отношений / е FM, входные параметры in(co) = Z'l для оператора со , выходные параметры out (со) = Z™' для оператора со . Взяв за основу категорный подход к формированию продукций [5], можно выстроить иерархию моделей заданной категории по степени детализации: М? - базис моделей /-той категории, — исходное состояние модели (вычислительного алгоритма), ц/ € Яо/гг(5,0,5,й), - производное исходное состояние модели (вы-

числительного алгоритма), Ле Нот^М",Л/,Я) - условие сопоставимости. Соответственно, распознавая ситуацию, система активизирует некоторую продукцию, сопоставимую с заданной ситуацией. Специалистами указывается [6], что в данной ситуации актуальна задача квалиметрии моделей, которая заключается в формировании подхода, позволяющего с единых позиций проводить оценку, сравнение, упорядочивание моделей. Сформированное множество иерархий моделей дает возможность использовать их в алгоритмах вывода. Отбор моделей осуществляется на основе двух альтернатив: при наличии удовлетворительной модели - детализация выходных данных (дедуктивных алгоритмов вывода); при отсутствии удовлетворительной модели - построение обобщённой модели (индуктивных алгоритмов вывода).

Как было упомянуто ранее, особый интерес представляет не просто оценка параметров системы, а анализ топологии, соответствующей структуре объекта. В частности, конструктивна идея доказательства непрерывности отображения между физическими процессами в системе, измерительной информацией и состоянием вычислительного процесса, что позволяет сделать вывод об адекватности процесса анализа.

Основу систем анализа состояния СТО составляют полимодельные комплексы. Проблема создания алгоритмов формирования и представления полимодельных структур является одной из ключевых в современном системном моделировании. Структура и функционирование аналитических систем - S зависит от следующих информационных сущностей: объекта анализа (СТО) - Q; цели функционирования аналитической системы - G, определяемой конкретной задачей принятия решения; полимодельного комплекса, задающего структуру системы -М ; среды, определяющей параметры системы - С, а также отношений между данными структурами

R-(rQM*rQc>rQO>rM c>rQM’rQc) • Соответственно, информация по всем имеющимся

в распоряжении субъекта информационным ресурсам 2 определится как г=и (м,я), тогда формирование новой структуры информационно-

О

аналитической системы можно представить в следующем виде: Р =(2,Ма,Э), где Ма — целевая структура системы, >9 = (Мь,р) - алгебра формирования структур, где Мь - множество базовых классов элементов структур М, а р = (М,К)~ операции формирования структуры системы, N - операция наследования, К - операция композиции. Комбинация данных операций формирования структуры системы, в отличие от конкатенации, позволяет сохранять целостность представления системы на различных уровнях иерархии. Алгоритмы формирования базовых классов объектов Аь = (2,С,Мь) являются, по сути, проблемно-ориентированной декомпозицией

2, а стратегия построения данных алгоритмов лежит в русле принципа семиотической интроспекции, заключающегося в идентификации различий и обобщении подобий множества объектов.

Модель объекта Л/' описывает некоторые его свойства в соответствующих категориях. Соответственно можно рассматривать М' как объект категории ОЬМ', а

взаимосвязь между объектами - как морфизмы МогМ1. Применительно к задаче таксономии категории формируются на основании [7] признакового пространства I" = {/,,*2,, множества классов К1(М) и самих объектов таксономии М. Объекты, принадлежащие одному классу, являются изоморфными, другими словами, неразличимыми в признаковом пространстве /", а классы объектов К1(М) в данном признаковом пространстве являются гомоморфными, образуя при соответствующих свойствах признакового пространства категорию Со/(М).

Полимодельное описание объекта определяется совокупностью моделей различных категорий МрЫу = и М'. Формирование правил отображения модели одного

/=|

вида в другой требует построения функтора вид которого определяет

отношения между моделями видов (V,г/). Соответственно возможно формирование знаний категории Сш (Ми) при недостаточных условиях формирования категории при помощи процедуры таксономии А. В этом случае возможна процедура А :3/г(Л/‘)—»Са/(А/и), которая позволяет строить и обрабатывать гипотезы относительно знаний одной категории, применяя их к знаниям другой категории, что расширяет практические возможности добывания знаний.

Алгоритмы реструктуризации данных полимодельных комплексов, заключающиеся в коррекции отношений между объектами категории, формировании новых категорий и редакции имеющихся, основаны на подходе наследования новой структуры из существующей, формирования иерархической или сетевой структуры из компонент полимодельных комплексов.

Пусть 5/* - базис категории, (50/,т,^) - исходный объект; ц/ е Нот(50/>т,5’/””)

- отношение между данными объектами; - производный объект, где

AeHom(sr,Sr)-

Условие сопоставимости заключается в выполнении следующих условий:

3 Q)eHom(sr,Sr)-,

З(м е Hom(sr.S~)) -> ((s/->)tf(s;"fu))

у

тогда

3(MeHom{sr.Sr))-*((sr'V)N(sr,o)),

гдeiV - операция наследования объекта в .

В общем виде стратегия оперирования вычислительными моделями следующая: либо модель является объектом дедуктивного вывода и формирует более детальный результат, либо представляет собой объект индуктивного для структур более высокой иерархии.

Таким образом, задание цели анализа вызывает активизацию нескольких конкурирующих вычислительных схемТ = (Г,,Г2,...,ГП), формирование которых осуществляется на основе множества игровых ситуаций .

Вышеизложенный материал лёг в основу формально-математического аппарата для представления, анализа и обработки разнородных данных и моделей, включающего в себя методы автоматической структуризации данных и формирования кате-горных моделей баз знаний, методы анализа свойств и отношений на моделях данных и знаний, методы формальной декомпозиции и агрегирования на элементах структур данных. Предложенная методология показала свою эффективность в процессах автоматизации формирования модели городской транспортной системы. Анализ существующих транспортных систем явился основой формирования алгоритмов адаптации заданной системы, что позволило существенно снизить объём ручной доработки данного программного проекта по сравнению с аналогичными проектами.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Охтилев М. Ю. Интеллектуальные технологии мониторинга и управления структурной динамикой сложных технических объектов [Текст] / М. Ю. Охтилев. Б. В. Соколов, Р. М. Юсупов. - М.: Наука, 2006.-410 с.

2. Батищев В.И. Аппроксимационные методы и системы промышленных измерений, контроля, испытаний, диагностики [Текст] / В.И.Батищев, В.С.Мелентьев. — М.: Машиностроение-1, 2007. - 393 с.

3. Вагин В. Н. Достоверный и правдоподобный вывод в интеллектуальных системах [Текст] / В. Н. Вагин, Е. IO. Головина, А.А. Загорянская. М. В.Фомина. - М.: Физматлит, 2004. - 704 с.

4. Батищев В.И. Категорное представление сложных технических объектов в индуктивных системах логического вывода [Текст] / В.И. Батищев, Н.Г. Губанов// Проблемы управления и моделирования в сложных системах: Тр. IX Международ. конф. - Самара: СНЦРАН, 2008.-С. 185-191.

5. Стефанюк В.Л. Локальная организация интеллектуальных систем [Текст] / В.Л. Стефанюк. - М.: Физматлит, 2004. - 328 с.

6. Соколов Б.В. Концептуальные основы оценивания и анализа качества моделей и полимодельных комплексов [Текст] / Б.В.Соколов. Р. М. Юсупов // Изв. РАН Теория и системы управления. - 2004.

- №6. - С. 5-16.

7. Загоруйко Н.Г. Прикладные методы анализа данных и знаний [Текст] / Н.Г.Загоруйко. - Новосибирск: Изд-во Ин-та математики, 1999. - 270 с.

8. Потапов А.С. Распознавание образов и машинное восприятие: Общий подход на основе принципа

минимальной длины описания [Текст] / А.С. Потапов. - СПб.: Политехника, 2007. - 548 с.: ил.

9. Губанов Н.Г. Категорный подход при формировании полимодельных комплексов сложных систем [Текст] / Н.Г. Губанов //Вестник Самар, гос. техн. ун-та. Сер. Технические науки. 2008. Вып. I (21) С. 183-185.

10. Батищев В.И. Методология оперативной реструктуризации информационных систем анализа состояния сложных технических объектов [Текст] / В.И. Батищев. Н.Г. Губанов // Проблемы управления и моделирования в сложных системах: Тр. IX Международ. конф. - Самара: СНЦ РАН. 2008. -С. 187-193.

Статья поступила в редакцию 25 июня 2009 г.

UDC 519.816+519.876.5

THE KATEGORING METHDOLOGICAL THE CONSTRUCTING OF THE INFOMATION SYSTEMS ANALYSIS STATE ON THE COMPLEX OBJECTS

V.I. Batishchev, N.G. Gubanov, D.N. Kosarev1

Samara Slate Technical University,

244, Molodogvardcyskaya str.. Samara, 443100

The methods of constructing the kategoring models of complex objects on the basis of inductive logical conclusion are given. The practical application questions of models data in the analytical systems are examined.

Key words: complex technical objects, multi-model systems, logical deduction algorithms.

1 Vitaliy I. Batishchev - Doctor of Technical Sciences. Professor.

Nikolay .G. Gubanov- Candidate of Technical Sciences, Associate professor. Dmitriy N. Kosarev — Postgraduate student.

i Надоели баннеры? Вы всегда можете отключить рекламу.