Научная статья на тему 'Интеграция технологии OLAP и нечетких множеств для обработки неопределенных и неточных данных в системах поддержки принятия решений'

Интеграция технологии OLAP и нечетких множеств для обработки неопределенных и неточных данных в системах поддержки принятия решений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
227
101
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Еремеев А. П., Еремеев А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интеграция технологии OLAP и нечетких множеств для обработки неопределенных и неточных данных в системах поддержки принятия решений»

- моделирование процессов складской логистики;

- комплексирование по данным разработанных пакетов моделирования складской логистики.

В заключение отметим, что в статье представлен подход к организации проблемно-ориентированных распределенных вычислений, обеспечивающий единую технологическую схему решения широкого спектра задач в интегрированной кластерной системе, а также комплексную инструментальную поддержку всех научно-технических процессов в ней.

Основное отличие представленного подхода от традиционно применяемых к организации разнородных распределенных вычислительных сред подходов в комплексном использовании методов и средств инженерии знаний, методов автоматического построения параллельных распределенных планов решения непроцедурных постановок задач на вычислительной модели предметной области в виде системы булевых уравнений, децентрализованной схемы управления решением поставленной задачи с использованием группы интеллектуальных агентов, концептуального, имитационного и полунатурного моделирования создаваемых проблемно-ориентированных распределенных программных комплексов.

Литература

1. Foster I., Kesselman C., Tuecke S., Intern. Journ. of High Performance Computing Applications, 2001, Vol. 15, no. 3. pp. 200-222.

2. Baker M., Buyya R., Laforenza D., Software: Practice and Experience, 2002, Vol. 32, no. 15, pp. 1437-1466.

3. Опарин Г.А. Сатурн - метасистема для построения пакетов прикладных программ. В кн.: Пакеты прикладных программ. Методы и разработки. Новосибирск: Наука, 1982. С. 130-160.

4. Бычков И.В., Опарин Г.А., Новопашин А.П., Феоктистов А.Г., Корсуков А.С., Сидоров И.А. Высокопроизводительные вычислительные ресурсы ИДСТУ СО РАН: Текущее состояние, возможности и перспективы развития // Вычислительные технологии. 2010. Т. 15. № 3. С. 69-82.

5. Бычков И.В., Опарин Г.А., Феоктистов А.Г., Корсуков А.С. Децентрализованное управление потоками заданий в интегрированной кластерной системе // Вестн. НГУ. Сер.: Информационные технологии. 2011. Т. 9. Вып. 2. С. 42-54.

6. Опарин Г.А., Феоктистов А.Г. Модели и инструментальные средства организации распределенных вычислений // Параллельные вычисления и задачи управления: тр. IV Меж-дунар. конф. М.: Изд-во ИПУ РАН, 2008. C. 1126-1135.

References

1. Foster I., Kesselman C., Tuecke S., Intern. Journ. of High Performance Computing Applications, 2001, Vol. 15, no. 3, pp. 200-222.

2. Baker M., Buyya R., Laforenza D., Software: Practice and Experience, 2002, Vol. 32, no. 15, pp. 1437-1466.

3. Oparin G.A., Pakety prikladnykh programm. Metody i raz-rabotki [Applied software packages. Methods and developments], Novosibirsk, 1982, pp. 130-160.

4. Bychkov I.V., Oparin G.A., Novopashin A.P., Feoktis-tov A.G., Korsukov A.S., Sidorov I.A., Vychislitelnye tekhnologii, 2010, Vol. 15, no. 3, pp. 69-82.

5. Bychkov I.V., Oparin G.A., Feoktistov A.G., Korsu-kov A.S., Vestnik Novosibirskogo Gos. Univ., 2011, Vol. 9, Iss. 2, pp. 42-54.

6. Oparin G.A., Feoktistov A.G., Parallelnye vychisleniya i zadachi upravleniya [Parallel Computing and Control Problems], Proc. IV Intern. Conf., Moscow, IPU RAS, 2008, pp. 1126-1135.

УДК 007:519.816

ИНТЕГРАЦИЯ ТЕХНОЛОГИИ OLAP И НЕЧЕТКИХ МНОЖЕСТВ ДЛЯ ОБРАБОТКИ НЕОПРЕДЕЛЕННЫХ И НЕТОЧНЫХ ДАННЫХ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

(Работа выполнена при финансовой поддержке РФФИ, проекты №№ 11-01-00140, 12-07-00508)

А.П. Еремеев, д.т.н., профессор, зав. кафедрой; А.А. Еремеев, аспирант (Национальный исследовательский университет «Московский энергетический институт», ул. Красноказарменная, 14, Е-250, г. Москва, 111250, Россия, eremeev@ßppmat.ru, [email protected])

Рассматриваются возможности интеллектуального анализа данных применительно к системам поддержки принятия решений, в том числе и к интеллектуальным системах поддержки принятия решений реального времени (ИСППР РВ), посредством интеграции технологии OLAP (Online Analytical Processing) и нечеткой логики. Данная интеграция позволит реализовать в ИСППР РВ средства для комплексного многомерного анализа больших объемов данных, их динамики и тенденций. Отмечается, что, хотя технология OLAP и не является необходимым атрибутом современных хранилищ данных (Data Warehouses), в настоящее время она активно применяется, в частности, для анализа накопленной в хранилищах данных информации. Используются такие понятия из теории нечетких множеств, как нечеткий срез, нечеткое множество для задания индекса соответствия и др. Даются необходимые формальные определения и приводится соответствующий иллюстративный материал. Работа выполнена с целью использования соответствующих методов и программных средств в ИСППР РВ для анализа плохо определенной (неоднозначной) информации (данных и знаний) и оперирования ею.

Ключевые слова: интеллектуальная система, хранилище данных, технология OLAP, нечеткие множества.

INTEGRATION OF THE OLAP TECHNOLOGY AND FUZZY SETS FOR PROCESSING OF UNCERTAIN AND INEXACT DATA IN DECISION SUPPORT SYSTEMS Eremeev A.P., Ph.D., Professor, Head of Chair; Eremeev A.A., Postgraduate (National Research University «Moscow Power Engineering Institute», 14, Krasnokazarmennaya, Moscow, 111250, Russia, [email protected], [email protected]) Abstract. Possibilities of the intelligent data mining for decision support systems by means of integration of the OLAP technology and fuzzy logic are considered. The given integration allows implementing measures for complex multidimensional analysis of big data volumes, their dynamics and trends. It is noticed that although the OLAP technology does not be a needed attribute of modern data warehouses, at present this technology is actively applied, in particular, for data analyses storing in warehouses. Such concepts from the fuzzy set theory as a fuzzy cut, fuzzy set to set an accordance index are used. The necessary formal definitions are given and the corresponding illustrations are presented. The work is performed for analyses and operating ill-definite (ambiguous) information (data and knowledge). Keywords: intelligent system, data ware house, OLAP technology, fuzzy sets.

Современные интеллектуальные системы (ИС), ориентированные на открытые и динамические предметные (проблемные) области, представителем которых являются ИС поддержки принятия решений реального времени (ИСППР РВ) [1], оперируют, как правило, большими массивами быстро изменяемых данных, поступающих из различных внешних источников (датчиков, сенсоров, оператора или непосредственно от ЛПР), то есть имеют дело с динамической информацией, для поддержки которой необходима соответствующая организация баз данных и знаний. ИСППР РВ должны иметь средства для комплексного многомерного анализа больших объемов данных, их динамики и тенденций [2]. Для этого предлагается использовать технологию OLAP [3]. Хотя технология OLAP и не является необходимым атрибутом хранилищ данных (ХД) (Data Warehouses), в настоящее время она активно применяется для анализа накопленной в ХД информации.

Согласно данной технологии, оперативная информация (данные) собирается из различных источников, очищается, интегрируется и складывается в реляционное ХД. Затем данные подготавливаются для OLAP-анализа. Они могут быть загружены в специальную БД OLAP или оставлены в реляционном ХД. Важнейшим элементом являются метаданные - информация о структуре, размещении и трансформации данных. Благодаря им обеспечивается эффективное взаимодействие различных компонентов ХД.

В процессе анализа данных в ИСППР РВ часто возникает необходимость построения зависимостей между различными параметрами, число которых может быть значительным. Возможность такого анализа требует представления данных в виде многомерной модели - гиперкуба, или OLAP-куба, содержащего одно или более измерений и представляющего собой упорядоченный набор ячеек (рис. 1). Каждая ячейка определяется одним и только одним набором значений измерений - ме-

ток. Под измерением понимается множество меток, образующих одну из граней гиперкуба. Примером временного (темпорального) измерения является список дней, месяцев, кварталов. Примером географического измерения может быть перечень территориальных объектов: населенных пунктов, районов, регионов, стран и т.д.

Для получения доступа к данным пользователю необходимо указать одну или несколько ячеек путем выбора значений измерений, которым соответствуют необходимые ячейки. Процесс выбора значений измерений называется фиксацией меток, а множества выбранных значений измерений -множеством фиксированных меток.

Используем следующие обозначения: OLAP-куб данных обозначается как множество ячеек И(Б, М), где Б={ёх, ё2, ..., dn} - множество измерений гиперкуба; М = М^ иМа и... иМ^ - множество меток гиперкуба; М^ ={щ , т ,..., та },

/=1, ..., п - множество меток измерения Б'сБ -множество фиксированных измерений; МсМ -множество фиксированных меток [3]. Подмножество OLAP-куба, соответствующее множествам фиксированных значений Б', М обозначается как И(П, М). Каждой ячейке OLAP-куба Н<еИ соот-

ветствует единственно возможный набор меток измерений MhcM. Ячейка может быть пустой (не содержать данных) или содержать значение показателя - меру. Множество мер OLAP-куба H(D, M) обозначается V(H).

Ценность и достоверность знаний, полученных в результате интеллектуального анализа данных, зависят как от эффективности используемых аналитических методов и алгоритмов, так и от правильно подобранных и подготовленных для анализа исходных данных.

Чтобы довести данные до приемлемого уровня качества и информативности, а также организовать интегрированное хранение данных в структурах, обеспечивающих их целостность, непротиворечивость, высокую скорость и гибкость выполнения аналитических запросов, необходимо выполнить ряд процедур, называемых консолидацией.

Консолидация - комплекс методов и процедур, направленных на извлечение данных из различных источников (ХД, БД и т.п.), обеспечение необходимого уровня их информативности и качества, преобразование в единый формат, в котором они могут быть загружены в ХД или аналитическую систему. Консолидация данных является начальным этапом реализации любой аналитической задачи или проекта. В ее основе лежит процесс сбора и организации хранения данных в виде, оптимальном с точки зрения их обработки на конкретной аналитической платформе или решения конкретной аналитической задачи. Сопутствующими задачами консолидации являются оценка качества данных и их обогащение.

Основными критериями оптимальности (относительно консолидации данных) являются обеспечение высокой скорости доступа к данным, компактность хранения, автоматическая поддержка целостности структуры данных, контроль непротиворечивости данных.

Для повышения уровня качества и информативности данных применяется интеграция различных технологий, например, в работе [4] рассматривается возможность интеграции темпоральных БД, оперирующих с данными, актуальными в определенный момент времени или на некотором временном интервале, с ХД и технологией OLAP.

Еще один пример эффективного обогащения (путем интеграции) одной технологии (ХД) другой (нечеткая логика) демонстрируют нечеткие срезы - фильтры по измерениям, в которых фигурируют нечеткие величины, например «все молодые ученые с небольшим доходом». Напомним, что в реляционных БД эту роль выполняют нечеткие запросы, предложенные в работах Д. Дюбуа и Г. Прада. Информация в ХД присутствует обычно в четком виде, поэтому для использования в фильтрах нечетких понятий нужно предварительно представить их в виде нечетких множеств.

Формирование нечетких срезов

Лингвистические переменные можно задать для любого измерения, атрибута измерения или факта, значения которого имеют непрерывный вид. Их параметры - названия, терм-множества, параметры функций принадлежности - будут содержаться в семантическом слое ХД (рис. 2).

Рис. 2. Нечеткое множество для задания индекса соответствия

Результатом выполнения нечеткого среза, помимо самого подмножества ячеек гиперкуба, удовлетворяющих заданным условиям, является индекс соответствия срезу Cíe [0, 1]. По сути это итоговая степень принадлежности к нечетким множествам измерений и фактов, участвующих в сечении куба, которая рассчитывается для каждой записи набора данных. Для ускорения выполнения запросов к ХД задают верхнюю границу a индекса соответствия CI >а, что позволяет уже на уровне SQL-запроса отсеять записи, заведомо не удовлетворяющие минимальному порогу индекса соответствия. На рисунке 2 показано, что элементы нечеткого множества со значениями в интервале [хь x2] обеспечат степень принадлежности не ниже а.

Алгоритм формирования нечеткого среза представлен на рисунке 3. На шаге 1 используется

1. Задание нечеткого среза

2. Задание минимального индекса соответствия

3. Преобразование нечеткого среза в SQL-запрос

4. Запрос к ХД

5. Расчет С1 для каждой записи в запросе

О

6. Сортировка набора данных по убыванию С1

Рис. 3. Алгоритм формирования нечеткого среза

семантический слой ХД. На шаге 3 в результирующий SQL-запрос попадают границы с учетом минимального индекса соответствия а. Шаг 5 предполагает применение нечетких логических операций.

Рассмотрим пример. Пусть в ХД содержится информация о соискателях вакансий и срез (четкий) по измерениям Код анкеты, Возраст и Стаж работы обеспечивает набор данных, представленный в таблице 1. Очевидно, что Код анкеты - это служебное поле. Для Возраста будем использовать лингвистическую переменную (рис. 4), а для поля Стаж работы - переменную, определенную на рисунке 5. При задании функций принадлежности используются следующие множества: Малый - {0; 0; 6}, Продолжительный -{3; 6; 10; 20}, Большой - {15; 25; 40; 40}.

Таблица 1

Информация о соискателях (срез по измерениям Возраст и Стаж работы)

Код анкеты Возраст Стаж работы

1 23 4

2 34 11

3 31 10

4 54 36

5 46 26

6 38 15

7 21 1

8 23 2

9 30 8

10 30 12

H(x)

1

Молодой Средний

Старый

0 10 20 30 40 50 60 70 80 90 100

Рис. 4. Графическое изображение лингвистической переменной Возраст

Малый Продолжительный

Ц(х)

1

0,8 +

0,6

0,4

0 5 10 15 20 25 30 35 40

Рис. 5. Графическое изображение лингвистической переменной Стаж работы

Определим нечеткий срез «Возраст = Средний и Стаж работы = Продолжительный». Например, для анкеты 4 (см. табл. 1) получим:

^^Средний ' ^продолжительный

= min [ ,ij= 0,8.

Аналогично рассчитываются степени принадлежности к итоговому нечеткому множеству для каждого претендента. Зададим минимальный индекс соответствия, равный 0,3, и получим результат, показанный в таблице 2.

Таблица 2

Результат нечеткого среза

Код Возраст Стаж Индекс

анкеты работы соответствия

3 31 10 1

9 30 8 1

6 38 15 1

2 34 11 0,9

10 30 12 0,8

8 23 2 0,3

1 23 4 0,3

Возможны ситуации, когда аналитику (ЛПР) требуется не только извлечь информацию, оперируя нечеткими понятиями, но и проранжировать ее по убыванию (возрастанию) степени релевантности запроса. В этих случаях нечеткий поиск в ХД является наиболее предпочтительным и позволяет ответить на следующие вопросы: каких клиентов обзвонить в первую очередь, кому сделать рекламное предложение и т.д.

С помощью аппарата нечетких множеств и методов извлечения нечетких данных реализуется расширение понятия OLAP-куба, что позволяет исследовать возможность представления неточных данных в OLAP.

Анализ неточных данных

и обобщение многомерной модели данных

В контексте представления неоднозначных (неточных и неопределенных) данных необходимо рассмотреть расширение многомерной модели данных OLAP, а также анализ возможной семантики для агрегации запросов по таким данным [5]. Рассмотрим несколько критериев, которые должны быть удовлетворены при любом подходе к обработке неоднозначных данных в OLAP. Первый критерий - непротиворечивость (consistency), используемый для установления отношений между подобными запросами, формируемыми в связанных узлах доменной иерархии и позволяющими пользователям осуществлять ожидаемую навигацию вверх и вниз по иерархии. Второй критерий -верность (faithfulness), гарантирующий то, что точные данные должны привести к лучшим результатам. Третий критерий - сохранение корреляции (correlation-preservation), по существу тре-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

x

0

x

бующий, чтобы статистические свойства данных не влияли на распределение неоднозначных записей данных.

Расширим обычную модель данных OLAP следующим образом. Прежде всего ослабим ограничение, согласно которому атрибуты размерности в факте должны быть назначены из конечного множества значений основной области, чтобы смоделировать неточность. Второе расширение должно представить новый вид атрибута меры - неопределенность. Таким образом, неопределенное значение - это диапазон возможных значений вместе с вероятностью каждого из них. В частности, можно представить значение для неуверенной меры как функцию распределения вероятностей (probability distribution function, PDF) по значениям от основной области.

Подытоживая сказанное, в плане интеграции технологии OLAP и аппарата нечетких множеств для обработки неоднозначных данных в ИСППР РВ предлагаются обобщение OLAP-модели для возможности представления неоднозначности в данных как в случае неточных значений размерности, так и в случае неопределенных значений меры, а также введение ряда критериев (непротиворечивость, верность, сохранение корреляции), направленных на выбор наиболее подходящей семантики для агрегации запросов по неоднозначным данным.

Рассмотрим обобщение стандартной многомерной модели данных, включающей неточности и неопределенности.

Атрибуты в стандартной модели OLAP могут быть двух видов - измерения и метки. Расширим модель с целью учета неопределенности в измерении величин и погрешности в измерении значения.

Пусть неопределенная область U, заданная на основной области (универсуме) O, есть множество всех возможных функций распределения вероятности (PDF) на O [5]. Таким образом, каждое значение u в U есть PDF, указывающая на степень уверенности в том, что истинное значение будет представлено как o для каждого oeO.

Неточная область I на основной области B является подмножеством множества B, а элементы области I называются неточными значениями, 0gI. Интуитивно понятно, что неточное значение имеет непустое множество возможных значений. Разрешение атрибутам измерения иметь неточную область позволяет, например, использовать неточное (обобщенное) значение Москва для атрибута расположения в записи данных, если известно, что некое событие произошло в Москве, но неизвестно, в каком районе.

В OLAP каждое измерение имеет соответствующую иерархию, например, размерность расположения может иметь атрибуты Города и Области, где Области - обобщение для Городов, что

свидетельствует об особых случаях неточных областей, называемых иерархическими областями.

Иерархическая область H на основной области B определяется как неточная область на B, такая, что H содержит все одноэлементное множество (то есть соответствует некоторому элементу B) и для любой пары элементов hb h2eH, h1^h2 или himh2=0. Таким образом, каждый одноэлементный узел есть вершина в иерархической области H, а каждый неодноэлементный узел в H - неконечный узел. Например, Южный административный округ (АО), Западный АО и т.д. - конечные узлы с родителем Москва, для которого (узла), в свою очередь, родителем является Россия.

Схема таблицы фактов есть схема (Ab ..., Ak; M1, ..., Mn), где размерность атрибута At , /'el, ..., k, имеет соответствующую неточную область определения dom(A), а размерность атрибута Mj, je 1, ..., n - область определения dom(Mj), которая может быть числовой или неточной.

Экземпляром БД такой схемы таблицы фактов является коллекция фактов вида (а1, ..., ak; m1, ..., mn), где aedom(A/), /el, ..., k, и mjedom(Mj), jel, ..., n. В частности, если dom(A/) является иерархической областью, a/ может быть любым конечным или неконечным узлом в dom(A/).

Рассмотренное обобщение многомерной модели данных позволяет представлять неточные данные и реализовать алгоритмы для оценки агрегации запросов.

В настоящее время довольно активно ведутся исследования по интеграции технологии OLAP с другими различными технологиями, в частности с нечеткими моделями. В статье рассмотрены возможности интеграции технологии OLAP с аппаратом нечетких множеств (нечетких срезов) в плане использования соответствующих методов и программных средств в ИСППР РВ для анализа и оперирования плохо определенной (неоднозначной) информацией (данными и знаниями).

Базовые программные модули предложенной интеграции технологии OLAP и нечетких моделей реализуются на кафедре прикладной математики МЭИ в исследованиях, касающихся разработки методов, моделей и базовых инструментальных средств конструирования ИСППР РВ семиотического типа на основе нетрадиционных логик. В дальнейших исследованиях и разработках планируется рассмотреть использование концепции возможных миров (possible worlds) при неоднозначности данных, позволяющей реализовать новый, основанный на распределении подход к определению семантики запросов агрегации и глубокому анализу вариантов, возникающих при обработке неоднозначности данных, используя критерии непротиворечивости, верности и сохранения корреляции. Кроме того, представляют интерес алгоритмы для оценки агрегации запросов (для обычных и для неточных мер), а также слож-

ности анализа и метод многомерного анализа данных на основе технологии так называемых недо-определенных вычислений [6].

Литература

1. Вагин В.Н., Еремеев А.П. Некоторые базовые принципы построения интеллектуальных систем поддержки принятия решений реального времени // Изв. РАН. Теория и системы управления. 2001. № 6. С. 114-123.

2. Еремеев А.А., Еремеев А.П., Пантелеев А.А. Темпоральная модель данных и возможности ее реализации на основе технологии OLAP // 12-я национальная конференция по искусственному интеллекту с международным участием КИИ-2010 (20-24 сентября 2010 г., г. Тверь, Россия): тр. конф. М.: Физматлит, 2010. Т. 3. С. 345-353.

3. Codd E.F., Codd S.B., Salley C.T., Providing OLAP to User-Analysts: an IT Mandate, Arbor Software Corp. Papers, 1996.

4. Еремеев А.П., Еремеев А.А., Пантелеев А.А. Возможности реализации темпоральной базы данных для интеллектуальных систем // Программные продукты и системы. 2011. № 2. С. 3-7.

5. Burdick D., Deshpande P.M., Jayram T.S., Ramakrishnan R. and Vaithyanathan S. The VLDB Journal, 2007, Vol. 16, no. 1, pp. 123-144.

6. Смирнов К.Е. Многомерный анализ данных в системах недоопределенных вычислений // Программные продукты и системы. 2010. № 4. С. 71-74.

Referenses

1. Vagin V.N., Eremeev A.P., Theory and Systems of Control, Proc. of RAS, 2001, no. 6, pp. 114-123.

2. Eremeev А.А., Eremeev A.P., Panteleev А.А., Proc. 12th National Conf. «CAI-200100», 2010, Vol. 3, Moscow, Fizmatlit, pp. 345-353.

3. Codd E.F., Codd S.B., Salley C.T., Providing OLAP to User-Analysts: an IT Mandate, Arbor Software Corp. Papers, 1996.

4. Eremeev А.А., Eremeev A.P., Panteleev А.А., Pro-grammnye Produkty i Sistemy, 2011, no. 2, pp. 3-7.

5. Burdick D., Deshpande P.M., Jayram T.S., Ramakrishnan R. and Vaithyanathan S., The VLDB Journal, 2007, Vol. 16, no. 1, pp. 123-144.

6. Smirnov K.E., Programmnye Produkty i Sistemy, 2010, no. 4, pp. 71 -74.

УДК 007:519.816

ПРОТОТИП ДИАГНОСТИЧЕСКОЙ СИСТЕМЫ поддержки ПРИНЯТИЯ РЕШЕНИЙ НА ОСНОВЕ ИНТЕГРАЦИИ БАЙЕСОВСКИХ СЕТЕЙ ДОВЕРИЯ И МЕТОДА ДЕМПСТЕРА-ШЕФЕРА

(Работа выполнена при финансовой поддержке РФФИ, проекты №№ 11-01-00140, 12-07-00508)

А.П. Еремеев, д.т.н., профессор, зав. кафедрой; Р.Р. Хазиев, аспирант (Национальный исследовательский университет «Московский энергетический институт», ул. Красноказарменная, 14, Е-250, 111250, г. Москва, Россия, [email protected], ruslan. haziev@gmail. com); М.В. Зуева, д.б.н., проф., зав. лабораторией; И.В. Цапенко, к.б.н.., с.н.с. (МНИИ глазных болезней им.. Гельмгольца, ул. Садовая-Черногрязская, 14/19, г. Москва, 105062, Россия, [email protected], [email protected])

Рассматриваются применение и программная реализация формального аппарата, интегрирующего возможности расширенных байесовских сетей доверия (Bayesian belief networks) и метода Демпстера-Шефера (Dempster-Shafer). Данный аппарат ориентирован на использование в интеллектуальных системах поддержки принятия решений для помощи специалистам при диагностике сложных проблемных ситуаций. В отличие от традиционных байесовских сетей доверия предлагается применение перспективных многоуровневых (сложно-структурированных) сетей, более удобных для комплексного исследования проблемы и представления экспертных данных. Интеграция позволяет использовать при диагностике как экспертные данные, так и числовые (вероятности) данные, полученные в результате измерений. Совместное использование байесовских сетей доверия и метода Демпстера-Шефера позволяет оценить соотношения между возможными исходами (ситуациями) и уточнить их вероятности. Предложенный подход реализован в прототипе интеллектуальной диагностической системы поддержки принятия решений для диагностики сложных заболеваний зрения.

Ключевые слова: интеллектуальная система, поддержка принятия решений, диагностика, проблемная ситуация.

PROTOTYPE OF THE DIAGNOSTIC DECISION SUPPORT SYSTEM ON THE BASIS OF INTEGRATION BAYESIAN BELIEF NETWORKS AND THE DEMPSTER-SHAFER METHOD

(This work was supported by RFBR) Eremeev A.P., Ph.D., Professor, Head of Chair; Khaziev R.R., Postgraduate (National Research University «MPEI», 14, Krasnokazarmennaya, Moscow, 111250, Russia, [email protected], [email protected]);

Zueva M. V., Ph.D., Prof., Head of Laboratory; Tsapenko I.V., Ph.D., Senior Researcher (Moscow Helmholtz Research Institute of Eye Diseases, 14/19, Sadovaya-Chernogryadskaya, St., Moscow, 105062, Russia,

visionlab@yandex. ru, sunvision@mail. ru) Abstract. Possibilities of the application and program implementation of formal means integrating capabilities of ex-

i Надоели баннеры? Вы всегда можете отключить рекламу.