УДК 004.9:004.75
Ю.М. ЛИСЕЦКИЙ*, В.Е. СНИТЮК*
ФОРМИРОВАНИЕ ИНТЕГРАЛЬНОГО КРИТЕРИЯ ЭФФЕКТИВНОСТИ В ЗАДАЧАХ ВЫБОРА ОПТИМАЛЬНОГО ПРОЕКТНОГО ВАРИАНТА
Институт проблем математических машин и систем НАН Украины, Киев, Украина Киевский национальный университет имени Тараса Шевченко, Киев, Украина
Анотація. Розглянуто задачу вибору оптимальної альтернативи проектного варіанта при побудові корпоративної інформаційної системи. Розроблено метод формування інтегрального критерію ефективності для оцінювання альтернатив з використанням ансамблю моделей, виконано експериментальну верифікацію.
Ключові слова: корпоративна інформаційна система, альтернатива, критерій ефективності.
Аннотация. Рассмотрена задача выбора оптимальной альтернативы проектного варианта при построении корпоративной информационной системы. Разработан метод формирования интегрального критерия эффективности для оценки альтернатив с использованием ансамбля моделей, выполнена экспериментальная верификация.
Ключевые слова: корпоративная информационная система, альтернатива, критерий эффективности.
Abstract. The problem of choosing the optimal alternative for design options in building corporate information systems was reviewed. The method for forming an integral criterion for assessing the effectiveness of alternatives using assembly of models was developed, the experimental verification was performed. Keywords: enterprise information system, alternative, criterion of efficiency.
1. Введение
Известно, что информационной системой называют систему обработки информации и соответствующие организационные ресурсы (человеческие, технические, финансовые и другие), которые обеспечивают и распространяют информацию [1]. Ее неотъемлемыми компонентами являются данные, техническое, программное, информационное, лингвистическое и организационное обеспечение. Одним из видов информационных систем являются корпоративные информационные системы (КИС), которые предназначены для обслуживания информационных процессов предприятий с целью достижения их полной согласованности, безызбыточности и прозрачности, а также для поддержки принятия решений при их управлении.
Как любая сложная система, КИС состоит из множества подсистем, объединенных совокупностью разнородных связей. Приступая к созданию новой КИС, лицо, принимающее решение, неизбежно сталкивается с необходимостью осуществления выбора из многообразия объектов, элементов и взаимосвязей между ними. Очевидно, что решение задачи выбора оптимальной альтернативы зависит от спектра задач P , которые будет решать КИС, а ее эффективность будет определяться существующей структурой S и стратегией управления C , заключающейся в эффективном распределении ресурсов.
Многовариантность выбора может быть сокращена путем применения принципа двойственности погружений видов обеспечений [2] (рис. 1) в композиции с методом последовательного анализа вариантов [3]. Несмотря на значительное уменьшение количества альтернатив, мощность их множества остается значительной, что определяется разнообразием существующих технических, программных и других решений. Рассмотрим один из методов выбора оптимальной альтернативы (подсистемы, объекта, элемента и т.п.) в условиях неопределенности.
© Лисецкий Ю.М., Снитюк В.Е., 2015
ISSN 1028-9763. Математичні машини і системи, 2015, № 1
157
2. Постановка задачи
1. Методическое.
2. Организационное.
3. Информационное.
4. Программное.
5. Техническое.
Предположим, что существует множество альтернатив
S = {^, s2,..., sn }; множество
функций, которые они выполняют F = {fi, Ї2,..., fk }; множество показателей эффективности выполнения каждой функции Z = {z1,z2,..., zk}. Необходимо
решить задачу поиска оптимальной альтернативы
Argmax E(s), (1)
seS
где E(s) - интегральный крите-
Рис. 1. Двойственность информационного погружения рий эффективности. Очевидно,
видов обеспечения что решение задачи (1) должно
быть получено с учетом ограничений, налагаемых на характеристики альтернатив. Процесс решения неизбежно имеет две составляющие: структурную и параметрическую идентификацию критерия эффективности, а также его оптимизацию.
3. Определение аддитивных критериев эффективности альтернатив
Поиск оптимальной альтернативы как процесс зависит от начальных данных. Рассмотрим его простейшие варианты. Предположим, что значения показателей эффективности для
„ ± / \n k
каждой альтернативы известны и сведены в матрицу Z = (ztj ) , где z.. - значение j -
го показателя эффективности i -ой альтернативы.
Если предположить, что все значения показателей эффективности являются нормированными равнозначимыми величинами, то интегральный критерий эффективности может быть рассчитан по формуле
E (s,) = Е z і,- , i = 1,n. (2)
j=i
Решение задачи (1) свелось бы к определению
max{E(sj),E(s2),E(sn)}. (3)
В практических задачах показатели эффективности являются разнозначимыми и выражение (2) приобретает такой вид:
E(s,) = Е w,z„ ■ ! = ^■ (4)
j=j
где Wj - весовые коэффициенты, значения которых либо заданы, либо подлежат определению. Во втором случае применяют метод иерархий Саати [4], в соответствии с которым
158
ISSN 1028-9763. Математичні машини і системи, 2015, № 1
формируют матрицу попарных сравнений A = (а )” и решают уравнение Aw = Aw, где
V у!,,]=\
A - собственное число, w - собственный вектор. Компоненты собственного вектора Wj,
соответствующего максимальному собственному числу, и будут искомыми весовыми коэффициентами в формуле (4), далее решают задачу (3).
Существует еще один метод определения оптимальной альтернативы без использования формул (2) и (4). Аналогично описанному выше способу находят весовые коэффи-
циенты Wj,j = 1,к показателей эффективности. Далее осуществляют синтез локальных приоритетов. Для этого для каждого показателя эффективности осуществляется построе-
i j і \П
ние матрицы попарных сравнений альтернатив. Обозначим также матрицы A = (а ) ,
V у h,j=i
l = 1,к. Для каждой матрицы вычисляют векторы wl = (wl1,wl2,...,wln), компоненты которых будут указывать на l -ый показатель эффективности i -ой альтернативы, i = 1,n. Используя выражение
и определяя max {п1,П2,
П = ^ wj • w/, i = 1,n (5)
j=i
,Пп }, находим соответствующую оптимальную альтернативу.
Рассмотренные методы определения оптимальных альтернатив являются несложными в реализации и имеют теоретическое обоснование. Их недостаток - субъективное формирование матриц попарных сравнений, которые, к тому же, могут быть несогласованными вследствие нарушения транзитивности сравнений. В таком случае полученные результаты будут смещенными.
4. Формирование интегрального критерия эффективности системы на основе альтернативных моделей
Предположим, что исходные данные содержатся в таблице типа «объект-свойство» (табл. 1). Априори предполагаем, что критерий эффективности является неизвестной функцией от показателей эффективности, то есть
E = E (f1, /2,..., /,). (6)
Таблица 1. Показатели эффективности альтернатив
fl /2 - fk E
sl Z11 Z12 - Z1k E1
S2 Z21 Z22 - Z2k e2
- - - - - -
Sn Zn1 Zn 2 - Znk En
Табличные значения критерия эффективности получены в результате экспертных заключений, возможно, для аналогичных альтернатив или являются ретроспективными данными.
ISSN 1028-9763. Математичні машини і системи, 2015, № 1
159
Какие особенности и шаги приводят к идентификации модели (6)? Во-первых, необходимо определить класс моделей, которому принадлежит искомая модель. Наиболее часто используются:
1. Модель множественной линейной регрессии:
к
Е = а0 + £ аг/г, (7)
i=1
где at - неизвестные коэффициенты. Их поиск и составляет сущность метода наименьших
квадратов. Заметим, что его использование сопряжено с необходимостью тестирования и устранения мультиколлинеарности, гетероскедастичности и автокорреляции [5].
2. Модель множественной нелинейной регрессии [6]:
k
E = a-П G, (s,), (8)
i=1
где а - некоторая константа, а Gi является функцией одной переменной (показателя эффективности), которая выбирается из некоторой совокупности. Ограниченность выбора указывает на недостаток метода.
3. Модель в виде полинома Колмогорова-Габора:
к
E=ao+£ a,f,+£ a fifj + £ a,3if,f3fi+.... (9)
i=1 i<j i<j<l
Идентифицируют значения параметров в (9), используя метод группового учета аргументов [7]. В пользу применения такого метода свидетельствует известная теорема Вей-ерштрасса о сколь угодно точном приближении любой непрерывной функции полиномом. Недостатком метода группового учета аргументов является сложность аналитического построения модели (9).
4. Нейронные сети являются универсальными аппроксиматорами [8]. Для получения зависимости (6) могут быть применимы прямосвязные сети с алгоритмом обратного распространения ошибки или подобными алгоритмами обучения, сети встречного распространения, сети с радиально-базисными функциями активации и многие другие. Каждая из нейросетей является самостоятельной моделью, учет результатов их использования и знание особенностей функционирования позволяют эффективно решать задачи идентификации. К недостаткам отнесем слабую интерпретируемость нейросетей как моделей и, в отдельных случаях, зацикливание в локальных оптимумах.
5. Еще один тип моделей, которые могут быть хорошими аппроксиматорами. Это нечеткие продукционные правила [9]:
Еслиz1 Є Z1 и z2 Є Z2, ..., и zk Є Zk, то e Є E, (10)
где zt - значения показателей эффективности, Zt - нечеткие множества с соответствующими функциями принадлежности (с неизвестными параметрами). Определение значений параметров осуществляется на основе обучения нечетких нейросетей. Недостаток, а возможно, и преимущество моделей - объективизация субъективных заключений.
Мы считаем, что для решения практических задач перечисленных моделей более чем достаточно. Все они могут быть использованы для получения (6) и для определения оптимальной альтернативы. Для этого необходимо выяснить, являются ли эти альтернативы однотипными, подобными (с экспертной точки зрения). Если это не так, то альтернативы классифицируют, используя известные методы, и табл. 1 разбивается на отдельные таб-
160
ISSN 1028-9763. Математичні машини і системи, 2015, № 1
лицы, соответствующие классам альтернатив. Во-вторых, таблицу необходимо разделить на две части: обучающую (А) и контрольную (В) выборки. Сделать это можно одним из способов, предложенных в [7]. Вначале строки табл. 1 упорядочиваются по убыванию их выборочных дисперсий. Далее в выборку А определяем верхние 70% строк, в выборку В -70% нижних строк или в выборку А определяем все строки с нечетными номерами и 50% строк с четными номерами, оставшиеся строки составят выборку В. Возможны и другие процентные соотношения и способы формирования выборок. Очевидно также и то, что они будут влиять на точность результата.
На следующем шаге, используя строки обучающей выборки, осуществляем идентификацию зависимости (6) для каждой модели Mt из ансамбля моделей M, i = 1, p. Таким образом,
M,=E, (f), i = 1P. (П)
Обозначим
C = (Cij)
V J)i,j=1
матрицу, соответствующую контрольной выборке и
полученную в табл. 1. Подставляя в модели (11) данные матрицы С, получим табл. 2.
Таблица 2. Результаты моделирования
fl їг fk Mi M2 M p
s1 C11 C ^12 Cik mil m12 m1p
S2 C21 C22 C2k m21 m22 m2p
Sq C1 Cq2 Cqk mqi mq2 mqp
Значения m,j, i = 1, q, i = 1, p являются значениями критерия эффективности для i -ой альтернативы, полученными с использованием j -ой модели.
Далее, для каждой из моделей найдем показатель отклонения табличных значений критерия эффективности от значений, полученных с использованием моделей,
1 q
4=1 £
q i=1
/ \2
ma-El
E.
і = 1, p.
(12)
Значения St свидетельствуют о точности аппроксимации искомой зависимости. У
нас появляются основания для определения важности каждой из моделей ансамбля.
Выполним инвертирование и нормирование показателей отклонения и будем счи-
Р
тать, что 4 Є [0;1], £St = 1. Далее, для любой новой альтернативы S достаточно оп-
1=1
ределить значения показателей эффективности z. , i = 1,k. Подставив их в модели (11),
получим значения Mj, j = 1, p. Для определения значения интегрального критерия эффективности альтернативы S* используем формулу
ISSN 1028-9763. Математичні машини і системи, 2015, № 1
161
e = e (s)=E <M
i=1
(13)
Рассчитав значения критерия эффективности для всех альтернатив, определяем наилучшую из них. Если необходимо выполнить сравнительный анализ альтернатив, то полученные значения критерия эффективности необходимо нормировать.
Таким образом, предложенный метод может быть алгоритмизирован и алгоритм содержит такие шаги:
Шаг 1. Предварительная подготовка данных. Разделение выборки данных на обучающую и контрольную части.
Шаг 2. Для получения пула однотипных объектов выполнить кластеризацию альтернатив.
Шаг 3. Используя математические вычисления и осуществляя обучение моделей, получить критерии эффективности как зависимости от частных показателей эффективности. Используем данные обучающей выборки.
Шаг 4. Определить погрешность аппроксимации на данных контрольной выборки, которые интерпретируем как значения, обратные важности моделей.
Шаг 5. Вычисляем значения интегрального критерия эффективности для каждой альтернативы и определяем оптимальную альтернативу.
Для проверки адекватности разработанного метода проведены вычислительные эксперименты. В первом из них данные были сгенерированы по сложной многофакторной функциональной зависимости. Во втором случае исследовались статистические данные.
Для первого эксперимента получены такие коэффициенты важности моделей: д (линейная регрессия) =0,02; д (нелинейная регрессия)=0,14; д (полином)=0,34; д (пер-цептрон)=0,11; д (КБЕ-сеть)=0,12; д (сеть встречного распространения)=0,01; д (нечеткие продукционные правила)=0,26. Средняя относительная ошибка на проверочных данных составила 2,3%, что более, чем в два раза меньше ошибки, полученной по методу группового учета аргументов.
Особенностью второго эксперимента являлись зашумленные данные и неочевидность зависимости результирующей характеристики от входных данных. Тем не менее коэффициенты важности имеют такие значения: д (линейная регрессия)=0,04; д (нелинейная регрессия)=0,12; д (полином)=0,28; д (перцептрон)=0,10; д (КББ-сеть)=0,11; д (сеть встречного распространения)=0,05; д (нечеткие продукционные правила)=0,30. Средняя относительная ошибка проверочных данных составила 6,8%, что указывает на преимущество интегрального критерия по сравнению с наилучшей моделью - нечеткими продукционными правилами, для которых ошибка составила 9,7 % .
5. Выводы
Предложенный метод выбора варианта проектной альтернативы может быть применен с небольшими модификациями в любых задачах, связанных с необходимостью определения оптимального объекта, подсистемы, способа решения проблемы и т.п. Традиционно такого рода задачи решаются лицом, принимающим решения, исходя из опыта, интуиции и знаний. Естественно, что принятые решения являются смещенными, зачастую неэффективными, а в современных условиях и вовсе не оптимальными. Для того, чтобы уменьшить неопределенность и минимизировать доминирующий субъективизм при принятии решений, необходимо применять технологии, позволяющие объективизировать процесс определения оптимальной альтернативы.
Рассмотренная в статье технология базируется на использовании ансамбля так называемых «советующих» моделей. Определение весовых коэффициентов, указывающих на
162
ISSN 1028-9763. Математичні машини і системи, 2015, № 1
их значимость, позволяет построить критерий эффективности, являющийся интегральным показателем качества альтернатив, значения которого вычисляются без вмешательства человека.
Расширение мощности ансамбля моделей является той задачей, решение которой позволит получить усовершенствованный спектр характеристик альтернатив и уточненные показатели их качества.
СПИСОК ЛИТЕРАТУРЫ
1. ISO/IEC 2382-1:1993. Information technology. - Vocabulary. - Part 1: Fundamental terms.
2. Снитюк В.Е. Методы уменьшения неопределенности на начальных этапах проектирования систем с переменной структурой: автореф. дисс. на соискание научн. степени канд. техн. наук: спец. 05.13.12 "Системы автоматизации проектирования" / В. Е. Снитюк. - К., 1999. - 18 с.
3. Михалевич В.С. Методы последовательной оптимизации в дискретных сетевых задачах оптимального распределения ресурсов / В.С. Михалевич, А.И. Кукса. - M.: Наука, 1983. - 208 с.
4. Saaty T.L. The Hierarchon: A Dictionary of Hierarchies / Saaty T.L. - Pittsburgh, Pennsylvania: RWS Publications, 1992. - 496 p.
5. Грубер И. Эконометрия. Введение в эконометрию / Грубер И. - К.: Астарта, 1996. - Т. 1. - 434 с.
6. Снитюк В.Є. Прогнозування. Моделі, методи, алгоритми / В.Є. Снитюк. - К.: Маклаут, 2008. -364 с.
7. Ивахненко А.Г. Моделирование сложных систем по экспериментальным данным / А.Г. Ивахнен-ко, Ю.П. Юрачковский. - М.: Радио и связь, 1987. - 120 с.
8. Хайкин С. Нейронные сети: полный курс / Хайкин C. — М.: Вильямс, 2006. — 1104 с.
9. Kosko B. Fuzzy Systems as Universal Approximators / B. Kosko // IEEE transactions on computers. -1994. - Vol. 43, N 11. - P. 1329 - 1333.
Стаття надійшла до редакції 05.01.2015
ISSN 1028-9763. Математичні машини і системи, 2015, № 1
163