УДК 658.5
UDC 658.5
РАНЖИРОВАНИЯ ПЕРЕМЕННЫХ ДЛЯ RANGINGS OF VARIABLES FOR
ИДЕНТИФИКАЦИИ ЦЕЛЕВЫХ ФУНКЦИЙ В IDENTIFICATION OF CRITERION
ЗАДАЧАХ УПРАВЛЕНИЯ И АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ
Стародубцев Виктор Сергеевич
д.т.н., к.г.-м.н., профессор
Российский государственный социальный
университет филиал в г.Воронеж, Воронеж,
Россия
Шхачева Рита Гучипсовна
Майкопский государственный технологический университет, Майкоп, Россия
Рассматривается алгоритм выбора независимых параметров в многопараметрических задачах идентификации целевых функций производства
Ключевые слова: АЛГОРИТМ, СТРУКТУРНАЯ ИДЕНТИФИКАЦИЯ, СИСТЕМА, СИСТЕМЫ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ
FUNCTIONS IN PROBLEMS OF MANAGEMENT AND DESIGNING AUTOMATION
Starodubtsev Victor Sergeevich Dr.Tech.Sci., Cand.Geol.-Min.Sci., professor Russian state social university branch in Voronezh, Voronezh, Russia
Shkhacheva Rita Guchipsovna
Maykop state technological university, Maykop, Russia
The algorithm of a choice of independent parameters in multiple parameter problems of identification of criterion functions of manufacture is considered
Keywords: ALGORITHM, STRUCTURAL IDENTIFICATION, SYSTEM, SYSTEMS OF AUTOMATION OF DESIGNING
Исследуя и моделируя сложные объекты, мы в большинстве случаев не можем точно определить, какие из параметров влияют на исследуемую систему, а какие есть производные первых. Для выяснения этого к перебору допускается как можно больше известных нам параметров, чтобы исключить один из моментов субъективного подхода в моделировании [1, 3]. С другой стороны, увеличивая количество исходных членов полного описания, мы увеличиваем время решения задачи, а также возникает возможность появлению зависимых переменных, что в свою очередь влечет плохую обусловленность матрицы коэффициентов и приводит в конечном результате к неверным решениям. Определение коэффициента парной корреляции
Ri,i =
M 2
X X g,i X g j
g = M1_______________
M 2 - M1 +1
, І *i; І=i,
где М1 - начало выборки, а М2 - конец выборки, 1, ] = 1, 2, ..., п, где п -количество переменных взятых для проведения эксперимента по идентификации целевых функций изучаемых процессов.
Коэффициент парной корреляции позволяет исключить из процесса идентификации модели с зависимыми переменными, т.е. с коэффициентом Я0 > 0,7. При большом количестве входных параметров процесс отбора независимых параметров становится неэлементарной задачей.
Для обеспечения автоматизированного корректного выбора независимых параметров во множестве фактических данных предлагается алгоритм ранжирования переменных. Алгоритм основан на ранжировании переменных (таблица 1), исходя из значения соответствующих коэффициентов парной корреляции между отдельными переменными.
Таблица 1 - РАНЖИРОВАНИЕ ПЕРЕМЕННЫХ ПО ЗНАЧЕНИЮ
ВЕЛИЧИНЫ КОЭФФИЦИЕНТА ПАРНОЙ КОРРЕЛЯЦИИ Ru
Значение коэффициента парной корреляции Ранг
R,., >0.9 1,25
0,9 < Ri] < 0,85 1
0,85 < Ri] < 0.8 0,75
0,8 < Ru < 0,75 0,5
0,75 < Ri,, < 0,7 0,25
Суммарный ранг переменной х; определяется в соответствии с выражением
n-1
RANG, = £ Rh] . (2)
] = 1
Из эксперимента исключаются переменные с максимальными значениями RANG. Количество переменных допускаемых для идентификации модели изучаемого процесса (n*) определяется исходя из возможности метода и (или) исходя из исключения всех переменных с Rjj > 0,7. В общем виде структурную схему алгоритма ранжирования переменных можно представить в виде рисунке 1.
Рисунок 1. Алгоритм ранжирования переменных по величине коэффициента парной корреляции ^ - множество управляющих
параметров)
Предлагаемый алгоритм ранжирования переменных был использован для идентификации целевых функций в задачах автоматизированного проектирования систем водозаборов подземных вод с учетом качественной составляющей питьевой воды и поддержки принятия управленческих решений с использованием метода группового учета аргументов (МГУА (Group Method of Data Handling, GMDH)).
Задача математического моделирования по выборкам наблюдений за протеканием исследуемого процесса - это задача восстановления зависимости вида
y = h(x) + h h:Rm ® Rn, (3)
где h = (h1--h n) - ошибка наблюдения.
Задачу восстановления зависимости (3), решаемую с помощью МГУА, можно сформулировать следующим образом [1]. Пусть выполнены следующие предположения:
- существует единственная зависимость h:Rm ® Rn между входной X и выходной Y величинами;
- задан класс F - класс структур отображений;
- задана (n x m) матрица Хзначений входной величины (выборка):
- y = (у0 +h1,--,y0 + hn), где y0,. .,y0 - истинные значения выходной величины в n точках, h = (h1-- h n) - ошибка наблюдений, причем величины hi, (i=1,...,n) предполагаются случайными, независимыми, одинаково распределенными с нулевым математическим ожиданием и конечной дисперсией.
В этих предположениях требуется решить задачу нахождения такой
*
структуры f е F, что
S(f *)= inf S(f)
f е F
или (если f *£ F) такой структуры f ee F, что
S(fe)= inf S(f ) + e,e>0.
f е F
Учитывая один из основных принципов теории МГУА - принцип "свободы выбора решений", дифференциальное уравнение конвективнодиффузионного переноса мигранта в двумерном потоке [2] для задачи автоматизированного проектирования систем водозаборов подземных вод с учетом качественной составляющей питьевой воды используем полное описание класса структур для идентификации процесса массопереноса загрязняющих компонентов подземных вод вида
дс
— = а, д/
(л 2 V- к (л 2 V - к /-Л V -к ( -Л V -к
д 2с
+ а2
д х д у
д 2с
+ а3
+ а4
+ (4)
+ а5 ¥ \~к + а6 ¥ *-к + а7 ¥ 1~к + а8 ¥ 4-к + а9 ¥ 5-к + а 10 ¥ 6-к + а11,
где с - концентрация ионов загрязняющего компонента (например, железа или марганца) в подземных водах (прогнозируемая переменная в мг/л); а1 -а4 - соответствующие коэффициенты при производных; / - время; х, у -пространственные координаты; к - запаздывание по времени, к = 1, 2, 3;
3 0
¥ - водоотбор в тыс.м /сут; ¥2 - температура воздуха в С ; ¥3 - осадки в мм; ¥4 - рН поверхностных вод; ¥5 - содержание О2 в поверхностных водах водохранилища мг/л; ¥6 - содержание ионов хлора в поверхностных водах водохранилища мг/л; а5 - а10 - соответствующие коэффициенты при ¥ 1 -¥6; а11 - свободный член.
Для задачи маркетинга, как объекта математического моделирования, по реализации прогнозирования экономической деятельности предприятий промышленности рассматривались на основе следующего класса структур
—=а 1х1 т + а2х2 т + к+аку/ т+ак+1ук+Т + к+
д‘ , (5)
/ — т , / — т ,
+ ап —1^„ — 1 + ап^п + а 0
где У - идентифицируемая функция, х1, х2,... - внешние параметры производства, ук, vk+1,... - внутренние параметры, wn-1, ^п - управляющие параметры, / - время, а1-ап - коэффициенты при параметрах социально-
экономической системы предприятия, а0 - свободный член, m = 0, 1 , 2 -шаг запаздывания, который равен кварталу.
Таким образом, на базе полного описания (4) рассматривались 10 параметров, а с учетом запаздывания по времени (0, 1 и 2) - 30 параметров.
В задаче маркетинга (5) количество параметров определяется возможностями исследователя провести мониторинг изучаемой социальноэкономической системы предприятия. Как правило, количество параметров в этом случае может достигать несколько десятков и даже сотен.
*
Для комбинаторного алгоритма МГУА [1] max n = 25, т.е. максимально может осуществляться перебор не более чем 225- 1 моделей претендентов. Рассмотрим возможности предлагаемого алгоритма для задачи маркетинга (5).
В задаче маркетинга для пищевого предприятия рассматривалась возможность повышения рентабельности производства. В этом случае проводились исследования по идентификации целевой функции формирования выручки от продажи товаров (Yj) и основных составляющих себестоимости продукции цены на молоко (Y2), масло (Y3), муку (Y4) и сахар (Y5). Для идентификации процесса формирования выручки от продажи товаров (Yj) на базе полного описания (3) было использовано 46 параметров, а с учетом запаздывания по времени (0, 1 и 2)
- 138 параметров. Аналогично для процессов формирования цен на молоко (Y2), масло (Y3), муку (Y4) и сахар (Y5) - 22 независимых параметров и с учетом запаздывания по времени (0, 1 и 2) - 66 независимых параметров.
Использование 138 независимых параметров для процесса идентификации модели "Выручка от продажи товаров" и 66 независимых параметров для моделей процессов формирования цен на молоко, масло, муку и сахар потребовало использования алгоритма ранжирования переменных при идентификации целевых функций рассматриваемых
процессов. Оценка эффективности отбора проводилась по критерию эпигнозного прогноза (Р) (рис. 2 - 6).
Р =
с
1
1=Б+1
1 кщ, -у,У,
с
1 Уц
1=Б+1
,
(6)
где У ш - модель, полученная по выборке Б, У и - табличное значение
выходной величины, при этом мощность выборки фактических данных О рассматривалась в виде О =Б+С, где Б=А+В.
0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
10
12
14
независимых переменных
І І І I
16 18 20 22
2
4
6
8
Рисунок 2. Значение критерия эпигнозного прогноза (Р) при изменении числа независимых параметров для параметра "Выручка от продажи
товаров"
Результаты оптимизации числа независимых параметров сведены в таблицу 2.
Интервал 10-12 независимых параметров для модели "Выручка от продажи товаров" объясняется тем, что при изменении числа независимых параметров выбиралась одна и та же модель.
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
Р
Количество независимых переменных
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Рисунок 3. Значение критерия эпигнозного прогноза (Р) при изменении числа независимых параметров для параметра "Молоко"
Рисунок 4. Значение критерия эпигнозного прогноза (Р) при изменении числа независимых параметров для параметра "Масло"
Рисунок 5. Значение критерия эпигнозного прогноза (Р) при изменении числа независимых параметров для параметра "Мука"
Рисунок 6. Значение критерия эпигнозного прогноза (Р) при изменении числа независимых параметров для параметра "Сахар"
Таблица 2 - ЧИСЛО НЕЗАВИСИМЫХ ПАРАМЕТРОВ, ОТОБРАННЫХ ДЛЯ ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТОВ ПО ИДЕНТИФИКАЦИИ ЭКОНОМИКО-СОЦИАЛЬНЫХ ПРОЦЕССОВ ПИЩЕВОГО
ПРОИЗВОДСТВА
Параметр Значение критерия эпигнозного прогноза (Р) Число независимых параметров
Выручка от продажи товаров 0,02824 10-12
Молоко 0,03704 9
Масло 0,00336 12
Мука 0,05577 10
Сахар 0,02614 9
Полученные результаты эксперимента по идентификации моделей
экономических процессов пищевого производства позволяют сделать вывод об эффективности предложенного алгоритма ранжирования переменных при идентификации целевых функций, позволяющего значительно сократить время проведения эксперимента (что определяет количество допущенных к эксперименту переменных п) и получать прогностические модели экономических процессов для целей управления, в том числе и для принятия управленческих решений в связи с малой погрешностью прогноза (3% - 5%).
Литература
1. Ивахненко А. Г. Индуктивный метод самоорганизации моделей сложных систем.-Киев: Наук. думка, 1982.-296 с.
2. Шестаков В.М. Динамика подземных вод.-М.: Изд-во МГУ, 1979.-368 с.
3. Шхачева, Р.Г. Моделирование бизнес-процессов с учетом затрат на маркетинг // Системы управления и информационные технологии. 2010. №1.2.(39). С. 280- 284.