цов. Новосибирск : Сиб. изд. фирма СО РАН «Наука», 2000.
7. Parzen E. On Estimation of a Probability Density Function and Mode // Ann. Math. Statistic. 1962. Vol. 33, № 3. P. 1065-1076.
8. Лапко А. В., Лапко В. А. Анализ асимптотических свойств непараметрической оценки уравнения
разделяющей поверхности в двуальтернативной задаче распознавания образов // Автометрия. 2010. Т. 46, № 3. С. 48-53.
9. Епанечников В. А. Непараметрическая оценка многомерной плотности вероятности // Теория вероятности и ее применения. 1969. Т. 14. Вып. 1. С. 156-161.
A. V. Lapko, V. A. Lapko
COMPARISON OF NONPARAMETRIC TESTING CRITERIA OF HYPOTHESIS OF DISTRIBUTION OF RANDOM VARIABLES
From a perspective of collective estimation principles, the authors worked out the technique of testing, for a hypothesis of identity of laws of distributions of random variables, based on nonparametric algorithms ofpattern recognition. Results of its comparison with Smirnov and Pearson criterion are presented.
Keywords: nonparametric statistics, pattern recognition, statistical hypothesis testing, random variables distribution, Smirnov criterion, Pearson criterion.
© Лапко А. В., Лапко В. А., 2011
УДК 62.501
А. В. Медведев
ТЕОРИЯ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ. АКТИВНЫЕ ПРОЦЕССЫ - I
Исследуется проблема моделирования организационных процессов и управления ими. Существенную роль при этом играет априорная информация. Обсуждаются вопросы принципиального отличия управления техническими и активными системами. Основной особенностью здесь является необходимость введения контуров управления в систему контроля некоторых выходных переменных, а также систему управления процессом реализации найденного управляющего воздействия.
Ключевые слова: активные системы, идентификация, априорная информация, измерение, гипотезы, непараметрические модели, дискретно-непрерывные процессы, К-модели.
В последние десятилетия внимание исследователей все больше привлекают процессы организационного характера. К ним относятся процессы, протекающие с участием человека или коллективов людей, в частности объектов промышленности, коммерческих структур, региональных образований и др. Характерными особенностями последних являются неполнота априорных данных, неопределенность, взаимосвязанность, трудность формирования согласованных целей и способов их достижения и др. Неполнота априорных сведений приводит к необходимости формулировать те или иные задачи локального характера
Теория - в виду практики.
Девиз конгрессов IFAC
Ограничиваясь одними рассуждениями, мы уподобились бы некоторым древним философам, пытавшимся добывать законы природы из собственной головы. При этом неизбежно возникает опасность, что построенный таким образом мир при всех своих достоинствах окажется весьма мало похожим на действительный...
Л. Д. Ландау
в различных, принципиально отличающихся постановках, а их объединение в единую систему представляет серьезные теоретические трудности. В частности, задача управления организацией, коллективами во многом остается в большей степени искусством, чем наукой. Обусловлено это тем, что присутствие человека (коллектива) в исследуемом процессе требует учета ряда факторов, а именно: морального, психологического, престижного, и других черт, свойственных человеку, наиболее важной из которых является искажение информации о своих возможностях, целях, способах и средствах их достижения.
Подобные процессы и соответствующие им системы стали называть активными [1]. Различные уровни априорной информации, характеристики процессов, проблемы их моделирования более подробно были рассмотрены ранее [2; 3; 4]. Предметом данного исследования будут активные системы.
Активные системы. Рассмотрим схему локальной организационной системы (рис. 1). Пусть А - неизвестный оператор объекта; х(/) - векторная выходная переменная процесса; и(/) - векторное управляющее воздействие; |(0 - векторная входная переменная процесса; |(0 - векторное случайное воздействие; У) - непрерывное время; Н1, Ни, Нх, Н0,
Ню, Нч, Н2 - каналы связи, соответствующие различным переменным, включающие в себя средства контроля, приборы для измерения наблюдаемых переменных; |, и, х{, 0(, qt, , ю{ означают изме-
рение |(/), и(/), х(/), 0(t) , q (^), 2 (t) , ю(t) в дискретное время t. Контроль переменных (х, и, |, 0, q, г) осуществляется через некоторый интервал времени, т. е. х1, щ, |, 0г-, qi, , юi, I = 1,5 -
выборка измерений переменных процесса
( U1, ^ 0l, ql, г1, Ю1 ) ^х2, ^ ^ 02, q2, 2 2, Ю2 ),...,
(, и,1,, 0,, qs, , ю )...;
5 - объем выборки, И1 ^), Их ^), Ии (t), Ию ^), И0 (t), И4 (t), И2 (t) - со значком вверху - случайные помехи
измерений соответствующих переменных процесса.
Отметим существенное отличие выходных переменных г(/), q(t) и х(/) (см. рис. 1). Выходная переменная х(/) контролируется через интервалы времени At, как и входные переменные, а q(t) контролируются через существенно большие интервалы времени -АТ, 2 - через Т (Т >> АТ >> Дt). С практической точки зрения для исследуемого процесса наиболее
важным часто является контроль переменных 2^). Этим и обусловлено существенное отличие дискретности контроля выходных переменных q(t) и 2($).
Особенностью здесь является то, что измеренное значение выхода объекта станет известным только через определенные промежутки времени, этим объясняется запаздывание в измерениях выходных переменных объекта х(/), q(t) и 2(г). Интервалы Д^ АТ и Т определяют дискретность, с которой происходят измерения. Стрелки, помещенные внутри объекта (см. рис. 1), символизируют наличие в нем человека (коллектива людей). Контроль переменных q(t) и 2($) осуществляется аналогично контролю х^) (на рисунке не показано, чтобы не загромождать его). Переменная 0^) представляет собой воздействие на объект внешней среды. Для организационных систем это могут быть какие-либо распоряжения, постановления, приказы, а также законодательные акты, которые с течением времени претерпевают те или иные изменения.
В этом случае х^) определяется следующим образом:
х^) = А(и^ - т), - т), ю^ - т),-т),0^ - т), ^),t).
Не следует путать запаздывание т, присущее процессу, и запаздывание (задержку) при измерении тех или иных переменных процесса.
Модель исследуемого процесса х^) может быть представлена следующим образом:
х^) = Ах (и^ - т), - т), ю^ - т), 0^ - т), t).
При прогнозировании q(t) и 2^) целесообразно использовать следующие зависимости:
q(t) = А9 (u(t - т), - т),ю^ - т),0(t - т), х^), t),
2^) = А2 (и(/ - т), |(/ - т), ю(/ - т), 0(/ - т), х(/), q(/), /),
где т - запаздывания, различные по соответствующим каналам связи.
Рис. 1. Общая схема многомерного активного процесса
В дальнейшем, из соображений простоты, все входные переменные, поддающиеся контролю, объединим в один совокупный вектор v(t), а выходные -в совокупный вектор у(/); векторы промежуточных переменных обозначим ю(/). Тогда схема, представленная на рис. 1, примет упрощенный вид (рис. 2).
£ я Пф
Л (ш) = ^ J='
cs
cs
s k
£Пф
і=1 j=1
f і i\ n f j i\
v - vi т\ ^ Ю7 -Ю7
Пф
__
f j j \ n f j j \
v - vi Д ^ &J -ю7
Пф
cs
j=1
cs
где колоколообразные функции Ф
и пара-
метр размытости удовлетворяют некоторым асимптотическим условиям сходимости [5]. Выбор компонент вектора параметров отыскивается из условия
К (С5 ) = К ( , С2 , ..., С[Гк }) =
минимума критерия
:s-1 £ (уі- я (vj,ю j ))2
по всем компонентам
j=1
вектора cs =
,(n+k)
). При
этом имеет место
Рис. 2. Упрощенная схема активной системы
Поясним содержание термина «совокупный вектор» - это вектор, составленный из некоторых компонент соответствующих векторов. Например, компоненты вектора входных переменных (см. рис. 2)
v(t) могут быть такими: V1 = (и], 1а3, 91, и2),
2 ( 2 4 3 1 3 \
vt = I и , и(, 9^ а, а) и т. п. Соответственно компоненты векторов ю(t) и у (ї) могут быть составлены так: Ю1 = (юи, ®3ї, ®4ї ) , ®2 =(®2ї, Ю3ї ) ;
у1 = (Х, , г2, ^), у2 = (X3, г2, ^, ^, X4) и т. п.
Состав компонент составных векторов находится в прямой зависимости от конкретного исследуемого процесса, наличия априорной информации о нем, его характеристиках, свойствах и т. д.
Принципиальным отличием моделирования организационных систем от других является наличие обратных связей, контуров управления, «встроенных» в исследуемый процесс извне. Это коренным образом меняет взгляд на проблему идентификации, которая усугубляется еще и тем, что необходимо изучать ее в «широком» смысле. Тем не менее в условиях непараметрической неопределенности возможно использование статистик у:! (ї) = £ (V (ї), ю (ї), у:!, V, ю;), где
£ - статистика; у = (У1,..., У:;), ^ =(vl,...,vs),
ю; =(ю1,...,ю;) - временные векторы; ; - объем
выборки наблюдений «входных-выходных» переменных объекта.
В основе последующих непараметрических моделей активных систем будут лежать непараметрические оценки функции регрессии по наблюдениям у; , Vs, со; вида [5]
следующее правило выделения существенных переменных.
*
Пусть R таково, что
R* (с* ) = min R (cs),
' с!с2 с(”+к)
тогда из всех компонент вектора cs можно выстроить цепочку неравенств. Компонента вектора v или ю, для которой параметр размытости окажется максимальным, оказывает наименьшее влияние на значение ys (v,ю), т. е. ее «вклад» в ys (v,ю) минимальный.
*
Например, если цепочка компонент вектора cs будет выглядеть следующим образом:
>+к - 3)*
5* 3* _ (n+к )*
cs > cs, > ... > cs ’
> cs > cs
(1)
то «кандидатом» на отбрасывание является пятая ко мпонента векторов V или ю из имеющегося набора (п + к) компонент вектора (у,ю). Заметим, что прежде чем решать задачу, необходимо все элементы выборки , ю5} привести к одному интервалу, используя, например, операции нормирования и центрирования.
В качестве непараметрических моделей активных систем могут быть приняты следующие статистики:
У5 (У (t), ю()) =
Е У№ ( (у (t) - V)) Ж ( (ю (t) - юi)) (2)
= _£=1___________________________________
5
Е Ж (п ( ()- V))) (л, (ю (t)- юi))
i=1
где Ж ( ) - некоторые колоколооборазные (ядерные) функции; весовые коэффициенты п, - обратные коэффициенты параметрам размытости, входящим в непараметрические оценки и алгоритмы [5], с той лишь разницей, что п5 0, а играют роль весовых
коэффициентов при соответствующих компонентах векторов V (t) и ю (t), поэтому в дальнейшем индекс 5 при п мы будем опускать. Принципиальным отличием статистик (2) от общепринятых [5; 6] непараметрических оценок является несостоятельность
предположения о наличии генеральной совокупности, стремлении 5 к бесконечности и, как следствие этого, отсутствие каких-либо асимптотических свойств оценок из класса (1), предполагающих 5 .
Оценка из класса (1) в частном случае примет вид
У5(у(?),ю(t)) =
Еу Пж ( ( ()- у/))ПЖ (л/ ( ()-ю()) (3)
= i=1 (=1_(=________ ( )
ЕПЖ( ( ()-У/))ПЖ( (ю((t)-ю/))
г=! (=1 (=1
либо
У5 (у (?) ю(?)) = Е I (у (?), ю(?)П , (4)
i=1
где
| (у (? п ю( ? )) = ( ( (?)-у ))Пж ( ( (?)-ю())
= (=1_(=1__________
Е ПЖ (п (у( (?)- у ))Пж ( (ю ((? )-ю())
('=1 (=1
5
а Е| (у (?), ю(?)) = 1, коэффициенты п являются
г'=1
весовыми коэффициентами.
Заметим, что алгоритмы (2)-(4) уже перестают быть непараметрическими оценками в общепринятом смысле. Мы сохраним термин «непараметрический», имея в виду отсутствие параметрической модели, но наличие некоторых сведений о свойствах качественного характера исследуемого процесса.
Активную систему можно представить в виде более общей схемы (рис. 3), где из соображений простоты мы не вводим специального обозначения «вход-ных-выходных» переменных (см. рис. 1), а ограничиваемся лишь связями между отдельными локальными процессами.
Контроль переменных, измерения, оценка.
Здесь мы подчеркнем важность проблемы измерения «входных-выходных» переменных исследуемого объекта,
процесса. Ранее [2; 3] уже отмечалось, что различные средства контроля даже для одних и тех же процессов приводят к различным формулировкам задач идентификации. Главное, что следует выделить в этой проблеме: нередко динамический объект мы вынуждены рассматривать как статический с запаздыванием из-за длительной процедуры контроля (измерения, анализа) некоторых переменных, существенно превышающей постоянную времени объекта.
Безусловно, при моделировании дискретнонепрерывных процессов и управлении ими целесообразно использовать все поддающиеся измерению переменные, но это требует тщательного анализа не только самого конкретного объекта, но и средств и технологии контроля всех доступных переменных, а также априорной информации, которая поступает одновременно по различным каналам измерения переменных многомерной системы объекта. Неучет тех или иных переменных, параметров, характера измерения и контроля, априорной информации, а также некоторая «вольность» при принятии тех или иных допущений, неизбежных при математической постановке задачи, может привести в конечном счете к негативным последствиям. Вся эта сумма вопросов часто не принимается во внимание при исследовании проблемы моделирования с теоретической точки зрения [4]. При решении же прикладных задач, построении моделей конкретных процессов это просто невозможно, ибо «истина ничуть не страдает от того, если кто-либо ее не признает» (И. Ф. Шиллер). Представляется уместным еще раз акцентировать внимание исследователя на формулировке проблемы идентификации реального процесса на самой начальной стадии.
Следует еще заметить, что измерения переменных исследуемого организационного процесса могут отличаться по своей природе. При построении соответствующих моделей активных процессов и алгоритмов управления ими, конечно же, это нужно учитывать. К наиболее употребительным шкалам измерения обычно относят следующие [7]: вещественную шкалу, шкалу отношений, шкалу интервалов, шкалу порядка, шкалу наименований.
Рис. 3. Фрагмент организационного процесса
Принципиальное отличие организационных систем от технических состоит в существенно отличающихся средствах контроля и измерения соответствующих переменных. И главное здесь обусловлено тем, что элементом средств измерения некоторых «входных-выходных» переменных, характеризующих состояние процесса, является человек, эксперт, группа экспертов. Мы оставляем в стороне технологию проведения такого измерения, оценки, экспертизы. Важнейшим здесь является то, что измерения, оценка некоторых переменных невозможны без участия человека, а значит, обязательного «присутствия» в них субъективных факторов: психологических, эмоциональных и т. п.
Математические постановки задач моделирования и управления. Ранее [8] мы уже обращали внимание на необходимость использования всей имеющейся информации о процессе и построении К-моделей. Эта информация базируется на триаде: фундаментальные законы, априорная информация о параметрической структуре отдельных связей (каналов) процесса и сведения качественного характера о процессе. Естественно, формирование матрицы наблюдений, включающей разнотипные переменные, принадлежащие различным шкалам - предмет специального рассмотрения в каждом конкретном случае.
Известно, что отыскание управляющих воздействий при соответствующих условиях осуществляется в диалоге «компьютерная (обучающая, интеллектуальная) система - ЛПР. Но компьютерная система управления с ЛПР организационными процессами требует также систему управления процессами реализации принятых управленческих решений. Это также существенно отличает процесс управления активными системами от технических систем.
Из вышесказанного следует, что система управления организационными процессами является принципиально иерархической, многоконтурной системой, включающей в себя человека как необходимый и важнейший элемент. Переход на новый режим подобного процесса, его перестройка является существенно нелинейной задачей, сложной и с точки зрения теории, и с точки зрения практики. Как справедливо замечено в [9], «не требуется, однако, специальной математической теории, чтобы понять, что пренебрежение законами природы и общества (будь то закон тяготения, закон стоимости или необходимость обратной связи), падение компетентности специалистов и отсутствие личной ответственности за принимаемые решения приводят рано или поздно к катастрофе. Математическая теория перестроек была создана задолго до нынешней перестройки. Трудность проблемы перестройки связана с ее нелинейностью. Привычные методы управления, при которых результаты пропорциональны усилиям, тут не действуют, и нужно вырабатывать специфически нелинейную интуицию, основанную порой на парадоксальных выводах нелинейной теории».
Совершенно очевидным является факт наличия существенно различной априорной информации об
исследуемом процессе [2]. Как следствие этого - различные математические постановки задач, с точки зрения математической строгости. Одним из основных «камней преткновения» на этом пути является несоответствие наших предположений об исследуемом объекте самому объекту. После традиционно произносимого «Пусть процесс...» следуют такие предположения, гипотезы, которые, к сожалению, часто имеют отдаленное отношение к реальности. Трудно представить себе процесс, объект, характеристики которого были бы неизменными или менялись бы по известному закону с течением времени. Мы имеем в виду процессы, описанные в [1], средства и технологии измерения переменных объектов, которые представляют интерес в существующей теории автоматического управления. Основные их черты - это недостаток априорной информации, воздействие случайных факторов, характеристики которых нам не известны, недостаток и несовершенство средств контро ля переменных, непредставительность отбора проб для измерений и многое другое. Наше незнание, приходится, к сожалению, заменять, говоря «Пусть.». Ясно, что если наши допущения достаточно близки к реальности, то в итоге можно рассчитывать на успех при решении той или иной задачи, если же - нет, то неудача неизбежна. Действительно, многие процессы и объекты в основе функционирования которых лежат фундаментальные законы физических, химических, электрических, механических и других явлений, могут быть описаны с высокой степенью точности. Соответственно для них могут создаваться и модели, и системы управления достаточно высокого качества, что во многих случаях имеет место.
Если же допущения слишком «грубые», то, видимо, есть два пути. Первый - восполнение нашего «незнания» о процессе, когда можно будет сделать аккуратную, с математической точки зрения, постановку задачи. Второй путь состоит в развитии математиче-с ко го подхода, адекватного тому уровню априорной информации, которым мы реально располагаем.
Нам предстоит в будущем моделировать и управлять реальными процессами, описанными в [2], включая организационные, потому что этого требует реальность, практика. В частности, многие экономические процессы могут быть отнесены к организационным. Еще в середине прошлого столетия по поводу применения математики в экономике Дж. фон Нейман и О. Моргенштерн писали: «Прежде всего отдадим себе отчет в том, что в настоящее время в экономической теории не существует универсальной системы и что если она и будет создана, то едва ли это произойдет в ближайшее время. Причина этого кроется в том, что экономика является слишком сложной наукой.». И далее: «Часто аргументация против применения математики состоит из ссылок на субъективные элементы, психологические факторы и т. п. <...> Важно осознать, что экономисты не могут надеяться на более легкую судьбу, чем та, которая постигла ученых других специальностей.
<...>
Важность социальных явлений, обилие и многообразие их проявлений, а также сложность их структуры по меньшей мере такие же, как и в физике. Поэтому следует ожидать (или опасаться), что для достижения в этой области решающих успехов потребуются математические открытия, сопоставимые с открытием инфинитезимальных исчислений. Тем более маловероятно, что простое повторение тех математических приемов, которые нам помогали в физике, поможет нам и в экономике. Вероятность этого покажется еще меньше, когда мы увидим, что в наших рассуждениях появляются математические задачи, совершенно отличные от задач, встречающихся в физике.
Эти соображения следует иметь в виду в связи с имеющим место в наши дни злоупотреблением в использовании дифференциального и интегрального исчислений, дифференциальных уравнений и т. д. как основного метода в математической экономике.
<...>
Несомненно, представляется разумным вскрыть, что именно привело к прогрессу в других науках, и исследовать, почему применение этих принципов не может привести к прогрессу в экономике. Если же действительно возникает необходимость приложения к экономике каких-то иных принципов, то это может обнаружиться только в процессе фактического развития экономической теории. Это само по себе будет переворотом в науке» [10].
Прошло более полувека, но математики для экономической науки, а также для моделирования и управления организационными процессами не появилось, хотя некоторые продвижения в этом направлении есть: разработаны основы теории активных систем, теория размытых множеств, теория принятия решений, системный анализ и теория систем и др.
Таким образом, основной отличительной чертой процесса управления организационными и техническими системами является необходимость наличия
не только системы управления в общепринятом смысле, но и системы управления реализацией полученных управленческих решений и системы оценивания выходных переменных активного процесса, которые сами по себе носят организационный характер.
Приведено правило выделения существенных переменных, характеризующих состояние исследуемого процесса, а также обучающие модели и алгоритмы принятия решений для организационных систем из класса непараметрических алгоритмов адаптации.
Библиографические ссылки
1. Бурков В. Н. Основы математической теории активных систем. М. : Наука, 1977.
2. Медведев А. В. Теория непараметрических систем. Процессы // Вестник СибГАУ. 2010. Вып. 3 (29). С. 3-9.
3. Медведев А. В. Теория непараметрических систем. Моделирование // Вестник СибГАУ. 2010. Вып. 4(30). С. 4-9.
4. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968.
5. Надарая Э. А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси : Изд-во Тбилис. ун-та, 1983.
6. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983.
7. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск : Изд-во ИМ СО РАН, 1999.
8. Medvedev A. V. Nonparametric approximation in adaptive systems theory // Works of Applied Methods of Statistical Analysis. Simulation and Statistical Inference. Novosibirsk : STU, 2011.
9. Арнольд В. И. Теория катастроф. М. : Наука, 1990.
10. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М. : Наука, 1970.
A. V. Medvedev
THEORY OF NON-PARAMETRIC SYSTEMS. ACTIVE PROCESSES - I
The problem of modeling and control of organizational systems, which contain, as a system element, a man or a group ofpeople, are investigated. A priori information obtained is considered to be essential. The problems of conceptual difference in modeling and control of technical and active systems are discussed. The main peculiarity is the necessity to introduce control loop into the control system of some output variables as well as into control system ofproc-ess of realization of the received controlling effect.
Keywords: active systems, identification, a priori information, measurement, hypotheses, non-parametric models, discrete and continuous processes, K-models.
© Медведев А. В., 2011