Научная статья на тему 'Модели разработки и освоения технологии комплексной деятельности'

Модели разработки и освоения технологии комплексной деятельности Текст научной статьи по специальности «Математика»

CC BY
189
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНОЛОГИЯ / КОМПЛЕКСНАЯ ДЕЯТЕЛЬНОСТЬ / КРИВАЯ НАУЧЕНИЯ. / TECHNOLOGY / COMPLEX ACTIVITY / LEARNING CURVE

Аннотация научной статьи по математике, автор научной работы — Белов Михаил Валентинович, Новиков Дмитрий Александрович

Представленные математические модели и задачи основываются на результатах и продолжают анализ проблем управления организационно-техническими системами и их комплексной деятельностью, выполненный в предыдущих работах авторов. Проблема разработки и/или освоения технологии комплексной деятельности формализована в виде математической модели, являющейся обобщением вероятностных моделей научения. Исследованы свойства процесса разработки и/или освоения технологии (научения), показана сходимость процесса к состоянию полного освоения технологии, получены аналитические выражения характеристик моделей – среднего времени достижения заданного уровня освоения. Предложены модели научения, описывающие комплексирование элементов технологии – конъюнктивное, дизъюнктивное и параллельное освоение технологии. Разработаны и изучены модели научения в процессе работы и группового научения. в том числе модели «научения научению» когда интенсивность процесса научения зависит от достигнутого уровня научения. Для всех моделей комплексирования получены аналитические выражения для уровней научения. Исследован асимптотический случай моделей при переходе к непрерывному времени. Показано, частными случаями предложенной модели являются модели экспоненциальных, гиперболических и логистических кривых научения, которые широко распространены в теории научения, теории испытаний систем, тестирования программного обеспечения и смежных отраслях знаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Models of designing and learning a technology of complex activity

Presented mathematical models are based on previous studies of the problems of managing organizational and technical systems and their complex activities, executed by the authors. The problem of developing and / or mastering the technology of complex activity is formalized in the form of a mathematical model, which generalizes of probabilistic learning models. The properties of the process of developing and / or mastering technology (learning) are studied, the convergence of the process to the state of full technology mastering is shown, analytical expressions of the characteristics of the models are obtained the average time to reach a given level of mastering. The models of learning that describe the integration of elements of technology conjunctive, disjunctive and parallel development of technology are proposed. Developed and studied models of learning in the process of work and group learning. including the “learning to learn” model when the intensity of the learning process depends on the learning level achieved. For all models of integration, analytical expressions for learning levels are obtained. The asymptotic case of models during the transition to continuous time is investigated. It is shown that special cases of the proposed model are models of exponential, hyperbolic, and logistic learning curves, which are widespread in the theory of learning, theory of system testing, software testing, and related branches of knowledge.

Текст научной работы на тему «Модели разработки и освоения технологии комплексной деятельности»

МОДЕЛИ РАЗРАБОТКИ И ОСВОЕНИЯ ТЕХНОЛОГИИ КОМПЛЕКСНОЙ ДЕЯТЕЛЬНОСТИ1

Белов М. В.2

(Компания ИБС, Москва) Новиков Д. А.

(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)

Представленные математические модели и задачи основываются на результатах и продолжают анализ проблем управления организационно-техническими системами и их комплексной деятельностью, выполненный в предыдущих работах авторов. Проблема разработки и/или освоения технологии комплексной деятельности формализована в виде математической модели, являющейся обобщением вероятностных моделей научения. Исследованы свойства процесса разработки и/или освоения технологии (научения), показана сходимость процесса к состоянию полного освоения технологии, получены аналитические выражения характеристик моделей - среднего времени достижения заданного уровня освоения. Предложены модели научения, описывающие комплексирование элементов технологии - конъюнктивное, дизъюнктивное и параллельное освоение технологии. Разработаны и изучены модели научения в процессе работы и группового научения. в том числе модели «научения научению» - когда интенсивность процесса научения зависит от достигнутого уровня научения. Для всех моделей комплексирова-ния получены аналитические выражения для уровней научения. Исследован асимптотический случай моделей при переходе к непрерывному времени. Показано, частными случаями предложенной модели являются модели экспоненциальных, гиперболических и логистических кривых научения, которые широко распространены в теории научения, теории испытаний систем, тестирования программного обеспечения и смежных отраслях знаний.

Ключевые слова: технология, комплексная деятельность, кривая научения.

1 Работа выполнена при частичной финансовой поддержке Российского научного фонда (грант № 16-19-10609).

2 Михаил Валентинович Белов, к.т.н. ([email protected]).

3 Дмитрий Александрович Новиков, д.т.н., чл.-корр. РАН, профессор ([email protected]).

Управление большими системами. Выпуск 77 1. Введение

Рассматриваемые в настоящей статье математические модели и задачи основываются на результатах анализа проблем управления организационно-техническими системами (ОТС) и их комплексной деятельностью (КД), проведённого в статьях [4, 5] и монографии [6].

В монографии [6] исследуется комплексная деятельность (КД), определяемая как деятельность (целенаправленная активность человека), обладающая нетривиальной внутренней структурой, с множественными и/или изменяющимися субъектом, технологией, ролью предмета деятельности в его целевом контексте. Методология КД представлена в [6] в виде интегрированной системы формальных утверждений и моделей, описывающих общесистемные свойства КД, прежде всего - её структуру, неопределённость и жизненный цикл (ЖЦ).

Работа [4] посвящена определению средств управления организационно-техническими системами и их комплексной деятельностью, основным среди которых является управление технологией комплексной деятельности (см. определение ниже).

Проблема управления технологией КД ОТС рассмотрена и формализована в [5], для чего в указанной работе проанализированы наиболее важные особенности КД ОТС, предложены формальные модели и сформулированы математические задачи управления технологией КД.

Настоящая работа имеет следующую структуру. В разделе 2 на основании результатов [5] проанализированы общесистемные проблемы разработки, освоения, оптимизации и модернизации технологии КД и сформулированы в общем виде соответствующие математические задачи. Раздел 3 посвящён обзору известных моделей и методов из смежных областей знаний. В разделе 4 проанализированы свойства процесса разработки/освоения технологии. В разделе 5 приведены аппроксимации кривой научения при различных распределениях вероятности состояний внешней среды, в разделе 6 - оценки среднего времени достижения требуемого уровня научения. Раздел 7 содержит описание моделей комплексирования компонентов технологии. Заключение включает краткое перечисление основных

результатов и перспективных направлений дальнейших исследований.

2. Концептуализация проблемы управления технологией КД

Технология КД определяется в [4-6] как система условий, критериев, форм, методов и средств последовательного достижения поставленной цели. Управлением технологией в [5] условно названа деятельность по созданию компонентов технологии в виде соответствующих информационных моделей, их комплексированию и поддержанию в состоянии, адекватном условиям внешней среды в ходе реализации жизненного цикла КД; для описания этого процесса предложена интегрированная модель в БРМК-нотации [25] (см. рис. 1). Содержательно технология представляет собой сценарии деятельности субъекта в зависимости от внешних условий (состояний внешней среды).

Рис. 1. Интегрированная модель управления технологией КД [4]

Уточним определение управления технологией КД, для чего расширим и проанализируем семантику интегрированной модели (рис. 1), которая представляет различные виды КД:

• разработку новой технологии КД или её модернизацию -блоки 1, 2 и цикл, включающий блок 3;

• последующее применение технологии КД - блок 4;

• выявление необходимости модернизации технологии - переход от с к а;

• тестирование или освоение технологии КД - объективное (когда технология новая) или субъективное (когда технология

существует, а субъект её осваивает/обучается) - цикл, включающий блок 3.

Несмотря на разнообразие перечисленных видов деятельности, их объединяет единое основание: их предметом является технология КД, все они направлены на изменение технологии КД, на изменение состояний технологии или ее отношений с субъектом КД. Поэтому деятельность всех этих видов является управлением технологией КД (управление согласно [6] - комплексная деятельность, обеспечивающая воздействие субъекта управления на управляемую систему (объект управления), призванное обеспечить ее (его) поведение, приводящее к достижению целей субъекта управления).

В общем случае оптимизация процесса управления технологией может выполняться за счёт:

• выбора разбиения состояний внешней среды на непересекающиеся подмножества, внутри которых все состояния внешней среды считаются эквивалентными;

• выбора последовательности «перебора» состояний внешней среды при проверках;

• перераспределения проверок между уровнем создания компонента технологии (блок «2» на рис. 1) и уровнем интеграции (блок «3»);

• разделения ограниченных ресурсов между отдельными операциями управления технологией;

• определения допустимого (с точки зрения рисков) объёма привлекаемого ресурса для обеспечения всех компонентов технологии.

Каждая из операций-«эвристик» создания технологии (блоки «1 » и «2» на рис. 1 ) и проверки технологий (блок «3») являются специфическими - зависят от предметной области - и на общесистемном уровне не могут являться объектами управления и оптимизации. Поэтому в интересах рассматриваемой задачи можно считать, что они характеризуются известными временами выполнения и расходуемыми ресурсами (в частном случае - случайными величинами с известными законами распределения). Также считаем, что эти операции выполняются независимо, а связи между ними реализуются через заданные

причинно-следственные зависимости между процессами создания отдельных элементов технологии; фиксированными считаем перечни элементов КД, логические и причинно-следственные модели [6].

Выполнение различных видов КД, описываемых интегрированной моделью (рис. 1), будем представлять, следуя [5], как процесс с дискретным временем, когда на каждом шаге выполняется один элемент КД (один из блоков «1-2-3-4» модели рис. 1 ), при этом состояние внешней среды принимает одно и только одно значение из конечного множества возможных состояний внешней среды (МВСВС).

Будем считать, что если состояние внешней среды на каком-то шаге впервые принимает некоторое значение, то возникает событие неопределённости, требующее затрат на создание или адаптацию технологии применительно к этим условиям. Когда состояние внешней среды повторно принимает это значение на одном из более поздних шагов, затрат на создание технологии не требуется. Неопределённость внешней среды предполагает, что субъект не может влиять на выбор её очередного состояния; для описания неопределённости используем вероятностные инструменты.

Предположим, что МВСВС состоит из К различных состояний, одно и только одно из которых внешняя среда принимает на каждом шаге дискретного времени, независимо от принятых на предыдущих шагах значений. Обозначим через рк вероятность того, что состояние внешней среды примет к-е значение

К

(очевидно, ^ рк = 1).

к=1

Состояния процесса реализации различных фаз жизненного цикла технологии в момент времени ^ е {0, 1, ...} будем описывать К-мерным вектором-строкой хг = (хи, х2, . • •, . • •, хК,), каждый из элементов хкЛ которого принимает значения 0 или 1 соответственно, если внешняя среда ещё не принимала или хотя бы один раз принимало к-е значение. В рамках рассматриваемой модели к-й элемент вектора хг может переходить из состояния 0 в 1, но не наоборот.

В рамках рассматриваемой модели процесс реализации различных фаз жизненного цикла технологии описывается тем, сколько и какие значения из МВСВС принимало состояние внешней среды, а какие ещё нет.

Уровень зрелости, готовности технологии к использованию

в момент времени t будем характеризовать величиной

к

= ^ хкр , 0 < Lt < 1 (или, наоборот, 1 - Lí). Величина Lt соот-

к =1

ветствует доле состояний внешней среды, для которых технология проверена или адаптирована в течение предшествующих t шагов, или же вероятности того, что на следующем шаге ^ + 1) состояние внешней среды примет одно из значений, которые уже принимало ранее. Для обозначения Lt будем использовать термин уровень разработанности технологии или, следуя традициям моделирования процессов научения [15], уровень научения, а последовательность значений уровня научения называть кривой научения. Следует отметить, что термин «кривая научения» в схожих смыслах чрезвычайно распространен в современной науке, начиная с «кривых забывания» Г. Эббингауза [28], психологии всего XX века (см., например, классические статьи [31, 38, 39, 40] и монографии [2, 9]), моделей Т. Райта [42] и его последователей [27, 29] (описывающих снижение временных затрат на производство единицы продукции с ростом осуществлённых объёмов производства) до моделей обучения искусственных нейронных сетей.

Процесс разработки/проверки технологии в данной постановке может быть рассмотрен с другой точки зрения: он представляет собой последовательное наблюдение серий уже известных состояний внешней среды, прерывающихся наступлениями новых (впервые наблюдаемых) состояний. Длительность таких серий (от одного впервые наблюдаемого состояния до следующего впервые наблюдаемого) отвечает схеме Бернулли и описывается геометрическим распределением с параметром, равным уровню научения. В течение каждой такой серии этот параметр геометрического распределения постоянен и скачкообразно меняется в конечной точке серии - в момент наблюдения нового состояния. Тогда в каждый момент

времени ^ матожидание длины текущей серии (до ближайшего момента наблюдения нового состояния внешней среды, не включая его) равно Ь((1 - Ь)1. Длина серии соответствует количеству повторов, необходимых для увеличения уровня разработанности/научения, что, в свою очередь, отвечает величине «издержек» (например, временных), требуемых для получения очередного приращения уровня научения, фактически, для получения порции новых знаний. Поэтому в некоторых случаях будем использовать матожидание длины серии наряду с уровнем научения для описания процесса научения и обозначать его N = Ь(1 - Ы1 для ь < 1.

Естественной является постановка задачи управления с целью как можно более быстрого или наименее ресурсоёмкого достижения требуемого уровня разработанности технологии или научения; оптимизируемыми и/или ограничивающими параметрами могут быть ресурсы или время.

В зависимости от знаний субъекта КД о внешней среде, в [5] сформулированы две задачи управления компонентами технологии.

Первая задача (условно назовём её базовой) характеризуется условиями, когда перечень и вероятности реализации состояний внешней среды постоянны и известны субъекту, т.е. К и все {рк} известны субъекту, независимы и не меняются во времени. Эта задача возникает всегда и является в этом смысле базовой: первоначальный синтез технологии КД и процесс проверок (блок 3 на рис. 1 ) субъект всегда выполняет, ориентируясь на определённый перечень состояний внешней среды. Базовая задача формулируется как получение зависимости УРТ от времени и её оптимизация в зависимости от ресурсов.

Вторая задача характеризуется неизвестными свойствами внешней среды, т.е. тем, что перечень и вероятности реализации состояний внешней среды К и/или хотя бы некоторые из вероятностей {рк} неизвестны субъекту или могут изменяться. Данная задача с необходимостью возникает при сколько-нибудь продолжительном повторяемом использовании технологии, когда вследствие естественной изменчивости внешней среды разработанная ранее технология перестаёт соответствовать новым условиям, что обнаруживается в результате выполнения

продуктивных активностей (блок 4 на рис. 1). Так как вторая задача (с неизвестными свойствами внешней среды) решается на основе закономерностей, характерных для первой, то в данной работе всё внимание уделим первой задаче.

Комплексные компоненты технологии формируются путём интеграции компонентов согласно логической и причинно-следственным структурам КД [6]. В [5] показано, что на общесистемном уровне логические модели любых структурных элементов КД (обладающих внутренней структурой) эквивалентны - им соответствует веерная структура, в то время как причинно-следственная модель описывается графом определённого вида - так называемой «бинарной сетью» [5]. Набор свойств бинарной сети позволяет говорить о необходимости и достаточности перечня задач комплексирования компонентов технологии в составе а) последовательного, б) параллельного конъюнктивного и в) параллельного дизъюнктивного комплек-сирования компонентов технологии. В качестве сложного варианта комплексирования следует также рассмотреть случай г) создания компонента технологии одновременно с созданием собственно технологии его создания, возникающий при «пионерных» инновационных разработках. В каждом из вариантов комплексирования следует оптимизировать уровень научения комплексного компонента технологии в зависимости от времени и ресурсов.

Таким образом, рассмотрение процессов разработки/освоения технологий КД порождает две задачи (базовую и с неизвестными свойствами внешней среды) управления компонентами технологии КД и четыре а)-г) задачи комплексирования компонентов технологии КД, причём все они вписываются в интегрированную модель (рис. 1).

3. Обзор моделей и методов из смежных областей знаний

В предыдущем разделе показано, что процесс управления технологией формально представляет собой последовательное повторение циклов интегрированной модели на рис. 1 . Такие задачи встречаются во многих отраслях знаний: испытание

сложных систем, анализ и тестирование программного обеспечения и др., где получено большое количество соответствующих решений. Рассмотрим примеры известных моделей и методы описания и решения задач, аналогичных сформулированной:

• испытания сложных систем и проверка их характеристик [1, 12, 13,30];

• тестирование программного обеспечения [18, 21, 22, 23, 24, 32, 35,44];

• управление знаниями и извлечение/приобретение знаний [8, 10, 26, 35, 36, 37,43];

• итеративное научение в педагогике, психологии, физиологии человека и животных [15, 31, 33, 39,40];

• тестирование знаний обучаемых в педагогике [11, 17, 19, 41].

Все перечисленные задачи, как и процесс создания технологии, отличаются неопределённостью, поэтому для их описания практически во всех случаях используются вероятностные модели и/или аппарат случайных процессов.

Испытания сложных систем (в частности, авиационных комплексов) в [1] представляются в виде иерархической структуры, узлы которой описывают испытания элементов, блоков и систем. Постулируется экспоненциальная (или логистическая) зависимость эффективности компонентов изделия от продолжительности испытаний, при этом, как правило, скорость роста эффективности пропорциональна обнаруженной ненадёжности в данный момент времени. Вычисляются средние значения времени испытаний на каждом уровне иерархии, необходимого для достижения заданного уровня эффективности, а также соответствующие затраты. Среднее время испытаний системы (изделия) в целом принимается равным сумме времён испытаний на каждом уровне иерархии.

На основании известной аппроксимации распределений случайных величин, через математические ожидания и дисперсии записывается задача оптимизации процесса испытаний. Постулирование зависимостей эффективности компонентов системы от длительности испытаний выглядит не очень обоснованным, а комплексирование испытаний компонентов системы путём

простого суммирования средних времён - сильно упрощённым, хотя общая схема постановки задачи заслуживает того, чтобы быть взятой за основу для дальнейшего развития и корректного уточнения.

Задачи испытания изделий и тестирования математических моделей также часто ставятся как задачи проверки гипотез и планирования эксперимента, например [12] и [13].

Весьма распространённым является метод Model Checking и его вариант Statistical Model Checking [32], которые применяются для тестирования и комплексных систем, и сложного программного обеспечения. Данный метод используется для комплексных систем с конечным множеством состояний, чьи количественные свойства специфицируются логическими выражениями, что позволяет оценивать меру соответствия свойств системы требуемым значениям. Задача тестирования стохастической системы формулируется как проверка гипотезы, удовлетворяют ли свойства заданным требованиям. Наличие описаний системы в логических выражениях позволяет использовать эти выражения для комплексирования элементарных тестов в сложные.

Другим популярным методом тестирования программных систем являются различные вариации регрессионного тестирования (Regression Testing) [22]. Регрессионное тестирование выполняется для верификации эксплуатируемого программного обеспечения и подтверждения его качества после внесения изменений и модернизаций. Наборы тестов всегда растут в объёмах, соответствуя развитию программного обеспечения, что делает чрезмерно дорогостоящим выполнение всего набора тестов после каждого изменения. В рамках регрессионного тестирования используются такие приёмы как минимизация, отбор и установление приоритетов тестов, реализуемые в виде формальных процедур. Минимизация набора тестов направлена на устранение избыточных тестовых примеров. Отбор тестового примера направлен на выделение тестов, непосредственно связанных с последними изменениями. Приоритезация направлена на упорядочивание последовательности тестов таким образом, чтобы максимально быстро обнаруживать ошибки.

Также среди популярных методов необходимо отметить тестирование на основе моделей (Model-Based Testing) [18], различные последовательные процедуры тестирования [41], широкое использование последовательного анализа [20], имитационных моделей [34], специальные методы тестирования кибер-физических систем [23] и другие.

Общие подходы к тестированию изложены в достаточно большом количестве ставших классическими работ - см., например, [3], а также основном профессиональном он-лайн-источнике программной индустрии SWEBOK V3 [24].

В настоящее время разработано достаточно большое количество моделей, описывающих процесс извлечения/приобретения знаний, все они в той или иной степени реализуют последовательные процессы анализа предметной области и улучшения моделей; приведём несколько примеров.

Так, в [43] предложен общий алгоритм поддержки принятия решений на основании анализа большого количества смешанных данных (непрерывных и порядковых). В качестве основного элемента данных рассматриваются некоторые события и ассоциированные с ними области в пространстве признаков. Алгоритм выявляет статистически значимые паттерны, которые в дальнейшем используются для решения конкретных задач. Паттерны поддаются классификации, для них можно оценить функции плотности распределения вероятностей и создать правила/модели поддержки принятия решений.

В работе [34] рассматривается проблема формирования согласованных планов задач для группы автономных агентов -подвижных роботов, которые находятся на качающейся плоскости и задача которых стабилизировать плоскость. Для решения задачи предлагаются методика группового обучения автоматов, заключающаяся в циклическом генерировании обучающих сигналов и статистическом закреплении «навыков».

Работа [26] посвящена методам обобщения знаний, полученных из эмпирических наблюдений. Знание синтезируется алгоритмом кластеризации, основываясь на обнаружении статистически значимых событий. Алгоритм, использующий вероятностную информационную меру, группирует упорядоченные и неупорядоченные дискретные данные в ходе двух фаз:

Во время инициирования кластера выполняется анализ распределения расстояний между ближайшими соседями для выбора критерия объединения образцов в кластеры. Во время уточнения кластера образцы перегруппируются с использованием метода покрытия событий, который выбирает подмножества статистически релевантных событий.

В статье [37] утверждается, что стохастические и детерминированные знания дополняют друг друга и улучшают друг друга, вводится стохастическая модель приобретённых знаний на основе диффузионной аппроксимации.

Работа [35] посвящена оптимальному байесовскому агенту -алгоритму, моделирующему процесс извлечения знаний в ходе последовательных наблюдений за стохастической средой со счётным множеством состояний, в основу алгоритма положена теория индуктивного вывода Соломонова (Solomonoffs Theory of Inductive Inference).

В работе [10] предложена и реализована в виде математической модели и программного комплекса концепция использования коэффициентов ценности для ранжирования ответов в универсальных гибридных вопросно-ответных системах, которая позволяет повысить эффективность формирования базы знаний системы.

Объектом исследования [8] являются базы данных систем автоматизированного проектирования, а предметом - процесс извлечения знаний из таких баз данных. Распределенность источников данных, гетерогенность представленных в них данных и вычислительная сложность анализа данных большого объёма обусловливают применение агентно-ориентированного подхода к достижению поставленной цели. Разработана организационная модель многоагентной системы извлечения знаний из распределенных гетерогенных баз данных. Описаны основные роли агентов и их взаимодействие между собой.

Модели итеративного научения [15] в педагогике, психологии, физиологии человека и животных описывают процесс итеративного научения - многократное повторение обучаемой системой (живой или неживой - технической или кибернетической) действий, проб, попыток и т.д. для достижения фиксированной цели при постоянных внешних условиях («научение» в

общем случае - процесс и результат приобретения индивидуального опыта», см. [14]). В обзорной работе [15] проанализированы десятки известных и распространённых моделей итеративного научения, и сформулирована общая модель, обобщающая свойства отдельных моделей. Обобщающая модель описывает систему, осуществляющую научение в стационарных условиях, состоящую из конечного набора элементов, каждый из которых характеризуется экспоненциальным законом научения. Научение системы в целом характеризуется некоторой функцией от частных экспонент. Ограничением и отдельных моделей научения, и обобщающей модели является, во-первых, постулирование законов научения, во-вторых, отсутствие обоснованных механизмов комплексирования моделей элементов в модель сложной системы, осуществляющей научение.

В педагогических измерениях получили широкое развитие методы современной теории тестов Item Response Theory (IRT) [19,41], предназначенной для оценивания латентных (ненаблюдаемых) параметров испытуемых, и заданий тестов на основе статистических моделей измерения. Модель взаимосвязи между значениями латентных переменных и наблюдаемых результатов выполнения теста в IRT определяется как условная вероятность правильного выполнения обучаемыми заданий теста. При этом условная вероятность задаётся логистической кривой или функцией нормального распределения. Наиболее распространёнными являются модели Раша [11] и Бирнбаума [17,19] в которых выбираются конкретные значения коэффициентов логистической функции.

Подводя итоги краткого обзора известных результатов, можно сказать, что рассмотренные модели представляют те или иные элементы «цикла проверок» в относительно простой форме: во-первых, без учёта рекурсивности и фрактальности таких циклов; во-вторых, постулируя базовые закономерности (например, экспоненциальная или логистическая зависимость эффективности компонентов изделия от продолжительности испытаний в [1] или экспоненциальная или логистическая зависимость уровня научения от времени в [15]), которые вообще говоря, являются следствием более сложных процессов, требующих моделирования и анализа. Результаты, изложенные в [4],

позволили обобщить особенности этого цикла и отразить их в единой общесистемной интегрированной модели (см. рис. 1), которая благодаря этому обобщает, детализирует и уточняет известные модели.

4. Анализ процесса разработки/освоения

компонента технологии КД в базовой модели

Исследуем свойства процесса разработки/освоения компонента технологии и уровня научения Ь в случае, когда К и все {рк} известны субъекту КД.

Данный процесс (вектор х() является марковской цепью с конечным множеством состояний, номера которых у образуем из элементов вектора-строки хг по следующему правилу:

К

Е-к-1

хы 2 ; тогда ^ также является марковской цепью и при-

к=1

нимает любые целочисленные значения от 0 до

К

I = ^ 2к 1 = 2К — 1 включительно.

к=1

Сформируем матрицу П = { щ; 7 = 0, 1, ..., I; у = 0, 1, ..., I} переходных вероятностей процесса у(. В начальный момент времени 7 = 0 процесс у находится 0-м состоянии у0 = 0 (хк0 = 0 для всех к), с вероятностью 1. Из состояния «0» процесс может перейти только в состояния с номерами 2 с вероятностями рк, в частности, в состояние «1» - с вероятностью рь в состояние «2» - с вероятностью р2, в состояние «4» - с вероятностью р3 и т.д.; оставаться в состоянии «0» процесс не может.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из состояния «1» процесс не может вернуться в состояние «0», с вероятностью р1 он может остаться в состоянии «1», а с вероятностями рк перейти в состояния 2к-1 +1 для каждого 1 < к < К.

Вычислим элементы 7-й строки матрицы П при 0 < { < I. Будем обозначать функцию, выделяющую значение к-го разряда в двоичном представлении числа I, как 6(7, к), причём самый

К

младший разряд считаем первым, т.е. 7 = ^ Ь (7,к) 2к—1 .

к =1

Для /-го состояния вероятность сохранения состояния на

к

следующем шаге равна жа Ь (у,к) рк; переход в любое состо-

к=1

яние с номером у < / невозможен (яу = 0); и для каждого к, для которого хк = 0, вероятность перехода в состояние / + 2к-1 равна рк, для остальных состояний с номерами, большими чем I, вероятности также равны 0.

Запишем выражение для элементов матрицы переходных вероятностей:

0, у Ф1 + 2п, п = 1,2 ,...,К,

к

я =]£Ь{¡,к)рк ,у = г, 1 = 0,1,...,/,у = 0,1,...,/..

к=1

рп, у = г + 2п, п = 1,2,..., К и у < I;

Тогда матрица П переходных вероятностей марковской цепи у( (верхне)треугольная, а состояние с максимальным номером I = 2К -1 - поглощающее: пп = 1 и = 0; у ф i.

Обозначим вероятности состояний цепи через q/t = Рг(уг = /), в векторной нотации: ^ =(, ,..., ,..., ); в начальный момент времени t = 0 распределение цепи = (1, 0, ..., 0), тогда qt = qt-1П для любого I > 0 и qt = е0П= (1, 0, 0, ..., 0)П Здесь и далее будем обозначать через е/ вектор-строку соответствующей размерности, у которой все элементы, кроме /-го равны 0, а /-й элемент равен 1.

Утверждение 1. Вероятность q/t любого состояния 0 < г < I из 1-й группы при любых t > 1 удовлетворяет условию дй < /!?'-1у'-!+1, где 0 < V < 1 - некоторая положительная константа.

Доказательство утверждения 1. Рассмотрим состояния из 1-й

' 1

группы, для каждого из них = рк , где к - номер соответствующего состояния природы, тогда справедливо < 1! ^°у1', где у1 = тах{рк} < 1.

Пусть дй < Ш1 1у{ 1+1 для всех состояний 1-й группы. Эволюция распределения вероятностей состояний описывается соот-

I-1

ношением дй = Xж..чр1 + л.ди1. Тогда для любого состояния из

1=0

(I + 1)-й группы при t < I = 0, а при t > I.

Ы 1-1 1-1 Ь-1

Чй = X Лгг X ЖцЧц-1-в = X Ж X ЖггЧм-в . ПолУчим ограниче-

в=0 1=0 1=0 в=о

ние на

г-1 (-1 г-1 (-1

Ж X жЧ-1_в ^ Ж X ж/Л( ' - 1 -в)1-1 У!-1-в <

1=0 в=0 1=0 в=0

<ii(t - 1)г 4 X*, Х*>/' —1

1=0 е=0

<tl-1 (l + 1)|(t-l)(max{*,})—l <(l + 1)ltVwt—l, где vui = max{^; max {*„}}, максимум берётся по всем состояниям i, принадлежащим (l + 1)-й группе.

Следовательно, для всех состояний (l + 1)-й группы выполнено qit <(1 + l)!t'vi+it-1.

Обозначим v = max {*,.,.} , тогда vl<v для всех l, следовательно q.t < 1!tlv'-1.

Тогда из метода математической индукции последует справедливость утверждения для всех i-х состояний цепи кроме 7-го. Утверждение 1 доказано.

Содержательно утверждение 1 означает, что вероятности всех состояний цепи, кроме 1-го, уменьшаются по времени не медленнее, чем tK-V, и, наоборот, вероятность 1-го состояния

стремится к 1 не медленнее, чем atK-lvt, т.е. q7i > 1 — atK—1v', где v =1 — min {Pk } .

Из утверждения 1 непосредственно следует также, что стационарное распределение марковской цепи yt существует и

единственно: 5 = (0, 0, ..., 0, 1) = е1, и оно является единствен-

I

ным решением матричного уравнения 5 = 5П (^ = X Я^ ).

¡=0

Следовательно, рассматриваемая модель создания технологий имеет единственное устойчивое состояние - состояние, когда все возможные состояния внешней среды проверены, т.е. на длительном периоде можно достичь любого наперёд заданного уровня (сколь угодно близкого к единице) научения.

Исследуем кривую научения - поведение математического к

ожидания процесса Ц = X хьрк . Используем символическую

к=1

запись Е[] для обозначения математических ожиданий.

Прежде всего, из утверждения 1 следует сходимость по вероятности уровня научения к единице:

Уе> 0, Нш{Рг(|Ц -1 >^)} = 0.

Во-первых, в силу определения процесса Ь( его приращения всегда неотрицательны: ДЦ = Ц -Ц ^ > 0, причём и значения Ь,, и приращения АЬ, неотрицательны и не больше единицы. Во-вторых, процесс Ь, также является марковской цепью, т.е. для любого , Ц и ДЦ - независимые случайные величины. Тогда4: к к . . к

(1) Е[Ц] = £РкЕ[] = £рк (1 -(1 -Рк) ) = 1 -XРк (1 -рк).

к=1 к=1 к=1

С другой стороны, выражение (1) для Е [ Ц ] также можно получить на основании распределения состояний цепи qt:

Е [Ц ] = X ( ХЬ 0> к) Рк | = , где в - вектор-столбец,

¡=1 V к=1 )

К

элементами которого являются величины X Ь (¡,к) рк , кото-

к=1

4 Напомним, что кривая научения Ь, соответствует вероятности того, что внешняя среда примет новое значение на (, + 1)-м шаге; эта вероятность оценивается по наблюдениям в течение , шагов включительно.

рые, в свою очередь, также являются диагональными элементами матрицы П.

Из (1) следует выражение для длины серии:

N = Е[Ц](1 -Е[Ц])" -£Л(1 -рк)(1 -рк)У .

Так как ДЦ = Ц - > 0, первые разности последовательности Е [Ц ] строго положительны для всех t. Получим выражение для m-х разностей, для этого сначала вычислим первые:

К ( К \ К

ДЕ[Ц] = 1 (1 -рк)'-11 -Xрк (1 -рк)'-1| = Ел2 (1 -рк)'-> 0,

к=1 V к=1 ) к=1

Д2 Е [ Ц ] = ДЕ [ Ц ]-ДЕ [ Ц-1 ] = ]Грк2 (1-Рк Г-^Рк2 (1-рк Т 2 =

к=1 к=1

К

= -Ър* (1-Рк)-2 < 0.

к=1

Продолжая, легко получить:

К

ДтЕ[Ц] = (-1)и+1 ^Тр^1 (1-рк)-т.

к =1

Следует заметить, что разности значений кривой научения для любого момента времени t образуют знакопеременную последовательность, значения которой убывают по модулю (|ДтЕ[Ц|>|Дт+1Е[Ц]), и, кроме того, для первых разностей

справедливо неравенство 1 - Е [Ц ] > ДЕ [Ц ].

Таким образом, справедливо следующее утверждение. Утверждение 2. Кривая научения Е [Ц ] обладает следующими свойствами:

• в начальный момент времени t = 0 её значение равно нулю: Е [ Ц ] = 0;

• она монотонно возрастает: ЛЕ [Ц ] > 0 ;

• первые разности ограничены неравенством 1 - Е [ Ц ]>ДЕ [ Ц ];

• скорость её роста монотонно убывает: ДЕ2 [Lt ] < 0 и ДЕ3[Lt]>0 ;

• она асимптотически стремится к единице.

5. Аппроксимации кривой научения

Рассмотрим возможные аппроксимации кривой научения Е [L ] (см. выражение (1)) в зависимости от вида распределения возможных состояний внешней среды

P = j jк = ; ¿А = l}

А) Равномерное распределение возможных состояний внешней среды P. Обозначим для упрощения выкладок S = 1 / K, тогда

(2) E[Lt] = l-£Рк (1 -Рк) = l-£S(l-S)' = l-(l-S)' =1 -exp(-)),

k=1 k=l

где у = ln(1 + 1 / (K - 1)) - скорость изменения уровня научения - скорость научения [12].

Экспоненциальная кривая научения (2) (ее разностный аналог: E[Lt] = E[LM] + 7 (1 - E[Lm])= 7 + (1 - Y) E[Lm]) является хрестоматийной для теории научения (см. обзор в [15] и пионерскую работу [31]). В то же время, для рассматриваемой модели она является частным случаем, соответствующим равномерному распределению состояний внешней среды.

Средняя длина серии в случае равномерного распределения экспоненциально растёт N = exp()t) -l, что интуитивно очевидно: с ростом уровня научения при всё большей доле «освоенных» состояний внешней среды получение новых знаний требует всё больших усилий для «поиска» новых состояний.

Разностное уравнение для Nt имеет простой вид N+1 = exp()) N + (exp())-l) - средняя длина серии мультипликативно растёт.

При K » 1 скорость научения Y = ln(1 + 1/(K - 1)) s 1/(K - 1) s 1/K,

Управление большими системами. Выпуск 77 и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(3) Е[Ц]« 1 - ехр(- t/K).

Следует отметить, что экспоненциальные кривые научения типа (2) или (3) являются классическими для теории научения (см. обзор в [15]). Кроме того, как показано в [7], именно равномерное распределение состояний природы максимизирует ожидаемое значение уровня научения.

Б) Распределение (п, - с несколькими (п) одинаково высоковероятными состояниями и остальными ^ - п) одинаково маловероятными (3 « 1/Х) состояниями:

(4) Р = { рк =(1 -5(К - п))/п, к = Щ; рк = 5, к = п + 1,к}.

Имеет смысл рассматривать случай, когда вероятности (1 - 3^ - п)) / п первой группы состояний существенно больше вероятностей 3 второй группы; случай, когда вероятности отличаются незначительно, аппроксимируется равномерным распределением (см. выше). То есть 3 « (1 - 3^ - п))/п, а это означает, что 3К« 1. Найдём кривую научения для рассматриваемого случая:

К

Е[Ц] = 1-£рк (1-рк)' =

к=1

= 1 -^ИК-ШГ1 - 1-5(К-п1 >|' -¿5(1-5);,

к=1 П V П ) к =п+1

т.е.

Е[Ц] = 1 -(1 -5(К-п))(1 -1 + ((К-П)д \ -(К -п)5(1 -5)'. ^ п п )

При больших t (так как 5 = ПК и п < N, то (1 -1 / п) < (1 - 5)) случай (4) стремится к предыдущему (равномерному распределению): Е [Ц ]«1-( К - п)5(1-5)'.

При малых t получается следующая аппроксимация:

Е[Ц]«1 -(1 -5(К-п)){1 -1 + (-К-п)з5 .

^ п п )

В) «Зашумлённое равномерное» распределение на

«большом» множестве областей возможных состояний внешней среды:

(5) P = |л;к = 1,2к, ^Рк = 1; рк << 1; K »1|.

При малых ^ кривая научения аппроксимируется следующим образом:

к к к к к

(6) Е[ь,] = 1 -^Грк(1 -рк) *1 (1 -р) = 1 -]Грк + ^Р? = ^Р?,

к=1 к=1 к=1 к=1 к=1

к

т.е. линейно растёт по времени ^ со скоростью X рк2 .

к=1

При больших ^ возможны два варианта поведения кривой научения. Если все области возможных состояний внешней среды примерно эквивалентны и вероятности различаются незначительно, т.е. р^ «1 /к; к = 1, к, тогда справедлива оценка (3), полученная для равномерного распределения. Если имеется некоторое количество (п), существенно отличающихся областей, то адекватной является аппроксимация Б:

Е [ ь ]-1 -(1 - к )(1 - к )'■

Отметим, что аналитические выражения (2), (3) и (6) , а также свойства кривой научения Е [ Ц ] в предложенной модели

в некотором смысле соответствуют многим известным моделям научения (в частности рассмотренные в разделах 4.2 и 6.7 [15]). Однако известные модели постулируют сам закон изменения кривой научения или уравнения, его описывающие, в то время как предлагаемая модель описывает сам процесс научения-разработки, а уравнения и свойства кривой научения следуют из анализа модели.

6. Среднее время научения

Получим выражение для среднего времени достижения требуемого уровня £треб е (0;1) научения (готовности, зрелости технологии), т.е. среднее значение момента времени I, когда

Ц = X ХьРк - Атреб •

к=1

Для этого исследуем поведение марковской цепи у, её

распределения состояний #й = Рг (у = г) . Выше было получено,

что начальное (при t = 0) распределение цепи д0 =(1, 0,..., 0) и

qt = д^П для любого t > 0, qt = е0 П= (1, 0, 0, ..., 0) Пt•

Матрица П является (верхне)треугольной, откуда следуют несколько свойств матрицы П:

• определитель матрицы П (обозначим его через ДП) явля-

I

ется произведением диагональных элементов АП = ^ жи ;

г=1

• Пt - также (верхне)треугольная (непосредственно следует из формулы умножения матриц);

• диагональные элементы матрицы П являются степенями

диагональных элементов матрицы П, т.е. ж'и = (жи )';

• определитель матрицы Пt является степенью определителя

П, т.е. АП' = (АП)' =(П яи

Сформируем «маску» - вектор-столбец г той же размерности, что и вектор-строка д, по следующему правилу:

г =•<

1 если XЪ(г,к)Рк <Ц«,, К

к=1 . _ ^ 0к

К

0, если XЪ (г,к) Рк- Цтреб; к=1

к=1

г = Х 2къ (г,к ) = 0,1,..., I.

Такой вектор-маска «выделяет» состояния процесса у, соответствующие уровням научения ниже требуемого. Тогда в каждый момент времени вероятность того, что уровень научения достиг или превысил заданный уровень будет равна

Рг (Ц - Ьтреб ) =1" Ч,г или Рг (Ц < Ьтреб ) = Ч,г . Вероятность того,

что момент времени ^ост достижения требуемого уровня научения превышает текущий, Рг ('дост >') = qtг или вероятность, что

К

уровень уже достигнут, Рг (,досг <,) = 1 - qtr . Очевидно, г = 0 , тогда из утверждения 1 следует, что вероятности Рг (Ц < Ьтреб) = Рг (,дост >,) мажорируются функцией гк-1у' при , ^да. Получаем:

Рг(,дост >,) =Х^ <!г«,к-1^ ^Хг 1 .

¡=0 ¡=0 ( ¡=0 )

Используем выражение qt = е0 П, тогда

Рг (,дост > о = qtr = е^г.

Так как Рг (^ > X -1) = Рг (^ = х) + Рг (^ > х), то

Рг ('дост = Х) = Рг ('дост > Х-1) - Рг ('дост > Х) .

Для среднего времени справедливо выражение

^ = £ X Рг (ХДосТ = X) = £ Х (Рг (ХДосТ > , - 1 - Рг (Хдост > 0) .

,=0 ,=0

Так как Рг(¿дост > мажорируются ,к-1у' при , ^да, то ряд

да

, Рг(,дост > сходится, а его сумма X, рг(,дост >,) конечна,

,=0

тогда

да

, дост =

,=0

да

= Х , (Рг (,дост > , - 0 - * (,дост > ,))

= Х (X + 1)РГ (,дост > ,)-X , РГ (,дост > ,) = Х РГ (,дост > ,)

,=0 ,=0 ,=0

Итак, получаем:

(7) ,дост =ХРг(,дост >,) = ХеоП'г = во |Хп' |г = ео(Е-П)-1 г,

, =0 , =0 ( ,=0 )

где Е - единичная матрица той же размерности, что и матрица П. Существование обратной матрицы (Е -П) 1 следует из того, что матрица (Е - П) (верхне)треугольная, все её диагональные элементы могут быть найдены из выражения для выше, и их

произведение больше нуля.

Вышеприведённые соображения обосновывают справедливость следующего утверждения.

Утверждение 3. Для любой марковской цепи среднее время первого достижения состояния из заданного множества равно

'дост =Х Рг ('дост >'). Если данный ряд сходится, то

'=0

'дост = е0 (Е-П) 1 г .

Выражение (7) позволяет аналитически получать значения ' дост в общем случае в зависимости от распределения возможных состояний внешней среды Р = {рк; к = 1, 2,..., К} (рк входят

в выражение (7) через матрицу П) и от требуемого уровня научения (А б учитывается через вектор т). Однако

выражение (7) не является наглядным - ни вероятности р^, ни уровень А^е6 в явном виде в него не входят. Кроме того, значительная размерность матрицы П (2К х 2К) затрудняет его практическое использование.

В ряде случаев можно получить более простые и наглядные выражения, рассмотрим один из них - равномерное распределение Р = |р^ = 1 / К = 5; к = 1, к} возможных состояний внешней среды. В этом случае вместо марковской цепи у, принимающей значения г = 0,1,..., I, рассмотрим цепь yt, значения которой отвечают количеству состояний внешней среды, для которых технология уже проверена, т.е. у принимает значения от 0 до К. Тогда Ц = 5%, а переходные вероятности примут вид:

0 при у < г или у > г +1,

1 -5г при у = г +1, для г = 0, 1, ..., К.

5г при у = г ;

Тогда матрица (Е - П) является (верхне)треугольной, ленточной, с элементами:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

пч =

=

0 при] < ¡ или] > ¡ +1,

1 -Л при ] = ¡, для ¡ = 0, 1, ..., к. 5¡ -1 при j = ¡ +1;

Обратная матрица (Е - #)-1 - также (верхне)треугольная с элементами

0 приj< ¡',

гг-=<(1 -д¡при ¡ < j < к, для ¡ = 0, 1, ..., к.

1 при j = к;

Операция (1, 0, 0, ..., 0)(Е-П)-1 г «вырезает» из матрицы

(Е -П) 1 первую строку и суммирует те элементы этой строки,

к

для которых X хкРк < Ц^еб. В рассматриваемом случае равно-

к=1

мерного распределения суммируются первые Ь^е6 / 8 = к Ь^ элементов, тогда среднее время достижения требуемого уровня

ьтреб равно:

_ кЬтреб кЬтреб £

?дост = X(1 -8)-1 = .

¡=0 ¡=0 к '

Получим компактную аппроксимацию , дост при ^ >> 1:

_ кЬтреб ^ кЬтреб 1 кЬтрев ,

,дост =У-= к X-- к-1® к [ -- к~1сХ =

X к - ¡ X1-к~Ч { 1-к-х

= -к 1п (1 - к 1 х )| ^ =-к 1п (1 - Ьтреб ),

т.е.

(8) ,дост ®-к 1п (1 - Ьтреб ) .

Отметим, что выражение (8) совпадает с приближённым решением / уравнения (см. выражение (2))

Е [ 4 ] = 1 -(1 -5) =

(1 -4,еб) 1п (1 -¿треб)

? =

для

К! (1 - !треб) .

которого

1п (1 -5 5

Получим выражение для среднего времени достижения «абсолютного» уровня научения: Е( = 1.

Пусть в некоторый момент времени уже известны, проверены какие-то состояния внешней среды, и остались не проверенными несколько, а именно I < К, состояний {рг; г = 1,1}, очевид-

I

но, что X р < 1 .

1=1

Обозначим через Т({рг; г = 1,1}) среднее время, в течение которого будут проверены все оставшиеся I состояний, т.е. достигнут уровень Е( = 1. Используя метод математической индукции, получим выражение:

(9) Т({р.; 1 = й}) = ХХР1 1 -Х(Р + РкГ +1(Л + Рк + Р.Г -- .

1=1 1;к 1;к;1

Запишем (9) в иной, эквивалентной, форме:

/, I ( к Л-1

(10) Т({р.1 = 1,1}) = ]Г(-1)к+1 X ( ХСРц ] .

к= ч;к;-;к Vл=1 /

То есть покажем, что среднее время равно сумме знакопеременных сумм всех к-к из {р¡; г = 1,1}, п = 1,1.

Обозначим сумму всех к-к из {рг; г = 1,1 }, к = 1,1 в выражении (10) для Т({рг; г = 1,1}) как ©(к; I):

( к Л-1 1

(11) ©(к; I)= X Хр = X -1-.

4;1г;-;'к VJ=1 / 4;1г;-;1к рн + Р'г + "'+ Рк

С учётом (11) выражение (10) примет вид:

I , . Г к Л-1 I -

к=1 ¿1 ;'2 ;--;гк V л=1 /

Пусть осталось непроверенным одно состояние внешней среды, тогда Т({рг; г = 1}) = 1/рь

,, _I к

(12) Т ({Р.; 1 = и}) = Х (-1) X X

= Х(-1У+1(л I).

л=1

,е. T{{Pi; i = U - l}) = g(-l)t+1 ©(k; I -1).

Пусть выражения (9), (10), (12) справедливы для I - 1 состо-

_ I-1

яний, т.( ™

\ I* [^ I /

к=1

Покажем, что (9), (10), (12) справедливы для I состояний. Событие, заключающееся в последовательной реализации

7 = 1,1 состояний, эквивалентно объединению I событий, каждое из которых заключается в реализации одного из I состояний и после этого в последовательной реализации оставшихся I - 1 состояний. Тогда

(13) Т({р,;I = й}) = |^Хл] + £р,- (¿р,] Т({р,;I = О;I *,}),

где первое слагаемое - среднее время до первого из реализовавшихся состояний 7—1,2,...I. Каждое из у-х слагаемых под знаком суммы - вероятность того, что первым проверено у-е

состояние и после этого Т({р7; 7 = 1,1; 7 Фу'}) - среднее время проверки I - 1 оставшихся состояний. Подставим (12) в правую часть (13):

4 + |£л] Цр,¿(-1)к 11 к;I-1

. ,=1 У V ,=1 У ,=1 V к=1 Преобразуем вторую сумму, подставив в неё (11).

(14) T ({p; i = U}) = (Zp,) + (IÄ) I ( Pj I Bf ©(k; I-1)1.

I l I-l \ i i-1 n

\k+1~/7 т Л\) X^V1/ i\k+1 v» Pi

IIP, I(-1)k+1©( k; I - 1)l = II(-1)k+1 %

J=1 V k=1 У j=1 k=1 i;i2;...;ik P4 + P + ••• + Pik

Так как каждая из вероятностей pj в числителях не входит в сумму p4 + p + ••• + p в знаменателях дробей, порядок суммирования можно поменять местами и получить:

I(р,I (- Г ©(k;I- 1))=II (-1)k+ I p + pP+ + p =

i=1 V k=1 У j=1 k=1 i1 ;i2;...;it pi + pi2 + ••• + pk

= I(- 1)k+1 I (Pi1+ Pi2 +-+ Pk )- 1 I РГ

k=1 i ;ь;...;ч i=1; i*\; i2;...; 4

Суммирование по j осуществляется по всем j от 1 до I, но не совпадающим ни с одним из i\, i2, ..., ik, поэтому

X Рл ^Р. |-(Рк + Р +'''+ Р ) .

л=1; л ^ н;-; 'к V '=1 )

Подставим это соотношение в выражение для второй сум-

мы

I

X Р' |-( Р'1 + Р>2 +''' + Р'к )

XIРлК4) 0(к;I-^К-Г1 X ^ в +

л=1 V к=1 ) к=1 ¿1; >2 ;-■■; % р + р +''' +Р >к

=Г^Р>- 1^(-1)к+1 X ( р. + Р. +'.'+Р4 )-1 -X(-l)k+1 X1=

ч '=1 ) к=1 ¿1; ¿2;---; ¿к I ЛI- , , I-

=ЦР ]X(-l)k+10(к;I)+X(-l)kc^

к=1

где С - число сочетаний из I по к. Подставим это выражение в (14)

т ({ Р ;>=и Р, y,+(X Р Щ р )|; н* +10( к' )+)= =X(-l)k+1 к; I )+|Хр,)-1 (1+;Ц(-1)кс;).

к=1 V 1=1 ) V к =1 )

Соответственно определению 0(7; I ) = 1 X р; | , а также

¿=1 I-1

1 + X(-1)"C^" + (-1) =(1 -1)' = 0, поэтому 1+ К-1)" с; =(-1)'+1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-1

п=1 П=1

Получим окончательно требуемое выражение в форме (12):

т ({ р, ;>=и ^ (-1)к+10( к; i).

4 ' к=1 Итак, в данном и предыдущих разделах рассмотрены свойства процесса разработки/освоения компонента технологии, уровня научения, а также времени научения. Перейдем к анализу моделей комплексирования компонентов технологии.

I -1

7. Модели комплексирования компонентов технологии

Проанализируем свойства процессов комплексирования частных компонентов технологии, описываемых каждый в рамках базовой модели (раздел 4):

A) последовательного;

Б) параллельного конъюнктивного;

B) параллельного дизъюнктивного;

Г) параллельного с полным обменом информацией;

Д) «научения научению».

Для этого рассмотрим процесс управления несколькими компонентами технологии с соответствующим объединением результатов. Состояния частных процессов образуют марковские цепи (и обладают свойствами, рассмотренными в разделе 3). Тогда поведение комплексного процесса также является марковской цепью на множестве состояний, равном произведению множеств состояний частных процессов.

Аналогично тому, как это было сделано выше, введём К -

м * /

мерный процесс (где К* Кт ) х* =(

*

,х * I

т=1

*

каждый элемент которого х & принимает значения 0 или 1 и отражает факт выполнения проверки соответствующего состояния внешней среды, а также процесс у ь отражающий номер состояния процесса х Оба процесса х í и у í являются марковскими цепями, матрица переходных вероятностей у í является (верхне)треугольной, и для у ( справедливы утверждение 1 (об асимптотическом поведении распределения состояний) и 3 (о среднем времени достижения заданного уровня научения).

А. Если целью комплексного процесса является создание всех частных компонентов технологии (конъюнкция всех М частных компонентов), то уровень 1}{'м научения, разработанности комплексной технологии, равен вероятности того, что при очередном испытании ни в одном из частных процессов не будет получено ещё не проверенное состояние внешней среды, т. е. равен произведению уровней разработанности частных технологий. А эта вероятность, в свою очередь, равна произве-

« тт

дению вероятностей Ц всех частных компонентов технологии,

м

т1..М 1 Г тт те. ц ц и

т=1

М

(15) е [ц--м ]=пе [Ц ]=П 1 -I рт (1 - рт)'

т=1 т=1 к=1

Формулу (7) для среднего времени достижения требуемого уровня научения одного компонента несложно расширить на случай М элементов:

да да / ч

(16) Хадост =!Рг(хаДосТ >Х) = 1Р(тах{^}>Х) =

Х=0 Х=0 у т '

да ( -М— \

=И(1-ГМ(1-)].

X=0 V т=1 у

Если характеристики процессов разработки компонентов технологии одинаковы, то

X А дост = ¿(1 - (1 - е0Пхг )М) = ¿1 ¿СМ (-1)т-1 (е0Пхг )т 1 =

= МIе0Пхг + 1| IС! (-Г^П'г)1 ] + (-1)М-1!(еоПхг)М .

Х=0 Х=0 \т=2 У Х=0

Рассматривая последовательность величин Xа дост для различных возрастающих М, легко получить выражение для пер-

~ \М -1

- í / í \ М -1

вых разностей АХм =1 е0П г (1 - е0П г) и вторых разностей

Х=0

А2 Хм =-1(е0Пхг) (1 - е0Пхг) . Откуда видно, что Ха дост растёт

Х=0

с увеличением М, однако скорость роста по М убывает. Также

первые разности ограничены сверху и снизу:

_ да 2 да — да —

Хдост-¿(е0Пхг) =1 е0Пхг(1 -е0Пхг)<АХм <1 е0Пхг = Хдост.

Х=0 Х=0 Х=0

Б. Если все частные процессы реализуются независимо и параллельно, а целью комплексного процесса является создание не менее чем одного из частных компонентов (дизъюнкция М

Х=0

Х=0 V т=1

частных компонентов), тогда доля «неразработанности» комплексной технологии равна доле непроверенных состояний «комплексной» внешней среды, соответственно

м

1 -Ц-м =П(1-Ц") и

m=1

м Г к

ei?) e [ ц-м ]=i-п Tpm (i - pm)

m=1 [ k=1

Среднее время достижения требуемого уровня научения M элементов в этом случае получится

_ да да , , да / M Л

08) }Бдост = £Pr(tEдост >t) = £Pr(min{tmдост}>t) = Z| ПеоЦ>т I.

t=0 t=0 v m ' t=0 V m=1 )

Если характеристики частных процессов одинаковы, то

_ да I M Л да ^

tБ дост =Х|П^оПmt^m| = Z(^0ntr) .

t=0 V m=1 ) t=0

Для случаев А и Б параллельной реализации нескольких одинаковых частных процессов получим следующие соотношения:

- - да (м-1 т\ -

tА дост = Mtдост + Z Z CM (-1)m-1 (e0ntr)m I + (-1)M-1 tБ дост , t=0 Vm=2 )

где tдост - среднее время завершения частного процесса,

tа дост - среднее время завершения разработки всех M частных

процессов, tб дост - среднее время завершения хотя бы одного из M частных процессов. Также получим оценки:

-^^t дост (M -1)t Б дост < t А дост ^ -^^t дост .

Отметим, что для случаев А и Б параллельной реализации двух одинаковых частных процессов tAдост = 2tдост ^Бдост, т.е. средние времена соотносятся как tдост = (tа дост +1б дост) / 2 .

В. Пусть последовательно выполняются два компонента технологии, причём второй начинается непосредственно после завершения первого. Данный случай описывается двумя независимыми марковскими цепями, вторая цепь стартует из известного состояния в тот момент, когда состояние первой достигло

заданной области. Распределение времени завершения создания такой комплексной технологии (состоящей из двух элементов, когда создание второго может быть начато только после завершения создания первого) - времени достижения заданной области второй цепью - равно свёртке распределений времени обеих цепей. Используя эту закономерность, можно вычислить «интегральную» кривую научения и получить среднее время разработки как сумму средних времён разработки частных технологий.

Г. Пусть создание одного компонента технологии выполняется параллельно и независимо в рамках нескольких (М) процессов с полным обменом информацией. Тогда за один шаг времени производится М независимых проверок, поэтому в этом случае

к

(19) Е[¿Т] = 1-Ха(1-йГ .

к=1

В этом случае среднее время достижения требуемого уровня научения М элементов равно:

_ да да I

(20) ?дост = ^Рг(?ДосТ >О = ^еоит'г =в0(Е-П)- г .

/=0 /=0 Нетрудно показать, что для всех случаев кривых научения -(15), (17) и (19) - справедливы все позиции утверждения 2.

Д. «Научение научению». Рассмотрим процесс освоения технологии одновременно с самим ее созданием. То есть когда интенсивность процесса проверок состояний внешней среды меняется соответственно некоторой другой кривой научения.

к

Пусть процесс Ц = ^ хырк характеризует разработ-

к=1

]

ку/освоение новой технологии, а процесс Ц хописывает

;=1

управление технологией создания этой новой технологии («научение научению»). Будем считать процессы Ь и Ь ( статистически независимыми друг от друга.

То есть в каждый момент времени ^ проверка состояний

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

т *

внешней среды производится с вероятностью Ь , а с вероятно-

стью 1 - Ь í момент времени t оказывается «пропущен» для создания технологии: состояние не тестируется и процессы хы не изменяют состояния5:

Е [ХЫ+1 \хы ] =

J

с вероятностью 1 - X ,

1 =1 J

(1 - ХЬ ) Рк с вероятностью X ,

1=1

где символическая запись Е [-| хь ] означает условные математические ожидания при известных значениях хй .

ТогДа Е [хк+1 |хк ] = хк, + Г,Рк (1 - хк,), где

Г = Е

X *

.1=1

1х*

J

:1-Х4(1-4).

1=1

Переходя от условных математических ожиданий к безусловным, получим разностное уравнение, позволяющее последовательно вычислять Е [ х^ ] для всех t > 0

(21) Е[хм ] = Е[хь]+Г Рк (1 -Е[хь]).

Обозначим через ^ = 1 - Е [хы ] (или Е [ х^ ] = 1 ), тогда с учётом введённых обозначений

Е [хы +! ] = 1 - ! = ^+ 11 , ^+! = ^ (1 - ГР ) .

<-1

Так как = 1, то получаем ^ = П(1 - ГР ) , и в резуль-

тате:

Е [ х, ]=1 -П(1 - Г рк )=1 -П|1 - Рк + Рк X 41 (1 - qJ П.

1=1

х

х

г=0

5 Можно эту же модель интерпретировать как то, что проверки выполняются в каждый момент времени, а технологию для нового состояния вырабатывается с некоторой вероятностью, определяемой некоторым "мета-процессом". В логистической модели эта вероятность равна уровню научения в самом процессе, в гиперболической - вероятности «ошибки» в некоторой степени с к-том пропорциональности ¡.

Тогда итоговая кривая научения: (22) E[L, ] = tA£[xfa ] = £А fi-f] (1-rzpk) 1 =

к ,-1 { J Л

=1 лП 1 -Рк + Рк1 Ъ (! - Г1-

к=1 г=0 ^ ]=\ )

Изучим выражение (21). Вычислив первые разности: АЕ [ хй ] = Г Рк Т, заметим, что для любых значений Рк АЕ [ хы ]|г=0 = 0, так как Г0 = 0, а также АЕ [хы ]> 0 для любых X > 0. То есть Е[х^ ] растёт при X > 1 , что интуитивно очевидно.

Вычислим и исследуем вторые разности: (23) А2Е[хь ] = АЕ[хш+1 ] - АЕ[хь ] = Г,(Т, - Т,Гр ) - ГркТ, =

= Г+1Рк (1 - Г,Рк ) Т, - Г,РкТ, = РкТ, (Г,+1 (1 - Г,Рк) - Г,). Прежде всего, справедливо А2Е[х^ ]|г=0 = Р^Г > 0 . Однако Г{ монотонно растёт от 0, асимптотически приближаясь к 1 при X ^ю. Тогда А2Е[хь]|=-р/Т, <0 и А2Е[х,]|^0- .

к

Так как кривая научения Е [ Ц ] = 1 РкЕ [ х , ] является линей-

к=1

ной комбинацией процессов Е [ х^ ] со строго положительными

коэффициентами, то для первых и вторых разностей кривой научения справедливы утверждения, сформулированные для Е [ х^ ]. А именно:

• Е [Ц ]| ,=0 = 0;

• АЕ [Ц ]|г=0 = 0 и АЕ [Ц ]>0 для всех X > 0, т.е. кривая

научения растёт по X от нуля, асимптотически приближаясь к единице;

• А2Е[Ц]|,=0 > 0, А2Е[Ц]|0 и А2Е[Ц]|^0-, то есть для X, меньших некоторого значения (точки перегиба), кривая научения строго выпукла, а при больших X - строго вогнута.

Рассмотрим пример «научения научению». Пусть имеются равномерные распределения возможных состояний внешней

k=1

среды Р = {рк = 1 /К; к = 1К}, и 0 = {^. = 1 /7; ] = 17} . Тогда, обозначив тт = 7 1, получим:

3 = Е

I

.1=1

1 "17 1 (1 -7 1) = 1 -(1 -7 1 / = 1 -(1Т .

1=1

Соответствующая кривая научения имеет вид:

г-1

(24) Е[Ц] = 1 -П(1 -^(1 -(1 -ЧУ)) .

т=0

Используя выражение (17) для вторых разностей, можно получить оценку точки перегиба 7 кривой научения (18) для «сложных» технологий (для которых К » 1, 7 » 1 и К < 7):

г* ^Л/К7+0^5КГ - о, 5К.

~ к-1

Запишем (24) в виде Е [Ц ] = 1 - ехр

1> (1 -^ехр(-^г))

где ф = 1п(1 + —1—).

7 — 1

к-2

Е [Ц ] = Е [Ц-1 ] + ^1 - (1 -т)г-1 )П(1 -^(1 - (1Т)) =

г=0

= Е[Ц-] + (1 -Е[Ц-]-(1 -Т-1) = в + ( 1 - в) Е[Ц-1 ], где = ^(1 -(1 — т)г1 ) = ^(1-ехр(-^(г-1)). Т.е. кривая научения (24) является «обобщением» кривой научения (2), в котором коэффициенты {Д} соответствующего разностного уравнения зависят от номера шага (времени).

Рассмотрим несколько частных случаев научения научению, а именно процессы, в которых вероятность успешной разработки технологии для каждого из впервые встретившихся состояний природы не равна тождественно единице и зависит не от состояния аналогичного «внешнего» процесса (см. выражение (22)), а от уже достигнутого уровня научения в самом процессе. Причём зависимость эта может быть как возрастающей (см. ниже модель логистической кривой научения), так и убывающей (см. ниже модель гиперболической кривой научения).

Соответствующий класс процессов научения назовем условно автонаучением.

Логистическая кривая научения. Рассмотрим важный частный случай «научения научению»: в достаточно большом числе практических ситуаций интенсивность процесса проверок состояний внешней среды пропорциональна уровню научения Г{ = ^ Е[ЬХ]. Действительно, практически всегда при испытаниях новой, например, авиакосмической или транспортной техники, или вводе в эксплуатацию новых производственных комплексов на первых этапах изделие или комплекс испытывается при ограниченном наборе режимов эксплуатации (стендовые и наземные испытания, работа на холостом ходу и т.д.). По мере накопления опыта диапазон режимов расширяется до полного множества всех возможных режимов и условий внешней среды при переходе к штатному использованию, что соответствует формальному предположению о пропорциональности «скорости научения» достигнутому уровню.

Такая ситуация соответствует частному случаю модели автонаучения - когда процесс разработки технологии Ь Х «совпадает» с процессом её освоения

Перепишем разностное уравнение (21), в несколько изменённой форме и проанализируем его:

(25) АЕ [ хь+1 ] = Г,Рк (1 - Е[хь ]).

Если все состояния внешней среды равновероятны (рк = 3 = 1/К), то из (25) следует разностное уравнение для уровня научения:

8 АЕ[хм ] = Г ,82 (1 - Е[хь ]) = Г,82 - Г,8(8Е[х„ ]). Суммируя данные выражения по к, получим

(26) АЕ[Ц+1 ] = Г ,К 82 - Г, 8 Е [Ц ] = Г, 8 (1 - Е[Ц ]).

В случае Г{ = ^ Е[Ь(] разностное уравнение для уровня научения примет форму (аналогичный результат для модели с непрерывным временем был получен в [33]):

(27) АЕ [Ц+1 ] = ^8Е [Ц ](1 - Е [Ц ]).

Уравнение (27) является разностным аналогом дифференциального уравнения аХ/аХ = в х (1 - х), где ¡3 = ^,8, решением

которого является классическая для теории научения (см. обзор в [15]) логистическая кривая, в дискретной форме логистическая кривая имеет вид:

(28) Е [ Ц ] =---1-.

1 + (-- 1)ехр(-р ') А

Она монотонно возрастает от X > 0 (при X = 0) до 1 (при X ).

Так как решениями аналогичных разностных и дифференциальных уравнений, как правило, являются разные по виду функции, логистическая кривая в дискретной форме (28) не является решением (27) в общем случае. Поэтому исследуем функцию (28) и найдём условия, при которых, функция (28) корректно аппроксимирует решение уравнения (27).

Для упрощения локальных выкладок введём компактное

обозначение функции (28) в виде х = —1—.

1 + Ъа'

Во-первых, покажем, что при неограниченном уменьшении дискрета времени (обозначим его Дх) разностное уравнение, описывающее (28) переходит в дифференциальное вида ёх/ёх = вх(1 - х).

С учётом обозначений х1+А1 = -—^ г+ь , преобразуем это

выражение. При Д' ^ 0 (на самом деле при 1п(а)ДХ = 1) корректными будут следующие преобразования:

1 1 1

х =-^-=-=

'+Д' 1 + Ъа'+Д' 1 + Ъа' (1 + 1п (а)Д') 1 + Ъа' + Ъа'1п (а)Д'

1 1

1 + Ъа' 1 + Ъа' (1 + Ъа' )-11п (а )Д' 1 , (1 - Ъа' (1 + Ъа' )-11п (а) Д') =

1 Ъа -1п (а )Д' = х + X (1 - X) 1п (а )Д'.

1 + Ъа' (1 + Ъа')

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

То есть х1+ы =х + X(1 -х^!п(а)А приусловии 1п(а)Аг = 1.

X — X

Откуда непосредственно следует -г+А-= 1п(а)х (1 - х) , что

Аг

доказывает требуемое утверждение.

Очевидно, при 1п(а) << 1 и Аг = 1 все преобразования остаются корректными, поэтому разностное уравнение, описывающее логистическую кривую в дискретной форме (28), аппроксимируется выражением вида (27).

В силу введённых промежуточных обозначений 1п(а) = в = ц 3= ¡/К, тогда условию 1п(а) << 1 соответствует ¡л/К << 1. Таким образом, при «большой» размерности К множества состояний внешней среды логистическая кривая (28) аппроксимируется разностным уравнением (27).

Логистическая кривая научения (28) является хрестоматийной для теории научения [15]. В то же время, для рассматриваемой модели научения научению она является частным случаем, соответствующим равномерному распределению состояний природы и пропорциональности интенсивности процесса проверок состояний внешней среды достигнутому уровню научения при «большой» размерности множества состояний внешней среды.

В случае, когда кривая научения является логистической -см. (28), средняя длина серии имеет вид N = Я(1 -Я) ехр(Дг) и порождается весьма компактным разностным уравнением N+1 = ехр(0)Г,.

Гиперболическая кривая научения. В другом частном случае автонаучения интенсивность процесса проверок состояний внешней среды может уменьшаться по мере роста уровня научения: Г{ = р (1 - Е[А7])а, где а > 0. На практике это может иметь место, например, при ограниченных когнитивных (в том числе ограниченность кратковременной памяти) и/или «вычислительных» возможностях обучающегося субъекта.

Аналогично рассмотренному выше случаю логистической кривой научения для равновероятных состояний внешней среды получим разностное уравнение для уровня научения. Выраже-

ние (26) справедливо и в данном случае; подставив в него Гг = р (1 - Е[Ь])а, получим:

(29) АЕ[Ьм] = Г, 5(1-В[Ц]) = »3(\-Е[Ц])'+".

Уравнение (29) является разностным аналогом дифференциального уравнения dx/dt = в (1 - х)1а, где /3 = ^,5, решением которого является классическая для теории научения (см. обзор в [15] и пионерские работы [32, 39]) гиперболическая кривая научения как функция непрерывного времени.

Гиперболическая кривая в дискретной форме имеет вид

(30) Е [Ц ]=1 -Л

(1 + а/ г)

Она монотонно возрастает от нуля (при t = 0) до 1 (при г ^ ). Как и в примере с логистической кривой, введя компактные

обозначения х = 1--1—тг-, легко выполнить аналогичные

г (1 + а/ г)

выкладки при в << 1 и ав << 1 и в результате получить хг+1 = хг +/(1 - хг)^ .

Условие в<<1 равносильно ц 3 = ¡/К<<1, поэтому гиперболическая кривая является решением разностного уравнения (29) при «большой» размерности К множества состояний внешней среды.

Средняя длина серии в этом случае равна N =(1 + а/ г )1/а -1.

Разностное уравнение для средней длины серии:

-]1/а

1 .

N+1 =

(N +1)а + а/

В частности, при а = 1 уравнение имеет вид N+1 = N + в.

Таким образом, гиперболическая кривая научения (30) (её разностный аналог: = Е[Ам] + в (1 - Е[Ам]:+а) для рассматриваемой модели является частным случаем «научения научению», соответствующим равномерному распределению состояний природы и убыванию интенсивности процесса проверок состояний внешней среды с ростом достигнутого уровня научения.

Автонаучение. Рассмотрим модель автонаучения в непрерывном времени - дифференциальное уравнение для уровня научения z(t) е [0; 1], t > 0: (31) z'(t) = y(1 - z)p(z)

с начальным условием z(0) = Ле [0; 1), где у> 0, p( •): [0; 1] ^ (0; A] - непрерывная функция, где 0 < A < (если p интерпретируется как вероятность, то A = 1).

Из введённых предположений следует, что:

а) решение уравнения (31) существует и единственно;

б) зависимость z(t) является строго монотонно возрастающей и V t > 0 z'(t) < у;

в) если z(0) = 0, то Vt > 0 z(t) < 1 - exp( -yAt);

г) зависимость z(t) является замедленно-асимптотической, т.е. lim z(t)= 1 и lim z'(t)= 0.

Варьируя p(z), можно получать различные кривые автонаучения. Частными случаями являются многие рассмотренные выше классы кривых научения, а именно:

1) Экспоненциальная кривая («вырожденный случай» - автонаучение отсутствует: p(z) = 1, имеет место обычное научение):

Л = 0; z'(t) = у(1 - z); z(t) = 1 -exp(-у t) .

2) Логистическая кривая:

p(z) = z, Л > 0; z'(t) = yz(1 - z); z (t) =---1-.

1 + (--1) exp(-у t) Л

3) Гиперболическая кривая:

p(z) = (1 - z)a, а > 0, Л = 0; z'(t) = y(1 - z)1+fl;

z(t) =1 1 ч1/- .

(1 + a у t j

Модель автонаучения (31) допускает ряд расширений - переход к моделям научения в процессе работы и к моделям группового научения.

Рассмотрим модель научения в процессе работы (Learning-by-Doing), в рамках которой обучаемый субъект (агент) может выбирать интенсивность w(t) > 0 своей деятельности (объем работы, выполняемый в единицу времени, число состояний

природы, анализируемых в единицу времени, и т.д.). Объем

t

выполненных работ W(t) = J w(r)dr можно условно считать тем

0

«опытом», который накопил агент, его «эффективным внутренним временем» [16].

Подставляя в (31) вместо p(z) интенсивность w(t), получим дифференциальное уравнение

(32) z'(t) = у(1 - z)w(z),

решением которого является «экспоненциальная» кривая научения

(33) zw(t) = 1 - exp( - W( t)) .

Если считать, следуя [16], что (33) - вероятность достижения результата в момент времени t (доля успешных действий агента), то кумулятивный ожидаемый результат будет определяться следующим выражением

t t w

(34) W+(t) = Jzw(w)w(w)dw = J1 -exp(-Jw(r)dr)w(w)dw .

0 0 0 Если задан интервал времени T > 0 и максимальный объем работ W0, которые может выполнить агент, то из (32)-(34) получаем, что задача максимизации ожидаемого результата примет вид задачи динамического программирования W+(T) ^ max .

w(-), W (T )<W0

Аналогичные задачи (в том числе с учётом затрат агента и т.п.), трактуемые как задачи об оптимальной стратегии научения агента, рассматриваются в [7,16].

В заключение настоящего раздела опишем в терминах автонаучения процесс группового научения [16].

До сих пор при рассмотрении научения агента считалось, что агент учится только «на собственном опыте». Тем не менее в коллективах имеет место обмен опытом, и агенты, наблюдая за деятельностью других (их успехами и трудностями), могут также приобретать опыт (см. модели в [16]). Для того чтобы отразить этот эффект, можно считать, что «опыт» p, накопленный агентом, зависит от уровней научения других агентов.

Пусть имеется п агентов. Обозначая через 7 номер агента, через ^ - уровень его научения, через г = (гь г2, ... , гп) - вектор уровней научения, запишем для каждого из агентов аналог уравнения (31):

(35) ¿(X) = уг(1 - г)р(г), 7 = 1, 2, п.

Влияние агентов друг на друга в модели (35) может быть различным:

ф. (г)

- если-> 0, то 7-й агент перенимает опыт у-го агента;

д!]

др, (г)

- если -< 0, то опыту-го агента «мешает» 7-му агенту;

дzj

- если РР ( ) = 0, то приобретение опыта у-м агентом не вли-

дzj

яет на 7-го агента.

Для модели (35) задача о оптимальном совместном научении группы агентов может ставиться и решаться по аналогии с тем, как это делается для дискретной модели в [16].

8. Заключение

Таким образом, в настоящей работе рассмотрены модели формирования и освоения технологии комплексной деятельности. В том числе:

- получена базовая кривая научения в ходе разработки технологии (выражение (1)) и исследованы ее свойства (утверждения 1 и 2);

- для ряда практически важных частных случаев получены аппроксимации кривой научения (выражения (3) и (6));

- получена оценка (7) среднего времени достижения требуемого уровня научения и исследованы его свойства (утверждение 3);

- предложены и исследованы:

• модели комплексирования частных компонентов технологии (выражения (15), (17), (19), (21), (25), (26) и (16), (18), (20), описывающие кривые научения и оценки средних времен соответственно);

• модели научения научению и автонаучения (раздел 7). Следует отметить, что классические для теории научения (см. обзор в [15]) экспоненциальная кривая (2), а также логистическая (27) и гиперболическая (30) кривые являются частными (для рассматриваемых моделей) случаями предложенной модели автонаучения.

Дальнейших исследований и осмысления, вероятно, заслуживает тот факт, что введённый в работе показатель «средняя длина серии» в случаях канонических для теории научения кривых описывается линейными разностными уравнениями:

• для экспоненты = ехр(у) N + (ехр(у) - 1);

• для логисты Ым = ехр(в) N

• для гиперболы первой степени N+1 = N + р. Перспективными представляются постановка и решение задач управления формированием и развитием технологий на базе предложенных моделей последних. Некоторые из таких задач управления рассматриваются в [7].

Литература

1 АЛЕКСАНДРОВСКАЯ Л.Н., КРУГЛОВ В.И., КУЗНЕЦОВ А.Г., ШОЛОМ А.М. Теоретические основы испытаний и экспериментальная отработка сложных технических систем. Учебное пособие. - М: Логос, 2003. - 735 с.

2 АТКИНСОН Р., БАУЭР Г., КРОТЕРС Э. Введение в математическую теорию обучения. - М.: Мир, 1969. - 468 с.

3 БЕЙЗЕР Б. Тестирование чёрного ящика. Технологии функционального тестирования программного обеспечения и систем. - СПБ.: Питер, 2004. - 318 с.

4 БЕЛОВ М.В. Проблемы управления жизненными циклами организационно-технических систем // Управление большими системами. - 2018. Вып. 76. - С. 117-172.

5 БЕЛОВ М.В., НОВИКОВ Д А. Проблемы управления технологией комплексной деятельности организационно-технических систем // Проблемы теории и практики управления. - 2018. - №7. - С. 26-42..

6 БЕЛОВ М.В., НОВИКОВ Д А. Методология комплексной деятельности. - М.: Ленанд, 2017. - 320 с.

7 БЕЛОВ М.В., НОВИКОВ Д.А. Модели управления технологией комплексной деятельности // Управление большими системами. - 2019. - (принята к публикации).

8 БОНДАРЕНКО И.Б., ИВАНОВ А.И. Организационная модель многоагентной системы извлечения знаний из распределённых гетерогенных баз данных систем автоматизированного проектирования // Известия высших учебных заведений. Поволжский регион. Технические науки. -2015. - №4(36). - С. 54-63.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9 БУШ Р., МОСТЕЛЛЕР Ф. Стохастические модели обучаемости. - М.: Гос. изд-во физ.-мат. лит., 1962. - 483 с.

10 ВАЛЬЧУК А.С. Разработка математической модели автоматического извлечения знаний для гибридной вопросно-ответной системы // Вестник КРАУНЦ. Физ.-мат. науки. - 2017. - №2(18). - C. 76-80.

11 ДРОЗДОВ В.И., БОЙЦОВА Е.А., НОВИКОВ Ю.М. Исследование качества тестов с использованием модели Раша. -URL: https://cyb erleninka.ru/article/n/issledovanie-kachestva-testov-s-ispolzovaniem-modeli-rasha (дата доступа: 23.01.2018).

12 КОВАРЦЕВ АН., ПОПОВА-КОВАРЦЕВА ДА., СЕРПОВ-СКАЯ Е.Е. Тестирование математических моделей вычислительных алгоритмов на основе метода глобальной оптимизации // Сборник трудов конференции «Информационные технологии и нанотехнологии», Самара, 29 июня -01 июля 2015 г. - С. 191-196.

13 КОЧУРА С.Г., КУЗНЕЦОВ НА., НОСЕНКОВ А.А. О математическом моделировании электрических испытаний космических аппаратов связи // ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. - 2011. - Т. 54, №4. - С. 43-47.

14 Краткий психологический словарь. - М.: ИПЛ, 1985. - 201 с.

15 НОВИКОВ Д.А. Закономерности итеративного научения. - М.: Институт проблем управления РАН, 1998. - 96 с.

16 НОВИКОВ Д.А. Модели обучения в процессе работы // Управление большими системами. - 2007. - №19. - С. 5-22.

17 САМОЛЮК Н.Г. Современные средства оценивания результатов обучения. Конспект лекций. - ФГБОУ «Томский государственный педагогический университет». - URL: http://koi.tspu.ru/koi_books/samolyuk/ (дата доступа: 23.01.2018).

18 СТАРОЛЕТОВ С М., КРЮЧКОВА Е.Н. Проведение on-line тестирования программного обеспечения на основе построенной модели // ПОЛЗУНОВСКИЙ ВЕСТНИК. -2010. - №2. - С. 212-216.

19 ЧЕЛЫШКОВА М.Б. Теория и практика конструирования педагогических тестов. Учебное пособие. - М.: Логос, 2002. - 432 с.

20 ШИРЯЕВ А.Н. Статистический последовательный анализ. Оптимальные правила остановки. - М.: Физматлит, 1976. -272 с.

21 AICHERNIG B.K., SCHUMIR, Statistical Model Checking Meets Property-Based Testing // IEEE Int. Conf. on Software Testing, Verification and Validation - 2017 (ICST-2017), Tokyo. - P. 390- 400. - DOI: 10.1109/ICST.2017.42.

22 ALAGOZ HERPEL T., GERMAN R. A Selection Method for Black Box Regression Testing with a Statistically Defined Quality Level // IEEE Int. Conf. on Software Testing, Verification and Validation - 2017 (ICST-2017), Tokyo. - P. 114125. - DOI: 10.1109/ICST.2017.18.

23 ALI S., YUE T. U-Test: Evolving, Modelling and Testing Realistic Uncertain Behaviours of Cyber-Physical Systems // IEEE 8th Int. Conf. on Software Testing, Verification and Validation - 2015 (ICST-2015), Graz. - P. 1-2. - DOI: 10.1109/ICST.2015.7102637/

24 BOURQUE P., FAIRLEY RE.(eds) Guide to the Software Engineering Body of Knowledge, Version 3.0 // IEEE Computer Society, 2014. - URL: www.swebok.org.

25 Business Process Model and Notation (BPMN), v2.0.2. - URL: http: //www. omg.org/spec/BPMN/2.0.

26 CHUI D.K.Y., WONG A.K.C. Synthesizing Knowledge: A Cluster Analysis Approach Using Event Covering // IEEE Trans. on Systems, Man, and Cybernetics. - March 1986. -Vol. 16, No. 2. - P. 251-259. - DOI: 10.1109/ TSMC.1986.4308945.

27 CRAWFORD J. Learning Curve, Ship Curve, Ratios, Related Data / Lockheed Aircraft Corporation. - 1944. - P. 122 - 128.

28 EBBINGHAUS H. Über das Gedächtnis. - Leipzig: Dunker, 1885. - 168 p.

29 HENDERSON B. The Application and Misapplication of the Learning Curve // J. of Business Strategy. - 1984. - Vol. 4. -P. 3-9.

30 HENRIQUES D., MARTINS JG., ZULIANI P., PLATZER A., CLARKE E.M. Statistical Model Checking for Markov Decision Processes // Int. Conf. on Quantitative Evaluation of Systems, (QEST), London, United Kingdom, 2012. - P. 84-93. -DOI: 10.1109/QEST.2012.19.

31 HULL C.L. Principles of Behavior and Introduction to Behavior Theory. - New York: D. Appleton Century Company, 1943. -422 p.

32 LEGAY A., DELAHAYE B., BENSALEM S. Statistical Model Checking: An Overview // In: Barringer H. et al. (eds) Runtime Verification. RV 2010. Lecture Notes in Computer Science, Vol. 6418. - Springer, Berlin, Heidelberg, 2010.

33 LEIBOWITZ N., BAUM B., ENDEN G., KARNIEL A. The Exponential Learning Equation as a Function of Successful Trials Results in Sigmoid Performance // J. of Mathematical Psychology. - 2010. - Vol. 54. - P. 338-340.

34 MIKAMI S., KAKAZU Y. Extended stochastic reinforcement learning for the acquisition of cooperative motion plans for dynamically constrained agents // Proc. of IEEE Systems Man and Cybernetics Conference (SMC), Le Touquet, 1993. - Vol. 4. -P. 257-262. - DOI: 10.1109/ICSMC.1993.390719.

35 ORSEAU L., LATTIMORE T., HUTTER M. Universal Knowledge-Seeking Agents for Stochastic Environments // In: Jain S., Munos R., Stephan F., Zeugmann T. (eds) Algorithmic Learning Theory. ALT 2013. Lecture Notes in Computer Science, vol. 8139. - Springer, Berlin, Heidelberg, 2013.

36 PATRICK M., DONNELLY R., GILLIGAN CA. A Toolkit for Testing Stochastic Simulations against Statistical Oracles // IEEE Int. Conf. on Software Testing, Verification and Validation (ICST), Tokyo, 2017. - P. 448-453. - DOI: 10.1109/ICST.2017.50.

37 STOCIA G., STACK B. Acquired Knowledge as a Stochastic Process // Surveys in Mathematics and its Applications. -2017. - Vol. 12. - P. 65-70. - URL: http: //www .utgj iu.ro/math/smahttp: //www .utgj iu.ro/math/sma

38 TOLMAN E.C. Theories of Learning // Comparative Psychology. Ed. Moss F.A. Chapter 12. - New York: Prentice Hall, 1934. - P. 232 - 254.

39 THURSTONE L.L. The Learning Curve Equation // Psychol. Monogr. - 1919. - Vol. 26, No. 3. - P. 1-51.

40 THURSTONE L.L. The Learning Function // J. of General Psychology. - 1930. - No. 3. - P. 469-493.

41 VAN DER LINDEN W.J., HAMBLETON R.K. Handbook of Modern Item Response Theory - Springer Science & Business Media, 1996. - P. 512.

42 WRIGHT T. Factors Affecting the Cost of Airplanes // J. of Aeronautical Sciences. - 1936. - Vol. 3(4). - P. 122-128.

43 WONG A., WANG Y. Pattern Discovery: A Data Driven Approach to Decision Support // IEEE Trans. on Systems, Man, and Cybernetics. - February 2003. - Vol. 33, No. 1. -P.114-124.

44 YIZHEN CHEN et al. Effective Online Software Anomaly Detection // Proc. of the 26th ACM SIGSOFT Int. Symposium on Software Testing and Analysis (ISSTA-2017), Santa Barbara, CA, USA, July 10-14, 2017. - P. 136-146.

MODELS OF DESIGNING AND LEARNING A TECHNOLOGY OF COMPLEX ACTIVITY

Mikhail Belov, IBS, Moscow, Cand.Sc. ([email protected]), Dmitry Novikov, Institute of Control Sciences, Moscow, Doct. of Sc. ([email protected]).

Abstract: Presented mathematical models are based on previous studies of the problems of managing organizational and technical systems and their complex activities, executed by the authors. The problem of developing and / or mastering the technology of complex activity is formalized in the form of a mathematical model, which generalizes of probabilistic learning models. The properties of the process of developing and / or mastering technology (learning) are studied, the convergence of the process to the state of full technology mastering is shown, analytical expressions of the characteristics of the models are obtained - the average time to reach a given level of mastering. The models of learning that describe the integration of elements of technology - conjunctive, disjunctive and parallel development of technology are proposed. Developed and studied models of learning in the process of work and group learning. including the "learning to learn " model - when the intensity of the learning process depends on the learning level achieved. For all models of integration, analytical expressions for learning levels are obtained. The asymptotic case of models during the transition to continuous time is investigated. It is shown that special cases of the proposed model are models of exponential, hyperbolic, and logistic learning curves, which are widespread in the theory of learning, theory of system testing, software testing, and related branches of knowledge.

Keywords: technology, complex activity, learning curve.

УДК 004.827

ББК 32.81 87 65.05 72.4

DOI: https://doi.org/10.25728/ubs.2019.77.7

Статья представлена к публикации членом редакционной коллегии Г.А. Угольницким.

Поступила в редакцию 10.07.2018.

Опубликована 31.01.2019.

i Надоели баннеры? Вы всегда можете отключить рекламу.