Научная статья на тему 'Принятие решений с выбираемой структурой предпочтений'

Принятие решений с выбираемой структурой предпочтений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
327
65
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРИНЯТИЕ РЕШЕНИЙ / МОДЕЛИРОВАНИЕ ВЫБОРА / ТЕОРИЯ ИГР / СОГЛАСОВАНИЕ ПРЕДСТАВЛЕНИЙ / АКТИВНЫЕ СИСТЕМЫ / ИДЕНТИФИКАЦИЯ / DECISION-MAKING / CHOICE MODELING / GAME THEORY / COORDINATION OF IDEAS / ACTIVE SYSTEMS / IDENTIFICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Виноградов Геннадий Павлович, Виноградова Наталья Геннадьевна

ЦЕЛЬ. Разработка концептуальной схемы принятия решений для получения возможности объяснить принятие решений субъектом в конкретных ситуациях, предсказать принимающим решение возможные реакции другого субъекта в различных ситуациях, решить задачи создания у управляемой стороны нужного образа ситуации выбора. МЕТОДЫ ИССЛЕДОВАНИЯ. При исследовании авторы опирались на общую методологию и методы системного анализа, аналитического моделирования, в работе также использовались методы теорий множеств, активных систем, принятия решений, искусственного интеллекта, нечетких систем и нечеткого логического вывода, теории игр. РЕЗУЛЬТАТЫ. Представлена концептуальная схема моделирования принятия субъективно рациональных решений. Для формального описания интересов субъекта введены два показателя: удельная ценность ситуации целеустремленного состояния по результату и удельная ценность ситуации целеустремленного состояния по эффективности. Предложено разделить процесс принятия решений на этапы: 1) формирование представлений о свойствах ситуации выбора; 2) собственно принятие решения о способе действия; 3) построение алгоритма (плана) реализации решения; 4) реализация алгоритма; 5) оценка результатов. Качество принятого решения предложено оценивать по критерию удельной ценности ситуации целеустремленного состояния по результату, качество представлений о ситуации выбора критерием потерь ценности. Показано, что при принятии решения субъект использует три множества альтернатив: множество способов действия, множество вариантов представлений, множество стратегий идентификации. Выбор альтернативы из соответствующего множества производится по своему индивидуальному критерию качества. Предложено связать критерий качества с некоторой виртуальной оперирующей стороной, имеющей в пределах своей компетенции свободу выбора. Интересы субъекта являются доминирующими для выделенных сторон, и он выступает для них в виде центра управления. Показано, что в этом случае принятие решений следует рассматривать как корпоративную игру с непротивоположными интересами. Поскольку интересы всех игроков взаимозависимы, то ее решение возможно на множестве согласованных компромиссных вариантов. ЗАКЛЮЧЕНИЕ. В статье представлена концептуальная схема моделирования принятия субъективно рациональных решений, предназначенная для понимания специфики управления эволюцией инновационных систем, в которых особую значимость приобретает гармоничность взаимодействия «субъект проект среда». В этом контексте важна проблема сборки субъектов, идентифицирующих себя с системой, в которой происходит их деятельность, и регулирующих свою активность с учетом ее влияния на результаты этой системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Виноградов Геннадий Павлович, Виноградова Наталья Геннадьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DECISION-MAKING WITH A SELECTABLE PREFERENCE STRUCTURE

The PURPOSE of the work is to develop a conceptual framework of decision-making in order to explain the subject’s decision-making in specific situations, give predictions to a decision-maker about possible reactions of another party in different situations, solve the problems of creation of the desirable image of the situation of choice for the party being controlled. RESEARCH METHODS. The study is based on the general methodology and the methods of system analysis, analytical modeling. The work also uses the methods of the theory of sets, active systems, decision-making, artificial intelligence, fuzzy systems, fuzzy logic, and a game theory. RESULTS. The conceptual simulation diagram of making subjectively rational decisions is presented. Two indicators are introduced for the formal description of the subject’s interests: specific value of a purposeful state situation by result and specific value of a purposeful state situation by efficiency. It is proposed to divide the decision-making process into stages: 1) formation of ideas on the properties of the situations of choice; 2) actual decision-making on the mode of action; 3) building an algorithm (plan) of solution implementation; 4) algorithm implementation; 5) evaluation of results. It is proposed to evaluate the quality of the made decision by the criterion of the specific value of the purposeful state situation by result, while the quality of ideas about the situation of choice is suggested to evaluate by the criterion of loss of value. It is shown that the subject when making decisions uses three sets of alternatives: a set of modes of action, a set of idea variants and a set of identification strategies. The alternative is chosen from the corresponding set by one’s individual quality criterion. It is proposed to associate the quality criterion with a virtual operating party that has the freedom of choice within its competence. The interests of the subject are dominant for the selected parties, and he acts as a control center for them. It is shown that in this case decision-making should be considered as a corporate game with nonconflicting interests. Since the interests of all players are interrelated its solution is possible on a number of correlated compromise variants. CONCLUSION. The article represents a conceptual simulation diagram for making subjectively rational decisions designed for understanding the specificity of innovation system evolution management where specific importance belongs to the harmonious interaction of “Subject Project Environment”. In this context, it is important to assembly the subjects identifying themselves with the system, in which their activity takes place and regulating their activity with regard to its impact on the results of this system.

Текст научной работы на тему «Принятие решений с выбираемой структурой предпочтений»

Оригинальная статья / Original article УДК: 519.21

DOI: 10.21285/1814-3520-2016-10-90-101

ПРИНЯТИЕ РЕШЕНИЙ С ВЫБИРАЕМОЙ СТРУКТУРОЙ ПРЕДПОЧТЕНИЙ

1 9

© Г.П. Виноградов1, Н.Г. Виноградова2

Тверской государственный технический университет, 170023, Россия, Тверь, ул. Маршала Конева, 12.

РЕЗЮМЕ. ЦЕЛЬ. Разработка концептуальной схемы принятия решений для получения возможности объяснить принятие решений субъектом в конкретных ситуациях, предсказать принимающим решение возможные реакции другого субъекта в различных ситуациях, решить задачи создания у управляемой стороны нужного образа ситуации выбора. МЕТОДЫ ИССЛЕДОВАНИЯ. При исследовании авторы опирались на общую методологию и методы системного анализа, аналитического моделирования, в работе также использовались методы теорий множеств, активных систем, принятия решений, искусственного интеллекта, нечетких систем и нечеткого логического вывода, теории игр. РЕЗУЛЬТАТЫ. Представлена концептуальная схема моделирования принятия субъективно рациональных решений. Для формального описания интересов субъекта введены два показателя: удельная ценность ситуации целеустремленного состояния по результату и удельная ценность ситуации целеустремленного состояния по эффективности. Предложено разделить процесс принятия решений на этапы: 1) формирование представлений о свойствах ситуации выбора; 2) собственно принятие решения о способе действия; 3) построение алгоритма (плана) реализации решения; 4) реализация алгоритма; 5) оценка результатов. Качество принятого решения предложено оценивать по критерию удельной ценности ситуации целеустремленного состояния по результату, качество представлений о ситуации выбора - критерием потерь ценности. Показано, что при принятии решения субъект использует три множества альтернатив: множество способов действия, множество вариантов представлений, множество стратегий идентификации. Выбор альтернативы из соответствующего множества производится по своему индивидуальному критерию качества. Предложено связать критерий качества с некоторой виртуальной оперирующей стороной, имеющей в пределах своей компетенции свободу выбора. Интересы субъекта являются доминирующими для выделенных сторон, и он выступает для них в виде центра управления. Показано, что в этом случае принятие решений следует рассматривать как корпоративную игру с непротивоположными интересами. Поскольку интересы всех игроков взаимозависимы, то ее решение возможно на множестве согласованных компромиссных вариантов. ЗАКЛЮЧЕНИЕ. В статье представлена концептуальная схема моделирования принятия субъективно рациональных решений, предназначенная для понимания специфики управления эволюцией инновационных систем, в которых особую значимость приобретает гармоничность взаимодействия «субъект - проект - среда». В этом контексте важна проблема сборки субъектов, идентифицирующих себя с системой, в которой происходит их деятельность, и регулирующих свою активность с учетом ее влияния на результаты этой системы. Ключевые слова: принятие решений, моделирование выбора, теория игр, согласование представлений, активные системы, идентификация.

Формат цитирования: Виноградов Г.П. Виноградова Н.Г. Принятие решений с выбираемой структурой предпочтений // Вестник Иркутского государственного технического университета. Т. 20. № 10. С. 90-101. DOI: 10.21285/1814-3520-2016-10-90-101

DECISION-MAKING WITH A SELECTABLE PREFERENCE STRUCTURE G.P. Vinogradov, N.G. Vinogradova

Tver State Technical University, 12 Marshal Konev St., Tver, 170023, Russia.

ABSTRACT. The PURPOSE of the work is to develop a conceptual framework of decision-making in order to explain the subject's decision-making in specific situations, give predictions to a decision-maker about possible reactions of another party in different situations, solve the problems of creation of the desirable image of the situation of choice for the party being controlled. RESEARCH METHODS. The study is based on the general methodology and the methods of system

Виноградов Геннадий Павлович, доктор технических наук, профессор кафедры информатики и прикладной математики, e-mail: [email protected]

Vinogradov Gennady, Doctor of technical sciences, Professor of the Department of Information Science

and Applied Mathematics, e-mail: [email protected]

Виноградова Наталья Геннадьевна, аспирант, e-mail: [email protected]

Vinogradova Natalia, Postgraduate, e-mail: [email protected]

analysis, analytical modeling. The work also uses the methods of the theory of sets, active systems, decision-making, artificial intelligence, fuzzy systems, fuzzy logic, and a game theory. RESULTS. The conceptual simulation diagram of making subjectively rational decisions is presented. Two indicators are introduced for the formal description of the subject's interests: specific value of a purposeful state situation by result and specific value of a purposeful state situation by efficiency. It is proposed to divide the decision-making process into stages: 1) formation of ideas on the properties of the situations of choice; 2) actual decision-making on the mode of action; 3) building an algorithm (plan) of solution implementation; 4) algorithm implementation; 5) evaluation of results. It is proposed to evaluate the quality of the made decision by the criterion of the specific value of the purposeful state situation by result, while the quality of ideas about the situation of choice is suggested to evaluate by the criterion of loss of value. It is shown that the subject when making decisions uses three sets of alternatives: a set of modes of action, a set of idea variants and a set of identification strategies. The alternative is chosen from the corresponding set by one's in dividual quality criterion. It is proposed to associate the quality criterion with a virtual operating party that has the freedom of choice within its competence. The interests of the subject are dominant for the selected parties, and he acts as a control center for them. It is shown that in this case decision-making should be considered as a corporate game with nonconflicting interests. Since the interests of all players are interrelated its solution is possible on a number of correlated compromise variants. CONCLUSION. The article represents a conceptual simulation diagram for making subjectively rational decisions designed for understanding the specificity of innovation system evolution management where specific importance belongs to the harmonious interaction of "Subject - Project - Environment". In this context, it is important to assembly the subjects identifying themselves with the system, in which their activity takes place and regulating their activity with regard to its impact on the results of this system.

Keywords: decision-making, choice modeling, game theory, coordination of ideas, active systems, identification

For citation: Vinogradov G.P., Vinogradova N. G. Decision-making with a selectable preference structure. Proceedings of Irkutsk State Technical University. 2016, vol. 20, no. 10, pp. 90-101. (In Russian) DOI: 10.21285/1814-35202016-10-90-101

Введение

Развитие идеи субъективно рационального выбора открыло возможность объяснить принятие решений субъектом в конкретных ситуациях; предсказать принимающим решение возможные реакции другого субъекта в различных ситуациях; решить задачу активного прогноза, когда управляющая сторона создает у управляемой стороны нужный образ будущего [1]. Субъективно рациональный выбор предполагает, что его мотивация определяется как внешними, так и внутренними факторами. Внутренние факторы отражают интересы субъекта, индуцируемые его потребностями и этической системой, которой он придерживается. Оценки удовлетворенности текущей ситуацией целеустремленного состояния субъектом, как показано в [2], могут приводить к изменению структуры интересов субъекта, и он ее может выбирать. Поскольку предпочтения субъекта в процессе выбора отражают его интересы, то можно определить множество G альтер-

нативных вариантов структуры предпочтений, которые будем называть структурными альтернативами [3].

Актуальность работы обусловлена тем, что эффективность рефлексивного управления поведением людей в организационно-технологических системах, особенно в условиях неопределенности и риска, зависит от представлений у управляющего органа о том, как люди выявляют и воспринимают объективные признаки складывающихся ситуаций, строят оценки, вырабатывают и согласовывают формы поведения. Это предполагает разработку моделей принятия решений субъектом, у которого есть внутренние образы себя и воздействующей на него стороны и которые учитывают субъективное понимание ситуации выбора. Наличие таких моделей позволяет делать оценки эффективности информационного воздействия до того, как оно будет произведено.

Исходные предположения

1. Выбор субъектом осуществляется устремленного состояния. на основе представлений о ситуации целе- 2. Компоненты представления отра-

жают различные аспекты понимания субъектом ситуации целеустремленного состояния и образуют информационную структуру представлений. Множество возможных вариантов представлений обозначим через X.

3. Для множества состояний окружения О множество наблюдаемых состояний окружения удовлетворяют условию

X , то есть представления субъекта могут содержать как объективную составляющую, так и фантомную.

4. Структурные альтернативы субъект выбирает в зависимости от оценок удовлетворенности значениями свойств ситуации целеустремленного состояния.

5. Формирование представлений осуществляется на основе процедур восприятия, осознания и анализа согласно когнитивным возможностями субъекта.

Активные интеллектуальные системы содержит в себе субъект интересов, объект интересов, средства реализации интересов и порождаемые ими отношения. В работах [2, 4] доказано, что формально интересы субъекта (в дальнейшем агента) могут быть представлены двумя показателями: удельной ценностью ситуации целеустремленного состояния по результату и удельной ценностью ситуации целеустремленного состояния по эффективности. Они позволяют оценить степень желательности для агента результатов и величину прикладываемых для этого усилий. С усилиями связано определение возможных способов действия, которые с формальной стороны следует рассматривать как управление. Оценку качества выбора следует связывать со стремлением к реализации интересов с некоторым наилучшим результатом. Формально понятие «наилучший результат» следует характеризовать, например, отношением удельной ценности ситуации целеустремленного состояния по результату к удельной ценности ситуации целеустремленного состояния по эффективности [4]. Значения этого показателя являются значениями некоторой шкалы, характеризующей субъективное отношение агента к эволюции своего состояния в зависимости от

выбранного управления, а также к эволюции системы в целом. Полярными значениями этой шкалы являются гибель -доминирование. Понятно, что оценки по этой шкале будут определять конкретное содержание интересов, их эмоциональное переживание, степень стремления к их реализации. На их значения будут оказывать влияние системы ценностей и норм агента, а также этическая система. Если учитывать тот факт, что реализация интересов агента возможна только в рамках системы, то можно считать интересы системы в целом и каждого агента не противоположными, но, в общем случае, не совпадающими.

Как установлено в [5], система внутренних ценностей может рассматриваться априорно заданной и инвариантной лишь до тех пор, пока не возникнет ситуация возможной гибели агента или получение таких оценок свойств ситуации целеустремленного состояния, которые он не может считать удовлетворительными. С другой стороны, систему ценностей следует рассматривать зависимой от принятой агентом этической системы, которая определяет для человека такие фундаментальные понятия, как «Добро» и «Зло» [6]. Этические системы, построенные на импликации этих понятий в терминах намерение (цель), действие, результат, определяются какими-то глубинными свойствами этноса, группы. Следовательно, понятие «с наилучшими результатами» зависит от этической системы через систему ценностей и норм, которая в свою очередь определяет структуру предпочтений на действиях агента. Отметим, что в нормативной теории принятия решений структура предпочтений агента считается априорно заданной [7].

В данной схеме формализации интересов агента можно определить его субъективные оценки желательности и возможности достижения различных значений удельной ценности ситуации целеустремленного состояния, и через них -конкретные значения показателей качества жизни, к которому стремится агент. Поскольку их значения формируются на основе субъективных оценок ценности и воз-

можности реализации интересов, то интересы агента и соответствующие цели являются эндогенными, то есть формируемыми внутри системы. Структура и конкретные значения целей определяются степенью выражения в них интересов агента через субъективные оценки свойств компонент ситуации целеустремленного состояния (подробно об этом см. в [4]).

Стремление выжить, не допустить

Поведение агента с эндогенным

Введем ряд утверждений:

1. Мотивацией поведения субъекта являются интересы и потребности. Характеризующие их показатели образуют иерархическую структуру, например, в смысле Маслоу.

2. Агент, как носитель интересов, выступает для объекта интересов в качестве управляющей системы.

3. Объект интересов агента может быть как пассивным, так и активным, обладающим свойством суверенности, активности, целеустремленности и интеллектуальности.

4. Субъект интересов может выбирать структуру предпочтений на множестве состояний объекта интересов, то есть его структура предпочтений не фиксирована.

5. Цель управления системой не задана экзогенно, а формируется внутри системы на основе согласования интересов и понимания обстановки.

6. Мотивация деятельности субъектов системы определяется их заинтересованностью в прогрессивной эволюции системы в целом и отдельных ее частей.

Согласно введенной аксиоматике, мотивация на управление (действие) определяется заинтересованностью субъекта эволюцией объекта управления. Следовательно, существует набор переменных, которые агент наблюдает и воспринимает и которые характеризуют состояние объекта и его окружение. Их восприятие и осознание является необходимым внешним условием, побуждающим субъекта к выбору управляющих воздействий, направленных

снижения удельной ценности ситуации целеустремленного состояния и обеспечить ее рост, данное в инстинктах, определяет второе свойство любой системы, проявляющей поведение. Оно связано с необходимостью непрерывного изучения своего окружения, а также совершенствования методов и способов действия. Цель для агента состоит в поддержке прогрессивной эволюции себя как целостной системы.

шципом формирования целей

на реализацию его интересов в ситуации выбора.

Заинтересованность агента в эволюции объекта интересов предполагает его отношение к состоянию окружения, которое порождается его представлениями о соответствии наблюдаемого состояния успешности реализации его интересов, намерений, интенций. Эти представления определяются многоуровневой системой обработки информации мозгом человека, структура которой с точки зрения постнеклассическо-го принципа рациональности рассмотрена в [1]. Само отношение выражается на качественном уровне посредством вербальных оценок и касается всех компонент состояния, в том числе и самого субъекта выбора. Таким образом, представление порождает как отношение к состоянию, так и некоторое отношение к возможности и эффективности. С помощью управляющих воздействий удается реализовать интересы с наилучшим результатом. Существование такого отношения позволяет субъекту ориентироваться при выборе управления (способа действия), а также определять содержательный смысл (кроме того, и прагматический смысл) его стремления к реализации интересов с наилучшим результатом.

Качественные характеристики, определяющие отношение субъекта к состоянию окружения, оценке направления его эволюции, ценности, эффективности возможных результатов, вероятности реализации интересов с точки зрения представлений о состоянии окружения, обусловленном его внутренней системой инте-

ресов, ценностей и норм, а также его этической системой, будем называть оценками ситуации целеустремленного состояния.

Поскольку представление о ситуации целеустремленного состояния строится на основе субъективных оценок состояния окружения и о себе самом, то можно утверждать, что выбор управляющих воздействий, направленных на реализацию интересов с наилучшим результатом, является субъективно рациональным выбором, осуществляемым на основе представлений о ситуации целеустремленного состояния. Состояние окружения в этом случае следует рассматривать как экзогенный фактор.

Ситуация целеустремленного состояния существует в сознании субъекта, отражает его индивидуальные особенности по моделированию состояния окружения, в частности, представление о состояния среды может быть фантомным. Поэтому следует ожидать отношения субъекта к своим представлениям, или рефлексию своих представлений. Это факт обсуждался в работах [1, 5, 8]. В частности, предложено оценивать представления по критерию их полезности при реализации интересов. В любом случае следует постулировать факт использования человеком определенных процедур, повышающих его убежденность в полезности представлений. Следовательно, человек осуществляет выбор из множества возможных вариантов представлений, то есть он выбирает модель ситуации целеустремленного состояния в зависимости от степени убежденности в ее адекватности и полезности для перехода в желаемое состояние. Для этой цели он разрабатывает и реализует специальные процедуры, которые будем называть процедурами идентификации ситуации целеустремленного состояния. Цель их применения - осуществление выбора модели ситуации целеустремленного состояния для получения оценок возможных вариантов результатов. Следовательно, ситуация целеустремленного состояния является эндогенным фактором в модели выбора субъекта и определяет его отношение к наблюдаемому состоянию, характеризуемое им с

помощью набора качественных характеристик.

Эти рассуждения позволяют предложить следующую схему выбора управляющих воздействий:

1. Для каждого состояния окружения юеО агент ставит в соответствие ситуацию целеустремленного состояния хт е X,

§ е О, где множество в характеризует предпочтения на множестве X. Для ситуации целеустремленного состояния определяется ее удельная ценность Еф, как оценка степени реализации интересов (ожиданий). Проводится оценка степени удовлетворенности ситуацией, а также оценка степени соответствия представлений о ситуации целеустремленного состояния состоянию О. В случае, если убежденность в адекватном отражении состояния О ниже некоторого порога, выполняется процедура идентификации ситуации.

2. Если удовлетворенность ситуацией целеустремленного состояния ниже заданного порога, то из множества G структурных альтернатив (оно соответствует по-

г

зитивному опыту Ос О, когда с их помощью субъект наблюдал реализацию своих интересов) выбирается управляющее воздействие с е С, позволяющее достичь желаемой ситуации целеустремленного состояния, ценность которой либо превышает пороговое значение, либо является оптимальной величиной при имеющихся возможностях. Определяется значение ценности желаемой ситуации целеустремленного состояния, строится дерево целей и способов действия, позволяющее ее достичь и конкретизирующее интересы субъекта. Переход к п. 6.

3. В противном случае определяется возможность достичь приемлемого состояния с помощью других вариантов структурных альтернатив § е О. Если это невозможно, то фиксируется возникновение проблемы, составляется проект ее преодоления путем соответствующих исследований и разработок. Их цель - расширение множества способов действия С Т, расшивка

ограничений и т.п. Для этой цели определяется направление эволюции в пространстве показателей и соответствующая возможностям величина шага.

4. Формируется план реализации нового намеченного способа действия с е С Т и план расширения множества

способов действия С = С Т.

5. Определяется величина стимулирования для создания определенного уровня мотивации субъектов, задействованных в реализации интересов субъекта интересов.

6. Для ситуации целеустремленного состояния реализуются структурные управляющие воздействия в форме, определенной в п. 4 и 5.

Такую схему, вытекающую из аксиом, постулирующих мотивацию управления (целеустремленного поведения), будем называть схемой управления целенаправленной эволюцией, определяемой стремлением субъекта к выживанию, сохранению достигнутого уровня или доминирования.

Согласно этой схеме субъект принимает управляющие решения, учитывая два типа условий: экзогенных (объективных), порождаемых динамикой окружения и объекта интересов; эндогенных (субъективных), порождаемых интересами субъекта.

Это возможно, если субъект обладает: а) стремлением к реализации интересов, к повышению вероятности их достижения за счет роста своего уровня знаний о закономерностях динамических процессов в окружении и динамики перехода объекта управления в различные состояния; б) соответствующими креативными способностями. Варианты интересов могут быть представлены следующими термами на оценках удельной ценности ситуации целеустремленного состояния: выживание, сохранение достигнутого уровня жизни, возможность целенаправленного изменения среды, доминирование.

Согласно аксиомам выбора, управляющая альтернатива выбирается в зависимости от представлений о ситуации, ко-

торые формируются с помощью процедур идентификации сообразно с состоянием. Тогда функция полезности должна быть определена на множествах способов действия, оценок ситуации хеX и состояний юеО. Пусть субъект имеет возможность выбирать структуру предпочтений из заданного множества структурных альтернатив G для получения приемлемых оценок удовлетворенности ситуации целеустремленного состояния. Тогда его функция полезности будет зависеть от структурной альтернативы gеG как от параметра вида

Еф%:(СхПхX) ^В1 и представляет априорные предпочтения на управляющих альтернативах cеC в соответствии с условием с >- с о Еф^(с ,со,х) > Еф^(с,со,х) . Подробно содержательный смысл и способы задания функции полезности для агентов с субъективно рациональной формой поведения рассмотрены в [4].

Как показано в [4], функция полезности Еф%(с ,т,х) для агента имеет смысл оценки удельной ценности ситуации целеустремленного состояния и представляет его априорные внутренние предпочтения на управляющих альтернативах в зависимости от состояний и ситуаций, а также его системы ценностей и норм, задаваемых этической системой. Так как выбор осуществляется в условиях неопределенности, то это предполагает введение в модель выбора предположений и правил устранения неопределенности, которые еще называют гипотезами детерминизма. Различные варианты элиминации неопределенности рассмотрены в работах Д.А. Новикова [9]. Здесь же ограничимся замечанием, что правило управления естественно выбирать из условия достижения максимума ожидаемой удельной ценности ситуации целеустремленного состояния.

Поскольку понятие ситуации целеустремленного состояния существует только в сознании агента, то суть ее формирования состоит в выборе модели ситуации целеустремленного состояния в зависимости от состояния окружения. Очевидно, что

если возможные модели рассматривать в роли альтернатив идентификации состояния окружения, то требуется некоторый критерий оценки их полезности и качества. Поскольку модель ситуации целеустремленного состояния является основой для выбора, то функция полезности может служить основанием для определения смысла и структуры требуемого критерия. Действительно, пусть для каждого состояния юеО

определена пара переменных

* *

(х ,с ) е X х С, на которой функция полезности достигает своего максимального значения. Пусть теперь из некоторых соображений в состоянии юеО выбрана ситуация хеХ в роли результата идентификации и с учетом этого выбрано управляющее воздействие се С. В таком случае будут иметь место определенные «потери полезности» в сравнении с возможным наилучшим выбором. Поскольку, в общем случае, окружение субъекта интересов является неопределенным и слабо формализуемым и наблюдаемая траектория состояний зависит от состояния окружения и от правила выбора управляющих действий, то качество представлений будет зависеть от используемых процедур идентификации состояния, которые можно рассматривать как средство детерминации представлений. Однако получить оценки потерь в этом случае возможно только по результатам реализации выбора. Поэтому человек на возможных значениях функции полезности в ситуации неопределенности строит два типа оценок: первый связан с оценками полезности представлений для получения желаемых состояний, а второй - с оценками возможности их достижения в виде оценок степени сомнения в правильности (адекватности) представлений.

Определим степень сомнения в правильности представлений о ситуации выбора в состоянии окружения юеО относительно возможности достижения желаемого состояния оеО располагаемыми способами действия се С как степень стремления у агента получить дополнительную информацию о количестве и степени влияния

факторов окружения для повышения своей информированности ХТ.

Поскольку степень стремления к получению дополнительной информации изменяется от нуля до некоторого максимума, то эти оценки можно рассматривать как значения шкалы лингвистической переменной степени сомнения.

Оценки полезности представлений связаны с ценностью появления желаемых состояний оеО в окружении юеО при выборе способа действия се С на основе представления хеХ, которые также являются значениями лингвистической переменной с тем же названием.

Очевидно, что интегральная оценка потерь полезности может быть получена по известным правилам теории нечетких множеств. Соответствующую оценку, как и в теории статистических решений, будем называть риском

Таким образом, в схеме целеустремленного управления для описания качества управления естественно использовать критерий, имеющий смысл ожидаемой удельной ценности ситуации целеустремленного состояния, а для описания качества идентификации состояния окружения - критерий, имеющий смысл лингвистической переменной риска. Ясно, что выбираемые таким образом правила будут определенным способом взаимозависимы. В этих условиях проблема выбора имеет игровое содержание, а ее наилучшее решение состоит в построении некоторого устойчивого компромисса между достижением максимальной ожидаемой полезности и минимальным риском. Такой компромисс принято называть равновесием [9]. Определение подобного равновесия естественно рассматривать в качестве внутренней цели управления, обеспечивающей требуемое значение по шкале удовлетворенности.

С учетом выполненных рассуждений окончательно концепцию управления в условиях принятой аксиоматики определим следующими основными положениями:

1. Наблюдение и обнаружение состояния является необходимым, но недо-

статочным условием осуществимости выбора управления.

2. Достаточное условие осуществимости выбора управления обусловливается заданием отношения субъекта к состоянию, определяемому некоторой качественной характеристикой, называемой ситуацией целеустремленного состояния.

3. Вследствие того, что причинно-следственные связи, определяющие поведение окружения, недоступны непосредственному наблюдению, возникает необходимость выполнения процедур идентификации состояния окружения, цель которых -выбор модели ситуации наблюдаемого состояния.

4. Выбор правила управления выполняется по критерию ожидаемой полезности.

5. Выбор правила идентификации выполняется по критерию риска.

6. Проблема выбора правил управления и идентификации имеет игровое содержание, и ее наилучшее решение состоит в построении устойчивого компромисса, называемого равновесием.

7. Построение и использование равновесных правил управления и идентификации является внутренней целью управления.

Сформулированные положения определяют концепцию «целеустремленного управления активными системами с эндогенно формируемыми целями».

Согласно введенной аксиоматике объект интересов может быть активным, динамическим, при этом природа его динамики не связана с механическим движением. Если его эволюция описывается правилом /:ХхС ^X и /■ - нечеткая функция вследствие использования лингвистических оценок, то соответствующая система является нечеткой системой, состояние которой в момент t+1 есть условное по xt и С нечеткое множество, характеризуемое функцией принадлежности вида . В

данных условиях естественно полагать, что эволюция объекта описывается нечетким марковским процессом.

Без ограничения общности можно считать, что множество состояний окружения О некоторым способом упорядочено и их значения случайны, то есть задано априорное распределение вероятностей Р(О) начальных состояний.

Согласно концепции целеустремленного управления, выбор управляющих альтернатив осуществляется в ситуации целеустремленного состояния, которая является качественной характеристикой, определяющей отношение субъекта к состоянию. Возможное множество ситуаций X может быть лишь конечным, и при этом должно выполняться условие |Х| <|О|.

Следовательно, к определенным выше двум аспектам интересов концепция целеустремленного управления вводит третий аспект, который связан с необходимостью идентификации ситуации в зависимости от наблюдаемого состояния.

Естественно полагать, что для каждого аспекта интересов существуют альтернативные варианты их реализации и заданы соответствующие множества допустимых альтернатив. Тогда, следуя концепции целеустремленного управления, предположим, что для аспекта интересов, связанного с управлением эволюцией состояний, задано множество C способов действия - управляющих альтернатив. Поскольку управляющие альтернативы выбираются в зависимости от ситуаций хеX, то естественно полагать, что существуют ограничения на допустимость управляющих альтернатив в зависимости от ситуации хеX. Такие ограничения естественно задавать включениями вида С е С,х е X лих

бо С с С,х е X. х _

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как показано выше, чтобы ситуация целеустремленного состояния была доступна сознанию агента, необходимо выполнение ее идентификации, содержание которой сводится к выбору ситуации из заданного множества в зависимости от состояния, то есть х е X. Очевидно, альтернативы идентификации зависят от состояния 5е5, то есть X е X,s е Б.

s

Субъект заинтересован в реализации своих интересов. Для этого он выбирает структуру своих предпочтений дев из заданного множества в структурных альтернатив.

Структура предпочтений отражает только интересы агента. Поэтому их выбор не может зависеть от состояний и ситуаций. То есть структурные альтернативы должны рассматриваться в качестве общего для состояний и ситуаций параметра, определяющего закономерность динамики состояний как объекта интересов, так и окружения.

Естественно полагать, что в составе активной системы субъект может наблюдать состояния и принимать управляющие решения лишь в дискретные моменты времени. С учетом этого процесс управления будем понимать как процесс последовательного принятия решений с дискретным временем.

Если субъект не меняет на интервале п > 1 стремления достичь определенного состояния и не меняет структуру своих предпочтений, то такая структурная альтернатива является стратегической, в противном случае - тактической.

Согласно введенному выше предположению, эволюция объекта интересов описывается нечетким марковским процессом в пространстве состояний Э. Примене-

ние управляющих воздействий в дискретные моменты времени порождает управляемый марковский процесс с дискретным временем, с тем же множеством состояний Э. Динамика такого процесса определяется переходной функцией, задающей вероятности одношаговых переходов на множестве состояний в зависимости от выбора управляющих альтернатив уеУ. При этом она будет зависеть также и от структурной альтернативы дев, но как от параметра. Обозначим переходную функцию управляемого процесса символом

qg(S\S х С) [3].

Согласно концепции целеустремленного управления, должна быть задана функция полезности

Eфg :(С х Б х X) ^ Я1, представляющая априорные предпочтения на управляющих альтернативах се С в соответствии с условием

с >- с Еф^ (с ,8,х)> Еф^ (с,8,х) .

Введенные предположения определяют условия принятия управляющих решений, где функция полезности зависит от структурной альтернативы дев как от параметра, а управление выполняется в соответствии со схемой ситуационного управления, мотивированного интересами.

1

Информационная структура представлений

В соответствие с введенными положениями, используя результаты работы [3], определим соответствующие объектам интересов носители информации как набор следующих формальных объектов: I = (Б),Х,[Х с Х^ е Б],С,

[С с С,х е Х],О,д§(Б\Б х С), х

Еф§(С х Б х Х)^ е О},

где Э - множество состояний; (3(Э) - априорное распределение на множестве состояний; X - множество ситуаций; Х^ с Х - ограничения на допустимость

ситуаций в роли альтернатив идентификации в зависимости от состояний 5еЭ; С - множество управляющих альтернатив;

С с С - ограничения на допустимость

х

управляющих альтернатив в зависимости от ситуаций хеХ; в - множество структурных альтернатив; qg(S\S х С) - переходная функция из Б х С в Э;

ЕфФ^(С х 8 х X) - функция полезности, представляющая априорные предпочтения на альтернативах се С в зависимости от состояний 5еЭ, ситуаций хеХ и структурных альтернатив дев.

Особенность информационной структуры I заключается в том, что выбор управляющих воздействий зависит от представлений о ситуации выбора, формируемых на основе процедуридентифика-ции. В этих условиях закономерность динамики ситуаций априори не может быть задана. Поэтому агент использует субъективные оценки закономерности динамики состояний, определяемой переходной

функцией д8(Б\Б х С) из Б х С в Э.

Если субъект сомневается в своих представлениях об элементах информационной структуры, то он использует дополнительную информацию для формулирования некоторого правдоподобного приближения. Например, если явный вид переходной функции априори не известен, то всегда можно сформулировать некоторое множество гипотез Г о ней.

Пусть, например, в базовой информационной структуре I переходная функция

д8(Б\Б х С) не задана, но задано

множество гипотез Г о ней. Тогда формально можно полагать, что переходная

функция д(8,у^(8\8хС) зависит от некоторого параметра у, принимающего значения из заданного множества Г, но истинное значение такого параметра остается неизвестным. В этих условиях информационная структура будет определяться набором объектов вида

1Г = {S,p(S),X,[Xs е X,

s е Б],¥,[¥х с Г,

х е X ],О, Г, q(8,у)(S\S хХ),

Еф8(У х (Б х X)), 8 е О, уе Г}.

Очевидно, что это приведет к расширению содержания проблемы, которая теперь вместе с выбором ранее введенных альтернатив потребует также выбора в определенном смысле наилучшей гипотезы о переходной функции.

Элементы модели субъективно рационального выбора

Введенные предположения фиксируют существование двух аспектов интересов субъекта, один из которых определяется заинтересованностью в эволюции объекта интересов, а другой - в выборе структуры интересов. Концепция целеустремленного управления порождает третий аспект интересов, связанный с необходимостью идентификации ситуации в зависимости от наблюдаемого состояния. В соответствии с этими тремя аспектами информационная структура I предполагает задание множества С управляющих альтернатив, множества G структурных альтернатив и множества X альтернатив идентификации. Предполагается задание также функции

полезности Еф8(С х Б х X) и переходной

функции д8(Б\Б х С) из Б х С в Э. Это позволяет задать критерий качества выбора управления, имеющего смысл ожидаемой полезности, и критерий качества выбора правила идентификации, имеющего

смысл риска. Для выбора структурных альтернатив может быть введен критерий качества, например, отражающий степень удовлетворения интересов.

Таким образом, при принятии решения о способе действия субъект для удовлетворения своих интересов использует три множества альтернатив. Выбор альтернативы из соответствующего множества производится по своему индивидуальному критерию качества, и его естественно связать с некоторой виртуальной оперирующей стороной, имеющей в пределах своей компетенции свободу выбора. Интересы субъекта являются доминирующими для выделенных сторон, и он выступает для них в виде центра управления. Поскольку интересы всех игроков взаимозависимы, то такая игра относится к классу игр с корпоративными интересами. Ее решение возможно на множестве согласованных компромиссных вариантов. Оно будет устойчивым, если его невозможно улучшить без

ухудшения хотя бы одногоиз критериев.

Подобное моделирование выбора будет возможно, если для структуры представлений определить наборы носителей информации для построения требуемых критериев. Это позволит гарантировать, что для каждой выделенной стороны зада-

ча изолированного выбора ее наилучшей индивидуальной альтернативы по соответствующему критерию будет разрешима. Тогда можно ожидать, что и задача совместного отыскания компромисса, удовлетворяющего требованиям корпоративной устойчивости, также будет разрешима.

Заключение

В статье представлена концептуальная схема моделирования принятия субъективно рациональных решений, предназначенная для понимания специфики управления эволюцией инновационных систем, в которых особую значимость приобретает гармоничность взаимодействия «субъект - проект - среда». В этом контексте важна проблема сборки субъектов, идентифицирующих себя с системой, в которой происходит их деятельность, и регулирующих свою активность с учетом ее влияния на результаты этой системы.

Процесс принятия решений разделен на этапы: 1) формирование представ-

лений о свойствах ситуации выбора; 2) собственно принятие решения о способе действия; 3) построение алгоритма (плана) реализации решения; 4) реализация алгоритма; 5) оценка результатов. С формальной точки зрения рассмотрены два первых этапа. Качество принятого решения предложено оценивать по критерию удельной ценности ситуации целеустремленного состояния по результату, качество формирования представлений о ситуации выбора -критерием потерь ценности. Показано, что в этом случае принятие решений следует рассматривать как корпоративную игру с непротивоположными интересами.

Библиографический список

1. Виноградов Г.П., Кузнецов В.Н. Эволюция представлений о моделях принятия решений в контексте научной рациональности // Рефлексивные процессы и управление: сб. материалов X Международного симпозиума (Москва, 15-16 октября 2015 г.). М.: «Когито-Центр, 2015. С. 27-30.

2. Виноградов Г.П., Кузнецов В.Н. Моделирование поведения агента с учетом субъективных представлений о ситуации выбора // Искусственный интеллект и принятие решений. 2011. № 3. С. 58-72.

3. Баранов В.В. Динамические равновесия в задачах стохастического управления и принятия решений при неопределенностях // Известия РАН. Теория и системы управления. 2002. № 3. С. 77-93.

4. Виноградов Г.П. Методы и алгоритмы принятия решений в автоматизированных системах управления производствами с непрерывной технологией на основе субъективных представлений: монография. Тверь: ТГТУ, 2013. 256 с.

5. Виноградов Г.П., Шматов Г.П, Борзов Д.А. Формирование представлений агента о предметной области в ситуации выбора // Программные продукты и системы. 2015. № 2 (110). С. 83-94.

6. Lefebvre V. Algebra of Conscience. Dordrecht/Boston/London. Kluwer Academic Publ. 2001. 411 р.

7. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений. Вербальный анализ решений. М.: Физматлит, 1996. 208 с.

8. Виноградов Г.П., Кузнецов В.Н. Целеуказание на основе представлений агента о целеустремленной ситуации в слабоструктурированной среде. [Электронный ресурс]. URL: vspu2014.ipu.ru/procee-dings/prcdngs/7907. pdf (25.06. 2016).

9. Новиков Д.А., Иващенко А.А. Модели и методы организационного управления инновационным развитием фирмы. М.: ЛЕНАНД, 2006. 336 с.

References

1. Vinogradov G.P., Kuznetsov V.N. Evolyutsiya pred-stavlenii o modelyakh prinyatiya reshe-nii v kontekste nauchnoi ratsional'nosti [Evolution of ideas about decision-making models in the context of scientific rationality]. Sb. materialov X Mezhdunarodnogo simpoziuma

"Refleksivnye protsessy i upravlenie [Collection of materials of X International Symposium "Reflexive processes and control"]. Moscow, Kogito-Tsentr Publ., 2015, pp. 27-30. (In Russian) 2. Vinogradov G.P., Kuznetsov V.N. Modelirovanie

povedeniya agenta s uchetom sub"ek-tivnykh pred-stavlenii o situatsii vybora [Modeling agent's behavior based on subjective perceptions on the situation of choice]. Iskusstvennyi intellekt i prinyatie reshenii [Artificial intelligence and decision-making]. 2011, № 3, pp. 58-72. (In Russian)

3. Baranov V.V. Dinamicheskie ravnovesiya v zadachakh stokhasticheskogo upravleniya i prinyatiya reshenii pri neopredelennostyakh [Dynamic equilibriums in the problems of stochastic management and decision-making under uncertainties]. Izvestiya RAN. Teori-ya i sistemy upravleniya [Journal of Computer and Systems Sciences International]. 2002, no. 3, pp. 77-93. (In Russian)

4. Vinogradov G.P. Metody i algoritmy prinyatiya resh-enii v avtomatizirovannykh sistemakh upravleniya pro-izvodstvami s nepreryvnoi tekhnologiei na osnove sub"ektivnykh predstavlenii: monografiya [Methods and algorithms of decision-making in automated management systems of continuous technology production based on subjective perceptions: monograph]. Tver', TGTU Publ., 2013, 256 p. (In Russian)

5. Vinogradov G.P., Shmatov G.P, Borzov. D.A. Formi-rovanie predstavlenii agenta o predmetnoi oblasti v

Критерии авторства

Виноградов Г.П. и Виноградова Н.Г. имеют равные авторские права и несут равную ответственность за плагиат.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов

Статья поступила 07.07.2016 г.

situatsii vybora [Formation of agent's representations on a domain in the situation of choice]. Programmnye produkty i sistemy [Software and Systems]. 2015, no. 2 (110), pp. 83-94. (In Russian)

6. Lefebvre V. Algebra of Conscience. Dordrecht/Boston/London. Kluwer Academic Publ., 2001, 411 p.

7. Larichev O.I., Moshkovich E.M. Kachestvennye metody prinyatiya reshenii. Verbal'nyi analiz reshenii [Qualitative methods of decision-making. Verbal analysis of decisions]. Moscow, Fizmatlit Publ., 1996, 208 p. (In Russian)

8. Vinogradov G.P., Kuznetsov V.N. Tseleukazanie na osnove predstavlenii agenta o tse-leustremlennoi situatsii v slabostrukturirovannoi srede [Targeting based on agent's perceptions of a goal-oriented situation in the semi-structured environment]. Availabe at: vspu2014.ipu.ru/proceedings/prcdngs/7907.pdf (25.06. 2016). (Accessed 25 June 2016).

9. Novikov D.A., Ivashchenko A.A. Modeli i metody or-ganizatsionnogo upravleniya innovatsionnym razvitiem firmy [Models and methods of organizational management of company innovative development]. Moscow, LENAND Publ., 2006, 336 p. (In Russian)

Authorship criteria

Vinogradov G.P. and Vinogradova N.G. have equal authors' rights and responsibility for plagiarism.

Conflict of interest

The authors declare no conflict of interest.

The article was received 07 Jule 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.