УДК: [656.61.052:681.518]:519.816
И. И. Зива, В. А. Ершов, В. И. Меньшиков
ОПТИМИЗАЦИЯ ЦЕЛЕВОЙ ФУНКЦИИ И АДАПТАЦИЯ «ЧЕЛОВЕЧЕСКОГО ЭЛЕМЕНТА» В НАВИГАЦИОННЫХ И ПРОМЫ1СЛОВЫ1Х ДИАЛОГОВЫ1Х СИСТЕМАХ
Внедрение на современных транспортных и промысловых судах экспертных систем, включающих проблемно-ориентированное математическое обеспечение и человека-оператора, использующего этот комплекс для поиска рациональных (оптимальных) решений, позволяет осуществлять диалоговый поиск рациональных (оптимальных) решений. В таких системах режим диалога представляет собой процесс анализа последовательности ситуаций, на основе которого оператор выбирает то или иное решение, отвечающее, с его точки зрения, поставленным целям. Предложена модель механизма поиска экстремума лицом, принимающим решения, целевой функции с гарантированным результатом, составлен алгоритм выбора рациональных (оптимальных) решений по управлению судовыми техническими средствами, обеспечивающих достижение поставленных перед оператором целей. Отмечается, что успех выбора оптимальных решений зависит как от качества проблемно-ориентированного математического обеспечения, так и от квалификации, информированности, опыта, психофизических способностей оператора, включенного в состав экспертной системы. Описан процесс адаптации лица, принимающего решения, к выбору рациональных (оптимальных) решений, который должен быть компромиссным и образованным по методу проб и ошибок в попытках улучшить решение на каждом последующем алгоритмическом шаге. Осознание компромисса и его формы, образованной в процессе диалога проблемно-ориентированного математического обеспечения и человека-оператора, обеспечивают движение к гарантированному успеху.
Ключевые слова: экспертная система, принятие решений, диалоговые системы, эффективность, человеко-машинная процедура.
Введение
В последнее время в судовождении получают достаточно широкое распространение так называемые экспертные системы, которые позволяют судовому специалисту непосредственно на рабочем месте оценивать результат, получаемый от принятого решения. Такие системы объединяют в себе вычислительный комплекс, снабженный соответствующим проблемно-ориентированным математическим обеспечением, и человека-оператора, использующего этот комплекс для поиска рациональных (оптимальных) решений. Традиционно принято считать, что режим диалога представляет собой анализ ситуаций, соответствующих различным решениям, и на основе этого анализа оператор останавливается на том или ином решении, которое, с его точки зрения, отвечает заданным целям. Естественно, такой подход предполагает, что оператор обладает необходимым временным ресурсом и способен проанализировать достаточно широкий спектр решений, чтобы не упустить из виду наиболее приемлемый вариант. Достаточно часто сделать это оператору не удается, т. к. число возможных вариантов решения оказывается настолько велико, что ему просто не хватает временного ресурса для их анализа [1].
Основной причиной этой ситуации является недостаточность математического обеспечения данной системы. Как правило, такие системы содержат математическое обеспечение, позволяющее воспроизводить ситуацию, соответствующую принятому решению, однако не содержат математического обеспечения самого процесса принятия решения, т. е. не подсказывают оператору, как он должен изменить решение, чтобы его улучшить. Если бы было возможно формализовать систему предпочтений при выборе рационального решения, проблема выбора решалась бы значительно проще. Однако диалоговые системы потому и существуют, что подобная формализация не всегда удается и приходится привлекать человека в качестве неформального носителя этой системы предпочтений [2].
Человек на основе опыта и интуиции может сравнивать различные ситуации и выбирать из них лучшую, однако трудно себе представить, чтобы человек обладал таким опытом и прозорливостью, которые позволяли бы ему всегда знать, как нужно изменить данное решение, чтобы получить лучшее в соответствии с его системой предпочтений. В этом ему может помочь математическая теория принятия решений, необходимые элементы которой должны входить в общее математическое обеспечение диалоговых систем. Рассмотрим один из возможных вариантов такого использования принципов теории исследования операций для обеспечения процедуры принятия решения в диалоговых системах [3].
Модель механизма поиска экстремума целевой функции с гарантированным результатом в диалоговой системе
Пусть определено множество возможных и допустимых вариантов решения, которое обозначим X. Предположим, что для любого фиксированного управления х е X диалоговая система (рис. 1) дает возможность лицу, принимающему решение (ЛПР), получать определенную информацию о последствиях принятого решения.
Внешние факторы
Рис. 1. Схема диалоговой системы
Форма, в которой эта информация от системы отображения поступает к ЛПР, может быть весьма разнообразной в зависимости от качества и полноты математического обеспечения диалоговой системы и того сервиса, которым она снабжена. Это может быть некоторый список значений тех или иных характеристик изучаемой операции или набор графических изображений. Если отвлечься от конкретных ситуаций, то можно считать, что каждому фиксированному значению х диалоговая система представляет некоторую ситуацию S(x), которая и поступает для анализа к оператору ЛПР.
Пусть ЛПР [4] в процессе принятия решения сравнивает две ситуации
£1 = £ (х1) и S2 = £ (х2) , отвечающие двум различным управлениям х1, х2 е X, и выбирает из них
лучшую. Если система предпочтений, на основе которой ЛПР осуществляет свой выбор, транзитив-на, это означает, что данной системе предпочтений соответствует некоторый скалярный критерий эффективности Ж = F (х) , хотя его формальное выражение может быть и неизвестно. Предположим далее, что существует следующая схема поиска оптимального решения для критерия вида F(x) на множестве альтернатив X е Ем , где Ем - евклидово пространство размерности N. Выберем некоторое опорное решение х е X. Это решение ЛПР должен выбрать на основе своего личного опыта, накопленного в аналогичных ситуациях в его предшествующей деятельности (рис. 2).
Рис. 2. Отображение данных в диалоговой системе
Если бы формальное выражение критерия эффективности Ж = F (х) было известно, то
проблема локального улучшения опорного решения решалась бы просто. Для этого было бы необходимо вычислить в точке х0 градиент функции F(x)
grad F(х) = {dF/ёх1, dF/dx2, ..., dF /ёхы}
и сделать в пространстве Е шаг в направлении этого вектора (для простоты можно предположить, что х0 является внутренней точкой множества X).
Если в точке х0 величина grad F (х0) ^ 0 и шаг р достаточно мал, то вновь полученное решение
х* = х0 + р(gradF (х) / |grad F(х) |)
предпочтительнее х0 в силу критерия F(x). В большинстве случаев функция F(x) неизвестна, и все, что о ней можно знать, это лишь то, что она объективно существует в сознании ЛПР и позволяет ему делать выбор из некоторого конечного множества альтернатив, представленного множеством ситуаций £
Таким образом, направление градиента функции F в точке х0 точно неизвестно, поэтому неясно, в каком направлении необходимо сделать шаг, чтобы увеличить значение критерия F. Однако нельзя сказать, что вообще ничего не известно о направлении вектора grad F. Определенную информацию о множестве его значений мы можем получить, используя вышеупомянутую способность ЛПР упорядочивать варианты решений по их эффективности. Для этого можно поступить
следующим образом. Рассмотрим наряду с опорным решением х0 = {х01, х 02,..., х0 м} систему
0к ( 0 0 00 0 ■> /; дг\
вспомогательных решений х = {х1, х2, ..., хк, хк+1, ..., хы}, (к = 1, 2 , ..., N), расположенных в достаточно малой окрестности опорного решения х0. Предположим, что ЛПР упорядочил эти N
новых решений вместе с опорным по эффективности. Это породит систему неравенств такого типа:
>
F(хк)-F(х0) = 0, где к = 1,2,..., N1
<
>
F (xJ)- F (xi) = U, где i, j = 1,2, ..., N, j > i.
>
Выбор конкретного знака (неравенства или равенства) в правой части выражений зависит от того, как ЛПР конкретно упорядочит данные решения по эффективности.
Если выбранная окрестность опорного решения достаточно мала, то компоненты вектора grad F можно представить через отношения конечных разностей:
дF / дхк = gk = (F (хк )-F (х0))/АГк .
Тогда система неравенств даст в опорной точке х0 систему ограничений на компоненты gk
вектора g = grad F :
> >
gk = 0 к = 1, 2, ..., N; А.. - Аxigi = 0,...; ¡,] = 1, 2,..., N ] > ¡.
< <
Таким образом, система предпочтений ЛПР порождает в опорной точке х0 некоторый многогранный конус К, которому принадлежит градиент функции F. Выберем теперь в точке х0 некоторое направление, определяемое единичным вектором
п
к = {й1,Н2,...,^ } при | к |2 Нк2 = 1.
к=1
Сделаем в этом направлении шаг с метрикой (длиной) р. Если функцию F(х) считать непрерывно дифференцируемой в точке х0, то приращение в этой точке можно найти так:
N N
AF = F (х0 + рh) - F (х0) = р£Щк (дF / дхк ) + 0(рх=хо) = р£hkgk + 0(р)
к=1 к-1
или, пренебрегая функциями более высокого порядка, чем р, следующим образом:
N
^ Х ^к ,
к=1
где g = {^ g2,..., gN )е К .
Задача заключается в том, чтобы найти такое направление Щ, на котором приращение ЛF достигало бы наибольшего возможного значения. Если бы был известен вектор g, то искомое направление h совпадало бы с направлением этого вектора при х0 е X. Однако вектор g неизвестен, а известно лишь множество значений, которые он может принимать. Следовательно, g является неопределенным фактором, и приходится сталкиваться с ситуацией, когда необходимо принять правильное решение в условиях неопределенности. Очевидно, что и в этом случае разумно воспользоваться принципом гарантированного результата. В соответствии с этим принципом оценка эффективности выбранного направления h будет определяться величиной
N
тт к=1 Х ^к = еК ( Щ g ) ,
N
где постоянный положительный множитель р опущен как несущественный, а min 2 hkgk -
к=1
скалярное произведение векторов h и g, обозначенное через (h, g).
Оптимальным гарантирующим направлением будет, очевидно, такое направление h°, на котором реализуется максимум оценки эффективности:
min (h0, g )h = max min (h, g ),
где h ограничено лишь одним условием Щ = 1.
Алгоритм решения этой задачи, включенный в математическое обеспечение экспертной системы, может выглядеть следующим образом:
- шаг первый - ЛПР сообщает экспертной системе опорное решение х0;
- шаг второй - экспертная система отображает последовательность вспомогательных
решений х0 (к = 1, 2,..., N)и воспроизводит множество ситуаций (S(х'0), ..., S(х^),... S(х0 )) ,
соответствующих совокупности опорного и вспомогательных решений;
- шаг третий - ЛПР анализирует полученное множество ситуаций, упорядочивает их в соответствии со своей системой предпочтений и вводит их в экспертную систему;
- шаг четвертый - программный продукт решает минимаксную задачу, строит улучшенное решение х1= х0 + рЩ и новую систему вспомогательных решений х1 при (к = 1, 2,..., N),
а также воспроизводит соответствующие им ситуации
s (),..., s (XN);
- шаг пятый - ЛПР анализирует новую совокупность ситуаций, упорядочивает их и т. д.
Процедура анализа и упорядоченности будет продолжаться до тех пор, пока ЛПР не прекратит диалог, причем это может произойти по разным причинам. Так, одной из этих причин может оказаться, что полученные решения полностью удовлетворят ЛПР, или на некотором шаге все решения становятся неразличимыми в системе предпочтений ЛПР. Фактически такая причина соответствует тому, что процедура привела в точку экстремума целевой функции F(t). Право прекращать диалог полностью принадлежит ЛПР, но никакая диалоговая система не гарантирует ЛПР однозначно оптимального решения задачи. Пульт по управлению диалогом в экспертной системе по выбору ЛПР оптимального решения представлен на рис. 3. В общем случае выбор оптимального решения зависит не только от качества программного продукта экспертной системы и ее технических возможностей, но также от квалификации, информированности, опыта, психофизических способностей ЛПР [5, 6].
Рис. 3. Иллюстрация данных при остановке диалога и выборе решений на управление энергетической установкой судна
Процессы адаптации ЛПР в диалоговой системе
При использовании адаптивного подхода человеко-машинная процедура решения задачи
векторной оптимизации представляет собой последовательное уточнение наиболее предпочти**
тельного, по мнению ЛПР, решения х путем перехода от одного альтернативного решения, х* е X, к последующему альтернативному решению, х 1+1 е X, с учетом информации Д получаемой от ЛПР. Формально процесс выбора решения х**, в рамках выше составленной процедуры, можно представить как последовательность фазовых переходов:
* "I—>* I * -I—>* I I * -I—>* I I * -I—>* л ч
х1, Fl ——— х2, F2—^ ,..., ——^ х*, Fl ——, ..., — > х*, FN (1)
где х]N = х**,F* = F* (х *) при (1 = 1, ..., N).
В процессе выбора решения х** происходят параллельно два вида адаптации: во-первых, адаптация программного продукта экспертной системы к системе предпочтений ЛПР, во-вторых, адаптация ЛПР к решаемой задаче. Адаптация первого вида связана с учетом информации, получаемой от ЛПР [4]. Этот процесс обеспечивает оптимизацию критерия, вид которого детерминируется информацией, представляемой ЛПР программному обеспечению экспертной системы (см. рис. 1).
Человеко-машинные процедуры многокритериальной оптимизации можно подразделить на две группы: одношаговые и многошаговые. В одношаговых процедурах ЛПР необходимую информацию для осуществления перехода х*-> х**1 может представить в одном сеансе диалога, в многошаговых процедурах - в нескольких сеансах (при этом вопросы программному продукту каждый раз иные).
В простейшем (одношаговом) случае информация I*, полученная на 1-м шаге, позволяет сделать очередной шаг процесса (1): х*1 = L(х*, ^), т. е. определить решение х* 1, которое
в смысле некоторого установленного показателя ф(Х) наиболее удовлетворяет требованиям ЛПР, представленным в информации I*. Алгоритм L осуществляет формализацию и решение следующей задачи оптимизации:
Ф* (X)->ех!х ^ х*1+1. (2)
Функционал ф7(Х и область D допустимых изменений X на 7-й итерации образуются на основе информации I,:
Ф, (X ) = /ф( 1,); Dl (X ) = / (1,),
и алгоритмы /ф и / задаются применяемым методом многокритериальной оптимизации. Заметим, что функционал ф7(Х может быть векторным, но таким, что задача (2) всегда проще исходной задачи (1). Поэтому в некоторых человеко-машинных процедурах (многошаговых) и задача (2) решается с участием ЛПР. Адаптация ЛПР к задаче происходит в результате многократной реализации процесса преобразования
F;->F;+l, (7 = 1,..., N) , (3)
в результате которого ЛПР осмысливает соотношение между своими потребностями и возможностями их удовлетворения. Трудность здесь заключается в том, что ЛПР, как правило, не осознает компромисса между своими потребностями - они у него изначально экстремальные, что и выражается в многокритериальности исходной задачи. Компромисс, необходимый для решения этой задачи, образуется в результате «проб и ошибок» ЛПР в его попытках улучшить решение на каждом шаге (3). Осознание компромисса и его формы образуется в процессе диалога и представляет собой адаптацию ЛПР к задаче.
Заключение
Следует отметить важность и необходимость ошибок ЛПР в этом процессе. Только в результате ошибок, ухудшающих решение, ЛПР в состоянии осознать нужный ему компромисс. Именно поэтому непрост смысл предпочтительности последующего решения в ряду (1). Это не только приближение к цели - компромиссу, но и удаление от этой цели, что несет большую информацию, формирующую дальнейшие шаги ЛПР. Процесс (1) имеет явно немарковский характер, и в процессе адаптации поведению ЛПР свойственна ярко выраженная дуальность, при которой такое поведение ЛПР двойственно: одни его шаги позволяют приблизить решение х 7 к желаемому, а другие - получить информацию о динамике текущей ситуации. Поэтому можно сделать следующий важный практический вывод: интерактивная система решения должна предоставлять ЛПР возможность возвращаться к предыдущим состояниям объекта, для чего необходимо протоколировать весь диалог в целом.
СПИСОК ЛИТЕРА ТУРЫ
1. Гладышевский М. А., Пасечников М. А., Пеньковская К. В. Организационно-технические структуры, обеспечивающие безопасную эксплуатацию судна / под общ. ред. В. И. Меньшикова. Мурманск: Изд-во МГТУ, 2008. 212 с.
2. Анисимов А. Н., Меньшиков В. И., Сарлаев В. Я. Эксплуатация добывающего судна в навигацион-но-промысловых структурах / под общ. ред. В. И. Меньшикова. Мурманск: Изд-во МГТУ, 2009. 175 с.
3. Еремин М. М., Меньшиков В. И., Пеньковская К. В. Оптимизация социотехнических связей в структурах мореплавания / под общ. ред. В. И. Меньшикова. Мурманск: Изд-во МГТУ, 2011. 166 с.
4. Смирнов А. Ж. К вопросу о безопасном несении ходовой вахты и общих требований к «человеческому элементу» // Вестн. Мурман. гос. техн. ун-та. 2015. Т. 18. № 1. С. 41-47.
5. Агарков С. А. Оценка качества управления по отклонениям от прицельной линии // Вестн. Мурман. гос. техн. ун-та. 2015. Т. 18. № 4. С. 589-594.
6. Меньшиков В. И., Суслов А. Н., Шутов В. В. Проблемы безопасного мореплавания в сложных навигационных условиях стесненных вод / под общ. ред. В. И. Меньшикова. Мурманск: Изд-во МГТУ, 2013. 186 с.
Статья поступила в редакцию 07.06.2016
ИНФОРМАЦИЯ ОБ АВТОРАХ
Зива Ирма Игоревна — Россия, 183036, Мурманск; Мурманский государственный технический университет; аспирант кафедры эксплуатации водного транспорта, судовождения; [email protected].
Ершов Владимир Александрович - Россия, 183036, Мурманск; Мурманский государственный технический университет; аспирант кафедры эксплуатации водного транспорта, судовождения; [email protected].
Меньшиков Вячеслав Иванович - Россия, 183036, Мурманск; Мурманский государственный технический университет; д-р техн. наук, профессор кафедры судовождения; [email protected].
1.1. Ziva, V. A. Ershov, V. I. Menshikov
OPTIMIZATION OF THE OBJECTIVE FUNCTION AND ADAPTATION OF THE "HUMAN ELEMENT" IN THE NAVIGATION AND FISHERY DIALOG SYSTEMS
Abstract. The introduction of expert systems on the modern transport and fishing vessels, including problem-oriented mathematical software and human operator, using the complex to search for the rational (optimal) solutions, enables lookup of rational (optimal) decisions. In such systems, the mode of the dialogue is the process of analyzing a sequence of situations, on the basis of which the operator chooses a solution, which, from his point of view, meets the set goals. The model of the mechanism of search of extremum of the objective function by the decision maker with a guaranteed result is presented, the algorithm of choosing rational (optimal) solutions for the management of ship technical means ensuring the achievement of the decision maker's goals is designed. It is stated that the success of choosing rational (optimal) solutions depends on the quality of problem-oriented mathematical software and the skills, knowledge, experience and psychophysical abilities of decision makers included in the expert system. The paper describes the process of adaptation of decision-makers to choosing rational (optimal) solutions, which should be compromise and educated with the method of "trial and error" trying to improve the solution at each algorithmic step. The realization of compromise and its forms, developed in the process of dialogue between problem-oriented mathematical software and human operator, ensure the movement to the guaranteed success.
Key words: expert system, decision-making, dialogue systems, efficiency, human-machine procedure.
REFERENCES
1. Gladyshevskii M. A., Pasechnikov M. A., Pen'kovskaia K. V. Organizatsionno-tekhnicheskie struktury, obespechivaiushchie bezopasnuiu ekspluatatsiiu sudna [Managerial-technical structures ensuring the safe operations of the ship]. Pod obshchei redaktsiei V. I. Men'shikova. Murmansk, Izd-vo MGTU, 2008. 212 p.
2. Anisimov A. N., Men'shikov V. I., Sarlaev V. Ia. Ekspluatatsiia dobyvaiushchego sudna v navigat-sionno-promyslovykh strukturakh [Operations of catching vessel in navigation and commercial structures]. Pod obshchei redaktsiei V. I. Men'shikova. Murmansk, Izd-vo MGTU, 2009. 175 p.
3. Eremin M. M., Men'shikov V. I., Pen'kovskaia K. V. Optimizatsiia sotsiotekhnicheskikh sviazei v strukturakh moreplavaniia [Optimization of sociotechnical connections in the navigation]. Pod obshchei redaktsiei V. I. Men'shikova. Murmansk, Izd-vo MGTU, 2011. 166 p.
4. Smirnov A. Zh. K voprosu o bezopasnom nesenii khodovoi vakhty i obshchikh trebovanii k «chelove-cheskomu elementu» [To the issue on the safe watching and general requirements to "human element"]. Vestnik Murmanskogo gosudarstvennogo tekhnicheskogo universiteta, 2015, vol. 18, no. 1, pp. 41-47.
5. Agarkov S. A. Otsenka kachestva upravleniia po otkloneniiam ot pritsel'noi linii [Evaluation of the quality of control in displacement from the target line]. Vestnik Murmanskogo gosudarstvennogo tekhnicheskogo universiteta, 2015, vol. 18, no. 4, pp. 589-594.
6. Men'shikov V. I., Suslov A. N., Shutov V. V. Problemy bezopasnogo moreplavaniia v slozhnykh navi-gatsionnykh usloviiakh stesnennykh vod [The problems of safe shipping in complex navigation conditions of the confined waters]. Pod obshchei redaktsiei V. I. Men'shikova. Murmansk, Izd-vo MGTU, 2013. 186 p.
The article submitted to the editors 07.06.2016
INFORMATION ABOUT THE AUTHORS
Ziva Irma Igorevna — Russia, 183036, Murmansk; Murmansk State Technical University; Postgraduate Student of the Department of Water Transport Operation and Navigation; [email protected].
Ershov Vladimir Aleksandrovich - Russia, 183036, Murmansk; Murmansk State Technical University; Postgraduate Student of the Department of Water Transport Operation and Navigation; [email protected].
Menshikov Vyacheslav Ivanovich - Russia, 183036, Murmansk; Murmansk State Technical University; Doctor of Technical Science, Professor of Department of Navigation; [email protected].