УДК 004.5
М.Г. Шишаев, П.А. Ломов, В.В. Диковицкий
ФГБУН Институт информатики и математического моделирования технологических процессов КНЦРАН
Кольский филиал ПетрГУ
ФОРМАЛИЗАЦИЯ ЗАДАЧИ ПОСТРОЕНИЯ КОГНИТИВНЫХ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ МУЛЬТИПРЕДМЕТНЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ* Аннотация
В работе рассмотрена постановка задачи построения когнитивных интерфейсов мультипредметных информационных систем. Предложена оценка качества интерфейса, основанная на соответствии семантической структуры навигационных связей ментальной модели пользователя.
Ключевые слова:
онтология, пользовательский интерфейс, мультипредметные ресурсы.
FORMALIZATION PROBLEM OF CONSTRUCTING COGNITIVE USER INTERFACES FOR MULTIDOMAIN INFORMATION RESOURCES
Abstract
The paper considers the formulation of the problem of constructing cognitive interfaces multidomain information systems. The estimation of the quality of the interface, based on according semantic structure navigation links and mental model of the user.
Key words:
опООду, user interface, multidomain resources.
Введение
В настоящее время в глобальных информационных сетях получают все более широкое распространение информационные ресурсы (в частности - вебсайты), ориентированные на разнородных пользователей, под которыми имеются в виду лица, принадлежащие разным возрастным категориям, различным социальным слоям, имеющие различные культурные традиции и области профессиональных интересов и т.д. Назовем данную разновидность ресурсов мультипредметными информационными ресурсами. Подобные ресурсы можно противопоставить специализированным информационным ресурсам, нацеленным на поддержку некоторого единственного сообщества пользователей, определяемого возрастом, профессиональными или досуговыми интересами и т.п. Назовем такие сообщества категориями пользователей.
Примерами мультипредметных информационных ресурсов являются новостные сайты, а также ресурсы, предоставляющие справочную информацию
* Работа выполнена в рамках проекта №2.8 программы фундаментальных исследований ОНИТ РАН «Интеллектуальные информационные технологии, системный анализ и автоматизация», при поддержке РФФИ (грант № 13-07-01016 «Методы динамического синтеза когнитивных интерфейсов мультипредметных информационных систем»).
о некоторой территории или ином объекте, представляющем интерес для пользователей различных категорий.
Мультипредметные ресурсы выдвигают специфические требования к качеству их пользовательского интерфейса. В некотором смысле, они должны «угодить всем» - обеспечить удобный интуитивно понятный механизм доступа к информации для пользователей разных категорий. Однако, вследствие различий в представлениях последних об окружающем мире (ментальных моделях), данное требование труднодостижимо.
Выходом из ситуации может служить динамическое формирование пользовательского интерфейса, адаптированного под актуального пользователя в данный момент использующего ресурс. Сегодня уже существуют некоторые информационные технологии, в той или иной мере способствующие решению этой задачи - каскадные таблицы стилей, облака тегов, и т.п. Однако упомянутые технологии решают лишь техническую задачу генерации пользовательских интерфейсов, отвечая на вопрос «как сформировать интерфейс», оставляя без ответа вопрос «каким должен быть интерфейс мультипредметного ресурса для данного пользователя».
Для правильного ответа на данный вопрос, определяющего последующую успешность применения технологий динамической генерации пользовательских интерфейсов необходимы четкие критерии качества интерфейса и соответствующие средства идентификации категорий пользователей.
Модель ресурса и категории пользователей
Будем понимать под ресурсом коллекцию документов, содержимое которых (контент) оперирует в смысле синтаксиса языка документа некоторым множеством понятий, складывающихся тем или иным образом в логическую систему. Логическая система образуется заданием на данном множестве понятий С различных семантических связей Ь, определяющих допустимые с точки зрения создателя документа способы взаимной интерпретации понятий из С:
КВ = {С, Ь},
где С - множество понятий (концептов), Ь - множество отношений над понятиями.
Подобную систему в современной ИТ-науке принято называть онтологией [1]. Назовем систему, описывающую контент информационного ресурса онтологией ресурса. Обратим внимание, что отношения на множестве понятий онтологии могут быть как симметричными, так и асимметричными. Наиболее распространенным примером симметричного отношения является отношение ассоциации. Например, в онтологии могут быть определены понятия «регион» и «административно-территориальная единица», связанные данным отношением. Примерами асимметричных отношений являются «есть составная часть», «есть разновидность», и другие. Асимметричные отношения обычно используются для формирования классификации понятий некоторой предметной области. При этом один из концептов, участвующих в двухместном асимметричном отношении, может рассматриваться как атрибут другого.
Ментальная модель человека, использующего информационный ресурс, также может быть представлена в виде логической системы - онтологии пользователя. Данная онтология характеризует взаимосвязь вещей в природе с точки зрения пользователя. Отметим, что (вследствие, вероятно, социальной природы человека) представления различных людей об окружающем мире в целом мало отличаются, что выражается в схожести структур различных пользовательских онтологий. Однако люди, различающиеся по различным признакам, таким, например, как принадлежность к социальным группам, возраст, пол, род профессиональной деятельности и другие, в процессе жизнедеятельности, как правило, оперируют различными фрагментами своих онтологий с разной интенсивностью. О ментальных различиях между группами людей, объединенных общей культурой или профессией, и «внутригрупповой» общности свидетельствуют, в частности, исследования в области психологии восприятия [2]. В данном случае эти различия и общность выражаются в существовании так называемых перцептивных стереотипов, определяющих общие для группы людей особенности восприятия информации [3]. Для практического использования в рамках современных информационных систем данные зависимости должны быть формализованы.
Можно заметить, что для определенного профессионального сообщества или для определенной социальной или культурной общности людей имеют место общие представления о некоторых объектах или задачах. Эта общность выражается в схожем ранжировании атрибутов понятий по значимости. При этом наиболее важные для человека (в контексте информационных систем - для пользователя) атрибуты играют роль свойств, идентифицирующих объект. Например, в ментальной модели человека категории «управленец» экземпляр понятия «Регион РФ (область, край, республика)» будет идентифицироваться значениями атрибутов, характеризующих структуру экономики и политическую ситуацию на территории. В то же время для пользователя категории «турист» экземпляр этого же понятия идентифицируется атрибутами, описывающими туристические возможности региона - туристические объекты, основные доступные виды туризма и отдыха, и т.п. К примеру, Мурманская область для управленца может ассоциироваться с горнодобывающей и рыбной промышленностью, развитой военной инфраструктурой, составом административных органов региона. Тогда как для туриста, Мурманская область - это рыбалка, горные лыжи, Кольская сверхглубокая и т.д. При этом для второй категории пользователей такие атрибуты региона, как структура экономики и политической власти являются, если и известными, то несущественными (рис. 1).
В этой связи можно определить на множестве атрибутов понятий отношение порядка, определяющее значимость атрибута для данного пользователя. Тогда некоторое количество наиболее значимых атрибутов (в представлении конкретного человека) будет идентифицировать объект окружающего мира как принадлежащий к тому или иному классу. Назовем это подмножество наиболее значимых атрибутов идентифицирующими атрибутами. Можно предположить, что для некоторой категории пользователей наборы идентифицирующих атрибутов для некоторого подмножества понятий окружающего мира будут близкими или идентичными.
меет атрибут^
Мурманская область)
имеет атрибут
имеет атрибут
имеет атрибут^^ Лыжи ^ I ^Ареал_у г______
имеет атрибут \ / у7Ь Экол
/ имеет атрибут имеет атрибут
(Рыболовство^) ( Горы
*ч'~——-имеет атрибут
Идентифицирующие атрибуты для категории «Турист»
Рис. 1. Идентифицирующие атрибуты понятия «Мурманская область» для различных категорий пользователей
Пусть С- некоторое множество понятий, и - множество пользователей. Множество атрибутов концепта с будем обозначать следующим образом:
А(с) = {а(с)1}а(с)1 е C,/ = 1, .
Упорядочив множество атрибутов по убыванию степени их значимости для пользователя и, получим последовательность, характеризующую его представление о данном концепте:
Аи (с) = {аи (с),},а = 1, N : а“ (с), <риаи (с),, V/ < ],
где (ри - отношение, задающее значимость атрибутов для пользователя и; афиЪ означает, что «для пользователя и а не менее значим, чем Ь».
Также можно определить группу пользователей, имеющих схожие представления о понятиях из некоторого множества С. Назовем подобную группу пользовательской категорией к-го порядка на множестве концептов С и определим ее следующим образом:
и'¡к = {“аи (с\ =аи (с), / = 1, к, Vc е С, Vu'еUkc } . (1)
То есть, для всех пользователей из категории Ukc совпадают к наиболее значимых (идентифицирующих) атрибутов для всех концептов из множества C. В более мягкой форме (без требования совпадения порядка атрибутов по значимости) это условие выглядит следующим образом:
= {м| {аи (с)} = {au (с)}, i = 1, k, Vc e C, Vu ' eUkc } . (2)
Можно заметить, что при k = const пользовательские категории, сформированные в соответствии с условием (1) или (2), образуют разбиение исходного множества пользователей на непересекающиеся подмножества:
и = и ^...^ul, р|и =0.
i=1.L
Несмотря на схожесть формулировок условий (1) и (2), их свойства существенно отличаются. Так, в случае использования условия (1) размер пользовательских категорий для некоторого фиксированного концепта с будет невозрастающей функцией от к с нижней гранью равной 1 и областью значений
[1, U ]. В то же время, для условия (2) размер категорий может свободно изменяться в пределах от 1 до |U| и достигать максимума, равного |U|, при
k = Nc.
Модель навигационного интерфейса
Пользовательский интерфейс ресурса имеет две основных составляющих - это внешнее оформление (дизайн) и навигационная структура. Если качество первого компонента является исключительно субъективной категорией и вряд ли может быть оценено формально, то для оценки качества навигационной структуры ресурса можно использовать степень ее соответствия ментальной модели пользователя. При этом должна рассматриваться семантика навигационной структуры (семантическая структура интерфейса). Чем более схожими являются семантическая структура интерфейса и ментальная модель пользователя, тем более удобным и понятным для конечного пользователя будет интерфейс. Последний в этом случае будет способен «предугадывать» образ мыслей пользователя и визуализировать фрагмент понятийной системы ожидаемым для него способом. Будем далее именовать меру соответствия семантической структуры интерфейса ментальной модели пользователя когнитивностью интерфейса. Далее рассматривается формализованное описание навигационной структуры и основанная на нем количественная оценка когнитивности пользовательского интерфейса.
Итак, пользовательский интерфейс представляет собой пару:
UI = ( I, s),
где I - множество информационных элементов; s - навигационная структура.
Навигационная структура определяет иерархию групп информационных элементов (ИЭ) или доступных для пользователя действий. При этом на каждом уровне иерархии исходное множество информационных элементов (будем для простоты полагать, что доступное пользователю действие является частным случаем ИЭ) делится на подмножества в соответствии с одним или несколькими
классификационными признаками. В качестве классификационных признаков используются атрибуты понятий предметной области. Очевидно, что при использовании на одном уровне навигационной структуры нескольких признаков, полученные множества ИЭ могут пересекаться. Введем следующие обозначения:
Г1 = {Gl} - множество разделов /-го уровня навигационной структуры;
GI - /-я группа информационных элементов /-го уровня навигационной структуры;
P = {} - множество классификационных признаков, используемых для формирования групп ИЭ на /-м уровне навигационной структуры.
Заметим, что использование информационной системы представляет собой, по сути, поиск некоторых информационных элементов по имеющемуся у человека образу. При этом образ, чаще всего, неточный: в нем специфицируются лишь некоторая часть идентифицирующих атрибутов. Вследствие этого, пользователь с разной степенью уверенности может предполагать в какой из групп ИЭ на некотором уровне навигационной структуры находится искомый элемент. Эта уверенность тем выше, чем более точно представляет пользователь потенциальное содержимое группы. Введем следующую функцию, задающую числовую оценку степени уверенности пользователя и (чем выше значение, тем выше степень уверенности):
ри : Г1 ^ [0,1].
Оценка времени, требуемого для доступа к искомому информационному элементу в рамках навигационной структуры на /-м уровне, будет равна
max Ig'I
O( 1 ' . ').
Ри (Gl У
Таким образом, при прочих равных, степень уверенности пользователя в принадлежности информационного элемента к той или иной группе определяет качество интерфейса в смысле скорости доступа к требуемой информации.
Сделаем следующее предположение: если для формирования навигационной структуры на некотором уровне иерархии используются идентифицирующие атрибуты, то пользователь с высокой долей уверенности сможет определить, в какой группе находится искомый информационный элемент. Обозначим через wu (a) е [0,1] нормированный вес атрибута а в ментальной модели пользователя и. Тогда, с учетом указанного предположения:
Ри (Gl) = max wu (a).
aeP1
То есть мы предполагаем, что если на /-м уровне используется несколько классификационных признаков для группирования информационных элементов, то пользователь оперирует той частью навигационной структуры, которая определяется наиболее значимым с его точки зрения атрибутом понятия верхнего уровня.
Поскольку при таком определении значение функции p" (Gl) не
зависит от группирования информационных элементов как такового, а зависит лишь от уровня навигационной структуры, будем далее использовать
редуцированную запись pu (l) .
Пусть навигационная структура интерфейса имеет глубину l уровней. Тогда в качестве количественной оценки когнитивности интерфейса для пользователя и может использоваться сумма:
Тр" С).
I=1
Данная мера может использоваться для оценки уже существующих
интерфейсов, когда известно значение l . Для решения же прямой задачи, то есть структуризации исходного множества информационных элементов в рамках навигационной структуры, требуется учитывать дополнительные ограничения. Эти ограничения обусловлены психологией восприятия человека, ограничивающей максимальное количество одновременно эффективно воспринимаемых объектов. Вследствие этого необходимо ограничивать размер группы информационных элементов, а также глубину навигационной структуры.
С учетом сказанного, оптимальная для пользователя и структура интерфейса есть решение следующей задачи с ограничениями:
l ( s )
max Z pU (l)
s l=1
g(s) < K,
l (s) < K.
здесь l (s) - количество уровней в навигационной структуре s; g(s) - максимальный размер группы информационных элементов l (s) -го в навигационной структуре s; K - когнитивная константа, определяющая максимальное число одновременно предъявляемых пользователю информационных элементов для их эффективного восприятия; K’ - когнитивная константа, определяющая максимальное число уровней навигационной структуры, в рамках которых поиск информации для пользователя остается комфортным.
Заключение
Рост объемов информации, обрабатываемой современными информационными системами, обуславливает необходимость развития технологий оперативного доступа в ней. Одним из путей решения данной проблемы является построения адаптивных пользовательских интерфейсов, способных предоставить пользователю необходимый функционал для оперирования большими массивами данных, в соответствии с его информационными потребностями. В данной работе рассмотрена формальная постановка задачи построения адаптивных интерфейсов мультипредметных информационных
систем, предложена оценка качества интерфейса как меры соответствия навигационной структуры ментальной модели пользователя.
В виду того, что для получения качественной навигационной структуры необходимо учитывать категорию, к которой принадлежит пользователь, необходимо провести общую классификацию пользователей. Для этого можно использовать статистику обращений пользователей к тем или иным понятиям логической системы ресурса и/или определять категорию пользователя на основе данных, указанных им при регистрации в системе. Категоризация пользователей может быть сформулирована как задача многомерной кластеризации [4]. Для формирования навигационной структуры интерфейса необходимо определить идентифицирующие атрибуты понятий текущей категории пользователей путем отображения ментальной модели группы пользователей на логическую систему ресурса.
Литература
1. Онтологии в системах искусственного интеллекта: способы построения и организации / А.В. Смирнов и др. // Новости искусственного интеллекта. -2002. - Ч.1. -№1. -С.3-13.
2. Koffka, K. Principles of Gestalt psychology /К. Koffka. -New-York., Routledge, 1935. - 720 p.
3. Салвенди, Г. Человеческий фактор /Г. Салвенди. - М: Мир, 1991.
ISBN 5-03-001710-0.
4. Ковалёв, С.С., Шишаев, М.Г. Современные методы кластеризации в контексте задачи идентификации рассылок почтового спама /С.С. Ковалев, М.Г. Шишаев / Труды Кольского научного центра РАН. Информационные технологии. - Апатиты: Изд-во КНЦ РАН. -4/2012(11). - Вып.3. -С.89-99.
Сведения об авторах
Шишаев Максим Геннадьевич - д.т.н., заведующий лабораторией,
е-mail: [email protected]. net. ru
Maksim G. Shishaev - Dr. of Sci (Tech), Head of laboratory
Ломов Павел Андреевич - к.т.н., научный сотрудник,
е-mail: [email protected]
Pavel A. Lomov - Ph.D. (Tech. Sci.), Researcher
Диковицкий Владимир Витальевич - младший научный сотрудник, е-mail: dikovitsky @iimm. kolasc.net.ru Vladimir V. Dikovitsky - Junior researcher