УДК 004.5
М.Г. Шишаев
Институт информатики и математического моделирования технологических процессов Кольского НЦ РАН
МЕТОДИЧЕСКИЕ ОСНОВЫ КОГНИТИВНЫХ ИНТЕРФЕЙСОВ МУЛЬТИПРЕДМЕТНЫХ ИС
Аннотация
В статье рассмотрены методические основы синтеза когнитивных интерфейсов мульти предметных информационных систем. Предложено определение когнитивного пользовательского интерфейса, подходы к его формальной оценке. Отдельно рассмотрены семантический и перцептивный аспекты когнитивных интерфейсов, понятия релевантности, пертинентности, гештальтов и перцептивных стереотипов.
Ключевые слова:
мультипредметная ИС, семантическая модель, пользовательский интерфейс, когнитивность, релевантность, пертинентность, гештальт, перцептивные стереотипы.
M.G. Shishaev
METHODOLOGICAL BASIS FOR THE COGNITIVE INTERFACES OF MULTISUBJECT INFORMATION SYSTEMS
Abstract
The article describes the methodological basis of the synthesis of cognitive interfaces for multisubject information systems. A definition of the cognitive user interface as well as approaches to its formal assessment are given. Special attention is paid to semantic and perceptual aspects of cognitive interfaces, the concept of relevance, pertinence, and gestalt perceptual stereotypes.
Keywords:
multisubject IS, semantic model, user interface, cognitive, relevance, pertinence, gestalt,
perceptual stereotypes.
Введение
За последние десятилетия информационные системы (ИС) претерпели впечатляющую эволюцию. Современные ИС отличаются большим разнообразием: масштабы - от микрочипа до глобальных систем; функциональность -от тривиального хранения данных до искусственного интеллекта. Выросли объемы хранимой информации. По оценкам экспертов, совокупный объем данных, хранимый в сети Интернет, удваивается каждые два года. Современный человек за месяц получает и обрабатывает столько же информации, сколько человек XVII века - за всю жизнь. Рост объемов информации ИС, расширение их функциональных возможностей привели к широкому распространению крупных информационных систем, ориентированных на различные категории пользователей. Под различными категориями пользователей имеются в виду лица, принадлежащие разным возрастным категориям, различным социальным слоям, имеющие различные культурные традиции и области профессиональных интересов, и т.д. Мы назвали такие системы мультипредметными. Подобные
33
системы можно противопоставить специализированным или проблемно ориентированным ИС, нацеленным на решение некоторого ограниченного спектра взаимосвязанных прикладных задач или же информационную поддержку некоторого единственного сообщества пользователей, определяемого возрастом, профессиональными или досуговыми интересами, или другими признаками. Примерами мультипредметных информационных систем являются новостные сайты, ресурсы, предоставляющие справочную информацию о некоторой территории или ином объекте, представляющем интерес для пользователей различных категорий, разного рода интернетпорталы, и другие.
Мультипредметные системы выдвигают специфические требования к качеству их пользовательского интерфейса (ПИ). В некотором смысле, они должны «угодить всем» - обеспечить удобный интуитивно понятный механизм доступа и интерпретации информации для пользователей разных категорий. Совокупность свойств интерфейса, обеспечивающих его интуитивную понятность и способствующих эффективному пониманию информации, передаваемой в рамках интерфейса, мы будем называть когнитивными свойствами, а интерфейс, обладающий ими, когнитивным интерфейсом. Очевидно, что для разных категорий пользователей, вследствие различий в представлениях последних об окружающем мире (ментальных моделях), обеспечить когнитивные свойства в пределах одного статичного пользовательского интерфейса трудно. Выходом из ситуации может служить динамическое формирование интерфейса, адаптированного под актуального пользователя, в данный момент использующего систему. Сегодня уже существуют некоторые информационные технологии, в той или иной мере способствующие решению этой задачи - каскадные таблицы стилей, облака тегов, и т.п. Однако, упомянутые технологии решают лишь техническую задачу генерации пользовательских интерфейсов, отвечая на вопрос «КАК сформировать интерфейс», оставляя без ответа вопрос «КАКИМ должен быть интерфейс мультипредметного ресурса для данного пользователя». Для правильного ответа на данный вопрос, определяющего последующую успешность применения технологий динамической генерации пользовательских интерфейсов, необходимы четкие критерии качества (когнитивных свойств) интерфейса и соответствующие средства идентификации ментальных стереотипов пользователей. Мы исходим из довольно очевидного предположения, что когнитивное качество интерфейса зависит от того, насколько полно он соответствует ментальным стереотипам пользователя. Для формального определения этого соответствия необходимо, с одной стороны, иметь четкое формальное представление информации и знаний, хранимых в системе (суть -объекта передачи в рамках человеко-машинного интерфейса). С другой стороны, также необходимо понимание и формальное представление закономерностей человеческого восприятия и интерпретации информации. В данной статье рассмотрены ключевые понятия, связанные с эффективностью передачи информации и знаний между человеком и машиной - когнитивность, релевантность, пертинентность, гештальт, и другие, на основе которых возможно определение указанной меры соответствия.
34
Когнитивность как свойство человеко-машинного интерфейса
Современный словарь иностранных слов определяет термин «когнитивный» следующим образом: когнитивный [лат. cognitio - восприятие,
познание] - относящийся к познанию, к функциям мозга, которые обеспечивают формирование понятий, оперирование ими и получение выводных знаний. [1]. Опираясь на данное определение, «когнитивный интерфейс» (КИ) можно представить, как интерфейс, обеспечивающий правильное формирование понятий в ходе человеко-машинного взаимодействия. При этом «правильность» в данном случае подразумевает возможность эффективного оперирования этими понятиями (в том числе - вывода новых знаний) для достижения стоящих перед пользователем целей.
В современной философии также существует еще одно понятие, тесно связанное с вопросами построения когнитивных человеко-машинных интерфейсов: «когнитивная информация». Коротко - это информация, порожденная на основе сигналов, извлекаемых из окружающей среды и необходимая живому организму для выживания. В работе [2] отмечается, что когнитивная информация (или знание) не содержится в окружающей среде как некая данность. Порождение этой информации требует наличия соответствующих условных алгоритмов - правил, устанавливающих условные связи между инвариантными сигналами, параметрами, инвариантными структурами, корреляциями и т.д. Эти правила реализуются когнитивной системой человека (рис. 1).
Рис. 1. Схема формирования когнитивной информации
Одной из первых моделей, описывающих процесс человеческого познания с точки зрения когнитивных процессов, является модель ранней селекции Бродбента [3]. В соответствии с данной моделью, поступающая извне в виде разнообразных сигналов информация подвергается фильтрации и последующему запоминанию с целью обработки. Изначально, Бродбент предполагал, что фильтрация осуществляется на основе лишь физических параметров сигналов (громкость, тональность, цвет, и т.п.). Однако впоследствии Дж. Греем и А. Ведденберном было доказано, что выбор каналов (селекция) осуществляется человеком с учетом семантики поступающей информации [4]. Таким образом, в когнитивном процессе задействован еще один компонент, обеспечивающий анализ семантики поступающей информации. Назовем его «анализатор семантики» или «менталитет» (рис. 2).
35
Рис. 2. Модель когнитивного процесса
В контексте человеко-машинного взаимодействия роль окружающего мира играет информационная система, формирующая некоторые образы, подлежащие восприятию человеком в рамках пользовательского интерфейса. Поскольку данные образы формируются целенаправленно, в рамках управляемого процесса, это означает, что информационная система может и должна быть активной, обладать внутренней интенциональностью. Мы предполагаем, что если при этом формируемые системой сигналы согласуются с менталитетом человека-пользователя, то когнитивный процесс будет более эффективен - человек быстрее и точнее построит правильные ментальные образы, составляющие когнитивную информацию. То есть, часть селективных функций будет делегирована от человека машине (рис. 3). Для реализации той или иной части когнитивных функций информационная система должна располагать представлением об ожиданиях пользователя. Назовем систему таких представлений «моделью менталитета пользователя» или «моделью ментальных стереотипов».
Рис. 3. Модель когнитивного интерфейса
Уточним определение когнитивного интерфейса с учетом сказанного: КИ - это интерфейс, реализующий часть когнитивных функций человека и обеспечивающий правильное и эффективное, в смысле скорости, формирование понятий на основе воспринимаемых сигналов. Тогда меру когнитивности ПИ можно определить, как долю когнитивных функций, делегированных системе. Очевидно, что теоретический предел этой доли зависит от точности модели
36
пользовательского менталитета и точности семантической модели данных информационной системы.
Правильность интерпретации предъявляемых в рамках интерфейса понятий обеспечивается, в первую очередь, корректностью семантической составляющей интерфейса: человеку должны быть предъявлены лишь значимые компоненты и отброшены второстепенные. Это, в свою очередь, обеспечивается корректностью модели ментальных стереотипов и соответствующих процедур селекции. Вместе с тем, важное значение имеет и способ визуализации отобранной информации: если при визуализации учитываются стереотипы зрительного (или иного - для "невизуальных" интерфейсов) восприятия, то скорость когнитивного процесса может быть существенно увеличена.
Таким образом, можно выделить две фазы формирования когнитивного интерфейса и, соответственно, два аспекта когнитивности ПИ - семантическую и перцептивную (рис. 4).
Рис. 4. Две составляющих когнитивности интерфейса
Семантическая когнитивность ПИ: модель ментальных стереотипов, релевантность и пертинентность
Если в сложных ситуациях информационная система не способна предложить пользователю уже готовое однозначное и правильное решение, то она вполне может и должна сформировать некоторое множество информационных потоков, передаваемых в рамках человеко-машинного интерфейса, облегчающее когнитивный процесс, то есть выявление человеком значащих факторов и их комбинаций для последующего принятия решения. Это становится возможным, если в рамках когнитивного интерфейса не пытаться смоделировать менталитет человека вообще, а сконцентрироваться на семантической модели задачи, решаемой в данный момент пользователем. В контексте отдельно взятой задачи (или некоторого класса схожих задач), пользователь, как правило, имеет в той или иной степени четкое представление об упомянутых значимых факторах, необходимых ему для решения. В рамках человеко-машинного взаимодействия (в семантическом смысле) это представление выражается в трудно формализуемом понятии информационной потребности пользователя: человек обращается к информационной системе в целях получения информации, адекватной его актуальным нуждам, суть - решаемым задачам.
37
Очевидно, что ключевым вопросом при синтезе когнитивного интерфейса, в указанной интерпретации, становится определение этих самых «значащих факторов» для последующего предъявления информационной системой. В случае узкоспециализированных (проблемно-ориентированных систем) дать ответ на этот вопрос не составляет труда - факторы, влияющие на решение задачи, заранее известны, также, как и их привычная для пользователей интерпретация и способ визуального представления и структуризации. Однако, все усложняется если нам необходимо предоставлять информацию из одного и того же набора разнородным пользователям, решающим существенно различные прикладные задачи и характеризуемым различными стереотипами восприятия и интерпретации информации [5]. В этом случае система должна сначала каким-то образом идентифицировать пользователя и затем сформировать представление информации, соответствующее специфике задачи и субъективным особенностям ее получателя. Практика показывает, что чем выше степень такого соответствия, тем более эффективен интерфейс в смысле скорости и точности восприятия информации пользователем [6].
Необходимо отметить важный нюанс: при взаимодействии с ИС человек далеко не всегда располагает полным и четким представлением о задаче и требуемой для ее решения информации. Если субъективной представление достаточно полное и четкое, то пользователь способен сформулировать полный/четкий информационно-поисковый запрос, в ответ на который система выдаст, при наличии, в точности ту информацию, которую ожидает человек. И наоборот - если пользователь плохо представляет себе, что ему нужно, ему нужно обеспечить возможность «серфинга». Этим обусловлены два подхода к организации эффективного информационного взаимодействия между человеком и машиной - поисковый (эффективен в первом случае) и навигационный (эффективен во втором случае).
Для характеристики соответствия интерфейса ментальным стереотипам пользователя воспользуемся известными понятиями, используемыми при рассмотрении задач информационного поиска - релевантность и пертинентность. Под релевантностью принято понимать меру соответствия результатов поиска формулировке поискового запроса: «Релевантность - в поисковых системах -мера соответствия результатов поиска задачи, поставленной в запросе. Различают содержательную и формальную релевантности.» [7]. Однако, следует признать, что сама по себе формулировка запроса является субъективным языковым выражением ожиданий пользователя в отношении информации, выдаваемой системой в качестве результата. Для обозначения соответствия результатов запроса именно ожиданиям пользователя используют термин пертинентность: «Пертинентность - соответствие полученной информации информационной потребности пользователя» [8]. Рис. 5 иллюстрирует различие данных понятий.
Очевидно, что получить объективную оценку пертинентности автоматически, в результате машинных вычислений, невозможно в силу невозможности абсолютно точного моделирования пользовательских ожиданий. Некоторые авторы высказываются даже в пользу бесперспективности каких-либо попыток оценивать качество результатов поиска на основе формализованных оценок субъективных ожиданий пользователя [9]. Одной из ключевых проблем, возникающих при этом, является динамика пользовательских ожиданий во времени.
38
Рис. 5. Соотношение понятий релевантности и пертинентности
Тем не менее, сделать определенные приближения к указанной оценке, на наш взгляд, возможно. В частности, проблему динамичности пользовательских представлений можно, если обеспечить постоянный мониторинг пользовательской активности и коррекцию на его основе модели ментальных стереотипов (суть - ожиданий) пользователя. Одна из технологий такого мониторинга предложена в работе [10]. В данной работе предлагается строить модель ментальных стереотипов пользователя в виде семантической сети, которая постоянно обновляется в соответствии с содержанием пользовательских информационных запросов и семантической структурой документов, попадающих в фокус внимания пользователя. Попадание в фокус внимания при этом идентифицируется путем анализа времени работы с документами, выбранными человеком среди результатов поискового запроса.
В случае интерфейсов навигационного типа поисковый запрос не формулируется пользователем в явном виде. Тем не менее, в процессе «серфинга» по информационному контенту ИС пользователь всегда имеет некоторые ожидания в отношении содержания тех или иных разделов информационной системы. Это позволяет использовать то же понятия пертинентности и для оценки когнитивных свойств навигационного интерфейса. В этом случае под результатом поиска следует понимать способ структуризации информационных баз, предъявляемых пользователю. А пертинентность может быть формально определена как «невязка» между структурой информационных баз и способом структуризации знаний об окружающем мире, характерном для данного человека. Способ числовой оценки такой невязки предложен в работе [5].
Перцептивная когнитивность ПИ: гештальты и стереотипы восприятия
Общепринятые сегодня подходы к описанию процессов восприятия и структурирования ощущений человека сформировались в начале XX века в рамках школы научной психологии, получившей название гештальтпсихология. Основной идеей гештальтпсихологии является постулат целостности восприятия, означающий, что воспринимаемая человеком картина не является простой суммой ее составляющих. Человек всегда стремится интерпретировать
39
опыт как некоторое доступное пониманию целое. Ярким примером подобной структурной целостности восприятия является наблюдение о том, что известная человеку мелодия узнается даже в случае, если она транспонируется в другие тональности. Центральным понятием гештальтпсихологии является гештальт -целостная структура (от нем. Gestalt - образ, форма), в принципе не выводимая из образующих ее компонентов.
Согласно гештальтпсихологии, целостность восприятия и его упорядоченность достигаются благодаря следующим принципам:
- близость (стимулы, расположенные рядом, имеют тенденцию восприниматься вместе);
- схожесть (стимулы, схожие по размеру, очертаниям, цвету или форме, имеют тенденцию восприниматься вместе);
- целостность (восприятие имеет тенденцию к упрощению и целостности);
- замкнутость (отражает тенденцию завершать фигуру так, что она приобретает полную форму);
- смежность (близость стимулов во времени и пространстве; смежность может предопределять восприятие, когда одно событие вызывает другое);
- общая зона (принципы гештальта формируют наше повседневное восприятие наравне с научением и прошлым опытом; предвосхищающие мысли и ожидания также активно руководят нашей интерпретацией ощущений) [11].
На рис. 6 показан пример использования гештальт-принципа близости. Одни и те же графические примитивы (рис. 6 а) компактно визуализированые одним (рис. 6 b) или другим (рис. 6 c) образом воспринимаются как набор точек, треугольник или квадрат, соответственно.
Рис. 6. Пример использования гештальт-принципа близости
Восприятие гештальтов можно считать одинаковым практически для всех людей. Вместе с тем, для групп людей объединенных общей культурой, образованием или профессией существуют свои, специфичные для группы, принципы восприятия. Эти принципы названы исследователями П. Фоули и Н. Моури перцептивными стереотипами [12]. Такие стереотипы устойчивы и остаются неизменными на протяжении всей жизни индивидуума. В отличие от гештальтов, перцептивные стереотипы отражают специфику некоторой проблемной области и могут рассматриваться как принципы, способствующие точному и быстрому восприятию объекта в контексте определенного спектра прикладных задач.
40
Примером может служить разная интерпретация красного и синего цвета учеными-физиками и большинством других людей. Для большинства красный цвет обычно считается «теплым», а синий - «холодным», но у физиков синий цвет вызывает ассоциацию с более нагретым телом (это объясняется известным соотношением между температурой черного тела и его спектром излучения). Еще один подобный пример связан с эксплуатацией электростанций. Обычно индикаторы, указывающие на нормальную работу агрегатов, делаются зелеными, а в случаях неисправности применяются индикаторы красного цвета. Но в электротехнике сложилось, что красный цвет используют для обозначения замкнутых цепей, по которым течет электрический ток, а зеленый — для разомкнутых цепей.
Эти примеры иллюстрируют тот факт, что для правильного и быстрого восприятия информации важно установить, какие стереотипы формируют восприятие пользователя. Тогда можно определить, как правильно отобразить данные. В тех случаях, когда наблюдатель находится в состоянии напряжения, в условиях дефицита времени или он устал, в восприятии проявляется тенденция выделять ожидаемые стереотипы (даже если в нормальных ситуациях восприятие ничем не затруднено). В этом случае важно представлять человеку информацию только в том виде, который соответствует его стереотипам восприятия.
Кроме способа визуализации информации, на скорость и адекватность ее восприятия влияет и ее количество. Человеческую память часто подразделяют на две составляющие: долговременную память, которая является постоянным источником информации о мире, и кратковременную, или оперативную, память — ограниченный запас «осознанной» информации, который является временным. В оперативной памяти удерживается ограниченное число несвязанных друг с другом элементов, даже если повторению уделяется все внимание; это число изменяется от 5 до 9 [13]. Из этого следует, что количество отображаемых данных нужно регулировать. Например, группировать данные и ранжировать по важности для отображения только самой важной информации.
Заключение
В рамках современных информационных систем накоплены огромные объемы информации. Современные ИС становятся все более интеллектуальными. Это существенно меняет характер и требования к организации человекомашинного взаимодействия. Увеличивающиеся возможности автоматизированной обработки информации и знаний позволяют делегировать часть когнитивных функций в рамках человеко-машинного взаимодействия информационной системе. Такое делегирование порождает новый тип пользовательских интерфейсов, частично автоматизирующих интеллектуальные функции человека. Мы назвали такие интерфейсы когнитивными. Для синтеза когнитивных интерфейсов необходимо согласованное использование существующих моделей инженерии знаний и психологии восприятия.
Несмотря на субъективность ожиданий пользователя в отношении качеств человеко-машинного интерфейса, учет психологических особенностей человека при разработке когнитивных пользовательских интерфейсов если и не позволит получить объективно лучший результат, то определенно повысит эффективность когнитивных процессов.
41
Литература
1. Словарь иностранных слов / Н.Г. Комлев. - М.: Эксмо-Пресс, 2000. - 1308 с.
2. Эволюция. Мышление. Сознание. (Когнитивный подход и эпистемология) / под ред. И.П. Меркулова. - М.: Канон +, 2004. - 352 с. (Серия «Современная философия»).
3. Broadbent, D.E. Perception and Communication / D.E. Broadbent. Elmsford, N.Y., 1958. -342 р.
4. Gray, J.A., Wedderburn, A.A. /Grouping strategies with simultaneous stimuli // J.A. Gray, A.A. Wedderburn. Quarterly Journal of Experimental Psychology. -1960. - №12. -Р.180-184.
5. Шишаев, М.Г. Формализация задачи построения когнитивных пользовательских интерфейсов мультипредметных информационных ресурсов / М.Г. Шишаев, П.А. Ломов, В.В. Диковицкий // Труды Кольского научного центра РАН. Информационные технологии. -Вып.4. -4/2013(17). - Апатиты: Изд-во КНЦ РАН, 2013. -С.90-97.
6. Диковицкий, В.В. Технология формирования адаптивных пользовательских интерфейсов для мультипредметных информационных систем промышленных предприятий / В.В. Диковицкий, М.Г. Шишаев // Информационные ресурсы России. -2014. -№ 1(137). -С.23-26.
7. Финансовый словарь. -Режим доступа: http://dic.academic.ru/contents.nsf/fin_enc/
8. Жданова, Г.С., Словарь терминов по информатике на русском и английском языках / Г.С. Жданова, Е.С. Колобродона, В.А. Полушкин, А.И. Черный. - М.: Наука, 1971. -360 с.
9. Аветисян, Р.Д. Теоретические основы информатики / Р.Д. Аветисян, Д.О. Аветисян. -М.: РГГУ, 1997. -168 с.
10. Диковицкий, В.В. Методы интеллектуальной обработки и представления информации в мультипредметных информационных системах промышленных предприятий // Труды СПИИРАН. -2015. - Вып. 42. -C.56-76.
11. Koffka, K. Principles of Gestalt psychology /K. Koffka. N.Y., Routledge, 1935. - 720 p.
12. Салвенди, Г. / Человеческий фактор. -Т.3, Ч.1. Модели психической деятельности // Г. Салвенди. - М: Мир, 1991. -487 с.
13. Миллер, Дж. А. Магическое число семь плюс или минус два. О некоторых пределах нашей способности перерабатывать информацию / Дж. А. Миллер // Инженерная психология // под ред. Д.Ю. Панова и В.П. Зинченко. -М., 1964. -С.564-581.
Сведения об авторе
Шишаев Максим Геннадьевич - д.т.н., профессор, руководитель лаборатории
региональных информационных систем,
е-mail: [email protected]
Maxim G. Shishaev - Dr.of Sci. (Tech. Sci.), рrofessor, head of laboratory for regional
information systems
42