УДК 004.7-053.88:340.130.53 ББК 32.81
ОПРЕДЕЛЕНИЕ СЛОЖНОСТИ ЗАДАЧ ДЛЯ ЗРИТЕЛЬНО-ПРОСТРАНСТВЕННОЙ ПАМЯТИ И ПРОПУСКНОЙ СПОСОБНОСТИ ЧЕЛОВЕКА-ОПЕРАТОРА1
Бакаев М. А.
(Новосибирский государственный технический университет, Новосибирск) Разумникова О. М.
(Новосибирский государственный технический университет, НИИ физиологии и фундаментальной медицины, Новосибирск)
Исследуется эффективность выполнения задач, возникающих в ходе человеко-машинного взаимодействия и требующих задействования зрительно-пространственной памяти. По аналогии с известным законом Фиттса и исходя из принципов восприятия гештальт-психологии предложена формулировка индекса сложности для таких задач, включающая в себя количество запоминаемых информационных единиц (фигур, посчитанных по правилам окрестности фон Неймана 1-го порядка), размер словаря отображаемых объектов и размер рабочего поля. На основе индекса сложности запоминания вычислена пропускная способность для участников специально проведённого экспериментального исследования.
1 Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 16-37-00184 мол а.
2 Максим Александрович Бакаев, кандидат технических наук (maxis81@gmail. com).
3 Ольга Михайловна Разумникова, доктор биологических наук, доцент (razum@physiol. ru).
Ключевые слова: человеко-машинное взаимодействие, информационная сложность, когнитивная психология, гештальт-принципы, графический интерфейс пользователя.
1. Введение
С 1980-х годов наиболее популярным средством взаимодействия оператора с системами управления остаётся графический интерфейс, который, как правило, предусматривает прямую манипуляцию объектами и использование меню; задействует зрение (в меньшей степени слух) и моторную реакцию рук; широко использует графические элементы; позволяет применять такие устройства как монитор, мышь, сенсорный экран, клавиатура и др.; имеет слабо выраженную интеллектуальность и направлен на прямое взаимодействие с человеком. Разновидностью графического интерфейса является веб-интерфейс, основной особенностью которого является то, что он работает в специальной программе - браузере - функционирующей на компьютере пользователя, в то время как данные и логика веб-приложения размещаются на удалённом веб-сервере. Для современных информационных систем и АСУ всё более характерен пользовательский интерфейс, разработанный именно на веб-платформе.
Выражение «Пользователь всегда прав» стало необсуждае-мым правилом для любого разработчика человеко-машинных интерфейсов и уже более десятка лет считается очевидным и не допускающим сомнений, а проектировщики интерфейсов и промышленные дизайнеры прилагают все усилия для создания у пользователя положительных впечатлений. Тем не менее, в задачах управления на первый план выходит достижение общей эффективности человеко-машинной системы, а не удовлетворенность пользователя. С 1970-х гг. в ходе активной разработки и внедрения АСУ в ряде ведущих стран мира специально обученный оператор или аналитик рассматривался как составная часть человеко-машинной системы управления, получая, обрабатывая и выдавая информацию так же, как любой другой её компонент. При этом отмечалось, что человек является неотъ-
емлемой частью такой системы, выполняя функции интегрирующего звена, придавая ей способность адаптироваться, возможность саморазвития [2, т. 1]. Тем не менее, при всех своих сильных сторонах человек определённо уступает машине в способностях по восприятию больших объемов информации, и отсутствие учёта данного аспекта ведёт к дорогостоящим ошибкам, возникающим по вине человека, особенно в системах управления [4].
Человек, как обработчик информации, может вводить (получать) и выводить информацию, причём для обоих процессов могут быть введены меры скорости (Rin и Rout) как производные от объемов информации по времени. Конечно, абсолютные значения скоростей зависят от единиц измерения, и это вносит определённую путаницу в сравнение оценок скоростей, полученных в различных исследованиях (привести все оценки к одним единицам измерения в общем случае представляется невозможным, так как зачастую отсутствуют точные данные об экспериментальных условиях). Относительно вывода информации считается, что максимальная скорость работы голосовых связок человека на продолжительном отрезке времени соответствует Rout = 5 слогов/с, что соответствует Rout = 12,5 звуков/с для английского языка (для других языков это значение может отличаться) [4] Для случая, когда человек использует какой-либо инструмент, значения скорости вывода обычно представляются в битах или символах в секунду. Для рукописного текста (авторучка) верхняя граница равна примерно 3,5 символа/с, средняя скорость печати составляет около 6,7 символов/с, а её рекордные значения достигают 10 символов/с. В целом оценка максимальной скорости человека по выдаче информации составляет 40 бит/с. Значения для скорости приёма информации хоть и выше, но не принципиально. Rin для восприятия речи на слух оценивается в 3-4 слова/с, для внимательного чтения с пониманием - 2,5 слова/с, или 18 бит/с, для чтения вслух - 30 бит/с, для скорочтения (на русском языке) - до 11,7 слов/с или 80 бит/с. Большинство исследователей соглашаются, что хотя Rin для чтения может достигать 45 бит/с, возможности визуального
восприятия человека в длительном периоде скорее соответствуют лишь 8 бит/с [4].
Скорость может быть увеличена до определённой степени посредством использования многомерных сигналов вместо простых одномерных, - например, тон и громкость вместо просто громкости, или же размер, яркость и цвет вместо лишь одного изменяемого визуального стимула, но эффект не является аддитивным. Известно, что ещё одним фактором, повышающим скорость, является тренировка, которая позволяет опытным операторам воспринимать целевую информацию на более высоком уровне, имея возможность обрабатывать меньшее количество единиц информации. Например, в то время как пилотам-новичкам приходится проверять каждое из показаний приборов в отдельности, опытным требуется лишь общий взгляд на приборную панель, чтобы понять, всё ли в порядке с объектом управления (летательным аппаратом).
Это отчасти связано с тем, что оператор в системах управления может обрабатывать информацию без выраженного задействования памяти или выступать как «канал с памятью», что неизбежно для многих типов задач, - например, отмеченного выше внимательного чтения с пониманием, в ходе которого в оперативной (рабочей) памяти может удерживаться около 160 бит информации [2, т. 7]. Соответственно, общая пропускная способность в основном зависит от особенностей извлечения информации из памяти и во втором случае она обычно составляет в районе 2-4 бит/с, т.е. на порядок ниже, чем в первом [2, с. 34], [3]. Приведённый в [4, с. 201-206] сравнительный анализ значительного количества работ, исследовавших работу кратковременной памяти, свидетельствует, что в большинстве исследований скорость обработки оказывалась равной 3-5 ед./с (не бит, а именно разнородных единиц, в том числе фигур).
В хорошо известной с 1980-х гг. модели человека как обработчика информации [11] (см. рис. 1) работа когнитивной подсистемы, включающей оперативную память, долговременную память и когнитивный процессор, является наиболее сложной, и по сей день привлекает внимание исследователей. Для органов чувств давно известна экспериментальная статистика, для мо-
торной системы широко признанной моделью является закон Фиттса, но для когнитивного процессора существуют лишь примерные оценки, что цикл его работы занимает 25-170 мс [11]. При этом остаётся неясным, как определять количество таких циклов, в каких случаях и как идёт обмен информацией с памятью, как он различается для различных групп пользователей и контекстов использования, и т.п.
Сенсорные
Рис. 1. Основные компоненты модели человека как обработчика информации
Выше было отмечено, что в современных графических интерфейсах основным каналом получения информации является визуальный, а основной тип взаимодействия - выбор графических элементов на мониторе мышью или пальцами на сенсорном экране. При этом основным инструментом пользователя или оператора является рабочая память, в частности её зрительно-пространственный компонент. Известно, что объем рабочей памяти и скорость восприятия объектов, отражая способности временного хранения и манипуляций с информацией для организации целенаправленного действия, представляют важные компоненты интеллекта, который в свою очередь рассматрива-
ется как психометрический показатель успешности адаптации человека [13]. Оценка потенциального диапазона ресурсов рабочей памяти, одним из важных компонентов которой является контур обработки зрительно-пространственной информации [6], важна для эффективной операторской деятельности в условиях нарастающей информационной емкости в задачах управления.
Понятия «рабочая память» и «кратковременная память» до сих пор не получили ясных критериев разграничения, так как и функциональное значение, и временной диапазон сохранения информации существенно зависят от ее характера и способа обработки. В связи с этим предлагается рассматривать емкость рабочей памяти как динамический процесс с учетом типа предъявленного при тестировании материала, способа его организации, контекста и сложности когнитивной нагрузки [21, 30]. Кратковременная память обычно противопоставляется долговременной, объем и время сохранения информации в которой не имеет пределов. Рабочая память представляет структуры и процессы для манипуляций с информацией и ее трансформации в долговременную память [14]. Однако, на наш взгляд, такое определение в большей степени отражает функции кратковременной памяти, тогда как рабочая или оперативная память выполняет функции организации и исполнительного контроля поведения, в том числе формирования ответа при решении поставленной проблемы.
Хорошо известно, что объем кратковременной памяти при последовательном предъявлении информации (букв, цифр, слов, образов) составляет 7±2 усл. ед. [1]. Имеется, однако, другая точка зрения с ограничением емкости памяти до 3-4 ед. [15, 16]. Это заключение сделано на основе результатов серий экспериментов, требующих при тестировании опознать целевые зрительно предъявленные объекты, имеющие различия в цвете, форме и пространственном расположении; причем стимулы предъявлялись достаточно короткое время, исключающее возможность повторения или какого либо структурирования информации. В таком случае оказывается, что в рабочей памяти может сохраняться только до четырёх элементарных признаков информации.
Сопоставление приведенных данных указывает на перспективность изучения параметров предъявления аллоцентрической информации для оптимизации зрительно-пространственных процессов ее обработки с учетом индивидуально комфортных или предельно возможных временных параметров безошибочных действий в системе человек-компьютер.
Таким образом, наша статья посвящена исследованию факторов, влияющих на эффективность выполнения человеком задач, задействующих зрительно-пространственную память, которые характерны при практическом взаимодействии с графическими интерфейсами. В разделе 2 мы проводим обзор существующих подходов и уточняем проблему, рассматриваемую в нашей статье, а также предлагаем методы для определения пропускной способности человека-оператора и описываем экспериментальное исследование, проведённое с 88 участниками. Раздел 3 посвящён анализу полученных экспериментальных данных, в нём приводится итоговая формулировка индекса сложности для использованной задачи зрительно-пространственной памяти и вычисляется пропускная способность. В Заключении мы перечисляем основные результаты, полученные в ходе исследования, а также вкратце обсуждаем его ограничения и дальнейшие перспективы.
2. Проблема определения количества воспринимаемой информации
2.1. ЗАКОНХИКА-ХАЙМАНА
Вероятно, наиболее очевидным подходом к количественному измерению воспринимаемой человеком-оператором информации явилось бы вычисление информационной энтропии. У. Хик, будучи одним из первых, кто применил положения теории информации К. Шеннона в когнитивной психологии, предложил выражение для времени реакции человека (ЯТ) в зависимости от количества рассматриваемых альтернатив (1) КГ ~ Ъ ■ \0%2(ЫН +1),
где коэффициент Ь - время для обработки одного бита информации (около 0,15 с). Таким образом, 1/Ь - это скорость перера-
ботки информации, которая считается равной около 6,7 бит/с, но может значительно варьировать в зависимости от характеристик конкретного человека, типа и интенсивности стимулов, обстановки и т.п. [24]. Конечно же, (1) является частным случаем (для равновероятных альтернатив) более фундаментального линейного соотношения между RT и энтропией набора стимулов (HT), которое было несколько позднее предложено Р. Хайманом: (2) КГ = ан + Ън ■ Нт ,
где aH и Ьи - константы, определяемые эмпирическим путём. Принципиальная применимость подхода, основанного на расчёте и минимизации количества обрабатываемой информации, впрочем, была продемонстрирована для некоторых элементов графических интерфейсов - например, выбора из особым образом организованных меню [22]. Были также получены расширенные модели для некоторых задач, возникающих в ходе взаимодействия в системе человек-компьютер, например, для визуального поиска [7, 12], причём в обоих исследованиях в модель вводился как собственно показатель сложности поиска, так и фактор, отражающий опыт пользователя. Некоторые из популярных рекомендаций в сфере проектирования человеко-машинного взаимодействия и удобства использования (юзаби-лити) также, фактически, вытекают из принципа минимизации энтропии: группировка элементов интерфейса и расположение их «по сетке», важность стандартизации и согласованности проектных решений, эстетичность минимализма и т.п.
Тем не менее, остаётся в общем случае неясным, как именно вычислять Hт на практике, и это признаётся самой существенной проблемой, препятствующей широкому применению закона Хика-Хаймана (2) в сфере человеко-машинного взаимодействия [29]. Нам представляется, что чисто аналитический метод, соответствующий классической шенноновской теории информации, не является адекватным для моделирования восприятия и запоминания человеком сложных графических объектов. Соответственно, для описания работы зрительно-пространственной памяти мы предлагаем рассмотреть объеди-
няющий подход с применением принципов гештальт-психологии.
2.2. ГЕШТАЛЬТ-ПРИНЦИПЫ ВОСПРИЯТИЯ
Гештальт-психология - школа, зародившаяся в начале прошлого века в Германии из исследований процессов восприятия (прежде всего визуального) и способности человека организовывать отдельные элементы в целое, отличающееся от суммы частей. Подробный обзор истории развития этой школы, её основных положений и «заката» в 1960-х годах дан в [32], причём отмечается, что в последние 20 лет интерес к гештальт-подходу заметно вырос - на наш взгляд, это связано с усложнением человеко-машинного взаимодействия в ходе масштабной информатизации, развитием технологий компьютерного зрения и пр. Перечень гештальт-принципов восприятия является не совсем организованным (критики даже обвиняли представителей этой школы, что они на каждый обнаруженный новый фактор, влияющий на восприятие, придумывают новый принцип), но кратко его можно изложить следующим образом [32]:
• «близость»: расположенные рядом или в едином регионе (например, внутри рамки) объекты воспринимаются как единая группа;
• «схожесть»: объекты, совпадающие по цвету, размеру, поведению (например, направлению или скорости движения) и т.п. воспринимаются как единая группа;
• «хорошая фигура» и «дополнение»: объекты подразделяются на группы так, чтобы образовывать более простые и привычные фигуры (например, крест воспринимается как два пересекающихся прямых отрезка, а не как два соприкасающихся прямых угла; отдельные точки и штрихи воспринимаются как прерывистое начертание буквы);
• гештальт-принципы, относящиеся к фону (переднему и заднему плану).
Последователи гештальт-школы утверждали, что эти принципы объясняются свойством человеческого сознания: поиском закономерностей, шаблонов, правил, - однако единой формаль-
ной теории, объединяющей принципы, разработано не было. Это давало основание критикам говорить о чисто описательном характере гештальт-подхода, слабой его применимости для понимания механизмов когнитивных процессов.
Центральное положение в обосновании гештальт-принципов занимало общее правило «Prägnanz» («простота»), которое гласит, что человек организует воспринимаемое так, чтобы оно было регулярным, упорядоченным, симметричным и простым. Уже позднее был предпринят ряд попыток подведения теоретического базиса под понятие «простоты» и его квантифи-кации (например, в [33] описаны четыре подхода, а в [32] - подход на основе теории информации Шеннона). Мы полагаем, что концепции простоты/сложности или «экономии нейронных ресурсов» человека (см. в [33]) действительно являются адекватным базисом, поскольку группировка воспринимаемых объектов уменьшает энтропию (хаос, неопределенность) и мозг имеет возможность воспринимать и обрабатывать меньшее количество информации. Таким образом, общая сущность гештальт-принципов - это уменьшение количества информационных единиц (способность, приобретенная человеком в ходе эволюции и личного опыта) для более эффективной обработки поступающих сигналов.
Как мы уже отмечали, шенноновское (вероятностное) определение количества информации, по сути, основанное на «суммировании» общего из неорганизованных элементов, не совсем пригодно для применения в сфере человеко-машинного взаимодействия. Альтернативами выступают теория алгоритмической (информационной) сложности Колмогорова и схожая с ней «теория структурной информации» в психологии [33], которая подходит к проблеме квантификации сложности в восприятии через описательную сложность конкретных объектов. При определении такой информационной сложности для графического интерфейса необходимо, безусловно, учитывать и принципы обработки информации человеком, на чём мы остановимся чуть далее.
Среди основных гештальт-принципов, оказывающих влияние на рабочую память при визуальном восприятии, называют
«связность», «схожесть» и «близость» [26]. Если привести данные понятия к визуальной сложности графического интерфейса, то можно использовать следующие аналогии:
• «связность» соответствует количественной характеристике воспринимаемых объектов (№), насколько они могут обрабатываться индивидуально или группой;
• «схожесть» соответствует характеристике гетерогенности объектов, размеру «словаря» элементов интерфейса (К);
• «близость» соответствует характеристике масштаба интерфейса (50), возможной распределенности объектов по области визуального восприятия.
При этом известно, что гештальт-принципы не равны по силе влияния на восприятие, и пока не разработано убедительной структуры, описывающей значение отдельных принципов и их сочетаний [17, 20, 26] (например, в каких случаях объекты разного цвета на двумерном поле будут группироваться по признаку близости, а в каких - схожести). Соответственно, конкретная форма показателя сложности (3), сформированного на основе трёх перечисленных выше факторов, по-видимому, должна определяться в зависимости от особенностей конкретной задачи по восприятию и обработке информации: (3) ЮМ = / (К, К, 50)
Существует значительное количество свидетельств, что процесс обработки информации у человека реализован на базе двоичного поиска (дихотомий), что подтверждается, в частности, двоичным логарифмом как функцией зависимости времени реакции от количества альтернатив в законе Хика-Хаймана (1). Действительно, предлагая итоговую форму своей модели, Хик заметил, что она соответствует количеству шагов в иерархической последовательности решений о бинарной классификации, ведущей к верному выбору [27].
Предположим, что для задач по зрительно-пространственном восприятию (запоминанию и визуальному поиску объектов) можно выделить два компонента: информационный и пространственный. Первый из них соответствует объему информации в «сообщении», удерживаемом в памяти, а вто-
рой - пространственному расположению элементов этого сообщения. В одном из наших прошлых исследований [8] результативность выполнения задач по поиску и выбору объектов на двумерном поле (выраженная затратами времени) лучше всего объяснялась индексом сложности выбора, включающим в себя количество объектов и двоичный логарифм размера словаря объектов. При этом влияние размера поля восприятия в совокупности с двумя другими факторами также было значимым, однако остался открытым вопрос о порядке взаимодействия этих двух компонентов, которое, по-видимому, зависит от особенностей задачи - т.е. где именно ищутся альтернативы: а) в запомненной информации или б) среди пространственных позиций. Случаю а) соответствует, например, эксперимент [34], где эффективность выполнения задания зависела от логарифма количества хранимых в памяти фотографий друзей. Для случая б) можно выдвинуть гипотезу, что результативность будет зависеть от двоичного логарифма размера области восприятия, но линейно - от количества соотносимой с ней информации, хранимой в памяти, т.е. ^■log (К).
Необходимо заметить, что проверить обоснованность предложенной формулировки показателя сложности напрямую затруднительно (неясно, с чем сравнивать полученное значение сложности задания, равное, например, 50 битам). Однако мы могли бы опираться на хорошо известные показатели скорости обработки информации человеком, рассмотренные в разделе 1. Для связи сложности и эффективности (скорости) выполнения задач обратимся к такой хорошо зарекомендовавшей себя фундаментальной модели в человеко-машинном взаимодействии как закон Фиттса.
2.3. ЗАКОН ФИТТСА И ПРОПУСКНАЯ СПОСОБНОСТЬ
МОТОРНОЙ СИСТЕМЫ ЧЕЛОВЕКА
Закон Фиттса фактически проводит аналогию между выполнением человеком быстрых прицельных движения и передачей информации в электронной системе и базируется на 17-й теореме Шеннона (также называемой теоремой Шеннона-
Хартли), постулирующей, что ёмкость канала С равна разнице между энтропиями сигнала и шума:
(4) с = и5 -ям = в 1се2((^ + рм)/рм) = в /Рм +1),
где С - ёмкость канала, означающая теоретическую верхнюю границу скорости передачи данных (бит в секунду); И - энтропия сигнала; И^ - энтропия шума; В - полоса пропускания канала (в герцах); Р$ - мощность сигнала (в ваттах); Ры - мощность белого гауссовского шума (в ваттах).
Фиттс предложил измерять сложность совершаемого человеком движения в битах, а сам человек (точнее, его нервная система), таким образом, выступает аналогом канала, выполняющего передачу данных. Далее, он предположил, что мощность сигнала аналогична расстоянию, на которое производится движение (А), а мощность шума - допустимому отклонению или размеру региона (Ж), в пределах которого движение должно быть завершено. Исходя из этого он задал индекс сложности (Ю) движения, для которого позднее была обоснована [31] предпочтительная формулировка в следующем виде:
(5) Ю = 1о&((А + Ж) / Ж) = 1о^(А /Ж +1) .
По аналогии с ёмкостью канала, передающего электронный сигнал, Фиттс стремился получить возможность вычисления «ёмкости» двигательной системы человека и в качестве её показателя ввёл индекс производительности (1Р), равный отношению индекса сложности движения ко времени, затраченному на его выполнение (МТ):
(6) 1Р = Ю / МТ.
Нетрудно заметить, что выражение (6) аналогично (4), причем 1Р соответствует С, а МТ - величина, обратная В. В экспериментальных исследованиях А и Ж выступают в качестве независимых переменных, а МТ является зависимой. Тогда возможно построение зависимости МТ от Ю при помощи регрессии, где а и Ь - регрессионные коэффициенты:
(7) МТ = а + Ь ■ Ю = а + Ь1о^(А/Ж +1) .
На практике коэффициенты детерминации (Я ), получаемые для регрессий (7), как правило, превышают 0,9, причем применимость закона Фиттса была продемонстрирована в широком
диапазоне условий, и он является общепризнанной и широко используемой моделью в сфере человеко-машинного взаимодействия [29]. Индекс производительности (6), введенный Фит-тсом, в настоящее время чаще называют пропускной способностью (англ. throughput) и обозначают как TP.
Важным добавлением в модель стал учёт фактора «эффективного» размера цели (We), так как очевидно, что время, затрачиваемое на движение, не должно рассматриваться в отрыве от точности его выполнения. «Эффективный» размер определяется из фактического распределения конечных точек движения так, чтобы в его область попадало 96% из них: теорема Шеннона-Хартли имеет предпосылкой то, что шум является белым гаус-совским, следовательно отклонения от цели движения должны быть распределены нормально (подробнее вывод We представлен, например, в [31]). В отличие от «номинального» ID, который показывает сложность «запланированного» движения, «эффективный» индекс сложности (IDe), полученный на основе подстановки We в (5), соответствует реальному выполнению заданий:
где Ae - фактическая («эффективная») дистанция между точкой начала и окончания движения. Соответственно, именно Юе рекомендуется использовать при регрессионном анализе данных экспериментов, изучающих закон Фиттса, и при вычислении пропускной способности моторной системы для участников. Как правило, TP рассчитывается как усредненная пропускная способность каждого из 5 участников, которая, в свою очередь, вычисляется как среднее значение отношения Юе к МТ, для каждого из М возможных сочетаний значений независимых переменных (А и 1¥) в эксперименте:
Рассчитанная с использованием эффективного индекса сложности пропускная способность является объективной мерой для заданных условий эксперимента, учитывающей как
(8) MT = d+b'-ID = a'+b' log 2 (A / W + !),
скорость, так и точность выполнения движений участниками. Следует отметить, что при изучении механизмов памяти показатели точности воспроизведения и времени реакции рассматриваются как наиболее информативные, причём рекомендуется их использование именно в комплексе, во избежание искаженной интерпретации исследуемых явлений [19]. Было даже продемонстрировано, что отсутствие учёта времени выполнения приводит к неверному пониманию изучаемых когнитивных процессов [28]. С другой стороны, характеристики нагрузки памяти и итоговая результативность выполнения задания зависимы от его сложности, включающей как информационные, так и временные переменные [23].
Соответственно, для применения аналогичного закону Фит-тса аппарата с целью определения сложности задач для зрительно-пространственной памяти и пропускной способности оператора как «канала с памятью», нам необходимо: 1) сформулировать индекс сложности для таких задач и проверить обоснованность формулировки и 2) выбрать способ определения результативности выполнения задачи участником и также оценить его обоснованность. Для достижения поставленных целей мы провели экспериментальное исследование и проанализировали полученные в ходе него данные.
2.4. ОПИСАНИЕ ЭКСПЕРИМЕНТАЛЬНОГО
ИССЛЕДОВАНИЯ
Экспериментальное задание заключалось в запоминании пространственного распределения одинаковых по содержанию стимулов (окрашенных клеток, расположенных на двумерном поле в случайном режиме) и воспроизведения этого набора. При случайном пространственном распределении объектов они могут формировать фигуры, которые воспринимаются в соответствии с гештальт-принципами как интегральные гностические единицы: буквы, геометрические фигуры и т.д. Известно, что группировка элементов предъявленной информации повышает результативность рабочей памяти [17, 20, 26].
Из теории клеточных автоматов, в анализе сложности которых используются как шенноновская, так и колмогоровская ме-
ры информации [35], известно два типа окрестностей («близости») - фон Неймана и Мура. В нашем экспериментальном исследовании мы будем определять количество информационных элементов тремя разными способами:
1) как простое количество «элементарных» объектов;
2) как количество фигур, определяемое по правилу окрестности фон Неймана 1-го порядка (элементы, соприкасающиеся диагоналями, не являются одной фигурой);
3) как количество фигур, определяемое по правилу окрестности Мура 1 -го порядка (элементы, соприкасающиеся диагоналями, являются одной фигурой).
Таким образом, основные задачи эксперимента включают в себя:
1. Проверку концептуальной валидности подхода и собранных данных.
2. Выбор предпочтительного способа определения информационной единицы при запоминании: «элементарные» объекты, фигуры по правилу фон Неймана или фигуры по правилу Мура. Для этого мы проанализируем связь их количества (И*) с результативностью запоминания и соответствие числу Миллера (7±2 информационные единицы, эффективно удерживаемые в рабочей памяти). Выбор такого критерия обусловлен использованием в нашем эксперименте однотипных стимулов, эффективность запоминания которых определялась только точностью их пространственного расположения (окрашенных квадратов на белом поле), отмеченного при тестировании.
3. Формулировка индекса сложности задач для зрительно-пространственной памяти (ЮМ*) и проверка её обоснованности. Исходя из изложенных ранее соображений, следующих из гештальт-принципов и обработки информации на базе двоичного поиска, можно предположить:
(10) ЮМ* = N * ■ 1о§2 £0 ■ 1о& К,
где £0 - характеристика размера двумерного поля (соответствует «длине сообщения» в теории информации), К - характеристика гетерогенности (размер словаря) запоминаемых объектов. Помимо теоретического обоснования, критерием удачности фор-
мулировки индекса сложности будет являться величина значения В2 в уравнении регрессии, соответствующем (7).
4. Предложение способа определения результативности выполнения задания и проверка его обоснованности. Как мы отмечали выше, в рамках определения пропускной способности человека-оператора необходим учёт как точности воспроизведения предъявленного для запоминания материала, так и фактического времени выполнения задания. Критерием обоснованности будет являться сила связи предложенного показателя с индексом сложности задания.
5. Вычисление пропускной способности человека-оператора как «канала с памятью» и сравнение полученных значений с аналогичными, известными из литературы.
В экспериментальном исследовании, проведённом в течение одной недели, приняли участие 88 студентов (из них 26 мужчин) бакалавриата и магистратуры Новосибирского государственного технического университета в возрасте от 16 до 22 лет (средний возраст 19,4 лет; среднеквадратическое отклонение - СКО - 1,1). Все участники имели нормальное или скорректированное до нормального зрение и опыт в использовании компьютерных технологий и компьютерной мыши. Все они принимали участие добровольно и использовали оборудование и системное ПО компьютерных классов университета, аналогичное по своему составу и параметрам (в частности, размер монитора и разрешение экрана).
Для проведения эксперимента использовалось специально разработанное программное обеспечение, реализованное на веб-платформе (размещено для авторизованного доступа по адресу http://psytest.nstu.ru/tests/23/). Участнику демонстрировалось двумерное поле, разделённое на клетки, некоторое количество которых, расположенных случайным образом, было окрашено синим цветом (рис. 2). Известно, что для сохранения информации в кратковременной памяти имеет значение не только объем и структура предъявляемой информации, но и временные параметры ее переработки: например, возможности трансформации с учетом имеющихся ресурсов и/или повторения [10]. Чтобы не вносить в эксперимент дополнительный фактор, стимулы
предъявлялись в течение фиксированного времени (2 с) вне зависимости от сложности задания, после чего участник должен был указателем мыши кликнуть на те места, где находились закрашенные клетки. Правильно отмеченные клетки окрашивались зеленым цветом, неправильные - красным, и в этом случае выбор считался ошибочным (рис. 3).
Рис. 2. Экран с предъявляемыми стимулами (3 фигуры по правилу фон Неймана или 1 фигура по правилу Мура)
Рис. 3. Экран с завершением исхода (тренировочное задание на поле 4 х 4 было выполнено с ошибкой, показано верное расположение фигур)
В случае ошибочного выбора, участнику предлагалось ещё раз выполнить задание с тем же количеством закрашенных клеток (снова расположенных случайным образом), однако общее количество таких дополнительных попыток на сессию было ограничено. В случае верного выбора всех клеток участник переходил к следующему набору стимулов, в котором количество закрашенных клеток увеличивалось на 1. Сессия завершалась, когда количество закрашенных клеток достигало установленного максимума или количество попыток обнулялось из-за частых ошибочных выборов. В ходе нашего эксперимента каждый участник должен был выполнить 5 сессий с различными размерами двумерного поля.
Программное обеспечение, разработанное для проведения эксперимента, фиксировало для каждого исхода:
1) независимые переменные:
• размер квадратного поля (£0) - в эксперименте использовались размеры полей, равные 25 (5 х 5) и 36 (6 х 6) клеток;
• количество закрашенных клеток ($р) варьировалось от 3 до 13 (соответствует количеству информационных единиц на базе элементарных объектов);
• количество получившихся из клеток «фигур» согласно правилу окрестности фон Неймана 1-го порядка
• количество фигур согласно правилу окрестности Мура 1-го порядка ^М);
2) зависимые переменные:
• количество верно выбранных клеток (5с);
• время, затраченное на выполнение задачи (ТМ), т.е. не включающее в себя 2 с, в течение которых производилась демонстрация закрашенных клеток в начале исхода.
Для каждого исхода нами вычислялся уровень ошибки (Ем), поскольку для характеристики работы зрительно-пространственной памяти точность запоминания традиционно считается является наиболее важным показателем:
(11) ЕА
1 _ ^
Отметим также, что в данном эксперименте размер словаря для запоминаемых элементов не варьировался и равнялся 2 (закрашена клетка или нет), т.е. log2 К = 1.
3. Анализ данных и результаты
3.1. ВАЛИДНОСТЬ ДАННЫХ И ОПИСАТЕЛЬНАЯ СТАТИСТИКА
В общей сложности нами было получено 5243 набора данных, из которых количество валидных исходов составило 4654 (88,77 %). Были исключены ошибочные данные и выбросы, когда итоговое время превышало стандартный срок нахождения информации в рабочей памяти (Тм > 14 с), когда выполнение задания фактически не производилось (Тм < 0 с), или же когда слишком большая ошибка при выборе свидетельствовала о недобросовестном подходе участника (Ем > 0,75).
В таблице 1 приведены диапазоны изменений, средние значения и среднеквадратичные отклонения для основных зависимых и независимых переменных в эксперименте.
Таблица 1. Описательная статистика для основных переменных в эксперименте
Переменная Диапазон Среднее (СКО)
& 3-13 7,36 (2,03)
Ем 1-10 4,55 (1,42)
Ем 1-8 3,2 (1,19)
Ем 0-0,75 0,079 (0,14)
Тм 1-14 с 6,01 (2,22)
Корреляция между зависимыми переменными (ЕМ и ТМ) оказалась значимой и положительной (г = 0,143; р < 0,001), что объяснимо, поскольку более трудные задания, в которых возникали ошибки, требовали и больше времени на выполнение. Кроме того, это может свидетельствовать о том, что дополнительные затраты времени не увеличивали шансы успешного извлечения информации из рабочей памяти (скорее наоборот, учитывая ограниченный срок хранения информации вследствие освобождения памяти для новых операций с информацией).
Корреляция ТМ с БР составила г = 0,403 (р < 0,001), Тм с ^ - г = 0,233 (р < 0,001), Тм с ¥м - г = 0,078 (р < 0,001). Наиболее тесная взаимосвязь времени с количеством закрашенных клеток была ожидаема, поскольку в ходе выполнения задания участник должен был выполнить клик мышью на каждой из запомненных клеток, т.е. чем больше стимулов предъявлялось, тем больше времени требовалось для воспроизведения информации.
Корреляция Ем с БР составила г = 0,238 (р < 0,001), Ем с - г = 0,336 (р < 0,001), Ем с - г = 0,240 (р < 0,001). Таким образом, самая тесная взаимосвязь с уровнем ошибок была обнаружена не для количества закрашенных клеток, а для количества фигур, определяемых по правилу окрестности фон Неймана. Корреляция Ем с общим размером поля (£0) также была значимой, хотя и более слабой: г = 0,179 (р < 0,001).
Далее мы приводим диаграммы, отображающие средние значения Ем в зависимости от значений независимых переменных, соответствующих количеству информационных единиц N : (рис. 4), FN (рис. 5) и ¥м (рис. 6). Средние ошибки для крайних правых значений не приводятся, так как исходов с максимальным количеством закрашенных клеток и фигур было слишком мало для статистических выводов. Из диаграмм можно заметить, что числу Миллера 7±2 соответствует FN в большей степени, чем (про Fм выводы сделать затруднительно вследствие диапазона принимаемых значений).
0,3 0,25
Е °,2
0,15
<и а
и 0,1 0,05 0
I
I
I I I
8
Бр
10
11
12
Рис. 4. Средний уровень ошибок EM по значениям Sp
0,45 0,4 0,35 Е 0,3
ш
<и 0,25 <и '
0,2 и 0,15 0,1 0,05 0
5
Рп
Рис. 5. Средний уровень ошибок EM по значениям FN
5
6
7
9
1
2
3
4
6
7
8
9
0,45 0,4 0,35 Е 0,3 8 0,25
«I 0,2 т 1
<и '
и 0,15
0,1 I
0,05 I 1 1 0
1 2 3 4 5 6 7 Рт
Рис. 6. Средний уровень ошибок EM по значениям FM
3.2. ИНДЕКС СЛОЖНОСТИ ДЛЯ ЗРИТЕЛЬНО-ПРОСТРАНСТВЕННОЙ ПАМЯТИ
Исходя из (10) и в соответствии с целями эксперимента, зададим три возможных формулировки индекса сложности (как мы отмечали ранее, в данном исследовании мы не рассматриваем влияние К):
(12) ЮЫ8Р = БР ■ 1св2 ¿0 ,
(13) ЮМШ=ЕЫ • 1св2 ¿о,
(14) ЮМш=¥м ■ 1сВ2 ¿о •
В таблице 2 для каждого из индексов приведен диапазон значений, среднее, среднеквадратичное отклонение и корреляция с Ем и Тм. Можно заметить, что наибольшее значение корреляции с уровнем ошибок при выборе запомненных клеток отмечается для ЮМШ.
Таблица 2. Характеристики для индексов сложности
Индекс Диапазон Среднее (СКО) Корр. с Ем Корр. с Тм
ЮМ8Р 13,9-67,2 36,2 г = 0,265 г = 0,386
(10,44) р < 0,001 р < 0,001
ЮМЕМ 4,0-51,7 22,48 г = 0,345 г = 0,216
(7,57) р < 0,001 р < 0,001
ЮМем 4,0-41,4 15,86 г = 0,252 г = 0,074
(6,29) р < 0,001 р < 0,001
Для проведения регрессионного анализа мы предварительно вычислили средние значения Ем для каждого из значений, индексов, определённых согласно (12), (13) и (14). В итоге регрессионные уравнения приняли следующий вид:
(15) Ем = -0,038 + 0,003 • ЮМ5Р , Я2 = 0,694; Е^ = 45,3;р < 0,001,
(16) Ем = -0,065 + 0,007 • ЮМШ , Я2 = 0,895; Е^ = 170;р < 0,001,
(17) Ем = -0,04 + 0,007 • ЮМШ , Я2 = 0,815; Еш = 74,7;р < 0,001. Наилучшее значение Я2 было получено в регрессионной
модели (16), однако оно содержит наибольший по модулю отрицательный свободный член, содержательный смысл которого труднообъясним.
У регрессионной модели, построенной для средних значений времени выполнения задачи (без учёта 47 исходов, где участники делали паузу неопределённой продолжительности между сессиями) и ЮМШ, коэффициент Я2 оказался существенно ниже, чем в (16) для Ем:
(18) Тм = 6,5 + 0,058 • ЮМШ , Я2 = 0,488; Еио = 19,1; р < 0,001.
То, что Тм в меньшей степени, чем Ем объясняется фактором сложности задания по запоминанию, ожидаемо, так как этот показатель отражает не только объем кратковременной памяти, но и навыки владения мышью, которая использовалась для выбора нужных пространственных меток.
3.3. «ЭФФЕКТИВНОЕ» ВРЕМЯ И ПРОПУСКНАЯ СПОСОБНОСТЬ
Как мы отмечали ранее при описании модели Фиттса, для определения пропускной способности (учитывающей как скорость, так и точность выполнения задания), использовался «эффективный» индекс сложности [31], соответствующий реальному заданию, выполненному участником. Для нашей формулировки ЮМ (10) «эффективные» компоненты будут следующими:
• N е - количество информационных единиц, правильно запомненных и воспроизведённых участником (может быть получено как произведение номинального, т.е. предъявленного количества информационных единиц на точность выполнения задания);
• Ке - гетерогенность объектов, предъявленных в конкретном исходе (в нашем эксперименте оно не отличается от номинального);
• £0е - размер участка поля, который реально рассматривался при воспроизведении положения запомненных элементов (распределённости элементов по полю и, предположительно, хаотичности их расположения, что мы не будем учитывать в данном исследовании, используя номинальное значение 80).
Тогда для нашего эксперимента эффективный индекс сложности, определённый на основе (13), примет вид:
(19) ЮМеш=Г„ • (1 - Ем ) • 1сВ2 ¿о •
Рассчитанный согласно (19) по данным нашего эксперимента ЮМШ оказался в диапазоне от 3,45 до 46,53 бит (среднее 20,35; СКО = 6,74).
Используя формулировку (19) и учитывая соотношение номинального индекса сложности с ЮМШ, мы можем переписать формулу для пропускной способности (9) следующим образом:
ЮМ* ЮМт1 ЮМс
(20) ТРМ = = = —ш ,
ТМ ТМ (1 - ЕМ ) ТМ
где Тм - «эффективное» время, т.е. затраченное только на воспроизведение правильно запомненной информации. Среднее
значение рассчитанного согласно (20) «эффективного» времени в эксперименте (без учёта 47 исходов, где участники делали паузу неопределённой продолжительности между сессиями) составило 6,86 с (СКО = 3,34 с). Корреляция между ТЕм и Юмт составила г = 0,302 (р < 0,001), т.е. выше, чем корреляция между Тм и 1Вмем (г = 0,216, см. в таблице 2). Регрессионная модель для Гм и 1вмем (т.е. по смыслу аналогичная закону Фиттса) показала высокую значимость и коэффициент Я2 значительно выше, чем для Тм в (18), хотя и несколько ниже, чем для Ем в (16): (21) ТЕ = 3,8 + 0,132 • ЮМШ , Я2 = 0,884; Еио = 152; р < 0,001.
Значение ТРм в эксперименте, вычисленное по всем валидным исходам и усреднённое, оказалось равным 3,75 бит/с (СКО = 1,69 бит/с). Метод статистического дисперсионного анализа (ЛКОУЛ) показал, что ТРм , усреднённое по активным участникам, существенно различалось в зависимости от пола (Е1,86 = 3,87; р = 0,05; г^ = 0,0435), при этом среднее значение для участников-мужчин составило 3,9 бит/с, а для участников-женщин - 3,61 бит/с. Можно отметить, что все полученные значения для пропускной способности довольно хорошо согласуются с известной скоростью работы человека-оператора как «канала с памятью» (2-4 бит/с [4]) и пропускной способностью моторной системы человека при использовании мыши (3,7-4,9 бит/с [31]). Преимущество мужчин как в пространственной ориентации, так и в скорости моторной реакции также часто отмечается в различных исследованиях [9, 18]. При этом различие в точности между полами может отсутствовать [25] (в нашем эксперименте эффект фактора пола на уровень ошибки также не был значим: Е\$6 = 2,91; р = 0,09).
4. Заключение
Результаты анализа данных проведённого нами экспериментального исследования свидетельствуют, что объединение подходов на основе гештальт-принципов восприятия и информационной энтропии быть полезно для вычисления пропускной способности человека-оператора. В частности, регрессионные модели, построенные с использованием предложенной нами формулы индекса сложности задач для зрительно-пространственной памяти (13), показали высокое значение Я2. Результаты корреляционного анализа и сравнения с известным объемом рабочей памяти (7±2) также свидетельствуют о корректности полученных в ходе эксперимента данных.
Основной вклад данного исследования мы видим в следующем:
1. Показано, что информационными единицами при запоминании объектов, расположенных на двумерном поле (соответствующем графическому интерфейсу пользователя), могут быть не отдельные элементы, а составленные из них фигуры, определяемые по правилу окрестности фон Неймана 1 -го порядка.
2. В рамках предложенного подхода на основе гештальт-принципов и закона Фиттса разработана формулировка индекса сложности рассмотренных задач для зрительно-пространственной памяти:
(22) ЮМт = Еы • 1св2 К • 1св2 ¿о .
3. Предложен способ определения пропускной способности оператора (20), который может применяться для различных типов задач, возникающих при человеко-машинном взаимодействии в системах управления.
Следует отметить некоторые ограничения нашего исследования. Прежде всего, задание включало в себя стадию не только запоминания, но и воспроизведения (указания объектов мышью в ходе моторной деятельности), что фактически означает смешение этих двух задач. Молодые участники, имеющие большой опыт взаимодействия с компьютерной техникой, выполняли эту
стадию относительно быстро и без затруднений, однако для других категорий участников ситуация может быть иной - время выполнения заданий может превысить типичный срок хранения информации в рабочей памяти. Впрочем, в одном из наших предыдущих исследований мы установили, что пожилые люди воспроизводят след зрительной памяти даже быстрее, чем молодые, так как объем кратковременной памяти у них меньше из-за более выраженных процессов торможения [5]. Следует также заметить, что в ходе эксперимента от участников не требовалось «выполнять задание насколько возможно быстро», поэтому найденная в нашем эксперименте пропускная способность может не являться максимальной. С другой стороны, молодые студенты-участники в действительности стремились закончить эксперимент поскорее.
Примечательно также то, что более резкий рост ошибок начался со сложности менее 160 бит (объема, который удерживается в рабочей памяти при чтении, согласно [2, т. 7]), но следует иметь в виду, что текстовую, как и вообще семантическую информацию большинству участников проще удерживать в памяти, чем абстрактные фигуры и клетки. Кроме того, единицы, получаемые в результате взаимодействия информационной и пространственной компонент сложности (22) - «пространственные биты» - могут иметь иную природу, нежели биты теории информации. Это предположение представляется обоснованным на нейрофизиологическом уровне, поскольку обработка информации в зрительно-пространственной памяти осуществляется за счет двух разных систем мозга (вентральной и дорсальной), но требует дальнейшего исследования.
Наконец, в данном исследовании мы не варьировали словарь объектов, поэтому изучение его эффекта и оценку обоснованности формулировки индекса сложности согласно (22) мы планируем в дальнейшей работе. Кроме того, среди перспектив исследования мы видим изучение связи предложенного индекса сложности с колмогоровской (описательной) сложностью, а также спецификация его пространственного компонента на основе энтропии и информационной сложности клеточных автоматов.
Литература
1. АТКИНСОН Д. Когнитивная психология. - СПб.: Питер, 2002.
2. ГАСОВ В.М., СОЛОМОНОВ Л.А. Организация взаимодействия человека с техническими средствами АСУ (в 7 томах). - М.: Высшая школа, 1990.
3. ЛОМОВ Б.Ф. Справочник по инженерной психологии / под ред. Б.Ф. Ломова. - Москва, Машиностроение, 1982.
4. ПРИСНЯКОВ В.Ф., ПРИСНЯКОВА Л.М. Математическое моделирование переработки информации оператором человеко-машинных систем. - Москва, Машиностроение, 1990. - 248 с.
5. РАЗУМНИКОВА О.М., ВОЛЬФ Н.В. Реорганизация связи интеллекта с характеристиками внимания и памяти при старении // Журн. высш. нервн. деят. - 2017. - Т. 67, №1. -C.55-67.
6. BADDELEY A.D., LOGIE R.H. Working memory: The multiple-component model // In: A. Miyake & P. Shah (Eds.), Models of working memory. - Cambridge, UK: Cambridge University Press, 1990. - P. 28-61.
7. BAKAEV M., AVDEENKO T., CHENG H.I. Modelling selection tasks and assessing performance in web interaction // IADIS Int. J. Computer Science and Inf. Systems. - 2012. -Vol. 7(1). - P. 94-105.
8. BAKAEV M, AVDEENKO T. A quantitative measure for information transfer in human-machine control systems // Proc. of the International Siberian Conference Control and Communications (SIBC0N-2015), May 21-25, Omsk, Russia. - 2015 - P. 1-4.
9. BLOUGH P.M., SLAVIN L.K. Reaction time assessments of gender differences in visual-spatial performance // Percept Psy-chophys. - 1987. - Vol. 41. - P. 276-281.
10. CAMOS V., PORTRAT S. The impact of cognitive load on delayed recall // Psychonomic bulletin & review. - 2015. -Vol. 22(4). - P. 1029-1034.
11. CARD S.K., MORAN T.P., NEWELL A. The psychology of human-computer interaction. - Hillsdale, NJ: Erlbaum, 1983.
12. COCKBURN A., GUTWIN C., GREENBERG S. A predictive model of menu performance // Proc. of the SIGCHI Conference on Human Factors in Computing Systems, Apr 28-May 3, San Jose, California, USA. - 2007. - P. 627-636.
13. CONWAY A.R.A., COWAN N., BUNTING M.F., THER-RIAULT D.J., MINKOFF S.R.B. A latent variable analysis of working memory capacity, short-term memory capacity, processing speed, and general fluid intelligence // Intelligence. -2002. - Vol. 30(2). - P. 163-183.
14. COWAN N. What are the differences between long-term, short-term, and working memory? // Progress in Brain Research, 2008. - Vol. 169. - P. 323-338.
15. COWAN N. The Magical Mystery Four: How is Working Memory Capacity Limited, and Why? // Current Directions in Psychological Science. - 2010. - Vol. 19(1). - P. 51-57.
16. COWAN N. Working Memory Maturation: Can We Get at the Essence of Cognitive Growth // Perspectives on Psychological Science. - 2016. - Vol. 11(2). - P. 239-264.
17. GAO Z., GAO Q., TANG N., SHUI R., SHEN M. Organization principles in visual working memory: Evidence from sequential stimulus display // Cognition. - 2016. - Vol. 146. - P. 277-288.
18. HALPERN D.F. Sex differences in cognitive abilities (3rd. ed.). - Mahwah, N-Y, London: Lawrence Erlbaum Ass. Publ, 2000.
19. KAHANA M., LOFTUS G. Response Time versus Accuracy in Human Memory // In: The nature of cognition (ed. by R.J. Sternberg), 1999 - P. 323-384.
20. KALAMALA P., SADOWSKA A., ORDZINIAK W., CHUD-ERSKI A. Gestalt effects in visual working memory // Experimental Psychology. - 2017. - Vol. 64(1). - P. 5-13.
21. MACKEN B., TAYLOR J., JONES D. Limitless capacity: a dynamic object-oriented approach to short-term memory // Frontiers in Psychology. - 2015. - Vol. 6, Iss. 293. - P. 1-15.
22. LANDAUER T., NACHBAR D. Selection from alphabetic and numeric trees using a touch screen: Breadth, depth, and width // ACM SIGCHI Bulletin. - 1985. - Vol. 16(3). - P. 73-78.
23. LOGAN G.D. Short-Term Memory Demands of Reaction-Time Tasks That Differ in Complexity // J. of Experimental Psychology: Human Perception and Performance. - 1980. - Vol. 6(2). -P. 375-389.
24. LONGSTRETH L.E., EL-ZAHHAR N., ALCORN M. B. Exceptions to Hick's law: Explorations with a response duration measure // J. of Experimental Psychology: General. - 1985. - Vol. 114(4). - P. 417-434.
25. LORING-MEIER S., HALPERN D.F. Sex differences in visuospatial working memory: components of cognitive processing // Psychonomic Bulletin & Review, 1999. - Vol. 6(3). -P. 464-471.
26. PETERSON D.J., BERRYHILL M.E. The Gestalt principle of similarity benefits visual working memory // Psychonomic bulletin & review. - 2013. - Vol. 20.61. - P. 1282-1289.
27. PROCTOR R.W., SCHNEIDER D.W. Hick's Law for Choice Reaction Time: A Review // The Quarterly J. of Experimental Psychology. - 2017. - Vol. 24(1). - P. 1-56.
28. RATCLIFF R., STARNS J.J. Modeling confidence and response time in recognition memory // Psychological Review. -2009. - Vol. 116(1). - P. 59-83.
29. SEOW S. Information theoretic models of HCI: A comparison of the Hick-Hyman law and Fitts' law // J. of Human-Computer Interaction. - 2005. - Vol. 20(3). - P. 315-352.
30. SIMMERING V.R., PERONE S. Working Memory Capacity as a Dynamic Process // Frontiers in Psychology. - 2013. - Vol. 3, Iss. 567. - P. 1-26.
31. SOUKOREFF R.W., MACKENZIE I S. Towards a standard for pointing device evaluation, perspectives on 27 years of Fitts' law research // Int. J. of Human-Computer Studies. - 2004. -Vol. 61(6). - P. 751-789.
32. WAGEMANS J., ELDER J.H., KUBOVY M., PALMER SE., PETERSON M A., SINGH M., VON DER HEYDT R. A century of Gestalt psychology in visual perception: I. Perceptual grouping and figure-ground organization // Psychological Bulletin. - 2012. - Vol. 138(6). - P. 1172-1217.
33. WAGEMANS J., FELDMAN J., GEPSHTEIN S., KIMCHI R., POMERANTZ JR., VAN DER HELM P.A., VAN LEEU-WEN C. A century of Gestalt psychology in visual perception: II. Conceptual and theoretical foundations // Psychological Bulletin. - 2012. - Vol. 138(6). - P. 1218-1252.
34. WOLFE J.M. Saved by a log: How do human perform hybrid visual and memory search // Psychological Science. - 2012 -Vol. 23(7). - P. 698-703.
35. ZENIL H., VILLARREAL-ZAPATA E. Asymptotic behavior and ratios of complexity in cellular automata // Int. J. of Bifurcation and Chaos. - 2013. - Vol. 23.09. - P. 1350159.
DEFINING COMPLEXITY FOR VISUAL-SPATIAL MEMORY TASKS AND HUMAN OPERATOR'S THROUGHPUT
Maxim Bakaev, Cand.Sc., Novosibirsk State Technical University, Novosibirsk, Senior Researcher ([email protected]). Olga Razumnikova, Doctor of Science, Head Researcher, Scientific Research Institute of Physiology and Basic Medicine, Novosibirsk, Professor, Novosibirsk State Technical University, Novosibirsk, ([email protected]).
Abstract: In this paper we study effectiveness and efficiency of HCI tasks that involve visual-spatial memory. Based on the Fitts' law model that is widely used to model human motor reactions and inspired by Gestalt principles of human perception, we proposed formulation for index of difficulty for these tasks. The index includes the number of memorized information chunks, the size of vocabulary for the displayed objects (representing the diversity of elements), and the size of the working area, where the visual search and memorization are performed. We performed experiment with 88 subjects and the analysis of the collected data suggested that the information chunks were not elemental objects (squares), but figures composed based on range 1 von Neumann neighborhood known from cell automata. Based on the proposed index of visual-spatial memorization difficulty, we calculated throughput, which in our experiment was 3.75 bit/s (4.07 bit/s for male subjects and 3.61 bit/s for female ones).
Keywords: human-computer interaction, information complexity, cognitive psychology, gestalt principles, graphical user interface.
Статья представлена к публикации членом редакционной коллегии М.В. Губко.
Поступила в редакцию 31.07.2017.
Опубликована 30.11.2017.