Проблемы моделирования буквенного чтения и экспериментальное исследование: квадриграммы как открытые биграммы

Коршунов Дмитрий Сергеевич

2. Цейтлин, С.Н. U-shaped development при усвоении метод. конфер. преподавателей и аспирантов / отв. ред.

ребенком родного языка (анализ случаев мнимого регрес- В.Б. Касевич. - 1998. - Вып. 13. - С. 76 - 80.

са) / С.Н. Цейтлин // Материалы XXVII межвузов. науч.-

УДК 81.23

Д. С. Коршунов

ПРОБЛЕМЫ МОДЕЛИРОВАНИЯ БУКВЕННОГО ЧТЕНИЯ И ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ: КВАДРИГРАММЫ КАК ОТКРЫТЫЕ БИГРАММЫ

В статье в качестве одной из актуальных проблем моделирования буквенного чтения рассматривается несоответствие принятого в современных западных моделях чтения принципа орфографической кодировки ряду выявленных за последнее десятилетие психологических эффектов в чтении. Идея «открытых биграмм», во многом решающая эту проблему, не имеет какого-либо психолингвистического обоснования. На основе собственных экспериментов с носителями русского языка автор обнаруживает особый статус в чтении квадриграммы (четырехбуквенного сочетания), вводит графический фактор общей формы буквы и обосновывает возможность использования «открытых» биграмм и триграмм как способа группировки при моделировании реально воспринимаемых квадриграмм.

Буквенное чтение, модели чтения, орфографическая кодировка, открытые биграммы, открытые триграммы, эффект квадриграммы, графический фактор.

The article deals with a current problem of discrepancy between the principle of orthographic coding used in modem Western models of reading and some psychological effects in reading emerged within last decade. The concept of «open bigrams» while solving this problem still doesn’t have any psycholinguistic grounds. The author reveals a special status of reading a quadrigram (a four-letter string), based on the experiments with Russian speakers, introduces a new graphic factor of general letter shape and substantiates the possibility of using «open» bigrams and trigrams in modeling as a way of grouping really perceived quadrigrams.

Аlphabetic reading, models of reading, orthographic coding, open bigrams, open trigrams, quadrigram effect, graphic factor.

В отечественной науке чтение традиционно рассматривается с точки зрения психологии зрительного восприятия, нейробиологии и различных патологий, педагогики и психологии обучения. На наш взгляд, чтение как один из видов речевой деятельности может и должно рассматриваться также и в лингвистическом аспекте - в качестве одного из способов функционирования и одной из форм существования языка. Поскольку составляющие чтение процессы непосредственно не наблюдаемы, исследовать проблемы можно с помощью изучения моделей, которые являются традиционным способом познания таких процессов.

Современные компьютерные модели чтения ([8], [12] и др.) достаточно неплохо справляются с имитацией чтения односложных слов, некоторые рассчитаны даже на двусложные [5] и многосложные [6] слова. Однако общим слабым местом, по мнению Дж. Грейнджера и Й. Циглера [7, с. 1 - 2], остается слогово-структурная кодировка орфографической информации, требующая строгого соответствия букв и сложных графем (диграфов, триграфов) предусмотренным для них ячейкам (слотам) на позициях консонантного начала слога (onset), слогообразующего гласного (vowel) и возможного конечного согласного звука слога (coda). Такая кодировка не допускает вольностей с нумерацией позиций букв в слоге. Другими словами, не терпит пропусков букв и опечаток, хотя известно, что в реальном чтении подобные ошибки настолько несущественны для общего восприятия текста, что зачастую вообще не заме-

чаются читающими (включая иногда даже профессиональных корректоров). Такие особенности зрительного восприятия текста распадаются на несколько психологических эффектов чтения, обнаруженных и экспериментально подтвержденных в последнее десятилетие. Это, например, эффекты крайних букв, перемещенных букв, относительного положения и

др.

Эффект крайних букв (edge effect) заключается в том, что в задаче опознавания букв испытуемые значительно лучше называют первую и последнюю букву слова (псевдослова), чем любую другую [8]. В экспериментах с праймингом - краткосрочным предварительным предъявлением орфографически связанного стимула - испытуемые быстрее принимают лексическое решение, если прайм сохраняет обе внешние буквы целевого стимула, а не все внутренние.

Эффект перемещенных букв (transposed letter effect) зависит от длины слова. Для 5-буквенных слов прайминг-эффект сохраняется лишь при перемещении внутренних букв (например, point - POINT, пукнт - ПУНКТ), для 7-буквенных слов манипулируемая пара букв может находиться в том числе в начале или конце слова (например, service - esrvice -service - SERVICE, севрант - есрвант - серватн -СЕРВАНТ). Прайминг-эффект пропадает, если две перемещаемые буквы заменить какими-либо другими (sedlice - SERVICE, седлант - СЕРВАНТ) [9]. Соединение эффекта крайних букв и эффекта перемещенных букв с дополнительными факторами кон-

текста (например, нормами лексической, синтаксической, семантической сочетаемости) наглядно демонстрируется популярными в интернете текстами. Приведем пример такого типа текста:

По рзелульаттам илссеовадннн одонго анлигАсокго унвнертнсета, не неемт занчненя, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блын на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке. всё-рвано ткест чтаитсея без побрелм. Пнчрнонн эгото ялвятеся то, что мы не чнатем кдаужю бкуву по отдльенотсн. а всё солво цлнкеом. ____________________________________________xopoiiio.ni

Еще одним эффектом, нарушающим слоговый принцип кодировки букв в слове, является эффект относительного положения (relative position effect). Он заключается в том, что изменение абсолютного положения букв в слове путем удаления части букв или добавления новых по-прежнему позволяет воспринимать слово правильно. Применительно к экспериментам с праймингом положительный эффект сохраняется как для укороченных праймов (grdn -GARDEN, крнз - КАРНИЗ), так и для увеличенных (gamrdsen - GARDEN, камрнсиз - КАРНИЗ) [5].

Приведенные эффекты говорят о том, что модели чтения для буквенных языков должны проявлять определенную гибкость в отношении положения букв в слове и извлекать некоторую информацию из относительного порядка их следования. Из известных в литературе моделей лишь одна учитывает взаимный порядок букв с помощью системы триплетов - распределенная обучающаяся модель опознавания и чтения слов (Distributed, Developmental Model of Word Recognition and Naming), часто обозначаемая в литературе как SM89 [14]. Триплеты представляют собой последовательности из трех букв или пробелов, например, слову make соответствуют триплеты _ma, mak, ake и ke_. Однако такому способу кодировки не хватает гибкости: пропуск буквы или эффект крайних букв триплеты отразить не могут. Более гибкой оказывается система биграмм, причем так называемых «открытых биграмм» (open bigram -[6]). Открытые биграммы учитывают относительный порядок букв в слове независимо от смежности этих букв. Например, слово РУКА будет состоять из биграмм РУ, РК, РА, УК, УА, КА. Перемещение двух внутренних букв (ркуа) сохранит 5 исходных биграмм из 6, что обеспечивает высокую степень сходства пары рука - РУКА и объясняет эффект перемещенных букв. Частично биграммы позволяют объяснить эффект относительного положения, хотя эффект крайних букв учесть с помощью биграмм сложно.

В литературе также известны системы «открытых триграмм» (для предыдущего примера это были бы триграммы РУК, РУ_А, Р_КА, УКА) [10], упоминаются квадриграммы как частотные сочетания биграмм, соответствующие морфемам или коротким словам [4]. При всей оригинальности биграмм и триграмм из имеющейся литературы было не вполне очевидно, в какой степени используемые в этих тео-

риях языковые элементы лингвистически значимы и не представляют ли эти n-граммы собой лишь удобный программистский прием, позволяющий приблизить результат вычислений к необходимому.

Применение идеи открытых биграмм к моделированию чтения отражено в работе «Двусистемный подход к орфографической обработке» (A dual-route approach to orthographic processing, [7]). Авторы обращают внимание на очередную модификацию модели интерактивной активации [9]. На этот раз между уровнем букв и уровнем слов предполагается наличие двух параллельных каналов уровня биграмм (см. рис. 1). Один канал, характеризуемый как «грубая орфография» (coarse - grained orthography), состоит из открытых биграмм, комбинация которых призвана обеспечивать быструю узнаваемость, «ди-агностируемость» слова (diagnosticity) с помощью необязательно смежных, но лучше визуально опознаваемых букв. Второй канал - «тонкая орфография» (fine - grained orthography) - служит для группировки часто встречающихся сочетаний букв (сложных графем, морфем) в один объект обработки (chunking). Оба канала извлекают выгоду из частотных характеристик обрабатываемых объектов, но диаметрально противоположным способом. Для идентификации всего слова более полезными становятся редкие сочетания букв, тогда как для группировки сложных графем и морфем используется высокая частота совместной встречаемости составляющих их букв.

семантика

орфография целого слова ■

саг hair Chair chain pair

узнаваемость 1 J группировка

С-Н С-А С-I C-R Н-А Н-1 H-R А-I A-R I-R ch - ai - г

"грубая"

орфография

тонкая

орфография

визуальные признаки

Рис. 1. Схема двух каналов орфографической обработки [7, c. 3]

Основная идея рассматриваемой работы состоит в том, что с учетом временных ограничений, налагаемых темпом чтения (около 250 мс на опознавание слова), и различий в визуальных характеристиках букв в слове наиболее эффективным способом быстро получить предположение о том, какое это слово, является идентификации наиболее видимых букв и их взаимного расположения. Это не гарантирует точного опознавания слова, но обеспечивает быструю активацию «сверху вниз», что в сочетании с

факторами контекста может позволить правильно идентифицировать слово. Если поддержки «сверху» оказалось недостаточно, параллельно работающий более медленный путь «тонкой» орфографии позволит все-таки прочитать слово [7, с. 3 - 4].

Необходимость найти механизм быстрого опознавания слов соответствует давно известным в психологии восприятия требованиям быстродействия и эффективности работы перцептивных механизмов (например, [1]), хотя «оборотной стороной выступает утрата точности (вернее, детальности) восприятия и определенная возможность ошибок» [2, с. 589]. Поскольку требования быстродействия и эффективности, то есть скорости и точности, являются по сути противоположными, обратно зависимыми, вполне логичным представляется предположить на этом этапе восприятия два параллельных механизма противоположного действия: один быстрый, но неточный, а другой точный, но медленный. Их взаимодействие и может обеспечить необходимую эффективность.

Таким образом, для первого механизма («грубой» орфографии) нужны наиболее быстро опознаваемые буквы, необязательно занимающие в слове соседние места; очевидно, что это будут буквы с лучшими визуальными характеристиками. Дж. Грейнджер и Й. Циглер в оценке визуальных качеств букв опираются на работу [15], в которой зрительная опознаваемость букв рассматривается как функция от степени удаленности буквы от точки фиксации взгляда читателя на слове - то есть от того, попадают буквы в зону фовеального (четкого) или парафовеального (бокового) зрения. Но буквы и сами по себе, на наш взгляд, имеют разную визуальную сложность и, соответственно, разную опознаваемость, тем более в зоне парафовеального восприятия. Далее этот вопрос изучается нами экспериментально.

Эксперимент

Одним из важных результатов применительно к проблемам моделирования чтения мы считаем получение данных об устойчивой разнице в опознаваемости букв русского алфавита.

При переходе от восприятия изолированных букв к восприятию буквосочетаний происходит общее улучшение восприятия букв. Это улучшение восприятия может быть рассмотрено подробно, по конкретным буквам (см. табл. 1). Ограничения в размере исходного текста и количестве буквосочетаний на экспериментальном бланке не позволили получить данные по всем буквам для всех видов сочетаний. Тем не менее, имеющихся данных достаточно для обнаружения ранговой корреляции между частотами успешного опознавания букв в изолированном предъявлении и в сочетаниях разной длины.

Между данными по опознаваемости большинства букв прослеживается очевидная взаимосвязь. В силу различий в визуальных характеристиках буквы ранжируются в определенном порядке от стопроцентной

до нулевой опознаваемости. Несмотря на то, что у некоторых букв процент опознаваемости в отдельных колонках меняется разнонаправленно, эти различия статистически незначимы - коэффициент ранговой корреляции Спирмена, вычисленный с помощью программы SPSS 16.0 for Windows, говорит о наличии сильной положительной корреляции между данными разных этапов эксперимента (табл. 2).

Таблица 1

Доля успешно опознанных букв при изолированном предъявлении и в составе 2-, 3-, 4-, 5-буквенных сочетаний (по данным эксперимента)

Буква Частота правильного опознавания букв, %

в изолированном предъявлении в 2-буквенных сочетаниях х й ё ни ен Ш И н уе бч -о о в х й ё ни ен Ш И н буче 4- со в в 5-буквенных сочетаниях

а 4,0 48,9 47,2 52,9 85,0

б 40,0 70,0 95,0 96,7 -

в 14,0 37,5 26,4 - 70,0

г 93,0 94,0 97,5 - -

д 72,0 97,0 97,7 100 90,0

е 15,0 41,9 46,3 48,3 55,0

ж 85,0 95,0 50,0 90 -

з 15,0 6,7 28,3 10 80,0

и 19,0 52,8 42,0 100 -

и 0 40,0 37,5 - -

к 76,0 62,5 92,9 50 95,0

л 79,0 44,0 68,3 87,1 95,0

м 21,0 36,2 27,8 - -

н 50,0 74,3 55,6 43,3 -

о 90,0 92,9 82,8 100 90,0

п 56,0 83,3 66,3 98 -

р 100 100 98,2 100 100

с 87,0 73,0 79,3 86,7 91,7

т 100 96,7 99,0 100 100

у 95,0 98,6 100 - 100

ф 100 100 100 - -

х 60,0 70,0 - - -

ц 88,3 80,0 - 100 60,0

ч 92,0 96,7 85,0 100 100

ш 97,1 93,3 - - -

щ 100 - - - -

ь 77,0 - - 85,6 95,0

ы 69,0 90,0 93,3 100 100

э 56,7 60,0 - - -

ю 87,5 86,7 - - -

я 1,0 7,0 - - -

Таблица 2

Данные о корреляции успешности опознавания букв при изолированном предъявлении и в составе 2-, 3-, 4-, 5-буквенных сочетаний (по данным эксперимента)

Спирмена р 1 буква 2-букв. 3-букв. 4-букв. 5-букв.

1 буква коэффициент корреляции значимость (2-стор.) количество 1,000 31 0,858** 0,000 29 0,844** 0,000 24 0,625** 0,004 19 0,677** 0,157 31

2-буквенная коэффициент корреляции значимость (2-стор.) количество 0,858** 0,000 29 1,000 29 0,877** 0,000 24 0,725** 0,001 18 0,684** 0,005 15

3-буквенная коэффициент корреляции значимость (2-стор.) количество 0,844** 0,000 24 0,877** 0,000 24 1,000 24 0,597* 0,11 17 0,827** 0,000 14

ная О ук б - - 03 -к ^ й а & и ° Ё Й ^ $г & Й ^ §Т & & й & о & ^ ^ * 1 § § н 5 к ^ ен 0,625** 0,004 19 0,725** 0,001 18 0,597* 0,11 17 1,000 19 0,494 0,073 14

5-буквенная коэффициент корреляции значимость (2-стор.) количество 0,677** 0,157 31 0,684** 0,005 15 0,827** 0,000 14 0,494 0,073 14 1,000 16

** Корреляция значима на уровне 0,01 (2-сторонняя) * Корреляция значима на уровне 0,05 (2-сторонняя)

Как видно, опознаваемость изолированных букв показывает сильную корреляцию с данными по всем остальным буквосочетаниям при высоком уровне значимости р < 0,01 (первая строка табл. 2). Значимая корреляция наблюдается для сочетаний 2 и 3 букв (р = 0,877, р < 0,01), 3 и 4 букв (р = 0,597, р < 0,05) и для практически любых других комбинаций данных. Только для сочетаний 4 и 5 букв, где много отсутствующих значений и связанных (одинаковых) рангов, корреляция превышает допустимый порог значимости (р = 0,073). Таким образом, ран-

жирование букв по опознаваемости сохраняется, несмотря на изменение уровня самой опознаваемости. Это говорит о том, что некоторые буквы устойчиво опознаются лучше других, то есть имеют значимо отличающиеся визуальные характеристики.

Введенный нами графический фактор общей формы буквы (П-фактор) также показывает свою значимость до четырехбуквенных сочетаний включительно. Это наряду с результатом корпусного исследования, показавшим стабилизацию частот словоформ с участием буквосочетаний именно после достижения уровня четырех букв, позволило нам предположить возможность существования эффекта квадриграммы, то есть говорить об особой роли в буквенном чтении четырехбуквенных сочетаний.

Обсуждение

В результате эксперимента мы установили, что буквы русского языка значимо отличаются друг от друга с точки зрения легкости (успешности) их зрительного опознавания. Графический фактор общей формы делит буквы на две группы:

1) частотные, но относительно графически однотипные (а, в, е, з, и, к, н, о, п, с, х, э, я);

2) более редкие, но графически более специфичные (г, т, ч, ь, б, д, ж, й, л, м, р, у, ф, ц, ш, щ, ы, ю).

Первая группа устойчиво опознается хуже, вторая группа - стабильно лучше.

Полученные данные позволяют наполнить практическим содержанием приводившуюся выше идею открытых биграмм и триграмм [6, с. 10]. В работах Дж. Грейнджера и соавторов роль квадриграмм и различия в визуальных характеристиках букв не рассматриваются, лишь предполагается, что некоторые буквы видны лучше или хуже в зависимости от удаленности от точки фиксации взгляда [7, с. 15]. Введение открытых биграмм как способа орфографической кодировки при моделировании чтения имеет в этих работах основания скорее интуитивные, чем теоретические или эмпирические.

По нашему предположению, биграммы и триграммы как единицы кодирования отражают связь уровня букв с уровнем квадриграмм. Если принять идею Дж. Грейнджера и Й. Циглера, что открытые биграммы обеспечивают быстрый канал «грубой» орфографии, в котором участвуют буквы с лучшими визуальными характеристиками, то механизм зрительного опознавания представляется следующим образом. При нормальном беглом чтении обработка графической информации на определенном участке текста начинается еще до переноса взгляда на этот участок, на стадии парафовеального восприятия. В таком восприятии актуальны будут наиболее общие визуальные признаки букв, описываемые нашим П-фактором. Относительно редкие и графически более специфичные группы из второй группы будут опознаваться раньше частотных, но однотипных букв первой группы. Возникает ситуация, когда во фрагменте слова некоторые буквы будут уже опознаны на своих позициях, а некоторые еще нет. Опознанные буквы активируют квадриграммы с этими буквами на соответствующих позициях. Например, в любом из слов фара, фора, фарс, форс будут уверенно опо-

знаны только буквы ф и р в своих относительных позициях, что приведет к активации всех перечисленных четырехбуквенных сочетаний. При моделировании чтения эта ситуация может быть отражена открытой биграммой ф_р_, где место пропуска соответствует какой-либо букве из первой группы зрительно однотипных. Появление на месте пропуска буквы из другой категории П-фактора приведет к появлению открытой триграммы, например, ф_рт, активирующей слова форт и фарт, или ф_рм, связанной со словоформами ферм, фирм, фарм, форм. Если в процессе чтения присутствует контекст (что практически всегда так и есть), то его может оказаться достаточно для вычисления всего слова без необходимости обнаружения детальных зрительных признаков еще не опознанных букв. Таким образом может быть обеспечена необходимая высокая скорость чтения.

Описанный механизм, на наш взгляд, может быть применим не только к парафовеальному этапу нормального беглого чтения, но и к чтению человека с ослабленным зрением (дальнозоркость, близорукость и т.п.). Любой, кто носит очки, но по каким-либо причинам не использует их в момент чтения, будет опираться на специфические графические признаки букв второй группы П-фактора в сочетании с позиционными характеристиками этих букв, чтобы с помощью контекста компенсировать недостаток зрительной информации и обеспечить восприятие текста.

Таким образом, предлагаемые в зарубежном моделировании чтения открытые биграммы и триграммы могут соответствовать группам квадриграмм с одинаковыми графически специфичными буквами на общих позициях; возможность квадриграммы как нейролингвистической единицы чтения предполагается в работе [4].

Литература

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Грановская, Р.М. Восприятие и модели памяти / Р.М. Грановская. - Л., 1974.

2. Касевич, В.Б. Труды по языкознанию / В.Б. Касе-вич; под ред. Ю.А. Клейнера. - СПб., 2006.

3. Ans, B. A connectionist multiple-trace memory model

for polysyllabic word reading / B. Ans, S. Carbonnel, S. Val-dois // Psychological Review. - 1998. - P. 678 - 723.

4. Dehaene, S. The neural code for written words: a proposal / S. Dehaene, L. Cohen, M. Sigman, F. Vinckier // Trends in Cognitive Sciences. - 2005. - Vol. 9 (7). - P. 335 - 341.

5. Grainger, J. Cracking the orthographic code: an introduction / Grainger J. // Language and Cognitive Processes. -2008. - Vol. 23. - P. 1 - 35.

6. Grainger, J. Modeling letter position coding in printed word perception / J. Grainger, W. van Heuven // The Mental Lexicon. P. Bonin (Ed.). - N.Y., 2003. - P. 1 - 24.

7. Grainger, J. A dual-route approach to orthographic processing. Frontiers in Psychology / J. Grainger, J.C. Ziegler // Language Sciences. - 2011. - Vol. 2 (54). - P. 1 - 13.

8. Harm, M.W. Computing the Meanings of Words in Reading: Cooperative Division of Labor Between Visual and Phonological Processes / M.W. Harm, M.S. Seidenberg // Psychological Review. - 2004. - Vol. 111. - P. 662 - 720.

9. McClelland, J.L. An interactive activation model of context effects in letter perception: Part 1. An account of Basic Findings / J.L. McClelland, D.E. Rumelhart // Psychological Review. -1981. - Vol. 88. - P. 375 - 407.

10. Mozer, M.C. Early parallel processing in reading: A connectionist approach / M.C. Mozer // M. Coltheart (Ed.), Attention and performance XII: The Psychology of Reading. Hove, UK: Lawrence Erlbaum Associates Ltd., 1987. - P. 83 -104.

11. Perry, C. Beyond single syllables: Large-scale modeling of reading aloud with the Connectionist Dual Process (CDP++) model / C. Perry, J.C. Ziegler, M. Zorzi // Cognitive Psychology. - 2010. - Vol. 61 (2). - P. 106 - 151.

12. Perry, C. Nested modeling and strong inference testing in the development of computational theories: The CDP+ model of reading aloud / C. Perry, J.C. Ziegler, M. Zorzi // Psychological Review. - 2007. - Vol. 27. - P. 301 - 333.

13. Schoonbaert, S. Letter position coding in printed word perception: Effects of repeated and transposed letters / S. Schoonbaert, J. Grainger // Language and Cognitive Processes. - 2004. - Vol. 19. - P. 333 - 367.

14. Seidenberg M.S. A distributed, developmental model of word recognition and naming / M.S. Seidenberg, J.L. McClelland // Psychological Review. - 1989. - Vol. 96. - P. 523 - 568.

15. StevensM. Letter visibility and the viewing position effect in visual word recognition / M. Stevens, J. Grainger // Perception and Psychophysics. - 2003. - Vol. 65. - P. 133 - 151.

УДК 81’366.593

Л.А. Мелехова

Научный руководитель: доктор филологических наук, профессор Л.А. Сергиевская

КОННОТАЦИЯ ИМПЕРАТИВА НА ЛЕКСИКО-МОРФОЛОГИЧЕСКОМ УРОВНЕ ЯЗЫКА

В статье проводится анализ добавочных оттенков семантики побуждения на уровне лексики и морфологии. Рассмотрены слова, лексическое значение которых заключается в окрашенной императивной семантике, и формы слов, грамматическое значение которых способствует организации соответствующего коннотативного смысла побуждения.

Императив, экспрессия, стилистические оттенки, глагол, перформатив, русский язык.

The author of the article analyses the additional meaning of imperative at the lexical and morphological level. The article considers the words with imperative semantics and forms of words, which grammatical characteristic features add to the connotative meaning of the imperative.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Коршунов Дмитрий Сергеевич

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Коршунов Дмитрий Сергеевич

Текст научной работы на тему «Проблемы моделирования буквенного чтения и экспериментальное исследование: квадриграммы как открытые биграммы»