Научная статья на тему 'Уровневая модель понимания текста'

Уровневая модель понимания текста Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
373
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СУБЪЕКТ-ПРЕДИКАТНЫЙ ПОДХОД / УРОВНИ ПОНИМАНИЯ ТЕКСТА / ТРУДНОСТЬ ОПРЕДЕЛЕНИЯ СУБЪЕКТА / КОЭФФИЦИЕНТ ИЕРАРХИЧНОСТИ / КОЭФФИЦИЕНТ МОДИФИЦИРУЕМОСТИ / SUBJECT-PREDICATE APPROACH / LEVELS OF TEXT UNDERSTANDING / DIFFICULTY OF SUBJECT DEFINITION / HIERARCHY FACTOR / MODIFIABILITY FACTOR

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Гидлевский А. В., Здриковская Т. А.

Обсуждается уровневая модель понимания, основанная на субъект-предикатном подходе к структуре содержания текста. При этом структура содержания текста отображается с помощью графа, узлами которого являются текстовые субъекты. Текстовыми субъектами чаще всего являются понятия и их сочетания. Трудность понимания текста на том или ином уровне раскрытия текстовых субъектов, находящихся в узлах графа, вычисляется через сумму трудностей определений субъектов, занимающих соответствующие уровни раскрытия. Уровни раскрытия, в свою очередь, связываются с уровнями понимания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LAYERED MODEL OF TEXT UNDERSTANDING

The paper discusses the layered model of understanding which is based on the subject-predicate approach to text understanding. The structure of text contents is represented with a graph the junctions of which are text subjects. Text subjets are normally concepts and their combinations. The difficulty of text understanding on different levels of disclosure of text subjects which are at the junctions of a graph is calculated via a sum of difficulties of subject definitions which occupy the corresponding levels of disclosure. Levels of disclosure in their turn are connected with levels of understanding.

Текст научной работы на тему «Уровневая модель понимания текста»

МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ И ИННОВАЦИИ

Вестн. Ом. ун-та. 2012. № 4. С. 170-173.

УДК 519.86; 519.87; 37.001.5 А.В. Гидлевский, Т.А. Здриковская

УРОВНЕВАЯ МОДЕЛЬ ПОНИМАНИЯ ТЕКСТА

Обсуждается уровневая модель понимания, основанная на субъект-предикатном подходе к структуре содержания текста. При этом структура содержания текста отображается с помощью графа, узлами которого являются текстовые субъекты. Текстовыми субъектами чаще всего являются понятия и их сочетания. Трудность понимания текста на том или ином уровне раскрытия текстовых субъектов, находящихся в узлах графа, вычисляется через сумму трудностей определений субъектов, занимающих соответствующие уровни раскрытия. Уровни раскрытия, в свою очередь, связываются с уровнями понимания.

Ключевые слова: субъект-предикатный подход, уровни понимания текста, трудность определения субъекта, коэффициент иерархичности, коэффициент модифицируемости.

Субъект-предикатный подход к исследованию структуры содержания текста

Для исследования структуры содержания текста мы используем субъ-ект-предикатный подход, преимущественно в редакции Л.П. Доблаева [1]. Однако в упомянутый подход мы внесли ряд изменений, позволяющих увеличить его эвристический потенциал.

Текст выражает иерархическую систему текстовых субъектов и предикатов различных рангов. Предикат также может быть представлен системой субъектов. Таким образом, текст представляется иерархией субъектов, когда раскрытие главного текстового субъекта - предмета высказывания - происходит посредством его замещения (модификации) иерархической системой субъектов нижележащих рангов. При этом каждый последующий субъект является модификатом предыдущего.

Некоторые текстовые субъекты не имеют модификаций и являются конечными (терминальными). Другие имеют только непосредственную модификацию: их модификатами являются субъекты только одного последующего ранга, которые далее не модифицируются (конечные). Таким образом, система субъектов текста оказывается системой модификации начального (главного) субъекта.

Наиболее просто расчет трудности понимания текста может быть проведен следующим образом. На основании структурной схемы (графа) выделяются линии модификации, для каждой из которых определяется трудность как сумма трудностей (трудностей определений) учитываемых субъектов. Трудность определения субъекта равна произведению исходной трудности, величина которой может быть принята равной единице для всех субъектов, на ряд коэффициентов, зависящих от места субъекта в их последовательности и типа непосредственной модификации данного субъекта. Затем суммируются показатели трудности для всех линий модификации, входящих в задачу определения трудности соответствующего фрагмента текста.

Таким же образом определяется трудность содержания узлов структурной сети, в качестве которых фигурируют текстовые субъекты. Иерархическая структура содержания субъекта позволяет, как мы покажем ниже, оценить трудность его раскрытия до требуемого уровня.

Пусть имеем субъект 3, структура раскрытия которого показана на рис. 1. Как видно из рис. 1, субъект 3 является главным, и трудность его содержания будет равна сумме трудностей его модификатов (субъектов нижележащих рангов). Например, субъекты Й1 и З принадлежат первому © А.В. Гидлевский, Т.А. Здриковская, 2012

рангу. Главному субъекту, таким образом, нами назначен нулевой ранг. Отметим, что главным данный субъект является лишь в представлении «горизонтального» его раскрытия (рис. 1). Будучи встроенным в иную линию модификации, он может иметь подчиненное место, т. е. может являться субъектом какого-либо не нулевого ранга.

Бі2

Трудность предиката для главного субъекта равна сумме трудностей определений всех субъектов, входящих в предикат. С другой стороны, субъект 3 является источником двух линий модификации, поэтому общую трудность его раскрытия можно оценить как сумму трудностей этих линий модификации. Соответствующие линии модификации показаны на рис. 2 и 3.

Оценим трудность субъекта 3 по линии модификации, показанной на рис. 2. Искомая трудность равна сумме трудностей всех субъектов, кроме главного (б). Трудность того или иного субъекта (трудность определения субъекта) Т может быть вычислена как произведение исходной трудности Т0, которую удобно положить раной единице, и ряда коэффициентов, характеризующих субъект с точки зрения его «когнитивных» характеристик - места субъекта в иерархии, характера его модифицируемости, степени знакомства читателю и др. То есть здесь мы имеем дело именно с «когнитивной» трудностью раскрытия субъекта. Определим два коэффициента, характеризующие субъекты, - коэффициент иерархичности (/с;) и коэффициент модифицируемости (кт). Прежде всего отметим, что субъекты 312 и бцц являются терминальными, трудность определения которых минимальна. В ряде случаев трудностью их определения можно пренебречь. Однако чтобы их как-то учесть, положим трудность их определений равной единице для любого, в том числе сложного, терминального субъекта. При этом, для терминальных субъектов величины коэффициентов к и кт должны быть равны единице. Для субъектов более высокого ранга (не терминальных), например 3111 на рис. 2 коэффициент иерархичности равен двум; для

субъекта 311 - трем. Подобная иерархическая неравноценность субъектов объясняется просто. Последовательность раскрытия главного субъекта - это последовательность действий в решении мыслительной задачи. Известно, что при решении задачи первый шаг - самый трудный, все остальные шаги фактически следуют из первого. То есть коэффициент иерархичности - это сугубо «трудностный», когнитивный параметр. То же самое мы можем сказать и о коэффициенте модифицируемости для того или иного субъекта. Коэффициент модифицируемости субъекта определяется количеством его непосредственных модификатов: чем их

больше, тем выше значение данного коэффициента. Если мы учитываем один моди-фикат (не терминальный), то величина коэффициента модифицируемости данного субъекта равна двум (единица уже занята терминальными субъектами). Если терминальных модификатов (терминалов) у данного субъекта несколько, то коэффициент модифицируемости данного субъекта также равен двум. Модификация в несколько терминалов - это модификация в более сложный терминал. Трудность же модификации данного субъекта в таком нашем предположении не меняется.

Бі2

Рис. 2. Линия модификации 5, 5і...

В случае двух непосредственных моди-фикатов (не терминальных) величина кт равна четырем (например, для субъекта 3 на рис. 3) и т. д.

Вкладом модификаций к терминальным субъектам в коэффициенты модифицируемости субъектов, как мы упоминали выше, для упрощения метода можно пренебречь. Например, субъект б12 является терминальным и трудность его определения равна единице. В связи с этим модификацию б1 -б12 мы, в числе прочих подобных модификаций, учитывать не будем.

Для вычисления трудности показанной на рис. 2 линии модификации составим табл. 1.

172

А.В. Гидлевский, Т.А. Здриковская

Бо Б1 Б2 Бз

Рис. 4. Часть линии модификации. Субъекты 50 и 5з , соответственно, главный и терминальный субъекты

Таблица 1

Значения коэффициентов и трудности определения для субъектов, показанных на рис. 2

Субъекты к кт Ъ

Б1 4 2 8

Б11 3 2 6

Б12 1 1 1

Б111 2 2 4

Б1111 1 1 1

Суммируя значения в последнем столбце табл. 1, получаем для данной линии модификации (рис. 2) величину трудности

Т1 = 20.

Составим табл. 2 для линии модификации, показанной на рис. 3.

Таблица 2

Значения коэффициентов и трудности определения для субъектов, показанных на рис. 3

Субъектыы к кт Ъ

Б2 3 4 12

Б21 2 2 4

Б22 2 2 4

Б211 1 1 1

Б221 1 1 1

Б222 1 1 1

Суммируя значения в последнем столбце табл. 2, получим для трудности линии модификации, показанной на рис. 3,

Т2 = 23. Итоговая трудность содержания условного текста (рис. 1) будет равна:

Т = Т1 + Т2 = 43.

Уровневая модель понимания текста

Определим понятие «уровень раскрытия субъекта (концепта, понятия)». Каждый текстовый субъект представляет собой в общем случае понятие. Наименования субъектов -это имена понятий. Если мы учитываем лишь имена субъектов (см., например, рис. 1), то глубина раскрытия понятий соответствует нулевому уровню, т. е. понятие не раскрыто, а воспринимающий текст субъект оперирует лишь с именами (терминами), которые он помнит. В данном случае можно говорить о нулевом (начальном) уровне понимания данного элемента текста. Это обыденное, не научное понимание, ориентированное на примитивный текст - детективы, газеты и т. п.

Для оценки уровня понимания текста (понимания на том или ином уровне) в трудность определения субъекта следует добавить трудность раскрытия его содержания вплоть до рассматриваемого уровня. Для этой цели необходимо на графе текста, либо на отдельных графах отобразить структуры содержания субъектов текста.

Для иллюстрации сказанного обратимся к условной линии модификации (рис. 4), дополненной условными структурами содержания субъектов (рис. 5).

Бо Бт Б2 Бз

ф______________ _______________ _______________ш Уровень 0

и Б11 и Б21 Уровень 1

• Б13 Уровень 3

Рис. 5. Граф условного текста с учетом содержания субъектов 52 и 51

Уровень субъектов бп и б12 соответствует первому уровню понимания, уровень субъектов б21 и 322 - второму и т. д. Для уровня понимания, кроме нулевого, требуется серьезная мобилизация рабочей памяти индивида, которая достигается тренировкой. Таким образом, для текста можно говорить о том или ином уровне понимания, или, другими словами, о трудности понимания текста на том или ином уровне раскрытия текстового субъекта.

Оценим трудность понимания на нулевом уровне. Для этой цели воспользуемся табл. 3.

Таблица 3

Значения коэффициентов и трудности определения для субъектов, показанных на рис. 5

Субъекты к; кт Ъ

Б1 3 2 6

Б2 2 2 4

Бз 1 1 1

Трудность данной линии модификации без учета раскрытия субъектов 62 и б1 равна 11. Расширим табл. 3, включив в нее «вертикальные» модификаты субъектов 62 и б1 и соответствующие уровни раскрытия данных субъектов (табл. 4).

В табл. 5 показаны величины трудности понимания текста на соответствующих уровнях. Из табл. 4 и 5 можно усмотреть, что трудность понимания на последующем уровне равна трудности понимания на предыдущем уровне плюс трудность определения субъектов на исследуемом уровне.

Таблица 4

Значения коэффициентов, трудности определения и уровней понимания для субъектов, показанных на рис. 5

Субъекты к кт Ті Уровень понимания

Бі 3 2 6 0

Б2 2 2 4 0

Бз і і і 0

Біі 3 2 6 і

Б21 2 2 4 і

Бі2 2 2 4 2

Б22 і і і 2

Біз і і і 3

Таблица 5 Величина трудности понимания в зависимости от уровня понимания

Уровень понимания Трудность понимания

0 іі

і 2і

2 26

3 27

Заключение: применение модели

Предлагаемая модель понимания текста применима к исследованию уровней понимания любого текста как естественным, так и искусственным интеллектом. Данная модель применима как для конструирования текстов, так и для их диагностики на предмет глубины раскрытия, понимаемости и др. Приведенная в данной статье модель

представляется эффективной и для конструирования диагностических материалов в образовании. В частности, она уже показала свою эффективность для оценки трудности решений применяемых в КИМах задач по математике, физике и химии [2]. В предлагаемом варианте модель применима к тестам и по низко формализованным дисциплинам - географии, биологии, русскому и иностранным языкам, литературе, истории и др. В указанных дисциплинах тесты содержат пропущенные концепты (задания открытого типа), уровень определения (раскрытия, понимания) которых может быть вычислен с применением данной модели. Весьма перспективной данная модель видится в приложении к анализу философского и научного текста. С ее использованием можно успешно оптимизировать концептуальную базу ряда философских и научных теорий, поскольку построение и анализ графов содержания позволяет избежать ряда семантических дефектов текста.

ЛИТЕРАТУРА

[1] Доблаев Л. П. Смысловая структура учебного текста и проблемы его понимания. М. : Педагогика, 1982. 176 с.

[2] Гидлевский А. В. Универсальный метод оценки трудности учебных тестовых заданий // Вестник Ом. ун-та. 2011. № 2. С. 271-276.

i Надоели баннеры? Вы всегда можете отключить рекламу.