Известия ТРТУ
Специальный выпуск
УДК 681.3.06
Э.М. Котов
ПОСТРОЕНИЕ МАТРИЦЫ ЛЕКСИЧЕСКИХ СВЯЗЕЙ В ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМАХ
Принимая во внимание наличие связей, существующих между различными предложениями текста документа на естественном языке, которые устанавливаются набором лексем документа, возможно рассматривать текст как ориентированный граф или иерархическую сеть, в которой помимо частоты встречаемости лексемы, важность приобретают и такие критерии, как положение лексемы в иерархии, длина ассоциативных цепочек порожденных некоторой лексемой. Отметим, что согласно [1], частотой лексемы будем называть число ее повторений в различ-, . Подмножество повторяющихся лексем составляет лексическое множество связи текста. Произведя исключение из рассмотрения лексем, принадлежащих подмно-, , -.
Пусть Ь = {/1,..., // ,..., N }- множество лексем,
0 = {^1,..., wг■,..., WN/} - множество частот соответствующих лексем. При условии, что все уникальные лексемы из рассмотрения исключены, то
wi > 1, V/ < N 1,
где Ы/ -общее число лексе м связи в тексте.
Если предложениям текста /7* поставить в соответствие множество входящих в них лексем, то:
к = |1, / е Пк
[0, /■ € Пк
и предложениям документа Гк соответствует вектор:
а тексту соответствует матрица лексических связей:
' & . .. & . сі л .. &
(&)= .. & . ок .. &
& . .. ^ . 6Ыр
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Чанышев ОТ. Ассоциативная модель естественноязыкового текста. Вестник Омского университета. Вып. 2. Омский государственный университет, 1997,С.17-20.
&