Научная статья на тему 'Лингвистический базис анализа поверхностно-синтаксических связей сегментов в русском предложении'

Лингвистический базис анализа поверхностно-синтаксических связей сегментов в русском предложении Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY-NC-ND
159
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА / СИНТАКСИЧЕСКИЙ АНАЛИЗ РУССКОГО ПРЕДЛОЖЕНИЯ / МОДУЛЬ МЕЖСЕГМЕНТНОГО АНАЛИЗА / ГРАФ ЗАВИСИМОСТЕЙ СЕГМЕНТОВ В РУССКОМ ЯЗЫКЕ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Кобзарева Татьяна Юрьевна

Рассматривается лингвистический базис модуля построения связей между сегментами (простыми-главными, придаточными предложениями, деепричастными и др. обособленными оборотами) в модульной системе синтаксического анализа русского текста, где связи сегментов строятся после построения сегментов и связей слов внутри них.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Linguistic basis of segment surface-syntactical connections analysis in Russian sentence

The paper discusses a linguistic basis of the segment connections building in Russian sentence and some problems that arise while searching for a control word of a specified segment.

Текст научной работы на тему «Лингвистический базис анализа поверхностно-синтаксических связей сегментов в русском предложении»

Прикладные исследования

Т. Ю. Кобзарева

Лингвистический базис анализа поверхностно-синтаксических связей сегментов в русском предложении

1. Введение

Рассматривается лингвистический базис модуля построения графа связей сегментов в русском предложении в системе поверхностно-синтаксического анализа (ПСА), разрабатываемой в настоящее время в РГГУ.1

В системе вся процедура анализа делится на модули [Кобзарева 2007а]. Каждый из модулей на основе минимально необходимой словарной информации, приписываемой словоформе при морфологическом анализе, грамматической информации, полученной на предшествующих этапах, и идеальной модели рассматриваемой грамматической зоны обрабатывает определенный круг синтаксических явлений. Система выстроена как лингвистически оптимальная последовательность процедур анализа и способов их организации, которые позволяют минимизировать используемую на каждом этапе информацию и упростить каждый очередной этап работы с текстом.

2. Используемые понятия

Используется следующая идеальная модель русского предложения (Б) [Кобзарева 2002, Кобзарева 2004а]. Б состоит из цепочки ^-сегментов - простых-главных предложений; каждый из в-сегментов может быть разорван вложением в него а-сегментов - придаточных предложений и обособленных оборотов (деепричастных оборотов, согласованных определений, предложных, вводных и сравнительных оборотов). Каждый а-сегмент в свою очередь может быть разорван следующего уровня вложениями в него а-сегментов, причем количество вложений одного уровня, как и количество уровней вложений теоретически ничем не ограничено.

Границами сегментов являются знаки препинания, эксплицитно задаваемые правилами русской пунктуации, и,

реже, - сочинительные союзы. При моделировании сегментной структуры предложения на основании соответствующей зоны грамматики линейной структуры предложения разрешается функциональная омонимия этих компонент предложения - их способность быть границей сегмента ув. сочинять сегменты или их компоненты [Кобзарева 2004а, Кобзарева 2005].

3. Иерархия процедур анализа

Вся процедура анализа делится на следующие модули [Кобзарева 2007а]:

1. Постморфология - решение несловарных проблем мор-фанализа [Кобзарева 2004Ь];

2. Разрешение омонимии частей речи [Кобзарева и др. 2002].

3. Предсегментация - построение проективных фрагментов определительных именных и предложных групп (ИГ и ПГ) [7], сложного сказуемого и т.д., выступающих единицами анализа в модуле Сегментации [Кобзарева 2004а, Кобзарева 2007а];

4. Сегментация - построение сегментов (придаточных предложений, деепричастных и других обособляемых оборотов и простых-главных предложений в составе сложных и сложноподчиненных предложений): определение их левых и правых границ и одновременное элиминирование разрывов, возникающих при вложении сегментов в сегменты [Кобзарева 2004а,Кобзарева 2005,Кобзарева 2007а].

5. Внутрисегментный анализ - поиск связей слов внутри построенных сегментов [Кобзарева 2007а].

6. Межсегментный анализ - построение графа связей между сегментами, построенными в модуле Сегментация.

К этапу анализа связей между сегментами построены сами сегменты и все сочинительные и подчинительные связи слов внутри сегментов, определяющие проективные фрагменты линейной структуры предложения[Кобзарева 2002, Кобзарева 2004а, Кобзарева 2005, Кобзарева 2007Ь], в частности, что важно для этапа, моделирующего межсегментные отношения - зоны влияния сочиненных предикатов [Кобзарева 2006].

При этом для каждого сегмента, потенциально имеющего хозяина, решается два вопроса: какое слово может быть его хозяином и где это слово-хозяин искать.

Для русского предложения, потенциально имеющего весьма сложную сегментную структуру и большую длину, целесообразно, а главное - возможно, как показывают теоретические и экспериментальные данные, строить сегменты до полного анализа внутрисегментные и межсегментных связей [Кобзарева 2005а,Кобзарева 2007а]. После модуля сегментации, который при построении сегментов снимает омонимию знаков препинания и сочинительные союзов (т.е. все сочинительные связи строятся в модуле сегментации при определении функций знаков препинания) [Кобзарева 2007а,Кобзарева 2005], работает модуль внутрисегментного анализа, строящий все подчинительные связи внутри сегментов [Баталина и др 2006], и только после этого - модуль межсегментного анализа.

4. Отношения между сегментами

При межсегментном анализе мы исходим из того, что между сегментами могут быть два вида отношений: отношения подчинения и сочинения.

1. Отношение подчинения выражается в том, что некоторое слово сегмента-хозяина является хозяином некоторого слова сегмента-слуги, это значит, что каждый конкретный случай отношения подчинения сегментов манифестируется подчинительной связью двух слов из разные сегментов.

2. Под отношением сочинения понимаем два вида отношений сегментов.

2.1. Отношение сочинения при соподчинении, когда два а-сегмента подчинены одному слову сегмента-хозяина. Это отношение выражается в сочинении двух слов разные а-сегментов одного класса - придаточные, деепричастные оборотов или определительные оборотов. Для обособленные оборотов это - сочинение их вершин, а для придаточные - подчинительные союзов (п\с).

2.2. Отношение простых-главных предложений - в-сег-ментов, входящих в одно предложение, традиционно рассматриваемое как их сочинение и выражаемое как сочинение их предикатные вершин.

Все связи сегментов предложения представляются при этом в виде графа связей сегментов, где каждая связь манифестируется связью двух слов разные сегментов.

При этом каждый а-сегмент потенциально имеет хотя бы одного хозяина и для каждого а-сегмента при поиске его хозяина решается два вопроса:

1. что именно искать, т.е. какое слово в принципе может быть его хозяином и

2. где искать, т.е. в какой зоне предложения может находиться слово - его хозяин.

При этом определение слова-слуги в межсегментных связях не составляет проблемы: у а-сегментов - оборотов в роли слуги всегда выступает вершина сегмента, а в придаточных слуга - подчинительный союз.

5. Особенности сегментной структуры предложения, осложняющие поиск межсегментных связей

Рассмотрим некоторые факторы, которые осложняют поиск хозяина, т.е. ответа на вопросы что и где искать.

5.1. Факторы, осложняющие ответ на вопрос, что искать, т.е. какое слово является хозяином, а-сегмента.

Придаточные предложения (ПП) способны:

1) заполнять валентности предикативных слов и

2) выступать в роли слуг актантов и сирконстантов - существительных в качестве присубстантивных определений или уточнений предложных групп и наречий.

Соответственно, при поверхностно-синтаксическим анализе для каждого ПП надо 1) представлять себе, что потенциально может быть хозяином такого ПП и 2) найти его хозяина в данном контексте.

При этом в зоне поиска может оказаться несколько слов, претендующих на роль слова-хозяина. Соответственно, нужно предусматривать, что может возникать синтаксическая неоднозначность межсегментных связей.

5.2. Факторы, осложняющие ответ на вопрос, где искать хозяина а-сегмента.

5.2.1. Подчиненные сегменты, «вложенные» по смыслу в сегмент-хозяин, могут физически не иметь в линейной структуре контакта с сегментом-хозяином.

Б1 Иван, зная все это, обзавелся двумя вязками бубликов и колбасою и, спросивши рюмку водки, в которой не бывало

недостатка ни в одном постоялом дворе, кончил свой ужин,, усевшись на лавке перед дубовым столом, вкопанным в глиняный пол (Набоков, далее Н)

Деепричастный оборот спросивширюмку водки отделен от своего хозяина-сказуемого кончил придаточным в которойне бывало недостатка ни в одном постоялом дворе.

Б2 Я узнал также, что его здоровье слабо, что жизненный пыл, угасший в этом человеке, оставил его тело без присмотра и без поощрения, что он скоро умрет» (Н)

ПП = что жизненный пыл оставил его тело без присмо-траибез поощрения подчинено сказуемому простого-главного узнал, но отделено от сегмента-хозяина ПП = что его здоровье слабо, а между последним придаточным что он скоро умрет и сегментом-хозяином находится ПП = что его здоровье слабо и матрешка - ПП с вложенным в него обособленным А-оборотом что жизненный пыл, угасший в этом человеке, оставил его тело без присмотра и без поощрения.

5.2.2. а-сегменты могут 1) быть соподчинены одному хозяину или 2) образовывать цепочку а-сегментов, связанных последовательно.

Б3. В тот час, когда и сил не было дышать, когда солнце, раскалив Москву, в сухом тумане валилось куда-то заСадовое кольцо, - никто не пришел под липы, никто не селна скамейку, пуста была, аллея (Булгаков, далее Б) Два присубстантивных ПП служат определениями слова час, т.е. соподчинены и сочинены.

Б4. И вот в то время, когда он рассказывалпоэту о том, как ацтеки лепили из теста фигурку, в аллее показался первый человек придаточные образуют цепочку последовательно подчиненных: (в то) время К когда и (о) том К как.

К этапу построения графа связей сегментов построены сегменты и построены все сочинительные и подчинительные связи слов внутри сегментов, определяющие все проективные фрагменты линейной структуры, в частности, - зоны влияния сочиненных предикатов, что и используется в модуле межсегментного анализа.

6. Проективность межсегментных связей

Узлами графа межсегментных связей являются сегменты. Их связи выражаются связью двух слов разных сегментов. Из

свойства проективности связей, введенного Теньером и обычно рассматриваемого на примерах связей слов внутри одного сегмента [Теньер 1988], естественным образом вытекает свойство проективности межсегментных связей. В очень редких специфических случаях, здесь не разбираемые, проективность межсегментные связей может нарушаться (см. Рис.1).

I-1 I I

[...студенты...] [смешавшись] [предводительствуемые] [вынесут]

Рис.1

Б5. Бородатые студенты в клетчатых пледах, смешавшись с жандармами в пелеринах, предводительствуемые козлом регентом, в буйном восторге выводя, как плясовую, вечную память, вынесут полицейский гроб с останками моего дела из продымленной залы окружного суда (Мандельштам)

Свойство проективности межсегментных связей позволяет ограничить зону поиска хозяина а-сегмента-слуги. Для этого в модуле межсегментного анализа при поиске хозяина ак-сегмента используются три общих правила проективности межсегментных связей.

6.1. Общие правила проективности межсегментных связей.

Правило 1. Если ак-сегмент полностью погружен в а'-сег-мент, т.е. в предложении и левее, и правее ак-сегмента есть хотя бы одно слово (включая границы - сочинительные союзы или сочинительные союзы в составе многокомпонентные границ, состоящих из знаков препинания и слов) а'-сегмента (м.б. неконтактно!), то хозяин ак-сегмента и сочиненный-соподчиненный ему а-сегмент не могут находиться в линейной структуре предложения ни левее, ни правее границ а'-сегмента.

Правило 2. Если левее (или правее) ак-сегмента есть часть (хотя бы одно слово) в-сегмента (м.б. неконтактно!), то хозяин ак-сегмента и, соответственно, сочиненный-соподчиненный ему а'-сегмент не могут находиться левее (или, соответственно, правее) этой - ближайшей - слева (или справа) к ак-сегмен-ту - части в-сегмента.

Правило 3. Если правее некоторого отрезка ак-сегмента есть левая граница а'-сегмента (м.б. неконтактно!), то хозяин ак-сегмента (и сочиненного и соподчиненного ему ап-сегмента)

не может находиться в линейном отрезке предложения между левой и правой границами а'-сегмента.

Б6 Оглядываясь на девятнадцатый век русской культуры, [разбившийся, конченый, неповторимый], [которого никто не смеет повторять], я вижу в нем единство непомерной стужи, спаявшей десятилетия в один денек, в одну ночку, в глубокую зиму, где страшная государственность - как печь, пышущая льдом (Н)

6.2. Поиск хозяина деепричастного оборота (П"-об).

Хозяином деепричастия (Бу) является предикат сегмента-хозяина. Поэтому для Бу-об, кроме перечисленных ограничений, важно определить, в зоне влияния какого именно предиката он находится. При построении сегментов строятся все сочинительные связи внутри сегментов, и важной составляющей анализа при построении придаточных и простых-главных предложений является анализ сочинения предикатов, в ходе которого определяются знаки препинания и союзы, являющиеся границами зон влияния предикатов, т.е. частей линейной структуры предложения, где могут находиться слуги каждого из предикатов.

Соответственно, при поиске хозяина Бу-об из трех правил проективности межсегментных связей выводятся следующие условия:

Условие 1. При полном погружении Бу-об в сегмент его хозяином является предикативная вершина (ПВ) сегмента, в зоне влияния которой находится Бу-об: при этом границы зон влиянии ПВ - это границы сегмента, в который погружен Бу-об или, при сочинении нескольких ПВ, сужающие границы - операторы, сочиняющие ПВ.

Б7 Она поднималась по седым ступеням; от нее шло знакомое тепло, ип, поднимаясь мыслью рядом с ней, я видел нашу предпоследнюю встречу на званом вечере в парижском доме, где было очень много народу, ик мой милый друг, желая мне оказать какую-то тонкую эстетическую услугу, тронул меня за рукав ик+1 подвел меня к Нине, сидевшей в углу дивана, сложившись зетом, с пепельницей у каблучка (Н).

Бу-об = поднимаясь мыслью рядом с ней_оказывается в зоне влияния предиката видел, ограниченной слева сочинительным союзом ип, и строится связь видел Ы поднимаясь; Бу-об = желая мне оказать какую-то тонкую эстетическую услугу полностью погружен в простое-главное = ик мой милый

друг тронул меня зарукав ик+1 подвел меня к Нине с ик - левой границей зоны влияния тронул и правой ее границей ик+1, из чего получаем связь тронул Ы желая. Бт-об = сложившись зетом полностью погружен в сегмент сидевшей в углу дивана с пепельницей у каблучка с единственной ПВ= сидевшей, следовательно строится сидевшей Ы сложившись.

Б8. Затем выходил александрийский актер и, ударяя себя в грудь,, истошным голосом,, закатываясь открика и переходя в зловещий шепот, читал стихотворение Никитина «Хозяин». (Н)

В Б8 все три Бт-об полностью погружены в в-сегмент Затем выходил александрийский актер и читал стихотворение Никитина «Хозяин». Границей зон влияния предикатов является сочиняющий их союз и. Все три Бт-об находятся в зоне влияния читал, и, соответственно, ему подчинены.

Условие 2 (вытекает из 2-ого и 3-ого общих правил проективности и Условия1 поиска хозяина Бт-об): если Бт-об - первый сегмент в предложении или непосредственно слева - двоеточие или точка с запятой, то его хозяин - первый предикат ближайшего справа от него в-сегмента.

Б9. Поднявшись по лестнице, мы очутились на щербатой площадке; отсюда видна была гора с собранием крапинок костяной белизны на боку; огибая подножье, бежал дымок невидимого поезда и вдруг скрылся.(Н)

В Б9 есть два Бт-об, непосредственно справа к каждому примыкает в-сегмент. По Условию 2 строятся соответственно связи очутились К Поднявшись и бежал К огибая.

Рассмотрим Условие2 в случае, осложненном вставлением а-сегмента или матрешки из а-сегментов между Бт-об и ближайшим справа фрагментом в-сегмента:

Б10 Оглядываясь на девятнадцатый век русской культуры, [разбившийся], [конченый], [неповторимый], [которого никто не смеет повторять], я вижу в нем единство непомерной стужи, спаявшей десятилетия в один денек, в одну ночку, в глубокую зиму, где страшная государственность - как печь, пышущая льдом. (Н)

Для Бт-об = Оглядываясь на девятнадцатый век русской культуры Условие 2 позволяет легко найти вижу - хозяина об: 1) хозяин анализируемого Бт-об (Оглядываясь на...) по 3-ому общему условию проективности не может быть в а-сегментах справа от От-об; 2) хозяин Бт-об по 2-ому общему правилу про-

ективности не может быть правее ближайшего слева или справа ^-сегмента (здесь есть только в-сегмент справа), т.е. хозяин м.б. только в в-сегменте я вижу в нем единство непомерной стужи. Так как в нем есть ровно один предикат вижу, строится связь вижу К Оглядываясь.

7. Специфика поиска хозяина ПП

Общие правила проективности определяют зону поиска хозяина ПП, т.е. сегмент или зону влияния предиката, где может находится хозяин ПП. Но для ПП встает вопрос, какое именно слово сегмента-хозяина может быть хозяином ПП в силу уже упомянутой потенциальной функциональной неоднозначности ПП.

Рассмотрим синтаксически возможные пути решения этой проблемы.

7.1. Виды ПП.

ПП по подчинительному союзу могут относиться к одному из трех видов.

A. ПП, выступающие в подавляющем числе случаев в роли присубстантивных, т.е. определительных ПП с подчинительным союзом который.

Б. ПП, способные выступать только в роли слуг предикативных вершин сегмента-хозяина. Это, например, ПП с подчинительными союзами если и хотя.

B. ПП, способные и заполнять валентности предикатов, и быть определениями слуг предикатов, в частности присуб-стантивными. К таким ПП относятся, например, ПП с подчинительными союзами кто, что, где, когда, как.... :

. ...решает, что книга бездарна,... ув... город, что на горе... ...знаю, как.ув. ...показателем того, как развивалось ...знаю, где он спрятал., ув. ..в десятой главе, где автор...

7.1.1.А.

Кратко рассмотрим определительные ПП с который. При поиске хозяина который мы можем использовать особенности его согласования со словом-хозяином (правила конгруэнтности), а именно: согласование по числу с учетом потенциального сочинения слов-хозяев, согласование в единственном числе по роду и, в некоторых случаях дающее возможность избежать синтаксической неоднозначности, согласование по одушев-

ленности (для который в Вин.п.м.р.ед.ч. и в Вин.п.мн.ч.): дом отца, на который не могу смотреть \ книги сестер, на которые ув. дом отца, на которого не могу смотреть\ книги сестер, на которых.

7.1.2. В.

Рассмотрим возможные пути разрешения функциональной неоднозначности ПП при поиске хозяина для ПП группы В. При этом мы действуем методом исключения: сначала проверяем, нет ли у ПП хозяина, не являющегося ПВ.

7.1.2.1. Скрепы.

Для связи сегмента-хозяина и ПП - его слуги часто используются слова, которые называют скрепами. Скрепы в своем сегменте уже имеют хозяина, и они объявляется хозяином подчинительного союза. Присубстантивными при наличии скреп-хозяев считаем ПП, скрепы которыгх выступают в функции существительных.

Б11. Хлестаков порхает по пьесе, не желая толком понять, какой он поднял переполох, и жадно стараясь урвать все, что подкидывает ему счастливый случай.(Н) Скрепа -все - местоименное существительное.

Б12. Беда в том, что ни искренность, ни честность, ни даже доброта сердечная не мешают демону пошлости завладеть пишущей машинкой автора (Н) Скрепа (в) том - тоже местоименное существительное.

Связи все К что и (в) том К что определяют соответствующие придаточные как присубстантивные.

Часто скрепа является согласованным определением существительного, и тогда она маркирует существительное, являющееся хозяином подчинительного союза (п\с). В этой ситуации ПП тоже выступают в определительной функции, а хозяином п\с является существительное - хозяин скрепы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Б13. Он находился в том состоянии чувств и души, когда существенность, уступая мечтаниям, сливается с ним в неясных видениях первосонья.(Н) Местоименное прилагательное - скрепа тот маркирует хозяина присубстантивного ПП: (в том) состоянии К когда.

Если при поиске хозяина присубстанивного ПП отсутствует скрепа, то при определении хозяина для многих ПП, например, с союзами где и когда, возникают трудности.

Таблица 1. Примеры открытых списков скреп для некоторых п\с.

Скрепы п\с в ак

Сп.1: там, там-то, туда, туда-то, оттуда, оттуда-то, везде, всюду, повсюду, нигде, никуда, где-то, кое-где... Сп.2 (скрепы присубстантивные): тот, каждый, какой-нибудь, какой-то, следующий ... где, куда, откуда

так, такой, таков, столько, настолько, постольку, тот как

такой, таков какой

столько, настолько, так, столь, сколько, насколько

Сп.1: так, настолько, столь, столько, что-то, потому, оттого, таков, Сп.2 (присубстантивные): тот (мн.ч. или ед.ч. ср.р.), такой, нечто, ничто, кое-что, что-нибудь, такой, один, все ( мн.ч. или ср.р. ед.ч.), первый, единственный, другой, весь, последний. что

постольку, такой, таков поскольку

тот, такой, всякий, каждый, некоторый, многие, любой, первый, последний, единственный, все(мн. ч.), никто, кто-то, кто-нибудь, кое-кто, некто, один. кто, чей

иначе, по-другому, по-иному, иной, другой. чем, нежели

так, затем, настолько, (не) такой, таков, столько, настолько, тот, слишком, столь. чтобы

тогда, всегда, иногда, изредка, когда-нибудь, когда-то, кое-когда, тот (слуга) когда

потому почему

затем зачем

При этом на втором шаге (когда скрепы нет) для где и когда можно использовать предлоги.

Если в части сегмента-хозяина слева от сегмента-слуги (с определенными ограничениями на то, какие слова могут быть между ними) есть предложная группа с предлогом, который может иметь значение места - в\на\к\под\за\над. и существительное - его слуга - предмет неодушевленный, велика вероятность, что это существительное и есть хозяин где. Аналогично, если в части сегмента-хозяина слева от сегмента слуги есть ПГ с предлогом до \ перед \ после \ в течение \в продолжении \ ... , существительное - слугу в этой ПГ мы можем считать хозяином когда.

Б14. В тот самый день, когда происходила всякая нелепая кутерьма, вызванная появлением черного мага в Москве, в пятницу, когда был изгнан обратно в Киев дядя Берлиоза, когда арестовали бухгалтера.. (Б)

В ситуациях, когда при поиске хозяина функционально неоднозначные п\с не найдено ни скреп, ни предложные групп с соответствующим значением, и в сегменте-хозяине нет ситуации, когда ПП - единственный претендент на заполнение валентности предиката, необходимо понять, какие слова могут претендовать на роль хозяина соответствующего п\с. При этом не удается обойтись без использования «семантических» классов.

Хозяином когда могут быть 1) существительные, называющие или подразумевающие некоторый момент или интервал времени или называющие некоторые явления, имеющие ограниченную протяженность во времени: январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь; зима, весна, лето, осень; понедельник, вторник, среда, четверг, пятница, суббота, воскресенье время, век, год, столетие, день, час, минута, период..;. урок, лекция, эксперимент, выступление, поездка, доклад, сон...;момент, финал...; или 2) наречия времени: весной, вечером,, впоследствии, давно, днем, изредка, зимой, летом, накануне, недавно, некогда, ночью, осенью, позже, потом, раньше, сначала, утром...

Сложнее определить семантические классы слов - хозяев где.

Если нет соответствующей скрепы, хозяином - не предикатом - могут быть наречия места: внизу, наверху, посередине, слева, справа, наверху, внизу, сбоку... или некоторые объекты, условно - «вместилища», для которые возможна конструкция «в\на Х, где». К таким относятся строения, их части, предметы, имеющие объем - физические вместилища: дом, комната, дача, имение, особняк, пансион, помещение, город, музей, кабинет, проход, пустырь, музей, заведение, веранда, теплица, здание ...;пещера, туннель, подземный переход, ...; коробка, шкаф, полка...;физические объекты, в одном из своих значений мыслимые как имеющие объем и\или поверхность: небо, река, море, гора, стол, дорога, озеро.; географические объекты типа район, страна, город, место, мир,... ; объекты, имеющие поверхность: карта, лист, крыша, стена, картина...; объекты, могущие выступать как физические и\или как «ментальные вместилища»: книга (и все объекты типа книги: журнал, задачник, сборник, энциклопедия, словарь, учебник.) статья, доклад, рассказ, сочинение, обзор, план, текст, абзац, глава.

Трудным для поиска хозяина является и п\с что: чаще всего в присубстантивных ПП он заменяет который или является слугою существительного, семантически связанного с предикатом некоторого ментального действия: мысль, понимание, слова, предположение, подозрение, предчувствие, подтверждение, рассуждение, слух, страх, убеждение, вероятность, ответ, возможность, донесение, допущение, знание, известие, открытие, условие .

Таким образом, мы видим, что для построении графа сегментных связей мы нуждаемся в словарной информации о способности существительных присоединять придаточные с определенными п\с. Способность эта определяется семантикой существительных и нуждается в отдельном исследовании.

Если мы можем утверждать, что существительных - претендентов на роль хозяина определенного п\с в сегменте-хозяине нет, то ПП, вероятнее всего, является слугою той ПВ сегмента, в зоне влияния которой ПП находится.

8. Заключение

Рассмотрены некоторые общие и частные проблемы построения графа поверхностно-синтаксических связей сегментов и подход к их решению, который может быть использован при анализе русских предложений любой сегментной структуры. Алгоритмы модуля межсегментного анализа в настоящее время программируются на разработанном в РГГУ языке объектного моделирования [Баталина 2004].

Опыт построения лингвистического базиса модуля межсегментного анализа показывает, что для анализа этого уровня необходима семантическая информация о способности слов присоединять ПП с определенными п\с.

Вышеизложенным не исчерпывается, естественно, весь круг проблем, возникающих при межсегментном анализе, однако алгоритмы, построенные на этой базе, уже позволяют решать достаточно сложные задачи этого уровня анализа.

Примечания

1 Работа подготовлена при частичной поддержке гранта РФФИ № 06-06-080434.

Литература

Кобзарева Т.Ю. Некоторые аспекты анализа сочинения при сегментации русского предложения // КИИ'2002. Труды восьмой национальной конференции по искусственному интеллекту с международным участием. М. Физматлит. Т.1.С. 192-198.

Кобзарева Т.Ю. Принципы сегментационного анализа русского предложения // Московский лингвистический журнал. М. 2004а. Т.8 №1. С. 31-80.

Кобзарева Т.Ю. Омонимия и синонимия знаков препинания в русском тексте // Труды Международной конференции Диалог'2005. М.: Наука, 2005 С. 233-237.

Кобзарева Т.Ю. Иерархия задач поверхностно-синтаксического анализа русского предложения // НТИ. Сер.2, №1, 2007а. С 23 - 35.

Кобзарева Т.Ю. Морфанализ in vivo // Компьютерная лингвистика и интеллектуальные технологии: Труды Международной конференции Диалог'2004. М.: Наука, 2004. С 286-291.

Кобзарева Т.Ю., Афанасьев Р.Н. Универсальный модуль предсин-таксического анализа омонимии частей речи в русском языке на основе словаря диагностических ситуаций // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции Диалог'2002: В 2 т. Т.2. М.: Наука, 2002. С. 258-268.

Кобзарева Т.Ю. Некоторые свойства линейной структуры именных и предложных групп (Поверхностно-синтаксический анализ русского предложения)// Вестник РГГУ. 2007b. № 8. С. 113-130. (Серия «Языкознание»: Московский лингвистический журнал № 9/2).

Кобзарева Т.Ю. Рекурсивность и проективность сочинительных связей в русском тексте // Компьютерная лингвистика и интеллектуальные технологии: Труды Международной конференции Диалог 2006 (Бекасово, 31 мая - 4 июня 2006 г.) М.: Наука, 2006. С. 223-229.

Теньер Люсьен,, Основы структурного синтаксиса. М.: Прогресс, 1988.

БаталинаА.М., ЕпифановМ.Е., ИвличеваО.О., КобзареваТ.Ю., Лаху-ти Д.Г. Инструментальная среда для экспериментов с алгоритмами поверхностно-синтаксического анализа / / Компьютерная лингвистика и интеллектуальные технологии: Труды Международной конференции Диалог'2004, М.: Наука, 2004. С. 32-38.

Баталина А.М. Епифанов М.Е. Кобзарева Т.Ю. Кушнарёва Е.В. Лаху ти Д.Г. Опыт экспериментальной реализации алгоритмов поверхностно-синтаксического анализа // Компьютерная лингвистика и интеллектуальные технологии: Труды Международной конференции Диалог 2006 (Бекасово, 31 мая - 4 июня 2006 г.) М.: Наука, 2006. С. 51-56.

i Надоели баннеры? Вы всегда можете отключить рекламу.