Научная статья на тему 'Моделирование синтагматической динамики слова'

Моделирование синтагматической динамики слова Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
125
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КРИПТОКЛАССНЫЙ АНАЛИЗ / CRYPTOTYPE ANALYSIS / МОДЕЛИРОВАНИЕ / MODELING / СЛОВОСОЧЕТАЕМОСТЬ / СОЧЕТАТЕЛЬНЫЙ ПОТЕНЦИАЛ / NOUN COMBINATORY PROFILE

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Борискина Ольга Олеговна

В статье, посвященной моделированию сочетательных процессов в лексике, объясняются возможности и перспективы метода криптоклассного анализа речи в применении к построению динамической модели лексической синтагматики, которая может использоваться не только на этапе анализа, но и на этапе синтеза текста.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE DYNAMIC NOUN COMBINATORY PROFILE

The article claims that the cryptotype approach to collocation analysis enables the researcher to model the dynamic Noun Combinatory Profile and to endeavour Cryptotype Noun Combinatory Matrix. The particular choice of parameters and their possible settings in dynamic noun combinatory ability modeling are discussed and illustrated. The Noun Combinatory potential realization degree is introduced.

Текст научной работы на тему «Моделирование синтагматической динамики слова»

О. О. Борискина

МОДЕЛИРОВАНИЕ СИНТАГМАТИЧЕСКОЙ ДИНАМИКИ СЛОВА

криптоклассный анализ, моделирование, словосочетаемость, сочетательный потенциал

В статье, посвященной моделированию сочетательных процессов в лексике, объясняются возможности и перспективы метода криптоклассного анализа речи в применении к построению динамической модели лексической синтагматики, которая может использоваться не только на этапе анализа, но и на этапе синтеза текста.

Стремительные и глубокие изменения технических и технологических параметров коммуникации XXI в. создали благоприятные условия для окказионального речетворчества, что заставляет задуматься: как оценить коммуникативную значимость (т.е. устойчивость и воспроизводимость) окказиональных словосочетаний? Готова ли лингвистика дать объяснение динамики обогащения сочетательной ценности слова?

Современные коммуникативные технологии, ориентирующиеся на потребности познания и актуальность изучения форм языковой культуры, поставили перед лингвистикой ряд задач, решение которых может содействовать созданию искусственного интеллекта. К таким задачам относятся, в частности, и теоретическое представление синтагматической динамики слова, и моделирование лексико-синтаксических сетей языка. Можно ли построить модель лексической сочетаемости для целей автоматической обработки и создания текстов? Можно ли формализовать синтагматическую динамику слова, опираясь на базовые процессы развития синтаксических единиц? Можно ли научить искусственный интеллект сочетать слова в согласии с языковыми традициями определенного коллектива и в соответствии с принципами растрачивания сочетательного потенциала слова (с такими принципами можно познакомиться в работе [Поликарпов 1998]).

Ответы на эти вопросы можно искать, опираясь на опыт современной когнитивной лингвистики: миромоделирующую функцию метафоры, типологию сочетаемости метафорических моделей; вооружившись методами концептуального и лингвокультурологического анализа. Многочисленность попыток разобраться в природе сочетательных процессов в лексике находит свое отражение в богатстве и разнообразии методик анализа и описания языкового знания. Действительно, круг вопросов, связанных с языковой интерпретацией внеязыковой действительности, постоянно

расширяется, что свидетельствует об активной разработке данной проблематики. Однако несмотря на устойчивый исследовательский интерес к проблемам метафоризации и «нарушений сочетаемости» слов, формального моделирования сочетательных свойств лексики пока, насколько мне известно, не предлагалось. Терминологическая разноголосица и увлечение методической эклектикой некоторых лингвистических исследований могут только мешать эффективности решения подобных задач. (Ср. размышления проф. Болдырева о месте и роли лингвокультурологического анализа, для которого характерны «... случайный характер выбора объектов и методов анализа, фрагментарность отдельных работ, а также отсутствие единой методологической базы ...» [Болдырев 2007: 28]). А если подойти к рассмотрению этих вопросов с другой стороны? Ведь комплексная природа языковой категоризации допускает многоаспектность подходов к изучению когнитивных и коммуникативных явлений, а также предполагает множественность специально разработанных алгоритмов представления и хранения знаний. Если перенести моделирование лексической синтагматики в сетку координат крип-токлассного анализа лексики?

Суть метода криптоклассного анализа состоит в изучении лексической синтагматики с целью распределения именной лексики по крипто-классам.

Криптоклассом мы называем скрытую (не имеющую специальных, стандартных грамматических показателей) категорию языка, образованную по полевому принципу моделирующего ядра и моделируемой периферии. Имена, входящие в состав криптокласса, на первый взгляд, не разделяют общих признаков. Однако объединяющим началом для членов криптокласса служит сходство в реализации их сочетательного потенциала, иными словами, связь ядерных и периферийных членов криптокласса осуществляется по сходству их дистрибуции. К примеру, что может быть об-

щего между мелким предметом и мыслью? Человек, который раздает, дарит свои мысли, может ухватиться за мысль, бросает мысль, когда ее тяжело оформить, неосознанно и ненамеренно сочетает имя мысль с глаголами, называющими действие, которое в норме производится рукой (давать, дарить, бросать, оформлять). Подобные словосочетания, часто называемые метафоричными, суть языковое свидетельство того, что мысль категоризуется русскоязычным сознанием по типу и понятию мелкого предмета. Следует заметить, что данное положение справедливо и для англоязычного сознания (ср., to give а thought, to grasp а thought, to catch а thought). Таким образом, способность имени мысль замещать объектную позицию, проецируемую вышеназванными глаголами, следует расценивать как форму скрытой категориальной активности языковой единицы, обусловленной ее (ЯЕ) членством в крипто-классе МЕЛКИЙ предмет.

Составляющие криптокласс имена состоят в отношениях: моделирующее ядро ^ моделируемая периферия. Например, моделирующим ядром (лучшими представителями) криптокласса МЕЛКИЙ предмет, являются имена, называющие такой предмет стабильной формы, который имеет достаточно маленькие размеры, чтобы его можно было взять в руку, держать в руке и передавать, например, плод, камень, палка. Заметим, что любая манипуляция с мелким предметом проходит три стадии. А именно, наличие предмета в руках предполагает акт приобретения (взятия чего-либо в руку), и соответственно, наличие предмета в руках следует считать необходимым условием акта его передачи «из рук в руки». Периферия данного криптокласса включает имена явлений психического и физического миров человека, денотат которых невозможно ни увидеть, ни тем более осязать, хотя можно категоризовать мелкоподобным, например ответственность, которую можно взять и нести; мысль, которую можно сжать и подкинуть; честь, которую можно отдать или потерять. По-видимому, такое свойство объекта, как малый размер, сопоставимый с размером руки, является коммуникативно значимым и классо-формирующим. Иными словами, языковое моделирование возможно в силу наличия метафорических или метонимических связей между моделируемым ядром и моделирующей периферией криптокласса.

Фактически признак, связывающий разные по тематике и семантике имена в рамках крипто-класса, имеет когнитивную природу и принад-

лежит к глубинному уровню языковой категоризации1 .

Криптокласс, выступая в функции системо-логически ориентированной единицы организации лексико-синтаксической сочетаемости, представляется нам эффективным и надежным средством изучения узуального и окказионального употребления словарных сочетаний, обусловленного особенностями языковой картины мира, а криптоклассный анализ, в свою очередь, удобным для целей языкового эксперимента и формализации лингвистического знания.

Методика криптоклассного анализа, которая апробирована при реконструкции отдельных криптоклассов имен существительных английского, немецкого и русского языков [Борискина, Кре-тов 2003, 2004; Борискина 2007; Молчанова, Аза-ретова 2006], позволяет оценить сочетательную способность имени и определить степень его предрасположенности к обогащению своей сочетательной ценности.

В рамках теории языковой категоризации физического и психического миров крипто-классную систему именной лексики логично рассматривать как относительно автономную и вариабельную подсистему языковой системы. Стохастическое взаимодействие элементов крип-токлассной системы, однако, не отменяет действия внутрисистемных законов, обеспечивающих ее целостность и устойчивость (сопротивляемость разрушению).

Становление криптоклассной системы началось фактически с возникновения потребности в коммуникации. Языки рождались и умирали, а криптоклассный (глубинный) принцип хранения знания оставался, по сути, тем материалом, из которого строились языковые системы.

Логично предположить, что в процессе многовековой адаптации криптоклассной системы вырабатывались свойства взаимосогласованности ее ядерных и периферийных элементов. Нельзя не признать интенсивности и прочности такого рода связей, поскольку «чем дольше существует система и чем сильнее воздействия, которым она подвергается, тем в большей мере в системе в целом и в каждом ее элементе должны проявляться свойства взаимосогласованности, выработанные в процессе адаптации» [Мельников 1978: 5].

Согласно системным принципам крипто-классной организации именной лексики модели-

1 Подробнее о природе криптокласса и технологии его выделения см., напр.: [Борискина, Кретов 2003, 2004].

рующее ядро криптокласса «навязывает» моделируемой периферии свои классификаторы. Таким образом, любой периферийный представитель криптокласса, стремясь реализовать свой сочетательный потенциал в полной мере, в идеале мог бы замещать ВСЕ свободные валентности ВСЕХ классификаторов определенного криптокласса.

Следует, однако, оговориться, что согласованность сочетательных траекторий вовсе не предполагает механического копирования периферийными именами сочетательной специфики ядерных представителей криптокласса. Сочетательная мимикрия периферийных членов криптокласса проявляется по-разному. «Склонность» или предрасположенность языковой единицы к реализации своей сочетательной ценности в значительной степени обусловлена ее (языковой единицы) криптоклассным статусом. Иными словами, реализация способности имени замещать проецируемые другим языковым знаком (например, глаголом) позиции зависит от меры

представленности имени в криптоклассе. Допустим, что мера представленности имени в криптоклассе - это отношение количества классификаторов, присловные позиции которых замещены рассматриваемым именем, к общему количеству классификаторов данного криптокласса. Заметим, что исследователь может задавать параметры перечня классификаторов (глагольные, адъективные, субстантивные и др.).

Например, общее количество глагольных классификаторов криптокласса английского языка «Мелкий предмет стабильной формы, сопоставимый с размерами руки» - 73. Мера представленности имени job, которое употребляется с 28 классификаторами данного криптокласса - 38,4%; имени vote, которое образует словосочетания с 27 классификаторами - 37%; имени democracy, которое обнаруживает свою сочетаемость с 21 классификатором - 29%; law - с 20 классификаторами - 27,4%; для legislation и resignation - 26% (см. рис. 1).

45-

40-

35-

30-

25-

20-

15-

10-

5-

1

N

N

Н

ш

Itt

с с

о о

с

М щ

с с

о о

>

с а

о а

с

«

м

£ £

сл rt

'3 ^ 3

с с

.¡2 .12

с 13 а о а

3 -О С

Рис. 1.

0

Белым цветом на рисунке отмечена мера представленности имен английского языка в криптоклассе «Мелкий предмет стабильной формы, сопоставимый с размерами руки». Черным цветом показана мера представленности имен в одноименном криптоклассе русского языка. Статус классификаторов криптокласса русского языка получили 69 глагольных лексем.

По-видимому, мера представленности имени в криптоклассе равна мере отдаленности имени от ядра криптокласса.

Так, наиболее близко к ядру криптокласса оказались имена job, vote, party. Данные единицы в наибольшей степени (по сравнению с другими именами социальных явлений английского языка) категоризуются англоязычным сознанием как

мелкий предмет. Среди представителей дальней периферии на первый план выступает имя immigration. Интересно, что анализ русскоязычных текстов показал, что все рассматриваемые нами номинации социальных явлений, за исключением имени закон, располагаются на дальней периферии криптокласса.

По-видимому, мера представленности имени в криптоклассе является показателем его предрасположенности к обогащению своей сочетательной ценности. Замечено, что единицы, представленные в криптоклассе в большей мере, т.е. ближе к ядру криптокласса, более динамичны в образовании окказиональных словосочетаний. Это объясняет особую активность имени закон в стремлении к расширению своего узуса или к изменению своей словосочетательной нормы.

Ср., на вопрос, почему нужно вбрасывать в Думу такой закон сейчас, разработчики ссылаются на послание президента, в котором он говорил, что нужно «четко и максимально быстро определиться с имуществом, которое следует оставить в государственной и муниципальной собственности».

В силу того обстоятельства, что имя может быть представлено больше чем в одном крипто-классе заданного языка, будет целесообразным определить совокупную криптоклассную частотность речевых реализаций валентных свойств име-

35

ни. Именно эта величина будет соответствовать степени реализации сочетательного потенциала имени. Так, к примеру, сочетательный потенциал имени закон реализован на 38%, в то время как степень реализации сочетательного потенциала соответствующего ему имени английского языка law значительно выше и составляет 53%.

Показательно, на наш взгляд, и то, что мера представленности практически всех имен социальных явлений английского языка (22 единицы) в криптоклассе ОБЪЕКТ СТАБИЛЬНОЙ ФОРМЫ выше, а в отдельных случаях несравненно выше аналогичного показателя для имен русского языка (см. рис. 2). В наибольшей мере в данном криптоклассе представлены наиболее значимые и стабильные для англоязычной культуры социальные явления nation, party, organization, population - основные атрибуты политической жизни XX в. Заметим, что для русскоязычной культуры такое явление, как партия, воспетое еще В.В. Маяковским, также представляется стабильным и коммуникативно-ценным. А лидирует по мере представленности имя закон. Это дает нам право предполагать, что при определенных условиях имена ближайшей периферии с большей вероятностью займут проецируемые классификаторами данного криптокласса свободные позиции, что приведет к образованию окказиональных словосочетаний: уронить закон* или шлифовать демократию *.

30 25 20 15 10 5 0

Рис. 2.

Оставим интерпретацию результатов крип-токлассного анализа речи при сравнении языковых портретов социальных явлений русскоязычной и англоязычной культур специалистам в области политической лингвистики и вернемся к рассмотрению других возможностей предлагаемого метода.

Итак, обработка результатов криптокласс-ного анализа речи, а именно сравнение показателей представленности имени в разных крипто-классах, дает исследователю необходимые показатели синтагматической динамики слова и возможность определить вектор реализации его сочетательного потенциала. Другими словами, предлагаемая модель синтагматической динамики слова будет способна предсказывать (эксплицировать) некоторые состояния объекта, которые

реально существуют в языке, но не проявляют себя. Следовательно, будучи системой активного типа, такая модель может использоваться не только на этапе анализа, но и на этапе синтеза текста.

Общая картина криптоклассного распределения имени укажет вектор реализации его сочетательного потенциала (см. рис. 3). По степени и вектору реализации сочетательного потенциала имени возможно будет судить о коммуникативной значимости (т.е. устойчивости и воспроизводимости) окказиональных словосочетаний. Действительно, «удовлетворение» сочетательной потребности слова увеличивает его функциональную нагруженность в системе и, соответственно, его коммуникативную нагруженность в дискурсе.

45403530-

2520151050

а

Т-1-

©

о о

а

S

4

5

«

S

и ч

и

is

ы О га S

©

я о

Рис. 3.

Так, в русскоязычном дискурсе коммуникативно востребуемыми в первую очередь являются окказиональные словосочетания, отражающие представления закона мелким предметом стабильной формы, которым легко манипулировать. По всей вероятности, для данной культуры неперспективно и коммуникативно неактуально кате-горизовать закон по типу и понятию живого (смертного). Интересно отметить, что Русский национальный корпус www.ruscorpora.ru не содержит словосочетания закон умирает. Показательна плавная синтагматическая динамика слова law, на фоне которой заметно выделяется мера представленности имени в криптоклассе «объект нестабильной формы» (5,1%). Появление окказиональных сочетаний с классификаторами дан-

ного криптокласса как в русскоязычном, так и в англоязычном дискурсе будет в меньшей степени коммуникативно нагружено.

Моделирование сочетательных процессов в синтагматике, безусловно, требует серьезной теоретической и методологической проработки и масштабной проверки на обширном материале национальных электронных корпусов. Следует также учитывать то обстоятельство, что скорость образования новых окказиональных словосочетаний должна неизбежно вести к замедлению самого процесса. Ведь «закономерным следствием траты словом своего сочетательного потенциала будет относительное понижение активности имени в образовании словосочетаний» (см. подробнее в [Поликарпов 1998]), (ср., сте-

пень метафорической активности [Скляревская 1993: 132]).

Результаты исследования будут иметь прикладное значение при создании информационно-поисковых систем и мониторинга языковой политики, а также для повышения эффективности языкового образования; базы данных могут использоваться в переводческой деятельности, на их основе можно совершенствовать программное обеспечение машинного перевода. Изучение криптоклассов (скрытых категорий) языка может оказаться чрезвычайно полезным в области политической лингвистики. Знание динамики крипто-классной категоризации мира способно дать информацию о состоянии общественного сознания. Выявление частностей поможет диагностировать вероятности развития языковой культуры народа. Интерпретация результатов такой диагностики будет способствовать выработке принципов управления социальными процессами.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Список литературы

Болдырев Н.Н. О понятии культуры и культурологическом анализе языка // Филология и культура: Мат-лы VI Междунар. науч. конф. 17-19 октября 2007 года. Тамбов: Изд-во ТГУ им. Г.Р. Державина, 2007.

Борискина О.О., Кретов А.А. Теория языковой категоризации: национальное языковое сознание сквозь призму криптокласса. Воронеж: Воронежский государственный университет, 2003.

Борискина О. О., Кретов А.А. Методология и практика криптоклассного анализа речи // Введение в когнитивную лингвистику. Кемерово: ИПК «Графика», 2004.

Борискина О. О. Лексико-синтаксическая сочетаемость в криптоклассном измерении // Актуальные проблемы профессионального образования: подходы и перспективы. Ч. 1. Воронеж: Научная книга, 2007.

Мельников Г.П. Системология и языковые аспекты кибернетики. М.: Советское радио, 1978.

Молчанова Л.В., Азаретова Ю.Н. Языковая категоризация первостихий огня (Feuer) и воды (Wasser) в немецком языке // Проблемы германских и романских языков: лингвистика, методика, лингвострановедение. Воронеж, 2006.

Поликарпов А.А. Циклические процессы в становлении лексической системы языка: моделирование и эксперимент: Автореферат дис. ... д-ра филол. наук, М., 1998.

Скляревская Г.Н. Метафора в системе языка. СПб.: Наука, 1993.

O.O. Boriskina THE DYNAMIC NOUN COMBINATORY PROFILE

cryptotype analysis, modeling, noun combinatory profile

The article claims that the cryptotype approach to collocation analysis enables the researcher to model the dynamic Noun Combinatory Profile and to endeavour Cryptotype Noun Combinatory Matrix. The particular choice of parameters and their possible settings in dynamic noun combinatory ability modeling are discussed and illustrated. The Noun Combinatory potential realization degree is introduced.

i Надоели баннеры? Вы всегда можете отключить рекламу.