ЯЗЫКОВАЯ ИГРА И ФОРМАЛИЗАЦИЯ СЕМАНТИКИ
Шихиев Ш. Б., к. ф-м. н., доцент, Гаджиев Т. С., к. ф-м. н., доцент.
Ясулова Х. С., старший преподаватель Дагестанский государственный педагогический университет
Аннотация. В статье демонстрируется пример построения конструктивной теории синтаксиса, семантики и естественного языка в целом. Формальная модель языковой игры используется в статье для демонстрации автономности синтаксиса и семантики, а язык интерпретировать как отображение элементов синтаксиса в элементы семантики и наоборот.
Ключевые слова: языковая игра, информация, лексика, морфология, синтаксис, семантика, слово, словоформа, синтаксически связанные словоформы, предложение, значение предложения, формализация, граф, сеть, дерево.
LANGUAGE GAME AND FORMALIZATION OF SEMANTICS
Shihiev Sukur Babaevich candidate of physico-mathematical Sciences, рrofessor.
Hajiyev Tajudin Serazhudinovich, candidate of physico-mathematical siences, professor.
Yasulova Khadizhat Sirajudinovna, senior lecturer Dagestan State Pedagogical University
Abstract. In article describes the example of creation of the constructive theory of syntax, semantics and a natural language. The formal model of language game is used in article for demonstration of autonomy of syntax and semantics, and to interpret language as mapping of elements of syntax in elements of semantics and vice versa.
Keywords: language game, information, vocabulary, morphology, syntax, semantics, word, word form, syntactically related word forms, sentence, the meaning of a sentence, formalization, graph, network, tree.
Каждый, кто интересуется компьютерной лингвистикой и, в частности, компьютерным анализом предложений естественного языка (ЕЯ), знает принципиальных проблемах, сдерживающих развитие этой области. Основная проблема одна: семантика языка или значение предложения не поддается формализации. Значение предложения имеет много граней и проявлений. Об этом говорить и тот факт, что одно и то же предложений обозначает предмет и его образ в сознании человека. В этой статье на конкретном примере показано, как можно
формализовать знания о пространственных отношениях. То есть, как простая программа в роботе с видеокамерой может управлять расстановкой предметов в помещении.
Информация поступает в систему через видеокамеру, то есть программа имеет фотографию (координаты) комнаты и предметов в ней в координатной плоскости. У каждого предмета есть свою предпочтительное место нахождения. Программа анализирует рисунок в фото, дает команду в форме предложения на ЕЯ, а робот или человек исполняет команду.
У системы (программы) есть цель: передвинуть предметы на их предпочтительные места нахождения.
В такой формулировке данная задача напоминает языковую игру. Языковые игры в различных формах известны каждому носителю языка. В языковые игры играют и дети, на них обращали внимание и выдающиеся ученые и лингвисты, тем более.
Возможности машинной программы и робота хорошо известны. Поэтому здесь будут рассмотрены вопросы синтаксиса, то есть, структура простых предложений и правила формирования их.
Августин Аврелий в своей «Исповеди» пишет о том, какими порциями ребенок усваивает лексику, синтаксис и семантику языка. А у Элочки из «13 стульев» словарь состоял из 24 слов, а предложения из одного слова. Так Элоч-ка играла в языковую игру.
Само словосочетание языковая игра впервые было использовано, как термин, Л. Витгенштейном в «Философских исследованиях» [1]. Он напоминает мысль Августина о том, как он, имитируя языковую активность окружающих, учился языку «по частям». Далее Витгенштейн пишет, что «весь процесс употребления слов в языке можно представить и в качестве одной из тех игр, с помощью которых дети овладевают родным языком. Я буду называть эти игры «языковыми играми» и говорить иногда о неком примитивном языке как о языковой игре».
Таким образом, языковая игра есть «некий примитивный язык». Иначе говоря, языковая игра есть некий подъязык обычного языка. Он примитивен в том смысле, что его словарь может состоять из нескольких десятков слов, а предложения из небольшого набора слов, например, одно, два или три слова. Возможны некоторые искажения в морфологии слов и синтаксисе словосочетаний, хотя данное обстоятельство не является существенным в структуре языковой игры.
Языковая игра, а было бы точнее, если сказать язык игры, задается: лексикой, морфологией и синтаксисом. Таким же образом задается и любой другой язык. Суть игры заключается в том, что выбирается такая лексика, чтобы морфология и синтаксис этого языка были простыми и прозрачными.
Для определения языковой игры названных трех образующих языка недостаточно. Требуется еще одного типа информация, она называется семантика языка. Витгенштейн вместо термина семантика использует слово «действие» и по этому поводу пишет: «Языковой игрой я буду называть также единое целое: язык и действия, с которыми он переплетен»
В качестве первого примера языковой игры Витгенштейн рассматривает язык из четырех имен существительных. Во второй игре к этим именам добавляется несколько числительных и прилагательных (указателей цвета). Языковая игра для Витгенштейна - это примитивный язык из нескольких предложений; она нужна ему как упрошенный аналог языка, как инструмент для изучения языка.
В числе упомянутых выше четырех имен имеется слово «плита». Предложение из этого слова, произнесенное на стройке монтажником Ивановым, может быть понято разнорабочим Петровым по-разному.
Чтобы доопределить значение предложения «Плита», надо иметь новое слово, уточняющее одно из качеств плиты, и эти два слова нужно сочетать: «белая плита». Процесс доопределения значения предложения можно продолжить: «Нужна плита белая».
Прежде чем продолжить рассмотрение языковой игры, имеет смысл обратить внимание на толкование языковой игры в литературе. Предмет семантики пока не имеет четкого определения. В таких случаях с новыми идеями часто случается то, о чем говорится в поговорке: «Попроси глупца молиться, он лоб себе расшибет». Стратегическая идея Витгенштейна об использовании языковой игры для исследования языка была искажена и превращена, в некоторых случаях, в развлечение.
В «Лингвистической энциклопедии» в статье, посвященной лингвистической философии, сказано, что «Соединение речи и действия Витгенштейн назвал языковой игрой».
В [2] мы читаем: «Для того чтобы исследовать использование лингвистических знаков, Витгенштейн и получившее большую известность понятие «языковая игра». Далее, «Конечно, языковые игры в концепции самого Витгенштейна - это своеобразная абстракция, выполняющая, помимо всего прочего, определенную методологическую функцию при анализе лингвистической деятельности. Многочисленные примеры различных игр выступают реализацией излюбленного им метода «мыслительного эксперимента».
Будет вернее, если сказать, что языковые игры суть эксперименты, для демонстрации определенной методологии для анализа языка в целом. Он потому и назвал подобные примеры языка игрой, чтобы указать на их примитивный характер, подобный детскому языку или языку инструкций. Но, было бы неверно сказать, что в лингвистической философии и, в частности, у Витгенштейна «на первый план выдвигается не когнитивная» (мыслительная), а «инструментальная функция языка» [5].
Витгенштейн однозначно высказал свое понимание слова и предложения в «Логико-философского трактата». Например. «4.01. Предложение - образ действительности. Предложение - модель действительности, как мы ее себе мыслим. 4.023. Предложение есть описание атомарного факта. 1.2. Мир распадается на факты. 2. То, что имеет место, что является фактом, - это существо-
вание атомарного факта. 2.01. Атомарный факт есть соединение объектов (вещей, предметов)».
В Википедии можно читать и следующее определение языковой игры. «В отечественном языкознании термин (языковая игра - Ш.Ш.) вошел в широкий научный обиход после публикации одноименной работы Е.А. Земской, М.В. Китайгородской и Н.Н. Розановой, хотя сами лингвистические явления, обозначаемые данным термином, имеют достаточно длительную историю изучения. Как указывается в данной работе, это «те явления, когда говорящий «играет» с формой речи, когда свободное отношение к форме речи получает эстетическое задание, пусть даже самое скромное. Эта может быть и незатейливая шутка, и более или менее удачная острота, и каламбур, и разные виды тропов (сравнения, метафоры, перифразы и т.д.)». Исследователи изучают факты языковой игры в разговорной речи и считают, что языковую игру следует рассматривать как реализацию поэтической функции языка». Далее приводятся примеры различных «языковых игр». Вот один из примеров языковой игры («в отечественном языкознании»): «поехал поездом, вернулся ослом».
К сожалению, в отечественном языкознании немало языковедов под семантикой подразумевают, именно, подобные каламбуры. Витгенштейн один из серьезных исследователей языка. Ему, точно, не до каламбуров и острот.
2. Далее вместо понятия «языковая игра» будет использован термин примитивный язык. Для предложения примитивного языка трудно найти более примитивное значение, нежели предмет или действие, обозначаемое этим предложением. Только потому, как мы полагаем, Витгенштейн в качестве значения предложения выбрал действие, а не знание (мысль), заключенное в нем.
А Декарт поступил иначе. В качестве очевидным образом существующего явления в бытии он назвал мысль, хотя мог бы называть и ощущения. Ради истины заметим, что он не обратил внимания на то, что, полагая свое существование как носителя мысли, он опирался на свои ощущения мысли. И к Витгенштейну можно было бы предъявить такие же претензии о том, что и ощуще-
ния, и мысли становятся явью благодаря сознанию. Пока мы не влезли в дебри феноменологии, вернемся к примитивным языкам.
Цель нашей работы заключается в уточнении понятия примитивного языка (языковой игры) и построении его математической и компьютерной модели.
Следуя Витгенштейну, рассмотрим пример примитивного языка. Рассматриваемый язык обозначим через Lang1. Словарь языка Lang1 включает в себе имена существительные (кирпич, савок, раствор, фундамент), имена прилагательные (красный, белый, густой, передний), порядковые числительные (первый, второй), количественные числительные (два) и глаголы (подайте, положите, поднимите, переставьте).
Все имена в Lang1 имеют форму мужского рода, можем считать, что вLang1 нет категории рода. В остальном слова языка Lang1 имеют формы, определенные морфологией русского языка.
Синтаксис языка начинается с определения набора словосочетаний, из которых будут построены предложения языка. Словосочетание есть упорядоченная пара словоформ (V, w), элементы которой считаются синтаксически связанными. Первый элемент является главным, а второй - зависимым.
Для задания словосочетаний вводятся обозначения для следующих лексических групп: £ - множество имен существительных; G - множество имен прилагательных; N - множество порядковых числительных; Э-множество количественных числительных; V- множество глаголов.
Некоторые лексические группы имеют производные группы, например, группа£ имеет 12 производных групп, которые обозначаются через £ с индексами: 8у, где I = 1..2;у = 1..6. Первый индекс указывает на категорию числа (1 -единственное число, 2 - множественное число), второй индекс - на категорию падежа. По определению £= 811. Каждое из этих 12 лексических групп имеет по 4 элемента. Например, Б12 = /кирпича, савка, раствора, фундамента}.
Аналогично определяются по 12 производных групп для G, ^ D:Gij и Nij, где I = 1..2; j = 1..6; Dj, где j = 1..6. Например, Nl2 = /первого, второго}, D5 = {двумя}.
Формы элементов названных 38 лексических групп определяются морфологией русского языка. Элементы группы V являются неизменяемыми словами.
Для перечисления всевозможных словосочетаний, определенных на множестве из 4*12+4*12+2*12+6+4=130 словоформ, будут использованы прямые произведения 38 лексических групп, по которым эти слова распределены.
Язык Lang1.1. Словосочетанием является элемент любой из следующих произведений:
V * Бц, Бц * ^ь Бп * N11 (1)
Три отношения (1) задают граф, показанный на рис. 1.
Граф из рис. 1 является корневым деревом, обозначим его через TrLang1.1. Чтобы каждый раз не рисовать деревья, для представления дерева далее будет использована скобочная форма записи дерева. В данном случае:
Тг1ап^1.1. = V(Sll ^11, N11)) (2)
Дерево представляет собой правило, порождающее предложения языка TrLang1.1. Чтобы получить предложения языка TrLang1.1, достаточно обозначение каждого множества в (2) заменить словом из этого множества. Например,
Подайте кирпич красный первый (3)
В корневом дереве TrLang1.1 содержится корневых деревьев с корнем в
TrLang1.12 = V; TrLang1.13 = ^(Б11);
TrLang1.14 = V £11 (Оп)); TrLang1.15 = V £п (N11)). Каждое из пяти деревьев представляет собой правило, порождающее предложения языка TrLang1.1. Из этих пяти правил состоит грамматика GrLang1.1 языка TrLang1.1. Предложения, порожденные последними четырьмя правилами таковы:
Подайте. Подайте кирпич.
Подайте кирпич красный. Подайте кирпич первый Можно и посчитать сколько различных предложений порождает грамматике GrLang1.1 из этих пяти правил.
Правило TrLang 1.12: 1 предложение.
Правило TrLang 1.13: 4 предложения.
Правило TrLang 1.14: 16 предложений.
Правило TrLang 1.15: 8 предложений.
Правило TrLang 1.11: 32 предложения. Всего 61предложение.
Можно дополнить новые правила к грамматике GrLang1.1 или новые правила рассмотреть как отдельную грамматику. Новые правила, которые будут ниже введены, определены на той же лексике, что и язык Lang1.1. Поэтому грамматику GrLang1.1 дополним новыми правилами, которые задаются деревом
ГГ1ОП^1.1Л = V(S21 ^21, N21)) (4)
определенным следующими отношениями:
V * Б21, Б21 * G21, Б21 * N21 (5)
Пять правил, извлеченных из дерева (4) порождают предложения:
Подайте. Подайте кирпичи.
Подайте кирпичи красные. Подайте кирпичи первые
Подайте кирпичи красные первые.
Теперь грамматика состоит из 9 различных правил. Они порождают 121 предложение. Продолжим наращивания правил в грамматике.
В дереве
TrLangl.lB = V(Di (S12 (G21, N21)) (6)
определенном отношениями:
V * Di, Di * S12, S12 * G21, S12 * N21(7) содержится шесть новых правил, которые порождают предложения типа:
Подайте два. Подайте два кирпича.
Подайте два кирпича красные.
Подайте два кирпича первые.
Подайте два кирпича красные первые.
Таким образом, в грамматике GrLang1.1 оказалось 15 правил, порождающих довольно разнообразный набор предложений.
Язык Lang1.2. К словарю языкаLang1.2 добавим местоимения (туда, оттуда) и предлоги (с, на, у) Множество местоимений обозначено через ^множество предлогов - через H.
Предлоги рассматриваются здесь как падежи по той причине, что они выполняют такие же словоизменительные функции, как падежи. Поэтому предлогам «с», «к» и «у» присвоены номера 7, 8 и 9. Лексическая группа S теперь имеет еще 6 производных групп: Sij, где i = 1.. 2; j = 7..9. Их элементы образованы по правилам морфологии русского языка. Например,
S17 = {скирпича, ссавка, сраствора, сфундамента} (Предлог «с» управляет родительным падежом)
Все три предлога являются пространственными. Элементы S17 и S27обобщаются местоимением оттуда. Элементы S18 и S28обобщаются местоимением туда. Поэтому вводится три множества:
From = S17+S27+ {оттуда}, To = S18+S28+ {туда}, On =S19+S29
Глагол, как известно, является многовалентным словом, то есть одновременно может быть доопределен несколькими дополнениями и обстоятельства-
ми. В рассматриваемом языке Lang1.2 глаголы могут быть доопределены указателем (обстоятельством) времени. Следовательно, ко всем деревьям, образующим грамматику языка Lang1.1, будут добавлены три дуги с началом в и с концами в вершинахFrom,Toи Оп.
TrLang1.21 = V (S11 (Gn , Nn), From, To, On) (8)
Примерами предложений, порожденных правилом (8), являются: Подайте кирпич красный первый с савка к раствору у фундамента Подайте раствор густой второй оттуда туда у кирпича Если вершиныFrom,Toи On добавлять к TrLangl.1 по одной и по два, эту же процедуру осуществить над остальными правилами грамматики GrLangl.l, то можно наблюдать, какое огромное число предложений разнообразной структуры порождаются несколькими лексическими группами.
В качестве следующего шага в расширении грамматики можно ввести группу наречий - указателей времени. Далее и другие валентности сказуемого и имен можно заполнить соответствующими выражениями.
Выше речь шла о синтаксически правильно построенном предложении. Синтаксические отношения между словами настолько привычны и всеобщи, что сознание придаст какое-нибудь значение любому синтаксически правильному сочетанию словоформ; если не из реальной жизни, то хотя бы из области фантастики или мира сказок. И морфология настолько материализована в соз-
нании человека, что слова из известного примера «Глокая куздра будланула бодренка» тут же обретают значения.
Лексику языка можно считать определенной. В значениях слов остается свобода для естественного вольнодумства хотя бы в том смысле, что слово «топор» для лесоруба и поварихи вызывают различные представления об этом орудии. Или, как писал классик, «совесть у роялиста иная, чем у республиканца».
Еще больше неопределенности в значениях словосочетаний: «железный конь», «облако камней», «горячий снег» и т.д. Несколько словосочетаний с иносказательными значениями надо связать вместе, чтобы поиск значения (смысла) в нем стало для сознания затруднительным: «горячий снег оседлал железного коня на облаке камней». Если надо, то для этого синтаксически правильно построенного предложения найдется подходящее толкование.
О степени осмысленности синтаксически правильного предложения можно только спорить. Можно говорить о степени реалистичности (действительности, вероятности) значения предложения. И сказки, и фантазии суть действительность в сознании человека.
Выходит, осмысленность предложения сводится к его синтаксической правильности. А синтаксически правильное предложение - это есть то предложение, которое порождается одним из правил грамматики. Дело в том, что «Никто не может сформулировать все правила английской грамматики, до сих пор этого не удалось сделать даже самым опытным лингвистам» [6].
На самом деле, основанием для такого заявления служит тот факт, что под правилами грамматикой подразумеваются правила как синтаксиса, так и семантики. Правила семантики незримо присутствуют в грамматике в качестве поправок к правилам синтаксиса. Задачей языковой игры должна быть разграничение правилам синтаксиса и правил семантики, и демонстрация на примерах того, что морфологических и синтаксических правил в грамматике языка
имеется конечное число; синтаксически правильное предложение имеет формальное (строгое) определение.
Любая формализация или моделирование налагает некоторые ограничения на исходную задачу. В морфологии и синтаксисе потери от формализации минимальны и незаметны.
Для любой последовательности словоформ всегда разрешима задача распознавания (анализа) этой последовательности, которая сводится к проверке синтаксической правильности предложения, членами которого являются элементы данной последовательности.
Алгоритм решения задача распознавания последовательности словоформ можно реализовать на компьютере. В таком случае мы имеем компьютерную языковую игру.
Совсем иначе обстоит дело при формализации семантики элементов языка. Об этом свидетельствуют приведенные выше примеры.
Витгенштейн в своих языковых играх в качестве семантики предложения не стал определять значение предложения, а остановился на его практической реализуемости.
Естественный язык теряет свои функции, назначение и определение без семантики (значения) слов и их сочетаний, какая бы расплывчатая она не была. И в языковой игре слова и их сочетания должны иметь значение. Значением предложения может быть мысль, активизированная в памяти говорящего или воспринимающего, действие, вызванное этим предложением у человека или машины.
Синтаксические отношения между словами представляют собой отражение отношений между вещами, которые именованы этими словами. Поэтому слова и их сочетания из синтаксического графа должны найти свое значение в семантическом графе, вершинами которого являются имена вещей, а дуги указывают на отношения между ними. Отношение, в котором состоят две вещи (предметы и явления), называются обладанием или качеством. Например, яб-
локо обладает красным цветом или красный цвет есть качество яблока. Мужчина и женщина могут состоять в отношениях: дружеских, недружеских, родственных и т.д.
Язык, на самом деле, задается двумя графами: синтаксическим и семантическим. Языковая способность человека есть отображения (средствами физиологии) элементов одного графа в элементы другого.
Литература:
1. Витгенштейн Л. Философские исследования //Новое в зарубежной лингвистике. Вып. XVI. - М., 1985.
2. Грязнов А.Ф. Аналитическая философия. - М., 2006.
3. Ельмслев Л. Пролегомены к теории языка //Новое в лингвистике. Вып.1. -М., 1960.
4. Кронгауз М. А., Семантика. - М., 2005.
5. Лингвистический энциклопедический словарь. - М., 1990.
6. Слобин Д., Грин Дж. Психолингвистика. - М., 1976.
7. Шихиев Ф.Ш., Шихиев Ш.Б. Формализация отношений синтаксиса и семантики. Сб. статей научно-практической конференции «Новые информационные технологии в экономике, управлении и образовании». - Дербент, РД, 2014.
8. Шихиев Ф.Ш. Формализация и сетевая формулировка задачи синтаксического анализа. Канд. диссертация. СПбГУ, 2006.
9. Ясулова Х.С. Коммуникативные возможности синтаксически правильных предложений //Вестник РГУПС. - Ростов-на-Дону, 2013. №1.
Literature:
1. Wittgenstein L. Philosophical Investigations // New in foreign linguistics. Vol. XVI. - M., 1985.
2. Gryaznov A.F. Analytical philosophy. - M., 2006.
3. Hjelmslev L. Prolegomena to a theory of language // New in linguistics. Issue 1. -M., 1960.
4. Krongauz M.A., semantics. - M., 2005.
5. Linguistic Encyclopedic Dictionary. - M., 1990.
6. Slobin D., J. Greene. Psycholinguistics. - M., 1976.
7. Shihiev F.S., Shihiev S.B. The formalization of relations of syntax and semantics. Coll. articles of scientific and practical conference "New information technologies in economics, management and education." - Derbent, Dagestan, 2014.
8. Shihiev F.S. The formalization of the network and formulation of the problem of parsing. Kand. thesis. St. Petersburg State University, 2006.
9. Yasulova H.S. Communication possibilities of syntactically correct sentences // Herald RSTU. - Rostov-on-Don, 2013. №1.