УДК 811.161.1 '22'27 ББК 81.2Рус-5
В0110.18500/2311-0740-2016-1-13-50-55
В. М. Савицкий
Самара, Россия
ПОРОЖДЕНИЕ РЕЧИ В СОЦИОСЕМИОТИЧЕСКОМ АСПЕКТЕ
Аннотация. В статье охарактеризован ряд со-циосемиотических правил выбора и комбинирования языковых средств в процессе порождении речи. Обоснована необходимость включения этих правил в генеративную модель высказывания. Выявлена зависимость выбора и организации слов в ходе порождения высказывания от конституэнтов коммуникативного регистра речи (категории, близкой к категории речевого жанра). В качестве примера рассмотрены социосемиотические правила выбора имени деятеля (агенса). Теоретические выкладки основаны на данных, полученных путем опроса информантов. В статье описана подготовка материалов опроса, его проведение, обработка и интерпретация полученных результатов. Сделан вывод о необходимости формализации экстралингвистических (социальных и культурных) сведений, значимых для разработки машинной модели порождения речи. Ключевые слова: порождение речи, генеративная модель, социосемиотика, контекстуальная дистрибуция, алгоритм, социальные роли.
Сведения об авторе: Савицкий Владимир Михайлович, доктор филологических наук, профессор кафедры английской филологии и межкультурной коммуникации.
Место работы: Поволжская государственная
социально-гуманитарная академия.
E-mail: lampasha90@mail.ru_
В XX веке в рамках генеративной грамматики ([1] и др.) и смежных направлений, ориентированных на превращение лингвистики в точную науку, была сделана попытка представить естественный язык как логический автомат, порождающий по строгому алгоритму все правильные и только правильные высказывания. Планировалось смоделировать этот «автомат» на компьютере, который, как предполагалось, станет порождать речь, не отличимую от человеческой, если заложить в него «полное, достаточное и эксплицитное описание всех языковых объектов и правил» [2 : 32].
В основе порождения речи лежит «механизм выбора и организации слов» [3 : 387]. Считалось, что в процессе речепроизвод-
V. M. Savitsky
Samara, Russia
SPEECH GENERATION IN THE SOCIOSEMIOTIC ASPECT
Abstract. The article contains a characterization of some sociosemiotic rules that regulate the choice and arrangement of language units in the process of speech generation. Arguments are offered in favour of the view that the rules should be included into the generative model of an utterance. A dependency is ascertained between the constituent parts of a communicative register (a category closely related to that of speech genre) and the word selection rules of speech generation. The sociosemiotic rules of choosing a name for the agent serve as an example. The theoretical theses are based on the results of interviewing testees. The article contains a description of preparing the interview materials, conducting the interview, processing and interpreting its results. A conclusion is made concerning the necessity of formalizing the extralinguistic (social and cultural) data relevant for creating a computer model of speech generation.
Key words: speech generation, generative model, social semiotics, contextual distribution, algorithm, social roles.
About the author: Savitsky Vladimir Mikhailovich, Doctor of Philology, Professor of the Chair of English Philology and Cross-cultural Communication. Place of employment: Povolzhskaya State Academy of Social Sciences and Humanities.
ства этот выбор и эта организация осуществляются автоматически, исходя лишь из правил языковой системы. Если, например, некий внеязыковой объект называется по-английски lemon «лимон», то при построении высказывания об этом объекте выбор данного слова из лексикона происходит сам собой.
Но так ли это? Слово lemon (в буквальном значении) не имеет синонимов. Однако даже в этом случае имеется номинационный выбор: если контекст и ситуация позволяют понять, о чем идет речь, данный внеязыковой объект можно называть гиперонимами fruit «фрукт», citrus «цитрусовое растение», а также разного рода перифразами и описаниями. (Такие замены дей-
© Савицкий В. М., 2016
ствительно нередко производятся в стилистических целях, дабы избежать однообразного повторения слова lemon.) Сказанное тем более относится к столь многогранному объекту номинации, как человек, который может обозначаться сотнями имен, и правила их выбора не заложены в самой языковой системе. Хомскианская генеративная модель не полна.
Порождение подлинной живой речи требует учета таких факторов, которые выходят за рамки системы языка. Эти факторы должны учитываться при разработке моделей порождения речи. Такие модели, наряду со строгими алгоритмами, должны включать эвристические алгоритмы, носящие не собственно языковой, а социо- и культурно-семиотический характер.
По М. Халлидею, три из вышеупомянутых факторов составляют коммуникативный регистр речи: 1) field of discourse «область дискурса» (тематика общения); 2) tenor of discourse «направление дискурса» (ролевой расклад речевой ситуации, отношения участников коммуникативного акта); 3) mode of discourse «модус дискурса» (цель речевого общения и его жанрово-лингвистические характеристики) [4].
В нашей статье в качестве примера описывается лишь небольшая часть общей совокупности социосемиотических правил, регламентирующих выбор и комбинирование языковых средств при порождении высказывания, а именно правила выбора имени деятеля при акциональном глаголе.
Мы установили, что этот выбор диктуется всеми тремя упомянутыми факторами [5 : 25-111]. Здесь мы опишем первый из них -зависимость выбора имени деятеля от характера совершённого действия. С целью ее выявления мы запланировали опрос информантов. На эту мысль нас навел пример: The linguist saw the pelican «Лингвист увидел пеликана». Он не раз приводился интерпретаторами идей генеративной грамматики (см.: [6-8] и др.) для демонстрации этапов порождения высказывания. В их генеративной модели отсутствует правило выбора имени субъекта (linguist) из лексикона.
Высказывания, сочиненные в экспериментальных целях, нередко звучат несколько искусственно. Так выглядит и вышеприведенный пример. В нем интуитивно ощущается какая-то семантическая аномалия; вряд ли оно могло родиться в подлинной живой речи. Даже если тот, кто увидел пеликана, и в самом деле лингвист, в этой ситуа-
ции его вряд ли назовут по его профессии: ведь она никак не связана с тем обстоятельством, что он увидел пеликана.
Постараемся вообразить ситуацию, в которой это высказывание всё-таки могло бы возникнуть. Предположим, что в зоосаде находится группа экскурсантов, в которую входит лишь один лингвист; значит, в этой группе людей его профессия служит его идентифицирующим и дифференцирующим признаком. Однако этого недостаточно, чтобы звать его лингвистом: согласно социокультурной норме, его предпочтут называть по имени собственному. Следовательно, его имя собственное, по-видимому, неизвестно членам группы, а о его профессиональной принадлежности они осведомлены; это обстоятельство представляется надуманным и странным.
Но и в этом случае человека будут именовать скорее по отличительной черте внешности - к примеру, the lean spectacled man «худой мужчина в очках». (Впрочем, это может быть и женщина: английское слово linguist не указывает на пол обозначаемого лица.) В любом случае говорящие будут ориентироваться на правила нормы и узуса речи, которые обусловлены социокультурно и не содержатся в моделях генеративной грамматики.
В крайнем случае в данной ситуации человека могут назвать словом linguist, если оно стало его прозвищем. Но такая вероятность невелика - это слово плохо согласуется с традиционными требованиями, которым должны соответствовать прозвища.
Одним словом, мотив выбора данного имени в данной ситуации неясен.
Цель запланированного нами опроса информантов заключалась в том, чтобы установить мотивы выбора имени деятеля (агенса) и представить их в виде правил, составляющих часть генеративной модели высказывания. Мы исходили из того, что упомянутый выбор происходит в два этапа:
1) Выбор на семантическим уровне, то есть выбор сигнификата для заданного денотата. К примеру, одно и то же лицо может быть репрезентировано как [мальчик], [(чей-либо) сын], [ученик], [бойскаут], [озорник] и др.
2) Выбор на лексическом уровне, то есть выбор имени для ранее выбранного сигнификата. Так, если выбран сигнификат [мальчик], то он может быть означен английскими словами lad, boy, kid, youngster, nipper, stripling etc или русскими мальчик, отрок, малец, паренек, пацан, шкет и др.
Выбор на лексическом уровне, определяемый жанрово-стилистическими факторами, детально описан в лингвистической литературе. Больший интерес вызывает выбор на семантическом уровне, определяемый социо-и культурно-семиотическими факторами.
Наша гипотеза состояла в том, что характер действия, выраженного сказуемым, тем или иным способом обусловливает выбор сигнификата и соответствующего ему имени деятеля, выраженного подлежащим. Опрос проводился с целью верификации гипотезы и установления этих способов.
В опросе приняли участие сто информантов - носителей английского языка, разных по возрасту, образованию и роду занятий. Во избежание давления группового мнения они опрашивались индивидуально (опросные листы вручались лично, высылались по e-mail и выставлялись на сайте).
В ходе подготовки было составлено десять вариантов опросного листа по десять экземпляров (итого сто). Бланки опросных листов содержали координатные сетки, в которых титулами строк служили именные группы (имена действующего лица), а титулами столбцов - глагольные группы (названия действий, совершённых данным лицом). При соединении именной группы (группы подлежащего) и глагольной группы (группы сказуемого) возникали высказывания в форме простых повествовательных двусоставных предложений, в которых сказуемое было выражено глаголом в простом прошедшем времени, действительном залоге, изъявительном наклонении. Например: The forest keeper (лесник) + paid the bus fare (оплатил проезд).
На этом этапе ставилась задача установить контекстуальную дистрибуцию имен лица (спектры контекстов, в которых употребляются различные разряды имен) и определить влияние фактора «область дискурса» на выбор имени лица. Подготовленный материал вносился в бланки опросных листов. В каждой таблице титулами строк (слева по вертикали) являлись группы подлежащего - имена некоего вымышленного лица, а титулами столбцов (вверху по горизонтали) служили группы сказуемого, которые обозначали действия этого лица. Информантам давалось задание оценить степень приемлемости каждого из высказываний, используя шкалу оценок, состоящую из трех делений: «+» (It is customary to say so «Так принято говорить»); «?» (It is hardly customary to say so «Вряд ли принято так гово-
рить»); «-» (It is not customary to say so «Так не принято говорить»).
Неприемлемость высказывания может быть истолкована в разных смыслах. Во-первых, она может быть понята как нарушение правил языковой системы. Во избежание этого в эмпирический материал не включались:
а) грамматически неправильные высказывания типа *John well English spoke «Джон хорошо английский говорил»;
б) бессмысленные высказывания типа * Colorless green ideas slept furiously «Бесцветные зеленые идеи яростно спали» (пример Н. Хомского).
Во-вторых, неприемлемость можно понять в экстралингвистическом (логическом, онтологическом, этическом и т.п.) смысле. Во избежание этого в корпус эмпирического материала не включались:
в) ложные (противоречащие общеизвестным фактам) высказывания типа Marco Polo discovered America «Марко Поло открыл Америку»;
г) высказывания, описывающие невозможные ситуации типа The baby wrote a textbook in Physics «Младенец написал учебник физики»;
д) высказывания, отражающие нерациональные и нецелесообразные действия типа John carried water in a sieve «Джон носил воду решетом»;
е) высказывания, описывающие ситуации, где нарушена этическая или иная социокультурная норма, типа John insulted a lady «Джон оскорбил даму».
Содержание всех высказываний касалось повседневных ситуаций. Информанты должны были оценить лишь меру соответствия высказываний языковой норме и узусу и ничего более; это отвечало цели эксперимента.
Индексы «приемлемо (+)», «вряд ли приемлемо (?)», неприемлемо (-)» вносились информантами в ячейки таблиц. Далее методом семантического дифференциала [9] нами вычислялась средняя оценка для каждого класса высказываний. Делениям шкалы были приданы числовые значения: «+» получило значение 1, «?» - 2, «-» - 3. Значения суммировались и делились на общее количество информантов (сто).
Для примера ниже приводится вычисление усредненной оценки приемлемости высказывания The accountant caught a carp «Бухгалтер поймал карпа». Можно быть бухгалтером и при этом поймать карпа, но данное ситуационно-ролевое действие не вхо-
дит в исполнение позиционной роли «бухгалтер». Этот человек поймал карпа вне своих производственных обязанностей. Но можно ли в данной ситуации называть его бухгалтером?
11 информантов признали это высказывание приемлемым (значение 1);
65 - вряд ли приемлемым (значение 2); 24 - неприемлемым (значение 3). Далее было вычислено среднее арифметическое: [(11x1) + (65x2) + (24x3)] : 100 = 213 : 100 = 2,13 = 2 («вряд ли приемлемо»).
Таким же способом подсчитывалась усредненная оценка во всех ячейках таблиц. В порядке иллюстрации приведем один из заполненных опросных листов (рис. 1).
На рис. 1 титулы столбцов - наименования действий: 1) статусно-ролевого; 2) пози-ционно-ролевого; 3) ситуационно-ролевого; 4) диффузно-ролевого; 5) неролевого. Титулы строк - имена: 1) имя собственное; 2) имя статусной роли; 3) имя позиционной роли; 4) имя ситуационной роли; 5) имя диффузной роли; 6) имя приметы внешности; 7) оценочное имя.
По данным всех опросных листов мы составили сводную таблицу, в которой титулами столбцов и строк стали не отдельные лексические группы, а названия их классов. Сводная таблица явилась главным материалом для теоретической трактовки и выводов, которые приводятся ниже. В качестве дополнительного материала были привлечены данные отдельных опросных листов, пояснения информантов и результаты анализа англоязычных текстов.
На основе экспериментальных данных выявлялась контекстуальная дистрибуция имен действующего лица - спектр контекстов их использования.
Как оказалось, самую широкую (почти универсальную) дистрибуцию имеют имена собственные. При этом их дифференциация по официальности / неофициальности слабо коррелирует с фактором «область дискурса».
С именами собственными сочетаются названия всех видов действий.
1) Статусно-ролевые действия: (Mr.) Brown prayed to St. Mary «(Мистер) Браун вознес молитву Деве Марии» (действие, свойственное христианину).
Рис. 1. Пример заполнения опросного листа
2) Позиционно-ролевые действия: (Mr.) Brown balanced the accounts «(Мистер) Браун подвел баланс счетов» (действие, свойственное бухгалтеру).
3) Ситуационно-ролевые действия: (Mr.) Brown paid the bus fare «(Мистер) Браун оплатил проезд» (действие, свойственное пассажиру).
4) Диффузно-ролевые действия: (Mr.) Brown ill-treated his family «(Мистер) Браун третировал семью» (действие, свойственное домашнему тирану).
5) Неролевые действия: (Mr.) Brown scratched his head «(Мистер) Браун почесал в затылке» (это действие не входит в исполнение какой-либо роли).
Почти универсальная сочетаемость имен собственных объясняется тем, что в их коммуникативном задании доминируют дифференцирующая и идентифицирующая функции. Онимы не генерализуют, не типологи-
наименования 1) took part in 2) made an an- 3) caught 4) fussed over 5) scratched
действий the election - nual report - a carp - every cent - his head -
участвовал сделал годовой поймал трясся над почесал
имена лица в выборах отчет карпа каждым центом в затылке
1) (Mr.) Brown - + + + + +
(мистер) Браун
2) The US citizen - ? - - - -
гражд-н США
3)The accountant - ? + ? + +
бухгалтер
4) The angler - - - + - +
рыболов
5) The niggard - - - - + ?
этот скряга
6) The stout man - - - + - +
этот толстяк
7) The bastard - ? ? + + +
этот чертов сын
зируют и не моделируют свой референт. Смысл их существования - в указании на референт, в его выделении из всех других референтов вне зависимости от характера совершаемого им действия (т.е. от фактора «область дискурса»). По данной причине, если продуценту речи известно имя собственное, он обычно предпочитает его именам нарицательным, потому что для их использования нужны особые причины, описанные в нашей (упоминавшейся выше) работе [5]. Если говорящий не задался никакой иной коммуникативной задачей, помимо указания на лицо, то он обычно использует имя собственное.
Бывают и собственно-нарицательные имена - John the Baptist «Иоанн Креститель», President Carter «президент Картер» и т.п. Один из компонентов комбинированного имени служит классификатором, относящим данное лицо к тому или иному классу лиц, а другой - дистинктором данного лица внутри данного класса лиц. Например, в классе «президенты США» выделяется тот, который носил фамилию Картер, или, наоборот, в классе «носители фамилии Картер» выделяется тот, который был президентом США. Компоненты дополняют друг друга, вместе выступая как идентификатор лица (человека, одновременно занимавшего данную позицию и носившего данную фамилию).
В ряде случаев имя нарицательное используется как прозвище, постоянно сопровождающее официальное имя: Wolf Larsen «Волк Ларсен» (Дж. Лондон. Морской волк); Poke Andrews «Громила Эндрюс» (Р. Чандлер. Золотые рыбки); Scaramanga the Gun «Скара-манга-Пистолет» (Я. Флеминг. Человек с золотым пистолетом). Подсчет показал, что комбинированные имена по широте дистрибуции почти не уступают обычным онимам.
Несколько более узкая дистрибуция присуща эквивалентам имен собственных. Согласно нашим наблюдениям, они делятся на три подразряда.
1) Широкоузуальные эквиваленты имен собственных - псевдонимы, клички, прозвища, которые прочно закрепились за теми или иными людьми в коммуникативной практике и употребляются всеми окружающими вместо их настоящих имен: Legs «Дылда» (Э. А. По. Король Чума); Shady «Теневик» (Я. Флеминг. Бриллианты вечны); Ginger «Рыжик» (А. Кристи. Вилла «Белый конь») и т.п. По данным текстуального анализа, такие имена не используются только в официальном общении, где требуется, во-первых, со-
блюдение этикета, а во-вторых, точные данные о настоящих именах участников.
2) Узкоузуальные эквиваленты имен собственных - прозвища, которые имеют хождение в малой группе (в небольшом производственном коллективе, в семье, в компании друзей и т.п.): the Boss «Хозяин» -прозвище губернатора, которое употреблялось только его доверенными лицами (Р. П. Уоррен. Вся королевская рать); Scout «Глазастик» - семейное прозвище маленькой героини (Х. Ли. Убить пересмешника); Sunset «Закат» - кличка гангстера, употреблявшаяся лишь в банде (Р. Чандлер. Золотые рыбки). В целом у этого вида эквивалентов дистрибуция уже, чем у предыдущего.
3) Окказиональные эквиваленты имен собственных - такие, которые используются только в одной ситуации. Например, в рассказе У. Сарояна «Филиппинец и пьяный» нет имен собственных. Один из героев рассказа именуется the Philippino «филиппинец», а другой - the drunkard, the drunken man «пьяный». Первое имя отражает происхождение, а второе - психофизическое состояние человека. Пьяный агрессор избирает инородца жертвой. Значимость этих свойств персонажей для сюжета и идеи рассказа побудила автора избрать эти имена в описываемой ситуации.
Стать эквивалентом имени собственного может имя позиционной или статусной роли, когда данная роль высокозначима в спектре общественных отношений человека и в большей или меньшей степени определяет всё, что и как он делает. Так, в новелле Р. Брэдбери «2002. Третья экспедиция» (из цикла «Марсианские хроники») один из героев всё время именуется the Captain «Капитан» - даже тогда, когда он не выполняет капитанские обязанности, а совершает разнообразные другие (в том числе бытовые) действия. Это связано с тем, что роль капитана, будучи главной в репертуаре его социальных ролей, служит его «визитной карточкой»; она как бы приросла к нему. Это и есть эквивалент имени собственного.
По мере того как позиционно-ролевые имена обретают независимость от характера действия, они тяготеют к обретению статуса эквивалентов имен собственных и - в дальнейшем - статуса имен собственных. Вначале такое имя выполняет классифицирующую и квалифицирующую функции - оно относит именуемое лицо к определенному классу лиц (например, smith «кузнец»). Выступая в этих функциях, такое имя сочетается в ос-
новном с названиями действий, относящихся к данной роли: The smith shoed a horse «Кузнец подковал коня». Имя деятеля согласуется с названием действия.
Но ролевое имя может выходить за рамки действий, относящихся к называемой им роли. Так, если в старые времена в селе имелся только один кузнец, то его называли кузнецом в связи с его любыми, а не только профессиональными действиями, например: The smith got married «Кузнец женился». В таких случаях позиционно-ролевое имя (кузнец) выполняет не классифицирующую, а дифференцирующую и идентифицирующую функции, выступая в качестве эквивалента имени собственного.
В эпоху Средневековья ремёсла наследовались вместе с сословной принадлежностью. Названия ремёсел становились цеховыми именами, а те, в свою очередь, - фамилиями: англ. Smith «кузнец», Baker «пекарь», Taylor «портной», франц. Forgeron «кузнец», Charpentier «плотник», Boulanger «булочник», славян. Кузнец, Рыбак, Гончар и т.п.
Так ролевые имена превратились в эквиваленты имен собственных, а затем - в имена собственные. Произошел градуальный переход от таких имен, которые жестко зависят от вида совершаемого действия (т.е. от фактора «область дискурса»), к таким именам, которые почти не зависят от него. При этом наблюдается ступенчатое расширение дистрибуции имен.
Итак, мы описали контекстуальную дистрибуцию имен собственных и их эквивалентов, наиболее широкую по сравнению с дистрибуцией ролевых имен, имен примет внешности и оценочных имен.
В заключение подчеркнем еще раз: весьма желательно включить в генеративную модель высказывания социосемиотические и культурно-семиотические правила выбора и комбинирования языковых средств. Но их формализация в ходе обучения искусственного интеллекта навыкам речевой деятельности на естественном языке представляется весьма сложным делом. По существу, для этого потребуется формализовать социум и культуру. Решения этой задачи можно ожидать лишь в отдаленной перспективе.
СПИСОК ЛИТЕРАТУРЫ
1. Хомский Н. Аспекты теории синтаксиса. М. : изд-во МГУ, 1972. 129 с.
2. Апресян Ю. Д. Лингвистические проблемы формального семантического анализа предложения // Структура текста-81. М. : Наука, 1981. С. 16-20.
3. Леонтьев А. А. Порождение речи // Лингвистический энциклопедический словарь. М. : Советская Энциклопедия, 1990. С. 387.
4. Halliday M. Language as Social Semiotic. London : E. Arnold, 1978. 256 p.
5. Савицкий В. М. Порождение речи : дискурсивный подход. Самара : изд-во ПГСГА, 2013. 226 с.
6. Moitra Sh. Generative Grammar and Logical Form // Logic Identity and Consistency / ed. by P.K. Sen. Calcutta : Allied Publishers Ltd., 1998. P. 1-48.
7. O'Connor J. D. Phonetics. London : Penguin, 1999. 320 p.
8. Palmer F. Grammar. L. : Pelican, 1986. 205 p.
9. Osgood C. E., Suci G. J., Tannenbaum P. H. The Measurement of Meaning. Chicago : University of Illinois Press, reprint 1967. 360 p.
REFERENCES
1. Chomsky N. Aspekty teorii sintaksisa [Aspects of the Theory of Syntax]. Moscow, 1972. 129 p.
2. Apresyan Yu. D. Lingvisticheskiye problemy formalnogo semanticheskogo analiza predlozheniya [Linguistic Problems of a Formal Semantic Analysis of a Sentence]. Struktura teksta-81 [Text Structure-81]. Moscow, 1981, pp. 16-20.
3. Leontyev A. A. Porozhdeniye rechi [Speech Generation]. Lingvistichesky entsiklopedichesky slovar [The Encyclopedic Dictionary of Linguistics]. Moscow, 1990, pp. 387.
4. Halliday M. Language as Social Semiotic. London, 1978. 256 p.
5. Savitsky V. M. Porozhdeniye rechi: discursivny podkhod [Speech Generation: a Discursive Approach]. Samara, 2013. 226 p.
6. Moitra Sh. Generative Grammar and Logical Form. Logic Identity and Consistency. Ed. by P. K. Sen. Calcutta, 1998, pp. 1-48.
7. O'Connor J. Phonetics. London, 1999, 320 p.
8. Palmer F. Grammar. London, 1986. 205 p.
9. Osgood C., Suci G., Tannenbaum P. The Measurement of Meaning. Chicago, 1967. 360 p.
Статья поступила в редакцию 17.12.2015.
БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ СТАТЬИ FOR CITING
Савицкий В. М. Порождение речи в социосемиотическом Savitsky V. M. Speech generation in the sociosemiotic as-аспекте // Жанры речи. 2016. №1. С. 50-55. DOI: pect. Speech genres, 2016, no. 1, pp. 50-55. DOI: 10.18500/2311-0740-2016-1-13-50-55. 10.18500/2311-0740-2016-1-13-50-55. (in Russian).