УДК 81'34
Т. И. Шевченко, И. Е. Галочкина
Шевченко Т. И., доктор филологических наук, профессор кафедры фонетики английского языка факультета ГПН МГЛУ e-mail: [email protected] Галочкина И. Е., кандидат филологических наук, профессор кафедры фонетики английского языка факультета ГПН МГЛУ e-mail: [email protected]
НАВСТРЕЧУ СОГЛАСИЮ: ФОНЕТИЧЕСКАЯ АДАПТАЦИЯ СОБЕСЕДНИКОВ В ДИАЛОГЕ
Статья посвящена обзору результатов современных исследований в области речевой аккомодации. Авторы описывают явление фонетической конвергенции, состоящее в полной или частичной согласованности частотных, темпоральных и динамических параметров речи собеседников и обеспечивающее чувство согласия в общении и успех в решении совместной задачи. Эта согласованность трактуется как динамический процесс, развивающийся в ходе диалога. Результаты, достигнутые в ходе экспериментов в рамках лабораторной фонологии, подкрепляются данными перцептивного анализа мелодики диалогов в художественных фильмах.
Ключевые слова: адаптация; аккомодация; конвергенция; дивергенция; идентичность; частотные, темпоральные, динамические, ритмические характеристики речи; терминация.
T. I. Shevchenko, I. E. Galochkina
Shevchenko T. I., Doctor of Philology, Professor, Department of English Phonetics, Faculty of Humanities and Applied Sciences, MSLU e-mail: [email protected]
Galochkina I. E., Ph.D., Professor, Department of English Phonetics, Faculty of Humanities and Applied Sciences, MSLU e-mail: [email protected]
ENSURING CONVERGENCE: PHONETIC ADAPTATION OF PARTNERS IN DIALOGUE
The article is a survey of recent research in speech accommodation. It focuses on the phenomenon of phonetic convergence, consisting in complete or partial concordance of pitch, temporal and dynamic parameters of interlocutors' speech, which gives a sense of solidarity in communication and facilitates progress in doing
a common task. Convergence is viewed as a dynamic ongoing process over the course of dialogue. The results obtained in laboratory phonology experiments are corroborated by auditory analysis of pitch convergence in feature films discourse.
Key words. adaptation; accommodation; convergence; divergence; identity; pitch, temporal, dynamic, rhythmic characteristics of speech; termination.
Между идентичностью и конвергенцией
Ситуативная вариативность речи может быть намеренной и сознательной, но может происходить инстинктивно и бесконтрольно. Мы настраиваемся на темп речи собеседника, на характер паузации, высотный уровень, громкость и даже тип произношения - процесс, известный как конвергенция. Один задает темп говорения и, как при ходьбе вдвоем, второй должен подстраиваться, согласовывать с ним свой темп речи и другие характеристики. Дивергенция - это явление противоположного характера, когда человек подчеркивает свои отличия от других людей. Два этих процесса составляют предмет изучения и сущность теории речевой аккомодации [7; 9].
Благодаря конвергенции человек может приблизиться к более престижному стилю речи (конвергенция вверх) или, напротив, снизить свой регистр (конвергенция вниз). Эти процессы наблюдаются в целом ряде языков: венгерском, фризском, иврите, тайском и многих других [8]. Конвергенция, как и дивергенция, может быть двусторонней или односторонней, полной или частичной. В работе Джайлза и его соавторов [9] приводится следующий пример: человек, который произносит 50 слов в минуту, может ускорить свой темп речи ради собеседника до 100 слов/мин (полная конвергенция) или до 75 слов/мин (частичная конвергенция). В прикладной лингвистике, как мы увидим далее, различают иные градации аккомодации (близость - proximity, конвергенция - convergence, синхронность - synchrony, координация реплик - coordination in turn taking), а весь процесс называют согласованностью - entrainment [17].
Кроме фонетической «настройки», т. е. адаптации собеседников друг к другу в произношении, различают лексическую, синтаксическую и семантическую конвергенцию; каждая из них обеспечивает успех коммуникации [20], который состоит в согласованности речевых действий между собеседниками, способствует совместному решению таких прикладных задач, как, например, выигрыш в компьютерной
игре [19]. В итоге в прикладной лингвистике экспериментальные работы дают материал для улучшения диалоговых систем, типа «человек - компьютер».
Когнитивные теории диалога рассматривают согласованность участников на многих уровнях лингвистической репрезентации, обеспечивающих производство и понимание речи. В частности, в качестве ключевого может быть избрано употребление такого лексического средства, как самые частотные слова в корпусе. Устанавливается связь между этим типом лексической согласованности партнеров в компьютерной игре, с одной стороны, и естественностью диалога и успехом в этой совместной деятельности, с другой. С точки зрения координации речевых действий при смене реплик было установлено, что более высокая степень лексической согласованности соответствует меньшей доле прерванных партнером реплик (interruptions) и большему количеству их частичного наложения, когда один партнер предвосхищает завершение высказывание другого, но не мешает ему закончить (overlaps). Плавные переходы реплик от одного участника к другому (smooth transitions) исключают затянувшиеся паузы. Следовательно, перебивы и сверхдлительные паузы - признаки слабо скоординированных диалогов [19].
Во время беседы ее участники адаптируют свою манеру говорения к тем речевым формам, которые использует собеседник: изменяют громкость, если он говорит громче [5] или повторяют за ним ту же синтаксическую конструкцию [21]. Значительный объем специальной литературы свидетельствует о том, что согласованность партнеров не только обеспечивает успех диалога в целом, но и то, как они воспринимают друг друга [20]. Высоко оценивается умение синхронизировать свое коммуникативное поведение, в том числе невербально в мимике лица. При этом люди, склонные к эмпатии (пониманию точки зрения другого человека) в большей степени проявляют эту способность. Отмечается, что степень согласованности, которая проявляется в лексических и синтаксических повторах в течение первых пяти минут диалога, дает надежные сведения для того, чтобы предсказать, насколько успешно будет выполнена совместная задача [21].
Конвергенция дает чувство согласия, гармонии в общении. Так матери, например, меняют свою манеру говорения, общаясь с маленькими детьми. В общении со взрослыми людьми конвергенция выступает
как попытка получить социальное одобрение, понравиться собеседнику. В социальном плане согласованность - это средство интегрирования в группу, возможно путем изменения своей социальной идентичности. Например, лектор или оратор ради социальной привлекательности ищет «точки соприкосновения» со своей аудиторией [2], а звезды поп-культуры в интервью подчеркивают свою связь с молодежной аудиторией, стремясь полностью идентифицироваться с ней [1].
Социальное одобрение опирается на тот факт, что мы сравниваем речевое поведение людей со своим, оцениваем его по своим критериям, и чем больше оно похоже на наше, тем больше эти люди нам нравятся. Это относится, например, к темпу речи высказывания: во время эксперимента по восприятию речи информанты оценили по аудиозаписи как более компетентных и привлекательных тех говорящих, речь которых совпала с их собственной по темпу, в отличие от тех, кто говорил быстрее или медленнее. При этом оказалось, что на результаты эксперимента повлиял пол говорящего, а также пол аудитора. Аналогичный эксперимент был построен на изменении длительности пауз, и в этом случае близость показателей диктора к собственным данным аудиторов обеспечила позитивное восприятие голосов [3]. Такие условия восприятия используются в коммерческих целях, когда звуковая реклама учитывает типичные голосовые характеристики целевой аудитории [16]. В Японии, например, пользователи компьютеров работали с мультипликацией, герои которой в большей или меньшей степени подражали их голосам в отношении ритма, интонации, громкости, высоты. Когда участников эксперимента попросили оценить такие качества героев, как дружелюбие, сочувствие, спокойствие и сотрудничество, наивысший балл получили те, кто по характеристикам голосов на 80 % совпадали с участниками эксперимента [14].
Итак, мы любим людей, которые в прямом смысле находятся с нами «на одной (звуковой) волне» и говорят в том же ритме. Если различие очень велико, коммуникация может и не состояться. Однако, осознавая свою идентичность, мы не теряем ощущения того, как наш социальный статус соотносится со статусом собеседника; и если явление аккомодации, как правило взаимной, характерно для любого диалога, то для людей различного статуса оно характерно в разной степени. Полагают, что конвергенция дает надежный ключ к тому, чтобы установить социальный статус партнеров в интервью: люди низкого
положения стремятся быть похожими на тех, у кого статус выше. По тому, в какой степени один говорящий адаптируется к другому, можно определить, чей статус выше, кто доминирует в разговоре [13]. Грегори и Уэбстер полагают, что изменение речевого поведения продавцов на Тайване зависит от размера кошельков их покупателей. Но не менее очевидны и колебания в речевых характеристиках известного американского телеведущего Ларри Кинга в зависимости от того, с кем он беседует - с более или менее высокими по статусу гостями его телепередачи: с Биллом Клинтоном или с Генри Киссинджером, например [13]. Американские специалисты [12] пытались даже доказать, что по уровню аккомодации претендентов можно предугадать результаты президентских выборов. Тот факт, что их прогнозы не сбылись (А. Гор доминировал как оратор, но проиграл в 2000 г.), трактуется как исключение из правила.
Существуют и межкультурные различия относительно аккомодации собеседников из другой страны. Японцы не приветствуют проявление такого сближения в переговорах с западными партнерами. Иными словами, они не хотят, чтобы речь американцев звучала с японской интонацией, подозревая в этом фальшь и снисходительное отношение [14]. Мы полагаем, что как представители самой закрытой культуры, японцы отстаивают ее уникальность, т. е. свою национальную идентичность. Это - проявление дивергенции, когда различие акцентируется для утверждения своей идентичности.
Фонетические сигналы согласованности в диалоге
В компьютерной лингвистике собран большой материал по анализу фонетических сигналов согласованности в диалоге, в частности относительно тех, которые призваны указать партнеру (а в дальнейшем - компьютеру) на необходимость выдать сигнал обратной связи (сигналы обратной связи - это короткие речевые сегменты, которые произносят для того, чтобы проявить неослабевающий интерес и внимание без смены говорящего [22]). В фокусе внимания исследователей - сходство сигналов, которыми обмениваются участники диалога. Оно, как показали эксперименты, увеличивается в ходе развертывания диалога и связано с координацией по высоте голоса и темпу речи собеседников, а также с успешным выполнением совместной задачи [16]. При этом идет разработка методов измерения
явлений согласованности: большинство работ направлено на обнаружение сходства речевого поведения в течение всего диалога или его сопоставление на ранней или поздней стадиях разговора; эффективной оказалась методика измерения просодических характеристик [6], а также принцип наблюдения за сигналами на локальном уровне, т. е. в участках диалога, завершающих реплику одного участника непосредственно перед высказыванием другого.
В работе с Колумбийским корпусом игр Гравано и Хиршберг [11] выделили пять (см. список далее) речевых явлений, которые значимо коррелируют с речью, сопровождаемой сигналами обратной связи. Однако авторы отметили, что отдельные говорящие демонстрируют различные комбинации этих сигналов и варьируют способы их выражения. В этой связи работа Левитан и ее соавторов направлена на поиск доказательства того, что участники диалога согласовывают выбор и способы произнесения таких сигналов в течение всей беседы и на локальном уровне, т.е. на стыке реплик [16]. Материал - тот же Колумбийский корпус игр [11], который состоит из 12 спонтанных диалогов, в которых участвуют 13 человек (6 женщин и 7 мужчин), из них 11 встречаются дважды, каждый раз с новым собеседником. Продолжительность звучания - 9 час 8 мин. Участники, разделенные занавесом, выполняли компьютерные игры, требующие совместных решений. Корпус аннотирован: отмечены способы смены реплик (плавные, прерванные, частично наложенные), сигналы обратной связи. Всего 5 691 смена реплик в корпусе, из них 58 % - плавные, 2 % -прерванные, 11 0% - сигналы обратной связи.
В анализе измерялись пять сигналов и их характеристики, ранее установленные в работе Гравано и Хиршберг [11]:
- мелодическое движение - понижение высотного уровня последних 200 мс или 300 мс в речевой единице - (1Ри - беспаузальном сегменте, отделяемом паузой 50 мс и более в речи одного человека);
- высотный уровень - средняя частота основного тона (ЧОТ) последних 500 мс и 1000 мс;
- интенсивность - средняя интенсивность последних 500 мс и 1000 мс;
- длительность - длительность речевой единицы от паузы до паузы (1Ри) в секундах и в количестве слов;
- качество голоса - (NHR - соотношение шумов к гармоникам), измеряемое с помощью программы Praat.
Левитан и ее соавторы [16] пытаются установить, за какими паузами следует сигнал обратной связи, если говорящий не передает право на реплику. С помощью статистической программы ANOVA выявляется значимое различие между теми речевыми единицами (IPU), за которыми следует такой сигнал, и теми, за которыми его нет.
Первое измерение - подсчет сигналов, общих для каждой пары собеседников. В корпусе каждый употребил от 0 до 5 сигналов (в среднем 2,17). Путем применения t-критерия устанавливают: в среднем участники диалога имеют значимо больше сигналов (cues), общих для своей пары, чем с другими участниками в корпусе (t = 2,1 df = 23 p < 0,05). Эти данные говорят о том, что такие сигналы - не просто проявление индивидуального речевого поведения, а по крайней мере частично - результат согласованности с партнером по диалогу [16].
Второй тип измерения предназначен для выявления сходства в показателях выявленных характеристик сигналов, общих для двух собеседников. Измеряется различие между участниками диалога путем сопоставления конкретных данных во всех беспаузальных отрезках, предшествующих сигналам обратной связи. Сравнение с усредненными показателями различия со всеми другими дикторами, с которыми данный участник не разговаривал, показывает, что если различие с партнером меньше, чем со всеми другими, то в данном диалоге происходит согласование по этому показателю. Итог: 11 из 12 диалогов демонстрируют согласование по высотному уровню и по интенсивности, 9 - по качеству голоса, 8 - по интонации и 7 - по длительности.
Коэффициент парных корреляций для всех просодических характеристик партнеров диалогов и в среднем по каждому участнику относительно всех дикторов корпуса показывают, что различия в интенсивности, высотном уровне и качестве голоса в речевых единицах перед сигналами обратной связи меньше между партнерами, чем между этими дикторами и теми участниками, с которыми они не разговаривали. Просодические показатели координируются в диалогах попарно. Различия уменьшаются к концу разговора, о чем свидетельствуют данные по первой и второй половине диалога. Вывод: согласованность - динамичный процесс, который развивается в процессе диалога.
Обращаясь к локальному уровню анализа путем изучения смежных беспаузальных речевых единиц на границе реплик двух партнеров, авторы установили, что согласованность по высотному уровню и по интенсивности - это, прежде всего, локальное явление. Эта настройка на голос партнера происходит постоянно, и хотя в течение разговора-игры участники эксперимента могут значительно расходиться по своим показателям, они вновь согласовывают высотные уровни и интенсивность, прислушиваясь к завершению реплики собеседника.
В доказательство значимости согласованности по изученным сигналам для координации реплик авторы сопоставили данные по этим сигналам с количеством сверхдлинных пауз и прерванных реплик. Результат: негативная корреляция. Позитивная корреляция сигналов -с результатами игры, определяемая по счету в ее конце [16].
Продолжая экспериментальную работу в том же направлении, Левитан и Хиршберг [17] детализировали последовательные этапы согласованности речевых действий партнеров в диалоге, начиная с сближения (proximity), далее к конвергенции (convergence) и завершая синхронизацией (synchrony). На уровне одного диалога данные извлекались по всему массиву, на уровне смены реплик - из финального беспаузального отрывка одного собеседника и следующего за ним начального отрезка в реплике другого. Избирались четыре измерения:
- интенсивность - средняя и максимальная в каждом беспаузальном отрезке;
- высотный уровень - средний и максимальный уровни ЧОТ;
- качество голоса - дрожание (jitter), мерцание (shimmer) и соотношение шума к голосу (NHR);
- скорость речи - количество слогов в секунду, рассчитываемое автоматически по словарю.
Все характеристики были нормализованы по гендерной принадлежности путем вычисления средней величины по каждой гендерной группе и ее стандартному отклонению.
На уровне целого текста игры сближение устанавливалось методом парной корреляции применительно к двум типам отличий: от партнера по данной характеристике и от всех других, с которыми не разговаривал. Сближение проверялось и другим способом - сравнением участника с самим собой в другом диалоге. Согласованность
отмечалась, по мнению авторов, если участник проявлял больше сходства с самим собой, чем с партнером [17].
Итак, во всех экспериментах подтверждался факт сближения партнеров по диалогу на основании того, что различие в паре всегда меньше, чем между каждым диктором и всеми другими, с кем он не разговаривал. Это проявилось в средней и максимальной интенсивности, уровне максимальной ЧОТ; в меньшей степени - в мерцании, а также в скорости речи. То же наблюдение верно и для всех других различий, но там они статистически не значимы.
Однако все участники больше похожи на самих себя (в другом диалоге), чем на своих партнеров по следующим характеристикам: средний уровень ЧОТ, дрожание, мерцание, соотношение шума и голоса (КНЯ) и скорость речи. Только средняя и максимальная интенсивность значительно ближе к партнерам, чем к самому себе в другом диалоге, с другим партнером. Этот факт говорит о том, что люди меняют свою нормальную громкость, чтобы приспособиться к партнеру. Влияние собеседника на громкость речи сильнее, чем индивидуальная норма. Аналогичным образом можно объяснить данные по максимальной ЧОТ. Результаты по мерцанию и скорости речи, только двум характеристикам, по которым участники больше похожи на себя, чем на партнеров, и больше похожи на партнеров, чем на других, говорят о том, что в этих измерениях участники сохраняют свои индивидуальные особенности, но, тем не менее, изменяют свой стиль ради координации со стилем партнера [17].
На границах реплик сближение еще ближе, чем по всему диалогу. Даже по тем характеристикам, по которым в целом по всей беседе оно не отмечено, говорит о том, что согласованность состоит в постоянной поднастройке участников диалога друг к другу в совместной игре-диалоге. Об этом же свидетельствует увеличение показателей сближения во второй части диалога по сравнению с первой. Так, например, показатели качества голоса (КНЯ) обнаруживают сходство не во всем диалоге, а лишь во второй его части. Только в интенсивности сходство проявляется сразу в начале диалога, а такие характеристики, как качество голоса, требуют больше времени для взаимной настройки.
Возвращаясь к вопросу о столкновении идентичности с аккомодацией речевых действий и, как следствие, возникающей согласованности через сближение и конвергенцию к синхронности и координации
реплик в диалоге, мы можем сделать выводы, опираясь на результаты экспериментов, изложенные в данном разделе. По ряду просодических показателей, выявленных на материале диалогов-игр, требующих согласованности партнеров, участники, тем не менее, сохранили верность самим себе по показателям средней ЧОТ, качеству голоса и скорости речи, которые они только частично модифицировали в ходе развертывания диалога. Идентичность, таким образом, была сохранена, несмотря на сильное воздействие фактора согласованности.
Как видно из описанных выше результатов экспериментальных работ, тема взаимодействия и конвергенции в диалоге активно разрабатывается. Однако, как справедливо отмечают сами авторы разработок для диалоговых систем типа «человек - компьютер», нет уверенности в том, что в реальной ситуации перед игровым автоматом люди поведут себя так же, как в лабораторных условиях (запись в кабине, за занавеской, отделяющей от собеседника, каждый сеанс компьютерной игры за определенную плату). Так, например, еще более далек от реальных ситуаций эксперимент, в котором дикторам предлагают читать текст одновременно с носителем другого диалекта английского языка, сидящим напротив, за тем же столом [15]. При этом автор работы ставит две основные цели: во-первых, сравнить ритмические характеристики американского и индийского вариантов английского языка, которые принято относить к тактосчитающей и слогосчитающей группам соответственно, а во-вторых, выяснить, возникает ли конвергенция во время взаимодействия между носителями двух вариантов языка, и если да, то какой характер она носит. Для проведения эксперимента использовались записи с одиночным и совместным чтением текста.
Автор исследования выдвигает следующие гипотезы: в американском варианте ударные слоги в стопах, содержащих один слог, должны быть длиннее, чем содержащих несколько, а в индийском варианте такого отличия быть не должно. Что касается длительности стопы, то в американском варианте она не зависит от количества слогов, в то время как в индийском варианте - зависит от него напрямую. Конвергенция (или дивергенция) устанавливается посредством сравнения двух вариантов прочтения текста - одиночного и синхронного.
В результате было выявлено: в американском варианте ударные слоги длиннее в стопах, состоящих из одного слога. Кроме того, они длиннее в синхронном варианте прочтения текста, но при этом
отмечается общее замедление темпа речи. В индийском варианте ударные слоги также длиннее в односложных стопах. Речь одного из индийцев демонстрирует взаимосвязь ситуации говорения и количества слогов в стопе - во время синхронного чтения ударный слог сокращается сильнее, чем при одиночном чтении. Таким образом, конвергенция возникает лишь в случае с одним информантом, т. е. его речь становится более тактосчитающей во время взаимодействия с американцем.
Для американского варианта английского языка в эксперименте было характерно увеличение длительности стопы при увеличении количества слогов в ней. Длительность стопы увеличивается также во время синхронного прочтения текста по сравнению с одиночным прочтением. Таким образом, во время взаимодействия носителей американского и индийского вариантов, в американском варианте можно наблюдать явления, более характерные для языка со слогосчитающим строем, что говорит об определенной степени конвергенции между двумя вариантами языка. В индийском варианте английского языка многосложные стопы длиннее односложных. Для одного информанта характерно увеличение длительности стоп в условиях одиночного чтения.
Темп речи в американском варианте был намного медленнее в условиях синхронного чтения по сравнению с одиночным. Эта разница была исследована в каждой паре информантов, в результате чего установлено, что темп речи носителей американского варианта приближался к темпу речи носителей индийского варианта, т. е. явление конвергенции проявилось и при исследовании темпа речи. Относительно ритмической конвергенции автор отмечает, что в речи американских информантов во время взаимодействия с носителями индийского варианта проявлялись некоторые свойства, характерные для слогосчитающей модели языка, а именно, длительность стопы стала более зависимой от количества слогов в ней. Обратная ситуация характерна для индийского варианта. Таким образом, можно предположить, что частичная конвергенция возникла в результате взаимной настройки говорящих друг на друга. Необходимо также обратить внимание на тот факт, что информант-носитель индийского варианта, в речи которого обнаружена наиболее явная ритмическая конвергенция, долгое время проживал в США, т. е. мог привыкнуть к ритмическим характеристикам американского варианта [15].
В реальной речевой практике людей каждая ситуация демонстрирует наложение целого ряда факторов, влияющих как на идентичность говорящего, так и на степень его конвергенции / дивергенции по отношению к собеседнику. Так, например, анализ темпа и ритма двух интервью известного американского телеведущего Дэвида Лет-термана в его вечернем телешоу на CBS, где его «гостями» был президент США (Барак Обама), а затем первая леди (Мишель Обама), показал, как социальный статус и личность собеседника влияют на речь ведущего. Согласуя свой темп с речью президента (5,5 сл/сек), ведущий ускоряет свой до 4,8 сл/сек, но в разговоре с первой леди (4,4 сл/сек) замедляет его до 4,1 сл/сек.
Данные по ритмической настройке еще выразительнее, но дивергенция в первом случае столь очевидна, что нуждается в особом комментарии. По данным Грабе и Лоу [10], которые сопоставили ритм 18 языков по методу PVI (индекс парной вариативности соседних слогов), индекс вариативности гласных nPVI для английского языка составляет 57,2, на фоне которого показатель президента - 63 представляется гиперакцентным, а показатель первой леди - 59 ближе к норме. Ведущий, увеличив темп в первом интервью, снижает индекс гласных до 50, как в слоговом китайском языке. Во втором интервью, однако, он чувствует себя спокойней и выравнивает nPVI(v) до 60. В отношении индекса согласных rPVI(c) речь президента напоминает слогосчитающий французский язык - 51, в то время как первая леди ближе к английскому, но «перекрывает» этот показатель - 77. Ведущий в первом интервью по индексу согласного ближе к норме английского языка - 69, а во втором диалоге - к мужскому варианту - 55. Эти колебания очевидны.
Что касается этнической идентичности в ритме, то работа Томаса и Картера [24] показала, как ритм городского населения афроамери-канцев в штате Северная Каролина изменился за последние два века от слого- к тактосчитающему, несколько превысив показатели евро-американцев (55,15 vs. 53,04), т.е. стал гиперакцентным по сравнению с ними, в то время как испаноговорящие билингвы сохранили слогосчитающий характер даже в английском языке (42,64). В Новой Зеландии, напротив, английский язык переселенцев в некоторой степени приобрел признаки слогосчитающего ритма, как в языке маори, что особенно характерно для молодых людей [23]. Следовательно,
с течением времени языковые контакты приводят к конвергенции больших слоев населения, оказывая воздействие на такую исконно присущую характеристику языка как ритм.
В художественных фильмах
С интересом воспринимая результаты компьютерных измерений в ходе лабораторного эксперимента, мы вынуждены отметить, что жесткие его рамки загоняют собеседников в неестественные для реальной коммуникации условия. Нам кажется, что валидность таких измерений необходимо проверять на большом корпусе живой речи. Кроме того, во всех описанных выше экспериментах изучалась фонетическая адаптация собеседников, происходящая автоматически и в подавляющем большинстве случаев спонтанно. Однако настройка на собеседника осуществляется и осознанно, на уровне разработки стратегии высказывания, где учитываются различные аспекты коммуникативного акта. При выработке общей стратегии поведения в конкретном акте общения принимаются во внимание социальные факторы: степень близости между собеседниками (родственники, друзья, коллеги по работе и т. п.) и различие в социальном положении. Такая настройка на партнера является универсальным правилом, обязательным к соблюдению всеми, кто стремится добиться поставленной цели, сохранив собственное лицо и лицо адресата, т. е. оставаясь вежливым.
На уровне тактики ведения беседы в интонационном оформлении высказывания находят отражение совпадение или несовпадение точек зрения коммуникантов на тему разговора (диалог-унисон или диалог-конфликт), ожидание определенного типа реакции от собеседника, желание или нежелание передать ему слово, предположение о содержании общего информационного поля. Адаптация на этом уровне осуществляется за счет воспроизведения мелодических моделей интонационных групп, употребляемых собеседником, использования определенных тональных конфигураций и т. д. В рамках данной статьи хотелось бы обратиться к результатам наблюдений за поведением такой единицы как «терминация», играющей значительную роль в стратегической и тактической интонационной подстройке под собеседника.
Коммуникативная значимость этой единицы была описана Д. Брэ-зилом в его основополагающем труде [4]. Ее формальная сторона определяется как уровень начала ядерного тона, а содержательная - как
ожидание определенного типа реакции со стороны собеседника. Высокая терминация предполагает ожидание активной (вербальной или невербальной) реакции адресата, средняя - сигнал к пассивному согласию. Низкая терминация требует завершения тематического блока или разговора в целом.
С точки зрения теории вежливости предложение пассивного согласия или завершения разговора означает увеличение степени импо-зиции, т. е. усиливает степень риска «потери лица» собеседником. Отсюда вывод: чем ниже социальный и возрастной статус говорящего, тем в меньшей степени он может использовать низкую и среднюю тер-минации. Это предположение подтверждено, в частности, результатами аудиторского и функционального анализа текста художественного фильма «Запах женщины», статистические данные по использованию терминации нисходящих тонов в котором приведены в таблице ниже.
Таблица наглядно демонстрирует зависимость вида терминации от социального и возрастного статуса говорящего: первые три фигуранта, занимающие более высокое общественное положение, отличаются преобладанием низкой и средней терминации. Промежуточную позицию занимает Карен, достаточно дружелюбная и вежливая по отношению к Чарли, но, будучи старше его, на момент общения являющаяся еще и его работодателем. Сам Чарли ограничивает свой уров-невый тональный репертуар преобладанием высокой терминации, тем самым адаптируясь к социальным характеристикам собеседников.
Таблица
Процентное содержание различных видов терминации нисходящих тонов в коммуникативном типе утверждения у основных персонажей фильма
Персонаж Терминация
Низкая Средняя Высокая
М-с Хансекер (глава Дисциплинарной комиссии, 60+) 78 11 11
Траск (глава колледжа, 50+) 51 28 21
Слейд (полковник в отставке, 60+) 55 24 21
Карен (племянница Слейда, 30+) 41 32 27
Чарли Симмз (студент, 18) 20 29 51
Подстройка терминации наблюдается и в диалоге между собеседниками, близкими по дистанции и статусу. Так, своеобразный социальный и эмоциональный унисон подчеркивается употреблением высокой терминации в одном из эпизодов фильма «Ноттинг Хилл»:
Honey: 'Since it's an 'evening of announcements ... I've 'also \got one, Ahm... I've de'cided to ,get enxgaged. I've Hound myself a xniceJ 'slightly xodd-looking >bloke }'who I xknow is =,going to ,make me xhappy for the 2rest of my xlife.
William: 3Wait axminute. 2I'm yourxbrother| and I =,don't know ,anything axbout this.
Max: ,Is he fi'nancially 'viable?
Honey: He's anxartistJ with 'brilliantxprospects. (As she sits down, Honey leans towards Spike and whispers.) 'By the vway - it's xyou.
Spike: ?Me?
Реплики всех участников этого разговора характеризуются преобладанием высокой терминации в ядерном тоне (высокий нисходящий или высокий восходящий тоны). Хани и Уильям - брат и сестра, для которых Макс и Спайк являются близкими друзьями. Все они равны и по возрасту, и по положению. С коммуникативной точки зрения каждый из них апеллирует к собеседникам, ожидая немедленной реакции, содержание которой теоретически может оказаться любым. Однако, все надеются на проявление заинтересованности, активности собеседников (что соответствует высокой терминации), а не пассивного соучастия (средняя терминация) или ухода от темы (низкая терминация).
Идеальным случаем интересующей нас интонационной подстройки можно признать, очевидно, диалог-унисон; однако эта разновидность диалога встречается относительно редко. Но достаточно показательным можно считать и факт чередования терминации в тех типах диалога, где происходит противопоставление мнений говорящих. Вспомним хотя бы шутливое соревнование друзей за обладание последним пирожным, которое предназначается самому большому в компании неудачнику (фильм «Ноттинг Хилл»). В этом полилоге прослеживается чередование низкой терминации в репликах участников, уверенных в своем «преимуществе», с высокой терминацией не согласных с ними друзей. Можно предположить, что в приводимом ниже эпизоде Берни и Белла подстраиваются под серьезно-минорный настрой Макса: они не просто сами уверены в объективности своей
позиции и в невозможности найти в ней изъяны (употребление низкой терминации - низкого нисходящего и низкого восходящего тонов), но и ожидают согласия с ней и других участников беседы (средний нисходящий тон).
Хани и Белла бросают вызов: с их точки зрения, каждая из них имеет не меньше оснований претендовать на приз. Особенно ярко этот контраст мнений выражен в речи Хани, которая начинает и заканчивает свои реплики высокой терминацией, словно требуя от друзей ответа на вопрос «А что вы скажете на это?».
Max: 'Having you xhere,} vAnnaJ 'firmly establishes what I've Tlong smspected,} that we 'really 'are the 'most Tdesperate 'lot of 'under-a>chievers. I'm 'not 'saying it's a 'bad > thing,} in Efact, }I 'think it's Tsomething we should 'take >pride in. 'I'm ,going to ,give the 'last =brownie} as a xprize} to the 'saddest >act here.
Bernie: к Well, }Vobviously,} it's >me, \isn't it - I 'work in the >City} in a xjob I ,don't understand} and 'everyone 'keeps 'getting proxmoted a=bove me. I 'haven't had axgirlfriend since ... >puberty,}6 and,} xnobody /fancies me,} and ,if these xcheeks get any =chubbier,} they 2never к will.
Honey: And I 3don't have xhair - I've 'got ^feathers, and I've got 'funny 'goggly \eyes,} and I'm at'tracted to 'cruel >men and ... no 3one'll ever xmarry me ...
Max: You 1see - in3credibly >sad.
Bella: On the xother =hand,} her 'best friend is TAnna xScott. "And 3most of her >limbs work. Where,as 'I'm 'stuck in this /thing} 'day and =night} in a 3house full of \ramps. And to 'add 3insult to x s erious .injury - I've 'totally 'given up \smoking, } my favourite .thing,} 6 and} ... the xtruth is... 'we 'can't have a >baby.
Характерно, что в реплике Беллы начальная фраза, содержащая противопоставление мнению Хани, произнесена с высоким нисходящим тоном, а последующие интонационно адаптированы под речь Берни и Макса, продолжая линию ориентирования на пассивное согласие собеседников.
В эпизоде с воришкой в книжном магазине Уильяма воспроизведение заданной хозяином спокойной мелодической модели [высокая шкала (предшкала) + тон с низкой (средней) терминацией], сопровождаемое лексическим повтором, в ситуации конфликта между говорящими создает юмористический эффект. Если Уильям имеет право на использование средней и низкой терминации, по праву ожидая
пассивного согласия собеседника, то со стороны последнего предполагается сопротивление и вызов, интонационно выражаемые высокой терминацией. Несовпадение лексико-грамматического контекста, выражающего протест, и значения интонационной единицы средней терминации и делает эту ситуацию смешной - воришка словно подстраивается под ролевую доминанту Уильяма, на которую он не имеет права в сложившейся конфликтной ситуации.
William: Exvcuse me.
Thief. /Yes.
William: 'Bad >news.
Thief. к What?
William: We've 6got aV security ,camera }in this ,bit of the >shop.
Thief /So?
William: 'So, I 'saw you 'put that 'book down your > trousers.
Thief: I 'haven't got a \book down my ,trousers.
William: >Right - Ixtell you =what - I'llxcall the po=lice —»and - 'what can I 6say? If I'm xwrong about the ,whole ,book-down-the-, trousers sce=narioj I 'really a>pologize.
Таким образом, есть основания утверждать, что одной из интонационных единиц, выполняющих функцию адаптации к собеседнику в процессе коммуникации, является терминация. С ее помощью говорящий получает возможность вести беседу с учетом возрастного и социального статуса собеседника, а также осуществлять подстройку под его отношение к теме разговора и эмоциональное состояние.
Выводы
Все предложенные читателю материалы, основанные на изучении специальной теоретической и экспериментально-фонетической литературы, включая ряд работ авторов статьи, раскрывают картину необыкновенно разнообразных типов вариативности произношения английского языка (географического, социального и ситуативного характера). На фоне этой вариативности из ее многообразных признаков и их сочетаний складывается речевой (звуковой) портрет личности, составляющий ее неповторимость, ее идентичность. Эта идентичность проявляется в общении с другими людьми той же или иной культуры; она модифицируется и приближается, как правило, по своим характеристикам к речи собеседника, если люди стремятся к согласию и пониманию.
Обзор результатов современных исследований в области речевой аккомодации показывает, как явление фонетической конвергенции, состоящее в полной или частичной согласованности частотных, темпоральных и динамических параметров речи собеседников, обеспечивает чувство согласия в общении и успех в решении совместной задачи. Эта согласованность трактуется как динамический процесс, развивающийся в ходе развертывания диалога. Результаты, достигнутые в рамках лабораторной фонологии, подкрепляются данными анализа ритма участников в реальных условиях интервью и перцептивного анализа мелодики дискурса в художественных фильмах.
СПИСОК ЛИТЕРАТУРЫ
1. Абрамова Г. С. Социально обусловленная вариативность фонетических средств как фактор регуляции общения : автореф. ... канд. филол. наук. -М., 2012. - 18 с.
2. Фрейдина Е. Л. «Социальная привлекательность» как фактор речевого общения // Актуальные проблемы лингвистики и лингводидактики. -М. : Прометей, 2011. - С. 283-288. (Сборник научных трудов, вып. 10).
3. Beebe L., Giles H. Speech accommodation theories: a discussion in terms of second language acquisition // International Language of the Sociology of Language, 46. - 1984. - P. 5-32.
4. BrazilD. The Communicative Value of Intonation in English. - Birmingham : Birmingham University Press, 2014. - 224 p.
5. Coulston R., Oviatt S., Darves C. Amplitude convergence in children's conversational speech with animated personas // Proceedings of ICSLP'02. -2002. - P. 2689-2692.
6. Edmund J., Heldner M., Hirschberg J. Pause and gap length in face-to-face interaction // Proceedings of Interspeech. - 2009. - P. 2779-2786.
7. Giles H., Smith Ph. Accommodation Theory: Optimal levels of Convergence // H. Giles, R. St. Clair (eds.). Language and Social Psychology. - Baltimore : Basil Blackwell, 1979. - P. 45-65.
8. Giles H., Williams A. Accommodating hypercorrection: a communication model // Language & Communication. - 1992. - Vol. 12, No 3(4). - P. 343-356.
9. Giles H., PoweslandP. Accommodation Theory // N. Coupland & A. Jaworski (eds.). Sociolinguistics: A Reader and Coursebook. - London : MacMillan, 1997. - P. 232-239.
10. Grabe E., Low E. L. Duration Variability in Speech and the Rhythm Class Hypothesis // Gussenhoven C., Warner N. (eds.). Papers in Laboratory Phonology 7. - Berlin : Mouton de Gruyter, 2002. - P. 515-546.
11. Gravano A., Hirschberg J. Turn-taking cues in task-oriented dialogue // Computer Speech and Language. - 2011. - Vol. 25 (3). - P. 601-634.
12. Gregory S., Gallagher T. Spectral analysis of candidates' nonverbal vocal communication predicting US presidential election outcomes // Social Psychology Quarterly. - 2002. - Vol. 65, No. 3. - P. 298-308.
13. Gregory S., Webster S. A nonverbal signal in voices of interview patterns effectively predicts communication accommodation and social status perceptions // Journal of Personality and Social Psychology. - 1999. - Vol. 70, No. 6. - P. 1231-1240. - URL : Columbia.edu>~rmk7/HC/HC_Readings/ Gregory
14. Karpf A. The Human Voice: How this extraordinary instrument reveals essential clues about who we are. - New York and London : Bloomsbury, 2006. - 401 p.
15. Krivokapic J. Rhythm and convergence between speakers of American and Indian English // Laboratory Phonology 4(1). - 2013. - P. 39-65.
16. Levitan R., Gravano A., Hirschberg J. Entrainment in speech preceding backchannels. - 2011. - URL : aclweb.org>anthology/p11-2020.
17. Levitan R., Hirschberg J. Measuring acoustic-prosodic entrainment with respect to multiple levels and dimensions. - 2011. - URL : cs.columbia. edu>nlp/papers/2011/p70791
18. Nass C., Lee K. M. Does computer-synthesized speech manifest personality? Experimental tests of recognition, similarity-attraction, and consistency-attraction // Journal of Experimental Psychology: Applied. - Vol. 7, No 3. -2001. - P. 171-181.
19. Nenkova A., Gravano A., Hirschberg J. High frequency word entrainment in spoken dialogue // Proceedings of ACL-08: HLT, Short Papers (Companion Volume). - Columbus, Ohio : Association for Computational Linguistics, 2008. - P. 169-172.
20. Pickering M., Garrod S. Do people use language production to make predictions during comprehension // TRENDS in Cognitive Science. - 2007. -Vol. 11, No. 3. - P. 105-110. - URL : psychology. nlinoisstate.edu.>...24... garrod2007.
21. Reitter D., Moore J. Predicting success in dialogue // Annual Meeting-Association for Computational Linguistics. - Vol. 45, No 1. - 2007. - P. 808-815.
22. Schegloff E. Discourse as an interactional achievement: Some uses of "uh huh" that come between sentences // D. Tannen (ed.). Analyzing Discourse: Text and Talk. - Georgetown University Press, 1982. - P. 71-93.
23. Szakay A. Rhythm and Pitch as Markers of Ethnicity in New Zealand English // Proceedings of the 11th Australian International Conference on Speech Science and Technology. - Christchurch, New Zealand : Linguistic Department, the University of Canterbury, 2006 - P. 421-426.
24. Thomas E., Carter P. M. Prosodic Rhythm and African American English // English World Wide. - 2006. - Vol. 27(3). - P. 331-355.