УЧЕНЫЕ ЗАПИСКИ ПЕТРОЗАВОДСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
№ 7 (168). С. 82-85 Филологические науки 2017
УДК 81'34
ТАТЬЯНА ИВАНОВНА ШЕВЧЕНКО
доктор филологических наук, профессор кафедры фонетики английского языка факультета английского языка, Московский государственный лингвистический университет (Москва, Российская Федерация) tatashevchenko@mail.ru
ТАТЬЯНА ВИКТОРОВНА СОКОРЕВА
старший преподаватель кафедры фонетики английского языка факультета английского языка, Московский государственный лингвистический университет (Москва, Российская Федерация) tatianasokoreva@gmail.com
ОПТИМИЗАЦИЯ АКЦЕНТНЫХ МОДЕЛЕЙ АНГЛИЙСКОГО ЯЗЫКА С ВОЗРАСТОМ
Цель настоящего исследования состоит в изучении просодических средств оптимизации ритмической выделенности ударных (акцентируемых) слогов в речи жителей США трех возрастных групп. Рассматриваются высотные, динамические и темпоральные характеристики акцентируемых слогов в сопоставлении с неакцентируемыми на материале начала телефонных разговоров. Исходя из положения о том, что акцентуация в английском языке важна для сегментации звукового потока, для распознавания слов, для обеспечения разборчивости речи и что ударный слог при этом отличается особой информативностью, были установлены средства сохранения и усиления контраста между ударными и безударными слогами параллельно с возрастными изменениями голосов. В центре внимания, таким образом, оказываются потенциальные возможности совершенствования ритмической акцентной выделенности на фоне ранее установленных фактов развития и угасания физических и психологических характеристик человека в более зрелом возрасте. Корпусный анализ ста двух речевых образцов жителей США выявил, что максимальные характеристики голоса человека достигаются в среднем возрасте, в то время как в старшем возрасте контраст между акцентируемыми и неакцентируемыми слогами сохраняется за счет процессов компенсации. Ключевые слова: ритм, акцентуация, просодия, возраст, американский вариант английского языка
ВВЕДЕНИЕ
В работе рассматриваются вопросы возрастных изменений ритмической выделенности акцентируемых слогов, существенных для устного речевого общения в начале телефонного разговора.
Понятие фразового акцента как относящегося к уровню высказывания может быть противопоставлено словесному ударению, которое является характеристикой слов [1], [3]. Акцент, таким образом, определяется как лингвистическое явление, в котором определенный элемент речевого потока выделен относительно окружающих элементов; так, в частности, акцентируемые слоги (АС) противопоставлены неакцентируемым слогам (НАС). Для английского языка с его прототипическим тактосчитающим ритмом, основанным на акцентуации, базовыми единицами ритма являются слог и такт (стопа), которые избираются в качестве единиц анализа в настоящем исследовании [6], [8], [9].
Большинство исследователей единодушны в том, что в английском языке акцентная выде-ленность обеспечивается следующими средствами: изменениями частоты основного тона (ЧОТ), интенсивности (Инт), длительности и качества гласного. Исследования А. Катлер на материале австралийского варианта английского языка доказали, что качество гласной в ударном слоге является наиболее значимым «акустическим ключом» для распознавания слов, которые отличаются по месту ударения. Тем не менее дальнейшие экс-
перименты показали, что носители английского языка используют также и просодическую информацию: просодия, в частности длительность акцентируемых слогов, облегчает задачу распознавания слов [7]. В данном исследовании мы считаем необходимым изучить эффект влияния всех просодических параметров (ЧОТ, длительности, интенсивности) на ритмическую акцентную вы-деленность слогов в английской речи жителей США на материале телефонных разговоров.
В работах теоретического и прикладного характера описана коммуникативная значимость акцентуации для информативной структуры дискурса независимо от ранжирования высотных, силовых, темпоральных или сегментных характеристик речи. В настоящем исследовании за основу принимаются следующие положения:
1. Акцентуация выполняет демаркационную функцию выделения слов в потоке речи; тем самым речевой поток сегментируется на значимые речевые единицы;
2. Акцентные структуры многосложных слов обеспечивают распознавание слов; в частности, когда акцент усиливает словесное ударение, акцентируемый слог используется как «кодовый ключ» для доступа в ментальный лексикон и выбора нужной лексической единицы;
3. Акцентуация, таким образом, обеспечивает разборчивость речи в процессе коммуникации: понять слово - это значит понять смысл речи;
© Шевченко Т. И., Сокорева Т. В., 2017
4. Английская акцентуация имеет метрическую основу, что обеспечивает ритмическую подачу информации, которая способствует восприятию важных информационных элементов и их предсказуемости;
5. Акцентуация способствует звучности и выразительности речи.
В отношении возрастных изменений голосов, в том числе их просодических характеристик, большинство исследований сфокусированы на фактах физического спада, угасания голосовых и перцептивных способностей. Ранее описаны понижение высотных и силовых показателей голосов, а также замедление процессов производства и восприятия речи, которое проявляется в замедлении темпа [2], [5]. В настоящем исследовании, оценивая достоверность описанных фактов, мы тем не менее стремимся найти средства оптимизации просодических признаков высотного, силового и темпорального характера, которые необходимы для успешной коммуникации в любом возрасте для ведения телефонных переговоров.
МЕТОДОЛОГИЯ
Материалом исследования послужили записи телефонных переговоров жителей США из лингвистического корпуса SWITCHBOARD [4]. Важным является тот факт, что никто из участников не разговаривал друг с другом и на одну и ту же тему дважды, так как это позволяет оценить роль социального опыта говорящих при выборе определенных просодических моделей для начала разговора с незнакомым собеседником. Для настоящего анализа были отобраны 102 записи речи американцев с определенным уровнем образования (выпускники учебных заведений), количество которых равномерно делится по полу (51 женщина и 51 мужчина) и по возрасту: по 34 человека молодого (20-39), среднего (40-59) и старшего (60-69) поколений.
Основной единицей исследования является слог; общее количество проанализированных слогов составило 2142 (по 21 слогу от каждого говорящего, не включающих явления хезитации, вокализованные паузы и первые безударные слоги синтагм).
С помощью программы PRAAT в ходе исследования были измерены следующие просодические показатели: ЧОТмакс, ЧОТмин, ЧОТдИапазон; Интмакс, Интмин, Интдиапазон; длительность АС/НАС, длительность стоп.
Для определения степени вариативности просодических параметров был использован метод PVI (pairwise variability index - индекс парной вариативности), основанный на сравнении длительности соседних слогов и стоп, а также слоговых показателей максимальной ЧОТ и максимальной интенсивности. Данный индекс вычисляется по формуле:
nPVI = — + It '""Ч1
т-1 iJk~1 |( dk+dk+1)/2
где m - количество слогов/стоп в высказывании, dk - длительность/ЧОТ/интенсивность k-го слога/ стопы.
Статистический анализ включал в себя два этапа: 1) проведение двухфакторного дисперсионного анализа значений всех просодических показателей и значений индекса РУ1 с целью определения степени влияния на них возрастного (три уровня: молодой, средний, старший) и тендерного (два уровня: мужчина, женщина) факторов; 2) корреляционный анализ с использованием коэффициента Спирмена для определения взаимосвязи значений просодических показателей с годом рождения говорящих.
РЕЗУЛЬТАТЫ
А. Дисперсионный анализ
1. Длительность стопы возрастает за счет увеличения длительности ударного слога в речи женщин.
Несмотря на то что двухфакторный дисперсионный анализ не выявил значительных изменений в длительности стопы, зависящих от возраста и гендера говорящих, согласно результатам, существует практически значимый эффект воздействия возрастного фактора на данную переменную. Поэтому для проверки двух гендерных групп по отдельности были проведены однофак-торные дисперсионные анализы показателей отдельно мужской и женской группы информантов. Данный анализ показал, что длительность стоп в речи женщин значительно растет с увеличением их возраста (DF = 2, F = 3,095, р = 0,05).
2. Значения ЧОТмакс с увеличением возраста информантов уменьшаются и в АС, и в НАС.
Ожидаемые различия максимальных и минимальных показателей ЧОТ в речи мужчин и женщин связаны с общеизвестными физиологическими отличиями мужского голосового аппарата от женского. Статистический анализ влияния возрастного и гендерного факторов на максимальные значения ЧОТ в акцентируемых слогах показал наличие значительных различий в значениях данного показателя между разными возрастными (DF = 2, F = 3,04, р = 0,05) и гендер-ными ^ = 1, F = 193,54, р < 0,000) группами. Схожие результаты получены при исследовании максимальных значений ЧОТ в неакцентируе-мых слогах: обнаружено значительное влияние факторов «возраст» (DF = 2, F = 6,54, р < 0,05) и «гендер» ^ = 1, F = 206,10, р < 0,000) на значения данного параметра. Таким образом, констатируя уменьшение максимальных значений ЧОТ и в акентируемых, и в неакцентируемых слогах с увеличением возраста говорящих, можно наблюдать, что контраст «АС - НАС» по данному просодическому показателю с возрастом сохраняется.
3. Значительный рост контраста «АС - НАС» по показателю максимальной интенсивности с увеличением возраста.
Однофакторный статистический анализ выявил значительное влияние возрастного фактора на значения показателей отношения максимальной интенсивности в АС по отношению к НАС ДО = 2, F = 4,498, р < 0,05).
84
Т. И. Шевченко, Т. В. Сокорева
Б. Корреляционный анализ
1. Рост длительности стопы за счет увеличения длительности АС, наблюдаемый с увеличением возраста информантов.
Согласно статистическому анализу, между значениями параметра средней длительности стопы и годом рождения говорящих существует значительная отрицательная корреляция: чем больше год рождения (чем моложе говорящий), тем меньше средняя длительность стопы (±о = -0,303, п = 102, р < 0,01).
2. Значительный рост контраста «АС - НАС» по показателю максимальной ЧОТ с увеличением возраста.
Анализ выявил наличие значительной отрицательной корреляции между годом рождения информантов и показателем ЧОТ, представляющим отношение максимальной ЧОТ в АС к максимальной ЧОТ в НАС (±о = -0,214, п = 102, р < 0,05).
3. Снижение значений минимальной ЧОТ и в АС, и в НАС с увеличением возраста.
В ходе исследования обнаружена статистически значимая положительная корреляция между годом рождения информантов и значениями минимальной ЧОТ в АС (Ло = 0,237, п = 102, р < 0,05) и в НАС (±о = 0,246, п = 102, р < 0,05).
4. Значительный рост контраста «АС - НАС» по показателю минимальной интенсивности с увеличением возраста.
Отношение значения минимальной интенсивности в АС к минимальной интенсивности в НАС, согласно результатам статистического анализа, отрицательно коррелирует с годом рождения информантов (Ао = -0,214, п = 102, р < 0,05).
В. Результаты, подтвержденные и дисперсионным, и корреляционным анализами
1. Рост значений длительности АС с увеличением возраста информантов.
На рис. 1 представлены средние значения длительности акцентных и неакцентных слогов в речи мужчин и женщин трех возрастных групп (п = 102). Согласно дисперсионному анализу, средняя длительность АС значительно увеличивается с возрастом (DF = 2, F = 7,12, р < 0,01) и различается в мужской и женской речи (DF = 1, F = 4,36, р < 0,05). Однако средняя длительность НАС изменяется лишь под воздействием гендер-ного фактора ДО = 1, F = 4,24, р < 0,05).
Корреляционный анализ подтверждает полученные результаты и свидетельствует о наличии сильной отрицательной корреляции между годом рождения информантов и показателем средней длительности АС (Ао = -0,319, п = 102, р < 0,01).
2. Расширение диапазона ЧОТ с увеличением возраста информантов.
Данные дисперсионного анализа говорят о значительном расширении диапазона ЧОТ в АС при увеличении возраста говорящих (DF = 2, F = 3,92, р < 0,05). Значения данного показателя в НАС не только увеличиваются под воздействием возрастного фактора (DF = 2, F = 3,86, р < 0,05), но и значительно варьируются в разных гендерных группах ДО = 1, F = 4,06, р < 0,05) (рис. 2).
Рис. 1. Длительность АС и НАС в речи американцев трех возрастных групп (мс)
Рис. 2. Диапазон ЧОТ в речи американцев трех возрастных групп (пт)
Рис. 3. Индекс вариативности максимальных значений ЧОТ в речи американцев трех возрастных групп
Проведенный корреляционный анализ выявил наличие статистически значимой отрицательной корреляции между значениями диапазона ЧОТ и годами рождения информантов в обоих типах исследуемых слогов - АС (Ло = -0,335, п = 102, р < 0,01) и НАС (±о = -0,295, п = 102, р < 0,01). Как результат, мы обнаружили значительное расширение диапазона ЧОТ с возрастом.
3. Увеличение показателя вариативности максимальных значений ЧОТ с увеличением возраста.
Индекс РУ1 параметров ЧОТ и интенсивности должен быть выше в речи с акцентным типом ритма. Данная тенденция в исследуемом материале наблюдается в случае индекса вариативности значений максимальной ЧОТ, которые растут
с увеличением возраста информантов, о чем свидетельствует дисперсионный (DF = 2, F = 7,80, р < 0,01) и корреляционный (Ао = -0,286, п = 102, р < 0,01) статистические анализы (рис. 3).
ЗАКЛЮЧЕНИЕ
В данной работе было изучено влияние возраста на варьирование способов выделения наиболее информативных акцентируемых слогов в американской разговорной речи, а также положительное влияние коммуникативного опыта на лингвистические навыки, которые с возрастом улучшаются и оптимизируются на фоне физиологического спада в организме. В ходе анализа были получены следующие результаты: во-первых, выделенность АС на фоне НАС в речи с возрастом сохраняется за счет сохранения контраста по длительности и увеличивается за счет максимальных параметров ЧОТ
и интенсивности; во-вторых, несмотря на общее уменьшение значений показателей ЧОТ с возрастом, вариативность значений данного параметра увеличивается, причем основная часть изменений происходит в среднем возрасте, в то время как в речи американцев старшего поколения уровень вариативности параметра ЧОТ остается относительно неизменным; в-третьих, с возрастом диапазон ЧОТ (в полутонах) расширяется за счет использования более низкого регистра, что также позволяет сохранять и усиливать контраст между АС и НАС.
Таким образом, результаты настоящего исследования свидетельствуют о наличии в речи пожилых американцев компенсаторных процессов, направленных, предположительно, на сохранение наиболее важных просодических моделей, обеспечивающих эффективное восприятие, сегментацию, распознавание и понимание речи.
СПИСОК ЛИТЕРАТУРЫ
1. Шевченко Т. И., Садовникова Н. А., Сибилева Л. Н. Ритм и смысл просодии дискурса: когнитивный подход и статистика // Вестник Московского государственного лингвистического университета. Сер. «Гуманитарные науки». 2012. № 1 (634). С. 175-187.
2. Beck J. M. Organic variation of the vocal apparatus / W. J. Hardcastle, J. Laver, F. E. Gibbon (Eds.) // The Handbook of Phonetic Sciences. Second edition. Wiley-Blackwell, 2010. P. 155-201.
3. Cutler A . Lexical stress in English pronunciation / M. Reed, J. M. Levis (Eds.) // The Handbook of English Pronunciation. Wiley-Blackwell, 2015. Р. 106-124.
4. Godfrey J., Holliman E., McDaniel J. SWITCHBOARD: Telephone speech corpus for research and development. ICASSP'92, 1992.
5. Linville S. E. Vocal Aging. San Diego: Singular Publishing Group, 2001. 320 p.
6. L o w E e - L i n g . The rhythmic patterning of English(es): implications for pronunciation teaching / M. Reed, J. M. Levis (Eds.) // The Handbook of English Pronunciation. Wiley-Blackwell, 2015. Р. 125-138.
7. McQueen J. M., Cutler A. Cognitive processes in speech perception / W. J. Hardcastle, J. Laver, F. E. Gibbon (Eds.) // The Handbook of Phonetic Sciences, Second edition. Wiley-Blackwell, 2013. Р. 489-520.
8. Nolan F., Asu E. L. Thepairwise variability index and coexisting rhythms in language // Phonetica. 2009. Vol. 66. Р. 64-77.
9. Ramus F., Nespor M., Mehler J. Correlates oflinguistic rhythm in the speech signal // Cognition. 1999. Vol. 73. P. 265-292.
Shevchenko T. I., Moscow State Linguistic University (Moscow, Russian Federation) Sokoreva T. V., Moscow State Linguistic University (Moscow, Russian Federation)
OPTIMIZATION OF THE ENGLISH ACCENT-BASED PATTERNS IN THE AGING VOICE
The primary objective of the study is to track speakers' life-long modifications of pitch, intensity, and duration of syllables focusing on their variance used for accent-based prominence patterns in telephone communication. The basic assumption is that the accent is very important for running speech segmentation, word recognition, and intelligibility in English. Age-related changes in prosody keep accentual prominence sustained or even enhanced. Thus, the current study is focused on the perspective of finding prosodic capacities for maintaining accentual patterns essential for spoken communication. The analysis of 102 Americans' speech patterns in phone conversations, balanced for gender and age, reveals that the middle age is defined by the maxima of human voice characteristics, whereas senior speakers preserve the prosodic contrast between accented and unaccented syllables due to compensation strategies.
Key words: rhythm, accentuation, prosody, age, American English
REFERENCES
1. Shevchenko T. I., Sadovnikova N. A., Sibileva L. N. Rhythm and Meaning in the Prosody ofDiscourse: a Cognitive Approach and Statistics [Ritm i smysl prosodii diskursa: kognitivnyy podkhod i statistika]. Vestnik Moskovskogo gosudarstvennogo lingvisticheskogo universiteta. Ser. "Gumanitarnye nauki" [Bulletin of Moscow State Linguistic University. Series: "Humanitarian Sciences"]. 2012. № 1 (634). P. 175-187.
2. Beck J. M. Organic variation of the vocal apparatus / W. J. Hardcastle, J. Laver, F. E. Gibbon (Eds.) // The Handbook of Phonetic Sciences, Second edition. Wiley-Blackwell, 2010. P. 155-201.
3. Cutler A . Lexical stress in English pronunciation / M. Reed, J. M. Levis (Eds.) // The Handbook of English Pronunciation. Wiley-Blackwell, 2015. P. 106-124.
4. G o d f r e y J . , H o l l i m a n E . , M c D a n i e l J . SWITCHBOARD: Telephone speech corpus for research and development. ICASSP'92, 1992.
5. Linville S. E. Vocal Aging. San Diego: Singular Publishing Group, 2001. 320 p.
6. Low Ee-Ling. The rhythmic patterning of English(es): implications for pronunciation teaching / M. Reed, J. M. Levis (Eds.) // The Handbook of English Pronunciation. Wiley-Blackwell, 2015. P. 125-138.
7. McQueen J. M., Cutler A. Cognitive processes in speech perception / W. J. Hardcastle, J. Laver, F. E. Gibbon (Eds.) // The Handbook of Phonetic Sciences, Second edition. Wiley-Blackwell, 2013. P. 489-520.
8. Nolan F., Asu E. L. Thepairwise variability index and coexisting rhythms in language // Phonetica. 2009. Vol. 66. P. 64-77.
9. Ramus F., Nespor M., Mehler J. Correlates of linguistic rhythm in the speech signal // Cognition. 1999. Vol. 73. P. 265-292.
Поступила в редакцию 13.06.2017