УДК 81'33 М. В. Хитина
доктор филологических наук, доцент, профессор кафедры прикладной и экспериментальной лингвистики института прикладной и математической лингвистики английского факультета МГЛУ; e-mail: [email protected]
ИСПОЛЬЗОВАНИЕ ПЕРЦЕПТИВНО-СЛУХОВОЙ ИНФОРМАЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ ФОНЕТИЧЕСКИХ И ОБЛИКОВЫХ ХАРАКТЕРИСТИК ДИКТОРА
В статье излагаются результаты эксперимента по оценке индивидуальных фонетических и обликовых характеристик диктора. На основании специально разработанного вопросника (автор - Р. К. Потапова) и проведенного перцептивно-слухового эксперимента показано, что аудиторы в ряде случаев способны дать адекватную оценку фонетических, а также обликовых характеристик говорящего по голосу и речи. Определены наиболее и наименее значимые признаки, проанализированы различия в их восприятии аудиторами разных возрастных групп при анализе монологов различных дикторов. Предложенная методика уже прошла апробацию на материале текстов разного типа (монолог, диалог, трилог) и может быть применена для анализа специфического материала из корпуса Сети, что позволит дать разностороннюю оценку фонетических и обликовых характеристик говорящих и поможет при разработке комплексной методики оценки параметров речевых сигналов и их модификации под воздействием различных факторов.
Ключевые слова: индивидуальные фонетические параметры; облико-вые характеристики, методика оценки; перцептивно-слуховой эксперимент; монолог; Сеть.
Khitina M. V.
D. Sc., Department of Applied and Experimental Linguistics, Unstitute of Applied and Mathematical Linguistics, Faculty of the English Language; e-mail: [email protected]
THE USAGE OF AUDITORY-PERCEPTIVE INFORMATION FOR ASSESSMENT OF SPEAKERS' FONETIC AND APPEARANCE CHARACTERISTICS
The paper presents the results of the experiment where in a speaker's individual phonetic and anthropometric characteristics have been evaluated. On the basis of the purposely designed questionnaire (composed by R. K. Potapova) and on the basis of the conducted auditory-perceptive experiment it was shown that in a number of cases auditors are able to estimate adequately the phonetic and anthropometric characteristics from voice and speech. The most and the least relevant characteristics have been determined. The difference in the perception of
these characteristics by auditors of various age groups while analyzing monologues of different speakers has been investigated. The proposed method has already been tested on different types of texts (monologues, dialogues, trialogues) and it can be applied to the analysis of the corpus collected from the Internet network. This method enables one to provide a diversified assessment of the speakers' phonetic and anthropometric characteristics. The current investigation helps to develop a complex method of evaluating the parameters of the speech signals and their modification under the influence of various factors.
Key words: individual phonetic characteristics; appearance characteristics; assessment methods; auditory-perceptive experiment; monologue; network.
Введение
Предлагаемое исследование является продолжением работ, проводимых на кафедре прикладной и экспериментальной лингвистики под руководством Р. К. Потаповой. Предшествующие исследования [1] по оценке индивидуальных фонетических и социальных особенностей диктора подтвердило работоспособность предложенной методики (вопросника Р. К. Потаповой) и позволило выявить наиболее значимые и устойчивые признаки при перцептивно-слуховой оценке голоса и речи говорящего. В предлагаемом исследовании используется другой материал (записи из Сети), а также иные группы аудиторов. Предполагается, что полученные данные позволят подтвердить и, вероятно, уточнить имеющиеся результаты, а также рассмотреть возможные модификации речевых сигналов с учетом качества, количества, тематики и т. д. анализируемого материала.
Как отмечает Р. К. Потапова, помимо собственно сообщения в голосе и речи заключается лингвистическая информация о территориальной, социальной принадлежности говорящего, его отношение к собеседнику и ситуации, его внешний вид, эмоциональное состояние и характер [2].
Цель эксперимента - анализ фонетических признаков речи говорящего, а также обликовых признаков, отбор из них наиболее и наименее эффективных, используемых аудиторами для оценки. Эксперимент проводился с помощью метода перцептивно-слухового анализа с участием двух групп аудиторов, которым было предложено прослушать аудиозаписи и заполнить специально подготовленные вопросники.
Предварительно информанты заполнили анкеты аудитора и ознакомились с вопросником. Материалом для эксперимента послужили аудиозаписи, взятые из корпуса звучащей речи spokencorpora.ru, где участники продуцировали монологи об интересных случаях из жизни.
Звучащая речь представляет собой очень сложное явление, отражающее взаимодействие биологических, физических и социальных процессов. При анализе речи имеют дело не с отдельными звуками, а с их сложной динамической совокупностью, образующей некую структуру. В речи, как и во всякой информационной среде, все структурные компоненты взаимосвязаны и взаимозависимы. Звуковая фактура определяет произносительные особенности фигур слов и словосочетаний и обусловливает их просодическую специфику. В свою очередь, просодия действует на сцепления слов, словосочетаний и фактуру звуков так, что в каждый момент времени происходят фонетические изменения речевого потока [2]. Просодические и звуковые аспекты речи взаимозависимы, тесно связаны между собой и являются чрезвычайно важными для ее понимания. Все супрасегментные характеристики, как бы накладывающиеся на сегментную структуру речи, настолько взаимопроникают, что их практически невозможно отделить друг от друга. В качестве лингвистического (языкового) сигнала речь включает коммуникативное содержание сообщения, а в качестве экстралингвистического сигнала она соотносится с информацией о таких признаках говорящего, как пол, возраст, региональное происхождение и т. д. [там же].
Эксперимент
Цель эксперимента - дать оценку восприятия аудиторами группы фонетических, а также лингвистических и антропологических признаков говорящих (на материале спонтанного речевого сообщения) для определения тех, которые являются наиболее стабильными и могут характеризовать конкретного говорящего.
Вопросник I (Анкета аудитора) предполагал фиксацию необходимой информации об аудиторе (в частности, его Ф. И. О., пол, возраст, место рождения, образование и специальность, а также аспекты изучения иностранных языков, наличие / отсутствие музыкального образования, места длительного проживания, профессии родителей). В качестве дикторов выступили две женщины и четыре мужчины, имеющие высшее или незаконченное высшее образование, гуманитарное и техническое (специализация: природоведение и водоохрана; автоматика, телемехника и связь; менеджмент; филология (два человека); математика). Возраст от 19 до 22 лет.
В качестве материала для проведения эксперимента были использованы фонограммы монологов, в которых дикторы (мужчины и женщины, п=6) рассказывали об интересных случаях из своей жизни (материалы из Интернета). Уровень владения речью варьируется, однако в основном он средневысокий. Длительность монологов составляла от 1 до 3 мин. Частота основного тона голоса и ее диапазон, а также тембр голоса у дикторов были различны. Речь дикторов характеризовалась как неподготовленная (спонтанная).
Для проведения эксперимента были задействованы две группы аудиторов (п=20) разного возраста. В первой группе были представлены аудиторы до 30 лет, во второй - возраст варьировал от 35 до 50. Родным языком в обеих группах являлся русский, в первой группе английский изучали 70 % аудиторов, один изучал немецкий, еще один -французский. Музыкальное образование имелось только у одного из аудиторов данной группы. Образование в основном высшее (60 %о аудиторов), преимущественно гуманитарное. По составу - шесть мужчин и 4 женщины. Во второй группе семь аудиторов имели высшее образование, четверо сообщили, что имеют музыкальное образование, но в настоящее время музыкой не занимаются. Изучаемые иностранные языки: пять человек изучали немецкий, три человека - английский.
Эксперимент проводился с двумя группами аудиторов отдельно. Аудиторы не имели опыта перцептивно-слухового анализа, специальных лингвистических или экспертных знаний. Сначала им предлагалось ознакомиться с вопросником, задать вопросы относительно его содержания и возможных специфических терминов. Затем поочередно однократно воспроизводились аудиозапись для регулировки громкости и адаптации к материалу. После этого записи воспроизводились многократно, и аудиторам необходимо было заполнить соответствующие графы в вопроснике и, при необходимости, осуществить проверку данных.
Вопросник II содержал список фонетических характеристик, которые могут быть определены на перцептивно-слуховом уровне. Среди них признаки, связанные с оценкой высоты голоса, мелодики, темпа речи, системы пауз, силы голоса, тембра, ритмики, речевого дыхания и специфики произнесения звуков и слогов. Вопросник учитывал как общую оценку указанных признаков, так и их модификацию. В ряде случаев предлагалась калибровочная шкала, на основе которой аудиторы
давали оценку. При составлении вопросника учитывались основные признаки, используемые экспертами при производстве идентификационных исследований личности по голосу и речи.
Анализ результатов, полученных по материалам Вопросника II, показал, что у первого диктора группа 1 уверенно отмечала высокий голос (80 % аудиторов). Диапазон изменения не дал однозначных результатов (40 %о аудиторов), мелодический рисунок был отмечен как плавный (60 % аудиторов), такое же количество аудиторов отметили средний темп речи. Паузация средняя (90 % аудиторов), с заполнителями пауз данные разнились (40 % аудиторов -отметили гласные звуки, 30 % - гласноподобные, 30 % аудиторов указали на повтор одних и тех же слогов). Сила голоса также определялась по-разному (50 % аудиторов отметили среднюю, 30 % - сильную, 20 % -слабую), однако варьирование отметили как равномерное 90 % испытуемых. Стоит отметить, что шесть аудиторов указали мягкий тембр голоса, еще двое назвали голос «певучим». Также практически однозначно (90 % аудиторов) была зафиксирована небольшая разница ударных и безударных слогов, что происходило за счет изменения высоты тона (80 % аудиторов); речевой ритм 80 % аудиторов первой группы отметили как четкий. Данные по речевому дыханию оказались менее надежными (60 % аудиторов - прерывистое, 40 % - нормальное), хотя произнесение звуков и слогов отмечалось четкое (70 % аудиторов).
Во второй группе наиболее часто представленными фонетическими характеристиками стали сила голоса - средняя (70 % аудиторов), тембр как звонкий и мягкий отметили по четыре аудитора, 80 % аудиторов указали небольшую разницу ударных и безударных слогов и нормальное речевое дыхание.
Для второго диктора высота голоса была расценена не так однозначно (только 60 % аудиторов зафиксировали ее как среднюю), диапазон изменения 60 % аудиторов отметили как узкий, то же самое справедливо для мелодического рисунка (60 % аудиторов - монотонный, 20% - плавный, 20% - скачкообразный). Темп речи второго диктора отмечен как средний (70 % аудиторов), однако паузация дала менее точные результаты (60 % аудиторов - средние, 30 % - короткие). Сила голоса определена как средняя (70 % аудиторов) с ровным варьированием (90 % аудиторов). Тембр голоса глухой (60 % испытуемых). Разница безударных и ударных слогов небольшая (отмечено
70 % испытуемых), достигается за счет изменения громкости (80 % испытуемых). Речевое дыхание 90 % аудиторов отметили как нормальное, с четким речевым ритмом.
Вторая группа, в отличие от первой, отметила скачкообразный мелодический рисунок (70 % аудиторов). Сила голоса также средняя, по характеристике тембра результат тоже похожий (глухой -40 % аудиторов).
Первой группой высота голоса третьего диктора отмечена как средняя (70 % аудиторов). Диапазон изменения однотипных результатов не дал (60 % аудиторов - средний, 40 % - широкий). Мелодический рисунок описан как изрезанный (70 % аудиторов). Темп речи только 60 % аудиторов отметили как быстрый, со средними паузами -70 % аудиторов. Сила голоса была оценена так: 60 % аудиторов оценили ее как среднюю, 30 % - как сильную, ее варьирование отмечено как ровное (80 % аудиторов). Тембр в 70 % анкет оценен как чистый. При фиксации различия безударных и ударных слогов половина испытуемых отметила небольшую разницу, остальные не отметили разницы, что сказалось на определении характеристик: 40 % аудиторов -за счет тона, 40 % - за счет изменения временных характеристик, 20 % -за счет громкости. Речевой ритм четкий, так же как и произнесение слогов (70 % аудиторов).
В вопросниках группы 2 наиболее часто встречались только две характеристики: различие в произнесении слогов (80 % аудиторов) и точность их произнесения (70 % аудиторов). Для остальных характеристик разброс данных был слишком значительным для получения надежных результатов.
У диктора № 4 первой группой наиболее часто были определены высота голоса (70 % аудиторов - средняя), средние паузы (70 % аудиторов), средняя сила голоса, но при этом отмечались ее резкие изменения (90 % аудиторов). Тембр оценивался как резкий, звонкий (60 и 30 % аудиторов соответственно). Ударные и безударные слоги различались незначительно, в основном за счет громкости голоса (80 % аудиторов). Речевое дыхание было отмечено как дискомфортное, но произнесение звуков и слогов оставалось четким.
Второй группой для диктора № 4 сходным образом были определены сила голоса (средняя - 70 % аудиторов) и звонкий тембр голоса (70 % аудиторов). Кроме того, зафиксирован четкий речевой ритм и четкое произнесение звуков и слогов (70 % аудиторов и 80 % аудиторов соответственно).
У диктора № 5 надежнее всего определялась высота голоса (70 % аудиторов - выше среднего), сила голоса была слабой, но изменялась резко, скачкообразно (90 0% аудиторов). Тембр 50 0% аудиторов оценили как резкий, речевое дыхание отметили как прерывистое. Не столь единообразно был определен мелодический рисунок (скачкообразный - 60 о% аудиторов, плавный - 20 % аудиторов, монотонный - 20 % аудиторов), темп речи (быстрый - 60 % аудиторов) и произнесение звуков и слогов (нечеткое - 60 % аудиторов).
Во второй группе, по сравнению с первой, высота голоса не отмечена аудиторами единообразно, но ее резкие изменения зафиксировали 70 % аудиторов. Мелодический рисунок отмечен как изрезанный в 90 % вопросников. Таким же образом отмечен тембр (звонкий -90 % аудиторов), четкий речевой ритм (70 % аудиторов) и четкое произнесение звуков и слогов (80 %).
Диктор № 6 - наиболее часто выделялась монотонная мелодика и медленный темп речи (70 % аудиторов), хриплый (30 % аудиторов) и неприятный (60 % аудиторов) тембр, прерывистое речевое дыхание (70 % аудиторов) а также нечеткое произнесение слогов (70 % аудиторов). Об остальных речевых характеристиках у первой группы не было единого мнения.
Для диктора № 6 у второй группы сложилась несколько иная картина - низкий голос (70 % аудиторов), скачкообразный речевой ритм (70 % аудиторов), нечеткое произнесение звуков (70 % аудиторов). Результаты оценки тембра и речевого дыхания оказались сходными -хриплый тембр - 50 % аудиторов; прерывистое речевое дыхание -70 %.
Вопросник III описывал варианты физико-антропологического облика говорящего. С помощью перцептивно-слухового метода определялись такие характеристики, как пол, возраст, рост, вес. Особо рассматриваются голова, форма и черты лица, волосы, ширина грудной клетки, т. е. признаки, которые могут оказать влияние на продуцирование речи.
Анализ данных, полученных по Вопроснику III, выявил следующее.
Лучше всего распознавались пол (со 100 % точностью для всех шести дикторов) и возраст (отмечалось варьирование от 70 % до 90 %).
Остальные признаки были распознаны либо только у нескольких дикторов (1-2), либо результаты аудиторов оказывались противоположными. При этом диктор № 1 оказался опознан наиболее точно:
пол - женский (100 % аудиторов), возраст 20-35 лет (90 % аудиторов), средний рост (80 %), хрупкое телосложение (65 % аудиторов), круглое лицо (75 %), средний размер головы (90 % аудиторов). Похожие результаты показал анализ ответов для диктора № 4 - пол женский (100 % аудиторов), возраст 15-20 лет (80 %), хрупкое телосложение (80 %), узкое лицо (65 % аудиторов), маленький нос (70 %). Для остальных дикторов ответы были менее точными, например при заполнении вопросника для диктора № 6 45 % аудиторов указали, что голос на записи принадлежит мужчине 35-40 лет, с полным телосложением, что не соответствует его реальным обликовым характеристикам.
В целом распределение по надежности признаков оказалось следующим: пол, возраст, рост, телосложение (корпулентность); размер носа, черты лица.
Заключение
На основе анализа данных, полученных в ходе проведения эксперимента, можно сделать вывод, что из фонетических признаков наиболее значимыми (стабильными) являются высота голоса, тембр, сила голоса, темп, мелодика речи, речевой ритм, а также речевое дыхание. Данные признаки аудиторы обеих групп отмечали чаще всего у всех шести дикторов.
Такие признаки, как заполнение пауз (звуковые паузы), варьирование ударных и безударных слогов, варьирование силы голоса, произнесение звуков в данном эксперименте оказались недостаточно существенными. Следует отметить, что на данный результат могли повлиять разная степень подготовки аудиторов и качество речи выбранных дикторов.
Что касается обликовых характеристик, то наиболее точно были опознаны пол, возраст, рост, телосложение, размеры носа и черты лица. В целом, можно сказать, что определение данных характеристик значительно варьировалось от диктора к диктору. Так, например, у диктора № 4 четко было определено семь признаков, а для дикторов № 2 и № 6 было определено только два или три признака соответственно.
Сравнение результатов выявления фонетических и обликовых характеристик дикторов аудиторами показало, что такие просодические характеристики, как высота и сила голоса, манера речи и ее эмоциональная насыщенность определяись лучше других.
Сегментно-тембральные характеристики (звонкость, хриплость, мягкость, назализованность, сиплость и т. д.) также опознавались с высокой точностью. Вместе с тем, ряд признаков, таких как заполнение пауз (звуковые паузы), варьирование ударных и безударных слогов, варьирование силы голоса, произнесение звуков, не были единообразно определены, что не позволяет считать их надежными для опознания личности.
При анализе обликовых характеристик наиболее точно были отмечены пол, возраст, рост, телосложение, размеры носа и черты лица.
Для дальнейшего исследования предполагается использовать большую выборку экспериментального материала, привлечь больше аудиторов для достижения достоверных результатов. При подготовке использовались материалы дипломной работы В. Жука, выполненной под руководством автора статьи.
СПИСОК ЛИТЕРАТУРЫ
1. Потапова Р. К., Потапов В. В., Хитина М. В. Методика оценки индивидуальных фонетических параметров сигнала // Фонетика: проблемы и перспективы. - М., ФГБОУ ВПО МГЛУ, 2014. - 294 с. (Вестн. Моск. гос. лингвист. ун-та; вып. 1 (687). Сер. Языкознание). - С. 197-205.
2. Потапова Р. К., Потапов В. В. Язык, речь, личность. - Языки славянской культуры, 2006. - 496 с.