Первичное распознавание и идентификация иноязычных говорящих по просодическим параметрам речи

Курьянова И.В.; Гусакова(Елемешина) Ю.А.

УДК 612.858.74

И. В. Курьянова, Ю. А. Гусакова (Елемешина)

Курьянова И. В., аспирант кафедры прикладной и экспериментальной лингвистики; Институт прикладной и математической лингвистики английского факультета МГЛУ; e-mail: [email protected]

Гусакова Ю. А. (Елемешина), аспирант кафедры прикладной и экспериментальной лингвистики; Институт прикладной и математической лингвистики английского факультета МГЛУ; e-mail: [email protected]

ПЕРВИЧНОЕ РАСПОЗНАВАНИЕ И ИДЕНТИФИКАЦИЯ ИНОЯЗЫЧНЫХ ГОВОРЯЩИХ ПО ПРОСОДИЧЕСКИМ ПАРАМЕТРАМ РЕЧИ

Статья посвящена возможности первичного распознавания говорящих на незнакомом и интерферированном русском языке с целью их дальнейшей идентификации по голосу и речи. В работе рассматривается один из автоматизированных методов идентификации иноязычных дикторов - метод анализа мелодического контура синтагм (на основе сравнения мелодического оформления различных фрагментов речевого сигнала).

Ключевые слова: таджикский язык; цыганский язык; интерференция; идентификация по голосу и речи; анализ мелодического контура синтагм; просодические параметры речи.

Kuryanova I. V.

Postgraduate Student, Department of Applied and Experimental Linguistics, Institute of Applied and Mathematical Linguistics, Faculty of the Humanities and Applied Sciences, MSLU; e-mail: [email protected]

Gusakova Y. A. (Elemeshina)

Postgraduate Student, Department of Applied and Experimental Linguistics, Institute of Applied and Mathematical Linguistics, Faculty of the Humanities and Applied Sciences, MSLU; e-mail: [email protected]

SPEECH PROSODY PRIMARI RECOGNITION AND IDENTIFICATION OF FOREIGN-LANGUAGE

The present article deals with possibility of primary recognition of persons speaking foreign language or foreign-accented Russian for the purpose of their further voice identification. This paper presents one of the automatically-assisted methods of speaker identification i.e. syntagma pitch pattern analysis method (on the ground of pitch pattern segments comparing).

Key words: the Tajik language, the Gipsy language, speech interference, voice and speech identification, syntagma pitch pattern analysis, prosodic vocal measures.

Введение

Использование специальных знаний в уголовном судопроизводстве имеет давнюю историю: пройдя долгий путь развития, судебная экспертиза в настоящее время является самостоятельным научным направлением, которое имеет в своем распоряжении немало новых высокотехнологичных способов идентификации личности, широко применяемых в последние годы.

В период высокой степени технической подготовленности и оснащенности преступных группировок различных национальностей, бесспорной является важность и значимость фоноскопической экспертизы на иностранном языке.

Идентификация экспертом иноязычного говорящего, не являющегося носителем исследуемого языка, - это проблема, разработка которой может быть отнесена к приоритетным направлениям не только в области судебного речеведения, но и прикладной лингвистики в целом [1, с. 373].

Работа по оценке эффективности и точности методов верификации и идентификации дикторов, говорящих на иностранном языке, позволила вслед за профессором Р. К. Потаповой, проводящей многочисленные фундаментальные исследования иноязычной речи, подтвердить идею о том, что первостепенными при восприятии высказываний являются просодические средства речи [4, с. 294; 6, с. 319]. Поэтому перспективной задачей современной лингвистики представляется необходимость рассмотрения средств просодии с целью выявления тех ее ключевых компонентов, которые позволяют идентифицировать говорящего на незнакомом эксперту языке.

ЭКСПЕРИМЕНТ 1

Для определения возможности адекватного первичного опознавания иноязычного говорящего и выявления некоторого объема индивидуальных признаков голоса и речи для успешной идентификации лиц, говорящих на иностранном языке, было проведено исследование, состоящее из двух экспериментов.

Речевой материал

Материалом для эксперимента послужили аутентичные фонограммы, содержащие спонтанную диалогическую речь (разговор по телефону - контрольные фонограммы) и спонтанную монологическую

речь (беседа на произвольную тему - опорные фонограммы) на таджикском и цыганском языках, а также на русском языке с признаками интерференции китайского языка.

Для проведения первого эксперимента испытуемым были предоставлены звуковые файлы, разделенные по следующим группам: 14 контрольных звукозаписей голоса и речи лиц, говорящих на таджикском, цыганском и интерферированном русском языках в виде спонтанного диалога ^=57 мин 28 с), и 12 опорных фонограмм -образцов, предназначенных для сравнительного исследования, в виде неподготовленного монолога ^ = 8 ч 19 мин).

Участниками диалогов и монологов являлись этнические таджики, цыгане и китайцы, мужчины и женщины в возрасте 35-46 лет, преимущественно со средним (средне-специальным) образованием.

Субъекты

В исследовании участвовали 46 человек, которые были разделены на две группы аудиторов согласно наличию / отсутствию у них экспертного опыта. Чтобы оценить влияние на степень надежности первичного опознавания не только разницы в опыте экспертной работы, но и, по возможности, знания / незнания аудиторами исследуемых языков, в состав реципиентов, принимающих участие в эксперименте, были введены эксперты - носители таджикского языка.

Метод

Чтобы исключить любые возможные неоднозначные толкования при проведении первого эксперимента была разработана инструкция, в соответствии с которой проводился перцептивно-слуховой анализ фонограмм. При подготовке инструкции и исследовательских таблиц были использованы образцы анкет и инструкций, разработанных Р. К. Потаповой при проведении многочисленных экспериментов по восприятию речи [6, с. 324-325]. Наряду с задачей первичного опознавания дикторов испытуемые должны были оценить вклад каждой из анализируемых характеристик, в частности мелодики речи, темпоральных и тембральных особенностей, ритма речи, особенностей паузации и высоты голоса.

Результаты

В целом, по результатам эксперимента № 1 могут быть выделены три различные категории ответов: верное опознавание (аудиторы

опознают диктора среди опорных фонограмм), ложное отклонение (аудиторы не могут опознать диктора, голос и речь которого представлена на опорных фонограммах), ложное принятие (аудиторы неверно принимают за «своего» один из «чужих» голосов). Кроме того, при проведении эксперимента были зафиксированы случаи, когда аудиторы опознавали диктора среди опорных фонограмм, но сомневались в правильности своего решения (неуверенное опознавание).

В протоколах, подготовленных группой профессиональных экспертов, носителей как русского, так и таджикского языков (группа испытуемых 1 - N = 34), в 100 % отмечено верное опознавание диктора - не было ни одного ошибочного опознавания вне зависимости от языка, на котором говорит диктор. Однако среди верных ответов в 31 % случаев наблюдалось неуверенное опознавание при исследовании экспериментального материала, содержащего эмоционально насыщенную речь. Для удобства дальнейшей математико-статистической обработки результирующих данных эксперимента первая группа была разделена на подгруппы.

При обработке ответов русскоговорящих профессиональных экспертов, не владеющих таджикским, цыганским и китайским языками, со стажем экспертной работы от 4 до 10 лет (подгруппа «а» - N = 27), процент неуверенного опознавания распределился следующим образом: таджикский язык - 2,3 0%, цыганский - 3,7 0%, русский язык с признаками интерференции китайского языка - 4,3 %.

Для ответов русскоговорящих профессиональных экспертов со знанием таджикского языка, не владеющих цыганским и китайским языками, со стажем экспертной работы 5 лет (подгруппа «Ь» - N=4), характерна следующая градация: таджикский язык - 4,3 %, цыганский язык - 2,1 о%, русский язык с признаками интерференции китайского языка - 4,4 %.

При этом у экспертов - носителей таджикского языка (подгруппа «с» - N = 3), процент неуверенного опознавания при идентификации дикторов, говорящих на таджикском языке, отмечен не был; для цыганского языка процент неуверенного опознавания для данной группы аудиторов составил 4,3 %, для русского интерферированного языка - 5,6 о%.

В протоколах, подготовленных группой испытуемых 2, профессиональными филологами без опыта экспертной работы ^ = 12), наблюдается следующая градация при опознавании разных языков: процент

верного опознавания дикторов, говорящих на таджикском языке, составил 57 %, из которых 19 % - процент неуверенного опознавания, процент ложного отклонения 26 0%, ложное принятие - 17 0%; процент верного опознавания дикторов, говорящих на цыганском языке, составил 62 %, из которых 21 % - процент неуверенного опознавания, ложное отклонение - 27 %, ложное принятие - 11 %; процент верного опознавания дикторов, говорящих на русском языке с признаками интерференции китайского языка, составил 68 %, из которых 12 % -процент неуверенного опознавания, ложное отклонение - 10 %, ложное принятие - 22 %. При этом основной процент ошибок (ложного принятия и ложного отклонения) - 56 % отмечен при исследовании экспериментального материала, содержащего эмоционально насыщенную речь.

Статистическая обработка ответов соответствующих групп испытуемых показала, что с точки зрения точности и адекватности распознавания различие между подгруппами первой группы аудиторов было несущественным. Как носители русского языка, владеющие таджикским языком и не владеющие ни одним из исследуемых языков, так и носители таджикского языка, не владеющие другими языками (кроме русского) с одинаковой точностью идентифицировали иноязычных дикторов.

Сравнения ответов между группой 1 (профессиональные эксперты) и группой 2 (лица без опыта экспертной работы) испытуемых показали существенные отличия в опознавании дикторов. Группа аудиторов 2, не имеющих никакого экспертного опыта по перцептивно-слуховому распознаванию голосу и речи, идентифицировала дикторов с контрольных и опорных фонограмм значительно хуже, чем испытуемые, являющиеся профессиональными экспертами. Кроме ложного отклонения и ложного принятия диктора среди верных ответов отмечен высокий процент неуверенного опознавания говорящих. Если у группы профессиональных экспертов неуверенное опознавание отмечалось лишь в случаях сопоставления эмоционально насыщенной и эмоционально нейтральной речи, то среди испытуемых группы 2 отмечена тенденция в неуверенных ответах при сравнении сопоставимых по эмоциональной насыщенности фонограмм. При этом статистические исследования показали, что испытуемые группы 2 выполнили задание точнее при сравнении фонограмм, содержащих эмоционально нейтральную речь.

Исследование экспериментального материала на разных языках характеризуется рядом расхождений при оценке выраженности признаков в зависимости от принадлежности речи диктора конкретному языку.

Общая картина расхождений выглядит следующим образом.

Для испытуемых группы 1 (профессиональных экспертов) характерно следующее распределение оценок применительно к анализу используемых для опознавания признаков: таджикский язык - мелодика речи 80 %, тембр речи 15 %, паузация 5 %; цыганский язык - мелодика речи 70 %, тембр речи 20 %, темп речи 13 %, паузация 7 %; русский язык с признаками интерференции китайского языка - мелодика речи 60 %; тембр речи 22 %, паузация 8 %.

Для испытуемых группы 2 (филологов, не являющихся профессиональными экспертами), присуще иное распределение: таджикский язык - мелодика речи 50 %, тембр 30 %, темп речи 10 %, паузация 10 %; цыганский язык - тембр речи 40 %, мелодика речи 30 %, темп речи 15 %, громкость голоса 10 %, паузация 7 %, ритм 7 %; русский язык с признаками интерференции китайского языка - тембр речи 60 %, мелодика речи 30 %, паузация 12 %, темп речи 8 %.

Таким образом, при восприятии иноязычной и интерферированной речи подготовленные эксперты способны уверенно атрибутировать речевые фрагменты по принадлежности определенным дикторам. При этом мелодика речи и сопутствующие воспринимаемые в комплексе признаки играют ведущую роль при первичном опознавании иноязычного диктора.

ЭКСПЕРИМЕНТ 2

Проведенный эксперимент № 1 показал продуктивность дальнейших исследований в этом направлении. Чтобы продолжить предварительное исследование, проведенное в эксперименте № 1, и оценить возможность идентификации иноязычного говорящего по просодическим параметрам голоса, был проведен эксперимент № 2.

Речевой материал

С учетом результатов эксперимента № 1 для проведения эксперимента № 2 был сформирован обновленный экспериментальный корпус: из речевого материала была произведена выборка фонограмм, содержащих эмоционально нейтральную спонтанную диалогическую

и монологическую речь на таджикском, цыганском и русском интерферированном языках.

Испытуемым было предоставлено 18 фонограмм, из которых девять звуковых файлов составили контрольные звукозаписи голоса и речи лиц, говорящих на таджикском, цыганском и интерферированном русском языках в виде спонтанного диалога (t=45 мин 35 с), и девять опорных фонограмм - образцов, предназначенных для сравнительного исследования, в виде неподготовленного монолога (t=7 ч 9 мин).

Субъекты

В связи с достаточно большим процентом ложного и неуверенного опознавания дикторов непрофессиональными экспертами, а также в соответствии с основной задачей исследования - оценка возможности успешной идентификации иноязычного говорящего экспертом, носителем другого языка - было принято решение об ограничении круга аудиторов, поэтому к проведению эксперимента № 2 дипломированные филологи без опыта экспертной работы не привлекались.

Таким образом, в дальнейшем исследовании участвовали профессиональные эксперты (N = 34), имеющие право самостоятельного проведения экспертиз по специальности «Идентификация по голосу и речи» с разным опытом и стажем экспертной работы, которые для удобства дальнейшей математико-статистической обработки данных эксперимента были разделены на две группы:

1) группа 1: профессиональные русскоговорящие эксперты, не владеющие исследуемыми языками, со стажем экспертной работы 5 лет и более (N = 18);

2) группа 2: профессиональные русскоговорящие эксперты, не владеющие исследуемыми языками, со стажем экспертной работы менее 5 лет (N = 16).

Метод

В эксперименте №2 двум группам испытуемых предлагалось провести идентификационное сравнение голоса и речи дикторов, говорящих на разных языках, на основе анализа мелодического контура синтагм.

С этой целью на базе платформы SIS II - универсального акустико-лингвистического комплекса по идентификации дикторов по голосу и речи - испытуемым требовалось отсегментировать реплики говорящего на синтагмы на каждой из предложенных фонограмм,

проанализировать индивидуальные характеристики основного тона голоса на различных участках синтагмы и провести сравнительное идентификационное исследование голоса и речи диктора на контрольной и опорной фонограммах на основе сравнения параметров мелодического контура голоса сравниваемых дикторов.

Разработанный метод позволяет эксперту анализировать и сравнивать основные характеристики мелодических структур, представленные в численном виде - как наборы значений параметров основного тона для сопоставимых участков мелодического контура (опорных фрагментов).

Для выделенного экспертом фрагмента контура в автоматическом режиме рассчитывались начальная, конечная, минимальная, средняя и максимальная частоты, время максимума и минимума (координата максимального / минимального значения в процентах от общей длительности выделенного фрагмента), разница между максимальным и минимальным значением ЧОТ, скорость изменения ЧОТ, коэффициент изрезанности мелодического контура синтагмы, длительность выделенного фрагмента (в мс).

Подбор опорных фрагментов мелодического контура (фрагментов, подлежащих сравнению) осуществлялся испытуемыми на основе аудитивного и визуального анализа речевого сигнала. Опорные фрагменты представляли собой синтагмы, а также их структурные составляющие (предшкалы, шкалы, ядерные слоги, ядерно-заядерные участки и т. д. с однотипным мелодическим оформлением).

При подборе фрагментов для сравнения для достижения надежного идентификационного решения испытуемым было рекомендовано соблюдение следующих условий:

1. Перед началом сравнительного анализа испытуемые должны были прослушать обе фонограммы, предназначенные для сравнения, и оценить их общую сопоставимость с точки зрения стиля и манеры речи, коммуникативной направленности, эмоциональной окраски.

2. Поскольку метод предназначен для сравнения фонограмм без ярко выраженной эмоциональной и модальной окраски, в случае необходимости следовало удалить из сигнала те участки, которые не соответствуют данным требованиям.

3. По возможности, подобрать элементы контура, имеющие ярко выраженную специфику и несколько примеров реализации в каждой из фонограмм (не менее 5).

4. Провести сравнение голосов в автоматическом режиме.

Параметры выделяемых экспертом на графике основного тона однотипных участков контура, сопоставимых с точки зрения реализационной специфики, коммуникативной и эмоционально-стилистической нагрузки, вычислялись автоматически, данные заносились в таблицу.

Автоматическое сравнение фонограмм осуществлялось на основе полученных средних (пороговых) значений по каждому параметру каждого типа / подтипа элементов мелодического контура. В процессе сравнения для каждого типа / подтипа рассчитывалась степень сходства и степень различий. Далее результаты сравнения отдельных типов суммировались для получения общего решения относительно тождества либо различия голосов.

При вычислении общего результата учитывались весовые коэффициенты, приписанные каждому параметру и типу фрагмента мелодического контура. Если показатель оценки сходства существенно превышал показатель различий, то вероятность тождества голосов считалась высокой. При высокой степени различий между фонограммами формулировалось решение о различии голосов. При незначительных различиях в оценках (менее 10 %) выдавалось сообщение о невозможности принять решение.

В одно из основных условий эксперимента № 2 входила оценка фонограмм с точки зрения стиля и манеры речи, коммуникативной направленности реплик, эмоциональной окраски, а также выявление и анализ сопоставимых для дальнейшего идентификационного сравнения фрагментов синтагм.

Результаты

Аудиторы группы 1, имеющие опыт экспертной работы более пяти лет, смогли успешно и уверенно выявить сопоставимые сегменты иноязычной речи во всех без исключения случаях. Сегментация сопоставимых фрагментов испытуемыми группы 2 была несколько затруднена в связи с отсутствием навыка восприятия таджикской, цыганской и интерферированной русской речи, потребовала больших временных затрат по сравнению с результатами сегментации испытуемых группы 1, однако в целом данная задача была выполнена успешно.

На основе метода анализа мелодического контура синтагм испытуемыми группы 1 было установлено 9 лиц, говорящих на цыганском, таджикском и интерферированном русском языках, что составило

100 % от общего числа лиц, подлежащих идентификации; испытуемыми группы 2 было установлено 7 лиц, говорящих на цыганском, таджикском и интерферированном русском языках, что составило 77,7 % от общего числа лиц, подлежащих идентификации.

При анализе идентификационных отчетов, выполненных методом анализа мелодического контура высказываний, обнаружилась прямая зависимость между опытом экспертной работы испытуемого и всесторонности и правильности проведенных исследований, в частности полноты и точности выделения типов / подтипов фрагментов контура. Так, испытуемые группы 1 с высокой степенью точности подобрали и проанализировали опорные фрагменты, дали адекватные характеристики типов / подтипов синтагм, достаточно точно зарегистрировали наличие тех или иных речевых особенностей, дали им обоснованное толкование, наиболее полно проанализировали наличие в речи дикторов слов и нефонологических элементов, являющихся заполнителями пауз хезитации. Аудиторы группы 2 также смогли выявить и проанализировать опорные фрагменты синтагмы, однако на выполнение данного задания испытуемыми было потрачено значительно больше времени, при этом оценка выявленных признаков затруднений не вызывала.

Таким образом, подготовленные эксперты в спонтанном речевом потоке на таджикском, цыганском и интерферированном русском языках уверенно выявляют и анализируют сопоставимые сегменты в условиях восприятия иноязычной речи. При этом для эффективного использования метода необходимо владеть понятийно-терминологическим аппаратом мелодического анализа и корректно подбирать опорные фрагменты контура для сравнения, соблюдая необходимые условия применимости данного метода.

Заключение

Результаты эксперимента № 2 позволили установить некоторый «инвентарь» просодических характеристик, являющихся информативными при идентификации иноязычного диктора. Статистическая обработка указанных характеристик позволила установить следующее.

Диапазон модуляций частоты основного тона в речи дикторов, говорящих на родном таджикском и цыганском языках уже, чем у дикторов-китайцев, говорящих на интерферированном русском языке.

Распределение типичных значений ЧОТ. В связи с возможными различиями в особенностях распределения значений ЧОТ внутри каждой языковой группы, обусловленных гендерным фактором, статистической обработке подвергалась только речь дикторов-мужчин.

Область распределения значений ЧОТ различных типов мелодического контура в таджикской речи располагается в диапазоне частот от 125 Гц до 206 Гц. Большинство ядерных слогов сконцентрировано в области значений от 154 Гц до 187 Гц, при этом ядерные слоги по тональному уровню, как правило, не отличаются от обычных ударных слогов (например, в шкалах и предшкалах). Для цыганского языка характерно схожее распределение значений ЧОТ: минимальное и максимальное значения ЧОТ распределились в диапазоне от 102 Гц до 270 Гц, отличие ядерных слогов от других ударных слогов синтагмы также практически не выражено, область значений ЧОТ в ядре синтагмы распределяется от 163 Гц до 207 Гц. При этом в обеих языковых группах очевидна тенденция к функциональному распределению слогов по тональным уровням в зависимости от ударности: чем более значим слог, тем выше уровень распределения значений основного тона голоса и тем более однозначна его принадлежность к ядерному участку синтагмы.

В группе дикторов-китайцев, говорящих на русском языке, наблюдается следующая картина: тональный диапазон распределяется в значениях от 88 Гц до 315 Гц, ядерные слоги наиболее часто попадают в диапазон частот от 126 Гц до 292 Гц, при этом другие ударные и безударные слоги реализуются с практически равной частотой основного тона. В качестве дифференцирующего признака ядра испытуемыми отмечалось увеличение силы и (или) громкости произнесения ядерного слога.

Несмотря на то, что число тональных модуляций у дикторов-китайцев значительно больше, чем у дикторов-таджиков и дикторов-цыган, речь первых воспринимается как более однообразная и ровная, чем речь таджиков и цыган. Все испытуемые характеризовали речь китайцев как «округло-текучую», с мягкими переходами, вокализованную, «эластичную» и мелодичную. Протекание речи таджиков и цыган, напротив, характеризуется всеми группами испытуемых как немелодичное, «угловато-отрывистое», с разрывами слов, резкими изменениями громкости.

Особенности паузации. При анализе особенностей паузации в речи таджиков и цыган, говорящих на родных национальных языках, а также в речи китайцев, говорящих по-русски, наблюдаются, скорее, сходства, чем различия. В речи всех указанных языковых групп испытуемые отмечали такие виды пауз, как долгие и короткие по длительности. При этом испытуемыми определялись как заполненные, так и незаполненные паузы. Незаполненные паузы отмечались в каждом исследуемом языке в основном как актуализаторы и (или) способ ограничения фраз без какой-либо дополнительной коннотации; заполненные паузы отмечались испытуемыми гораздо реже и только в случаях хезитации.

Анализ длительностей незаполненных пауз показал следующее: короткие незаполненные паузы практически совпадают по длительности в таджикском, цыганском языках и в русской речи китайцев. Длительность коротких незаполненных пауз в речи этнических таджиков составила от 20 мс до 50 мс, цыган - от 15 мс до 40 мс, китайцев - от 25 мс до 60 мс. Длительность долгих пауз имеет следующую область распределения значений: для таджикского языка - 58 мс до 70 мс; для цыганского языка - от 45 мс до 60 мс; для русского с признаками интерференции китайского - от 63 мс до 80 мс.

Средняя длительность заполненных пауз хезитации в речи таджиков, цыган и китайцев оказалась примерно равной: у дикторов-таджиков от 59 мс до 83 мс, дикторов-цыган - от 50 мс до 77 мс, дикторов-китайцев - от 48 мс до 74 мс.

Общее количество коротких по длительности пауз составило примерно 48,4 % в группе дикторов-таджиков, 39,8 % в группе дикторов-цыган, 52,3 % в группе дикторов-китайцев, говорящих на русском языке. Общее количество длинных незаполненных пауз для таджикского, цыганского и интерферированного русского языков в сумме составило 23,6 %, 25,3 %, 27,7 % соответственно.

Заполненные паузы, как было сказано выше, отмечались испытуемыми только в случаях хезитации, их оценка по длительности проставлялась всеми группами испытуемых как длинные. Среднее количество заполненных хезитационных пауз в речи таджиков, цыган и китайцев оказалось практически равным: 12 %, 14 % и 9 % соответственно.

Основные различия особенностей паузации в исследуемых языках наблюдаются в частоте употребления и характере функционирования

незаполненных пауз, а также в особенностях заполнения пауз хези-тации. Дикторы-цыгане и дикторы-таджики используют короткие незаполненные паузы для ограничения синтагм (в среднем в 69 % случаев), длинные - как метку-дескриптор, актуализирующую высказывание (в среднем 57 % случаев). Этнические китайцы, говорящие на русском языке, используют незаполненные короткие паузы и незаполненные длинные как для ограничения синтагм, так и для выделения фраз, примерно в равной пропорции, при этом частота их использования выше - в среднем 86 % и 83 % соответственно, следовательно, зависимость функции паузы от ее длительности у дикторов-китайцев не настолько стабильная, как в речи таджиков и цыган.

Анализ характера заполнения пауз хезитации позволил установить следующее. Для дикторов-таджиков характерно заполнение хезитацион-ных пауз растягиванием конечного гласного; [а]-образное, [э]-образное, [эм]-образное, при этом для всех дикторов-таджиков характерна однообразная схема заполнения и употребления таких пауз: заполнение (100 % от длительности всей паузы) ^ начало коммуникации. Паузы хезитации встречаются как в начале, так и в середине фразы.

У дикторов-цыган отмечается более разнообразное заполнение пауз хезитации - для них, как и для дикторов-таджиков, характерно [а]-образное, [э]-образное, [эм]-образное заполнение, также были отмечены частотные случаи заполнения хезитационных пауз причмокиванием, цоканьем, шумным вдохом или выдохом, смехом, скрипящим звуком. Схемы заполнения и употребления пауз также разнообразны, наиболее частотны две схемы: 1) заполнение (100 % от длительности всей паузы) ^ начало коммуникации; 2) заполнение (30-40 % от длительности всей паузы) ^ молчание (10-20 % от длительности всей паузы) ^ заполнение (50 %) ^ начало коммуникации.

Для китайцев, говорящих на русском языке, характерно аналогичное таджикскому языку заполнение хезитационных пауз растягиванием конечного гласного, а также [эм]-образное заполнение. При этом заполнение пауз растягиванием конечного гласного встречается наиболее часто. Схема заполнения пауз в речи дикторов-китайцев следующая: заполнение (60-70 % от длительности всей паузы) ^ молчание (30-40 % от длительности всей паузы) ^ начало коммуникации.

Темпоральные характеристики. Статистический анализ темпоральных характеристик заключался в исследовании скорости

произнесения структурных составляющих синтагмы (предшкал, шкал и ядерных слогов). Темпоральные особенности речи у представителей исследуемых языковых групп заключаются в различной степени дифференциации скорости произнесения слогов.

Так, в русской речи китайцев ядерный слог практически не отличается по длительности от других ударных и безударных слогов синтагмы в шкале, предшкале и заядерном участке, так как скорость произнесения этих слогов очень близка. В цыганском языке скорость произнесения ядерного слога приблизительно равна скорости произнесения заядерного участка и противопоставлена шкале и предшкале, при этом ударные и безударные слоги шкалы и предшкалы практически не различаются между собой. Дикторы-таджики при произнесении ядерных слогов демонстрируют ту же тенденцию, что и дикторы, говорящие на цыганском языке, однако, в отличие от дикторов-цыган, у первых ударные и безударные слоги шкалы и предшкалы, а также ядерно-заядерный участок более четко дифференцированы.

Среднее значение скоростей произнесения слогов для указанных языков представлено в таблице 1.

Таблица 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Среднее значение скорости произнесения слогов (МС)

Исследуемая структура Речь на таджикском языке Речь на цыганском языке Рречь на русском интерферированном языке

предшкала (безударный слог) 268,03 86,05 287,06

шкала (ударный слог) 388,06 90,08 307,03

ядерный слог 511,06 229,08 309,05

заядерный участок 304,06 200,01 270,05

В целом, анализируя распределение скоростей произнесения слогов в таджикском, цыганском и русском языке с признаками интерференции китайского, можно констатировать, что для речи китайцев, говорящих на русском интерферированном языке, характерна средняя скорость произнесения слогов, речь таджиков характеризуется как размеренная, речь цыган - как быстрая и очень быстрая по сравнению с исследуемыми языками.

Таким образом, идентификация иноязычных дикторов методами перцептивно-слухового и акустического анализа по просодическим характеристикам голоса и речи позволила выявить определенные

закономерности при исследовании просодических параметров, в частности ритмо-мелодических характеристик, особенностей паузации и темпоральных характеристик голоса и речи, которые вносят определенный вклад в теоретическую значимость и практическую ценность данного исследования.

Данное исследование подтвердило возможную применимость данных методов анализа для идентификации русскоязычных и иноязычных дикторов подготовленными экспертами, не владеющими исследуемыми языками.

СПИСОК ЛИТЕРАТУРЫ

1. Ролощапова Т. И. Идентификация иноязычных дикторов автоматическими методами: материалы Междунар. конф. «Информатизация и информационная безопасность правоохранительных органов» / отв. ред. В. И. Ки-рин. - М. : Академия управления МВД России, 2009. - С. 372-377.

2. Ролощапова Т. И. Идентификация по голосу и речи лиц, говорящих на таджикском, узбекском, цыганском и азербайджанском языках, с применением АПК «Этнос»: методические рекомендации для экспертов / Т. И. Голощапова, М. И. Фомичева, И. В. Курьянова, А. В. Малышкин, П. О. Коровянский, Ю. А. Елемешина, Н. А. Фролова / под ред. С. В. Сы-ромятникова. - 2-е изд., перер. и доп. - М. : ЭКУ 9 Департамента ФСКН России, 2011. - 155 с.

3. Ролощапова Т. И. Идентификация иноязычных дикторов на платформе SIS II АПК «Этнос»: методические рекомендации для экспертов / Т. И. Голощапова, Н. А. Кочетов, Ю. А. Елемешина, Е. А. Красовская, М. А. Девятова / под ред. С. В. Сыромятникова. - 3-е изд., перер. и доп. -М. : ЭКУ 9 Департамента Федеральной службы РФ по контролю за оборотом наркотиков, 2012. - 142 с.

4. Потапова Р. К., Потапов В. В. Язык, речь, личность. - М. : Языки славянской культуры, 2006. - 496 с.

5. Потапова Р. К., Михайлов В.Р. Основы речевой акустики. - М. : ИПК МГЛУ «Рема», 2012. - 493 с.

6. Потапова Р. К., Потапов В. В. Речевая коммуникация: От звука к высказыванию. - М. : Языки славянских культур, 2012. - 464 с.

7. Künzel H.J. Current approaches to forensic speaker recognition // Proc. ESCA workshop on automatic speaker recognition identification. - Martigny, Switzerland, April 5-7, 1994. - P. 135-141.

8. McDermott M. C., Owen T., McDermott F. M. Voice identification: The Aural / Spectrographic Method. - URL: http://www.forensictapeexpert.com/ published/voiceidaural.htm.

9. Nolan F. Intonation in speaker identification: an experiment on pitch alignment features // Journal of speech language and the law. Forensic Linguistics. -2002. - Vol. 9. - #. 1. - P. 1-21.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Курьянова И. В., Гусакова(елемешина) Ю. А.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Курьянова И. В., Гусакова(елемешина) Ю. А.

SPEECH PROSODY PRIMARI RECOGNITION AND IDENTIFICATION OF FOREIGN-LANGUAGE

Текст научной работы на тему «Первичное распознавание и идентификация иноязычных говорящих по просодическим параметрам речи»