УДК 612.85
Вестник СПбГУ. Сер. 3. 2012. Вып. 3
А. С. Григорьев, Е. Е. Ляксо
ПЕРЦЕПТИВНЫЙ И СПЕКТРОГРАФИЧЕСКИЙ АНАЛИЗ СЛОВ ИЗ РЕЧИ ДЕТЕЙ 5-7-ЛЕТНЕГО ВОЗРАСТА
При изучении речевого онтогенеза рассматривают разные аспекты становления речевых навыков у детей. Одна из основных функций речи — коммуникативная, которая подразумевает возможность передачи информации вербальными средствами и ее восприятие. Успешность коммуникативного акта применительно к онтогенетическому аспекту развития во многом зависит от сформированности фонетико-артикуляцион-ного уровня речи ребенка. В предшествующих работах по восприятию взрослыми носителями русского языка речи детей было показано, что распознавание значений слов и фраз детей двухлетнего возраста основано на количестве выделенных слогов и гласных в слове и осуществляется только в условиях ситуативного контекста. Согласные распознаются плохо [1]. В три года акустические характеристики гласных и согласных в словах детей полностью не сформированы, однако начинается распознавание взрослыми детских слов вне контекста ситуации, в словах четырехлетних детей начинают формироваться ударные гласные на основе длительности и частоты основного тона [2]. Во взрослой речи ударный гласный выделяется на основе большей длительности, чем безударный [3]. В речи детей пятилетнего возраста словесное ударение сформировано, фразовое — нет [2]. Распознавание отдельных слов детей осуществляется носителями языка с высокой вероятностью. Для речи детей в возрасте от четырех до семи лет характерно усложнение грамматики и синтаксиса, освоение типов склонений, спряжений; широко используются сложносочиненные и сложноподчиненные предложения и соединительные союзы [4]. Все это способствует формированию коммуникативной функции речи, позволяющей ребенку общаться со взрослыми и сверстниками, нейтральными по отношению к нему. Проведенная оценка когнитивного развития детей позволила установить, что в возрасте четырех-пяти лет нормально развивающиеся дети успешно справляются с заданиями по определению наименований предметов и игрушек и их использованию, а также размера, цвета и положения предметов; выполняют различные поручения, умеют считать, как минимум, до десяти без подсказки взрослого [5]. Дети правильно выполняют все предложенные задания по точному копированию вслед за взрослым интонации и повторению слов и фраз. Дети четырех и пяти лет могут рассказывать о двух событиях, следующих по порядку, хорошо запоминают стихи и короткие рассказы. Проверка знания алфавита показывает, что наиболее часто дети называют пять первых букв, следующих по порядку, реже — десять букв, все они узнают часть заглавных и строчных букв в книге, а двое из десяти детей способны правильно написать свое имя печатными буквами [5].
На основе акустического инструментального анализа и фонетического описания установлено, что к четырем годам при нормативном развитии ребенка в его речи сформировано словесное ударение. Артикуляционная модель гласных к пяти годам полностью не сформирована [2]. Таким образом, данные акустического анализа указывают
© А. С. Григорьев, Е. Е. Ляксо, 2012
на то, что в речи 4-, 5-летних детей сформированы не все признаки, присущие речи взрослого. Однако взрослые, нейтральные по отношению к ребенку, понимают значение 60-100% слов и фраз нормально развивающихся детей [6].
Овладение ребенком языковыми навыками и уровень его когнитивного развития наиболее отчетливо проявляются в процессе диалогического общения. Установлено, что диалоги детей этого возраста характеризуются большей длительностью за счет большего количества реплик и за счет усложненных ответов. Ответные реплики детей имеют сложную синтаксическую организацию. Возраст от шести до семи лет характеризует более сложный активный лексикон, использование детьми слов, состоящих из трех и более слогов и требующих сложной артикуляции [4].
Данные об акустических характеристиках речи русскоязычных детей шести-се-ми лет, а также данные о распознавании их речи на материале русского языка немногочисленны [7, 8].
В связи с этим целью работы было изучение восприятия взрослыми носителями русского языка слов детей в возрасте 5-7 лет. В основу исследования легла гипотеза о том, что распознавание носителями языка слов детей вне контекста фразы будет отражать степень сформированности артикуляционных укладов у ребенка.
Задачи исследования:
1) сравнить особенности восприятия взрослыми носителями русского языка слов детей 5-, 6- и 7-летнего возраста;
2) проанализировать характеристики слов, распознанных взрослыми носителями языка с высокой (> 0,75) и низкой (< 0,25) вероятностью;
3) описать наиболее часто встречающиеся ошибки в речи детей, вызывающие у взрослых сложности в распознавании их слов.
Методика исследования
Предметом исследования послужили слова из речи 5-, 6-, 7-летних детей, объединенные в тестовые последовательности. Речевой материал взят из базы данных речи русских детей CHILDRU [9]. Тестовые последовательности составлялись из слов детей от пяти до семи лет, вырезанных из контекста фразы; значение слова определялось в соответствии с этим контекстом. Слова отбирались произвольным образом в соответствии с их слоговой структурой. Информанты развивались в соответствии с нормой, не имели нарушений слуха и диагностированных специалистами нарушений речевого развития. Для контроля использовали тесты, содержащие слова, произнесенные взрослыми голосами: мужским и женским. Данная речь содержала те же самые фразы, из которых были взяты детские слова. Таким образом, тестовые последовательности, содержащие взрослую речь, были составлены из слов, аналогичных употребляемым в тестах, содержащих слова из речи детей.
Каждая тестовая последовательность содержала 24 либо 30 слов. Каждое слово предъявлялось три раза, интервал между предъявлениями составлял 5 с, интервал между разными словами — 15 с. Составление тестовых последовательностей производилось с использованием компьютерной программы Cool Edit Pro.
В табл. 1 представлена информация о тестовых последовательностях и аудиторах — взрослых носителях русского языка, — которым предъявляли для прослушивания данный речевой материал.
Таблица 1. Информация о тестах и аудиторах
Тесты (оригинальное название) Количество слов в тесте Возраст аудитора Пол аудитора Опыт взаимодействия с детьми
М Ж Есть Нет
5 лет 24 18,8 ± 1,1 10 10 14 6
AnnL6 30 19,1 ± 1,0 3 7 6 4
LibL6 30 19,3 ± 0,8 6 4 7 3
ArtG6 30 19,8 ± 1,3 5 5 6 4
NiKo6 30 19,8 ± 1,3 4 6 5 5
SKar6 30 19,7 ± 1,1 4 6 5 5
7 лет 24 19,9 ± 2,1 10 10 10 10
Sami7 30 19,4 ± 0,7 5 5 7 3
DZar7 30 19,3 ± 0,8 5 5 8 2
Ech7 30 19,7±1,1 4 6 7 3
NatN7 30 19,5 ± 0,7 5 5 6 4
SKar7 30 19,4 ± 0,7 4 6 5 5
Adult man 30 19,8 ± 1,3 12 8 11 9
Adult women 30 19,7 ± 1,3 10 10 13 7
Примечание. «±» — среднее значение, стандартное отклонение; М — аудиторы мужского пола, Ж — женского.
В работе использован комплексный метод анализа, включающий перцептивный и акустический спектрографический анализы речи детей, метод аудиометрии.
1. Проверку остроты слуха аудиторов проводили методом аудиометрии. Использовался клинический одноканальный тональный аудиометр AD229E (частота: 125-8000 Гц; интенсивность: от -10 до 120 дБ; маскирующий шум: узкополосный; тестовый тон: чистый, пульсирующий, воздушная проводимость: диапазон от -10 до 100 дБ; индикация результатов — светодиодная подсветка). При измерении тональным аудиометром острота слуха определяется по порогам слышимости чистых (т. е. синусоидальных) тонов. Пороги слышимости измеряются в децибелах (дБ) по отношению к среднестатистическим порогам нормального слуха. Разница в децибелах между измеренным и нормальным порогами численно характеризует потерю слуха. Результаты аудиометрии каждого аудитора заносили в специальные бланки аудиограмм. Все аудиторы имели пороги слышимости в пределах нормы — от -2 до 8 дБ.
2. Взрослым носителям русского языка (п = 180) для прослушивания предъявлялись тестовые последовательности, составленные из слов детей от пяти до семи лет, а также из слов, произнесенных взрослыми. Разработаны анкеты, предложенные для заполнения аудиторам, в которые они вносили личную информацию (пол, возраст, образование, опыт общения с детьми) и услышанные слова «позвуково» напротив номера соответствующего слова (по порядку следования в тесте) и возможное значение этого слова.
Анкеты обрабатывали с целью выявления количества верно распознанных слов и слов, вызывающих трудности при распознавании аудиторами. Эти слова обозначались как «содержащие ошибки», которые, в свою очередь, были разбиты по категориям (ошибка в конце слова, в начале слова, слово не распознано полностью).
Затем из общего числа слов, содержащихся в тестовых последовательностях, для их дальнейшего исследования с помощью фонетического и акустического спектрографического анализов выбирали слова, которые распознавались аудиторами с высокой (> 0,75) и низкой (< 0,25) вероятностью.
Акустический спектрографический анализ слов проводили с помощью компьютерной программы Cool Edit Pro. Определяли временные характеристики звуковых сигналов по аналоговой форме представления сигнала и спектральные характеристики — по динамической спектрограмме. Спектральный анализ проводился на основе быстрого преобразования Фурье, данные взвешивались при помощи окна Хемминга, 512 точек отсчета. В словах выделяли ударный гласный, для которого считали: длительность гласного, длительность стационарного участка гласного, значения частоты основного тона (ЧОТ, F0), первой и второй форманты (F1, F2), а также их амплитуды. За первые две форманты принимали два энергетически выраженных максимума на огибающей спектра [10], следующих за максимумом, соответствующим ЧОТ. По полученным значениям F1 и F2 ударных гласных строили формантные треугольники с вершинами [a], [i], [u] для каждого возраста для слов, распознанных аудиторами с высокой и низкой вероятностью распознавания. Все полученные измерения вносили в базы данных при помощи компьютерной программы Microsoft Office Access. Гистограммы строили в программе Microsoft Office Ехсе1. Статистическую обработку данных проводили в программе STATISTICA 7.0, используя непараметрический критерий Манна—Уитни.
Результаты исследования
Данные слухового восприятия взрослыми слов детей 5-7-летнего возраста. Аудиторы с вероятностью 0,76-1,0 распознают 50% слов детей пяти лет, 55% слов детей шести лет и 48% слов детей семи лет (рис. 1). Процент слов детей 5-, 6-, 7-летнего возраста, распознаваемых аудиторами с низкой вероятностью (0,25), значимо не различался и составлял 13, 16, 19% (соответственно для каждого возраста). Слова из речи взрослых распознаются носителями языка лучше, чем слова из детской речи (77%). Таким образом, значимых различий в распознавании речи 5-, 6- и 7-летних детей выявлено не было, но получены значимые различия по сравнению с распознаванием взрослой речи (p < 0,05).
Акустические характеристики гласных. По значениям F1 и F2 ударных гласных, полученным в ходе акустического спектрографического анализа, построены формант-ные треугольники с вершинами [a], [i], [u] для каждого возраста для слов с большой и низкой вероятностью распознавания.
Формантные треугольники для ударных гласных в словах с высокой и низкой вероятностью распознавания различаются. Однако у треугольников, построенных для слов с высокой вероятностью распознавания, наблюдается ориентация, сходная с ориентацией треугольника для взрослой речи, но при этом вершины треугольников для звуков [i] и [u] из речи детей лежат не в соответствующих им областях на двуформант-ной плоскости (рис. 2).
При сравнении значений F1 и F2 для различных гласных звуков обнаружено, что в словах 5-летних детей статистически значимо отличаются значения F1 ударных гласных [i]/[a], [a]/[o], [a]/[e]; F2 — для гласных [i]/[o], [a]/[o], [a]/[e], [o]/[e]; для пар
100 80 60 40 20 0
0-0,25 0,26-0,50 0,51-0,75 0,76-1,0
100 80 60 40 20 0
0-0,25 0,26-0,50 0,51-0,75 0,76-1,0
100 80 60 40 20 0
100 80 60 40 20 0
Г
0-0,25 0,26-0,50 0,51-0,75 0,76-1,0
0-0,25 0,26-0,50 0,51-0,75 0,76-1,0
Рис. 1. Распознавание взрослыми слов из речи 5-, 6-, 7-летних детей и взрослых:
А — распознавание слов из речи детей пяти лет; Б — из речи детей шести лет; В — из речи детей семи лет; Г — из взрослой речи. На горизонтальной оси — количество слов, распознанных аудиторами в соответствии с указанными вероятностями; по вертикальной оси — вероятность распознавания слов в тестовой последовательности, ранжированная по группам.
гласных [1]/[а] и [и]/[е] различия проявляются на уровне тенденции (табл. 2). Для слов из речи детей шести лет по значениям F1 статистически значимо отличаются только ударные гласные И/[и]; гласные И/[а] — на уровне тенденции. По значениям F2 различаются ударные гласные И/[а], И/[и], И/[о], [а]/[е], [о]/[е]; гласные [а]/[о] — на уровне тенденции. По сравнению с 5-летним возрастом к шести годам уменьшилось число гласных, которые статистически значимо различаются между собой по F1, но увеличилось число различающихся по F2. В словах детей семи лет по F1 статистически значимо отличаются ударные гласные [а]/[и], [а]/[о], [а]/[е]; [и]/[е] лишь на уровне тенденции. По F2 между собой статистически значимо различаются все гласные, кроме И/[е] и [и]/[о]. Таким образом, по сравнению со словами 6-летних в словах 7-летних детей выявлено увеличение числа ударных гласных, отличающихся по значениям двух первых формант. Аналогичное отличие показано при сравнении со словами 5-летних детей по значениям F2; количество гласных, различающихся по F1, в словах 5- и 7-летних детей одинаково. Во взрослой речи статистически значимые различия обнаруживаются при попарном сравнении всех (за исключением [ы], по которому сравнение не проводилось) гласных (исключения: отсутствие различий по F1 между [о]/[е] и по F2 между [1]/[е]). На основании сравнительного анализа значений F1 и F2 ударных гласных можно заключить, что к 7-летнему возрасту различия между формантами для разных ударных гласных еще не соответствуют таковым для взрослой речи (см. табл. 2).
Согласно теории дифференциальных признаков [11], наряду с абсолютными значениями формант, для описания гласных применяют их относительные значения — разность ^2^1], сумму [F2+F1], отношения ^2^1], ^1^2]. Ранее было показано, что для идентификации гласноподобных звуков детей первого года жизни наиболее информативным является параметр ^2^1] [12].
F2, Гц 4000 г
А
3000 2000 1000
О
F2, Гц 4000
200
400
600
800
1000
1200 1400 F1, Гц
1400 F1, Гц
1200 1400 F1, Гц
______... ... ... .... .... 1400
F1, Гц
Рис. 2. Формантные треугольники для ударных гласных из слов 5-, 6- и 7-летних детей, а также классический формантный треугольник для ударных гласных из речи взрослых [10]:
А — формантные треугольники из слов детей пяти лет; Б — из слов детей шести лет; В — из слов детей семи лет; Г — классический формантный треугольник. На рис. 2 А, 2 Б, 2 В: 1 — формантный треугольник с вершинами [a], [i], [u] ударных гласных из слов, распознанных с высокой вероятностью; 2 — то же для слов, распознанных с низкой вероятностью. По горизонтальной оси — значение первой форманты (Гц); по вертикальной — значение второй форманты (Гц); линиями на двуформантной плоскости указаны фонемные границы восприятия гласных русского языка [11].
Таблица 2. Попарное сравнение ударных гласных из слов детей 5-, 6-, 7-летнего возраста и взрослых по значениям первой и второй форманты
Звуки/возраст 5 лет 6 лет 7 лет Взрослые
Б1 Б2 Б1 Б2 Б1 Б2 Б1 Б2
[1]/[а] +++ + + +++ - +++ +++ +++
[1]/[и] - - + ++ - ++ +++ +++
[1]/[о] - + - +++ - +++ +++ +++
[1]/[е] - - - - - - +++ -
[а]/[и] - - - - +++ + +++ +++
[а]/[о] +++ ++ - + +++ +++ ++ +++
[а]/[е] +++ +++ - +++ + +++ +++ +++
[и]/[о] - - - - - - +++ +++
[и]/[е] - + - - + ++ +++ +++
[о]/[е] - ++ - +++ - +++ - +++
Примечание. «-» — различия не значимы; «+» — различия не очень значимы (различия на уровне тенденции 0,1 > р > 0,05); «+» — различия значимы (0,05 > р > 0,01); «++» — различия очень значимы (0,01 > р > 0,001); «+++» — различия экстремально значимы (р < 0,001); р — непараметрический критерий Манна—Уитни.
Разность между второй и первой формантой статистически значимо не отличается по гласному [1] у детей от пяти до семи лет и взрослой речи, и наоборот во взрослой мужской и женской речи (р < 0,05). Для гласного [а] разница между значениями первой и второй формант ударных гласных в словах мужской и женской взрослой речи статистически значимо не отличается. Однако выявлены статистически значимые различия между взрослой и детской речью для гласного [а] по этим параметрам. Для гласного [и] наблюдается картина, аналогичная гласному [а] (исключение: отсутствие различий между словами детей семи лет и взрослой мужской речью) (рис. 3).
Для 6- и 7-летнего возраста статистически значимо различается длительность стационарного участка для ударного гласного [а] в словах, распознанных с высокой и низкой вероятностью (р<0,05), но не различается для гласных [и] и [1] (рис. 4). Значения ЧОТ для каждого из ударных гласных в словах с высокой и низкой вероятностью распознавания у детей от пяти до семи лет статистически значимо не отличаются.
Ошибки распознания слов. В ходе перцептивного анализа установлено, что в речи 5- и 6-летних детей наибольшее число ошибок аудиторов связано с полным нераспознаванием слова. Что касается 7-летних детей, несмотря на некоторое общее ухудшение распознавания, присутствовали дети (тесты Sami7, в речи которых наиболь-
шее число ошибок распознавания связано с неправильным пониманием аудиторами окончания слова. Например, вместо слова «столько» аудиторы в анкете записали «с Толиком», т. е. добавление дополнительного согласного и т. д.
Во взрослой и мужской, и женской речи наибольшее число ошибок аудиторами было допущено в конце слова (рис. 5).
Рис. 3. Разность между второй и первой формантами для звуков [1], [а], [и]
По горизонтальной оси — возраст; по вертикальной — значения разности (Гц). Пунктирные линии — сравнение с мужским голосом; непрерывные линии — сравнение с женским голосом. * — статистически значимые отличия по непараметрическому критерию Манна—Уитни (р < 0,05).
Рис. 4. Сравнение длительности гласных [а], [1], [и] и их стационарных участков:
1 — длительность ударного гласного в словах, распознанных с высокой вероятностью; 2 — длительность стационарного участка ударного гласного в словах, распознанных с высокой вероятностью; 3 — длительность стационарного участка ударного гласного в словах, распознанных с низкой вероятностью. * — статистически значимые отличия по непараметрическому критерию Манна—Уитни (р < 0,05).
Рис 5. Распределение ошибок распознавания по категориям для слов 5-, 6-, 7-летних детей, а также для слов, взятых из взрослой речи:
1 — ошибки в конце слова; 2 — ошибки в начале слова; 3 — значение слова не распознано полностью. По горизонтальной оси — возраст; по вертикальной — процент ошибок каждой категории от общего их числа для каждого из возрастов.
Заключение
Носители русского языка распознают с вероятностью 0,75-1,0 от 48 до 55% детских слов, содержащихся в тестовых последовательностях, что значимо меньше аналогично распознанных слов взрослой речи. Существенных различий в распознавании взрослыми слов детей 5-, 6-, 7-летнего возраста не выявлено.
Для ударных гласных из слов детей 5-, 6-, 7-летнего возраста показана разная форма и ориентация формантных треугольников с вершинами [a], [i], [u] в словах с высокой (>0,75) и низкой (<0,25) вероятностью распознавания. Значения ЧОТ ударных гласных практически не различаются. Длительность стационарного участка ударных гласных для слов с высокой и низкой вероятностью распознавания статистически значимо различается для ударного [a].
Наиболее частыми ошибками, допускаемыми аудиторами при распознавании слов детей пяти, шести лет являются полное нераспознавание значения слова; для слов детей семи лет — полное нераспознавание слова либо ошибки в конце слова, связанные с пропуском или заменой гласного или согласного звука, что характерно и для распознавания слов взрослой речи.
Литература
1. Ляксо Е. Е., Петрикова Н. А., Челибанова О. В. Особенности восприятия русскими аудиторами звуков детей второго года жизни // Физиологический журнал. 2003. № 4. C. 456-472.
2. Lyakso E., Gromova A. The acoustic characteristics of Russian vowels in children of 4 and 5 years of age // Psychology of Language and Communication. 2005. Vol. 9, N 2. P. 5-14.
3. Бондарко Л. В. Фонетика современного русского языка: учеб. пособие. СПб.: Изд-во СПбГУ, 1998.
4. Цейтлин С. Н. Язык и ребенок. Лингвистика детской речи. М., 2000. 240 с.
5. Ляксо Е. Е., Столярова Э. И. Специфика реализации речевых навыков 4-5-летних детей в диалоге / Психологический журнал, 2008. Т. 29, № 3. С. 48-57.
6. Ляксо Е. Е., Громова А. Д., Куражова А. В. Акустический аспект речи детей 4-, 5-летних и ее распознавание взрослыми // Язык, сознание, культура / под ред. Н. В. Уфимцева. 2007. С. 128-140.
7. Lyakso E., Frolova O. Russian Vowels System Acoustic Features Development in Ontogenesis // Interspeech 2007, Antwerp, Belgium, 2007. P. 2309-2313.
8. Lyakso E., Frolova O., Grigoriev A. Acoustic Characteristics of vowels in 6 and 7 years old russian children // Interspeech, September 8-15. 2009. UK.
9. CHILDRU: Речевая база записей детей в возрасте от 4 до 6 лет / Ляксо Е. Е., Богорад М. Ю., Гайкова Ю. С., Громова А. Д., Куражова А. В., Остроухов А. В., Фролова О. В. // Сборник трудов XIX сессии Российского Акустического общества «Акустика речи и биологическая акустика. Архитектурная, строительная акустика. Шумы и вибрации. Аэроакустика». Нижний Новгород, 2007. Т. 3. С. 83-88.
10. Деркач М. Ф., Гумецкий Р.Я., Губа Б. М., Чабан М. Е. Динамические спектры речевых сигналов. Львов, 1983.
11. Слепокурова Н.А. О положении фонемной границы между гласными [i]—[e], [u]-fa] и [u]-[o] // Анализ речевых сигналов человеком. Проблемы физиологической акустики. Вып. 7. Л.: Наука, 1971. Т. 36. С. 138.
12. Михайлов В. Г., Златоустова Л. В. Измерение параметров речи / под ред. М. А. Сапожко-ва. М.: «Радио и связь», 1987.
13. Галунов В. И., Ляксо Е. Е. Формирование акустического образа звуковых сигналов на ранних этапах развития // Сборник трудов XI сессия РАО: акустика речи и биологическая акустика. М.: ГЕОС, 2001. Т. 3. С. 20-24.
Статья поступила в редакцию 15 марта 2012 г.