2003. 03. 019. Языкознание в теории и эксперименте: сб. Науч. Тр. (по материалам конф. «Актуальные проблемы общего и Восточного языкознания»)

Потапов В.В.

УРОВНИ ЯЗЫКА

ФОНЕТИКА. ФОНОЛОГИЯ

2003.03.019. ЯЗЫКОЗНАНИЕ В ТЕОРИИ И ЭКСПЕРИМЕНТЕ: СБ.НАУЧ.ТР. (По материалам конф. «Актуальные проблемы общего и восточного языкознания»).

Из содерж.:

1. БЛОХИНА Л.П. Просодическая организация спонтанной речи. - С. 123-132.

2. КАСАТКИНА Р.Ф. Об одной инновации в просодической системе русского языка. - С. 300-305.

3. КИРОВ Е.Ф. Основания коммуникативной фонологии. - С. 327-335.

4. МИХАЙЛОВ В.Г. Модель слухового восприятия звучащей речи. - С. 384-402.

5. ПОСПЕЛОВ Б.В. К вопросу лингвистической и

экстралингвистической информативности микроструктуры речевого вокализма. - С. 427-434.

6. ПОТАПОВА Р.К. Реконструкция «портрета» говорящего по его лингвоакустическим характеристикам. - С. 435-461.

В работе (1) рассматривается роль просодии, как одного из ведущих средств организации устных, в частности спонтанных, текстов. Являясь обязательным компонентом любой речевой единицы - от слога до сверхфразового единства, - просодические средства (частота основного тона, интенсивность и длительность) принимают непосредственное участие в организации устных текстов и их отдельных компонентов.

Просодическая организация устного текста, как и любая форма движения материи, предусматривает два взаимообусловленных процесса: членение (сегментацию) и объединение (интеграцию).

Исследование было проведено в лаборатории экспериментальной фонетики Московского государственного лингвистического университета (МГЛУ) и лаборатории экспериментальной фонетики ИССА при МГУ им. М. В. Ломоносова. В качестве экспериментального материала использовались сигналы слушающего с нейтральным сегментным составом типа: «ага», «угу», «хм». и т. д. Анализ проводился в рамках двух оппозиций: 1) конвергенция / дивергенция и 2) оценка / отношения.

Как показали результаты аудиторского анализа, слушающий воспринимает в процессе речевого общения определенные коммуникативные намерения говорящего, интерпретирует их в рамках оппозиции «оценка / отношение» и принимает решение о конвергенции/дивергенции с точки зрения говорящего.

В результате проведенного исследования автор делает вывод, что стимулы с восходяще-нисходящей и с нисходяще-восходящей конфигурацией контура частоты основного тона (ЧОТ) оцениваются аудиторами в основном как выражающие «конвергенцию»; стимулы, конфигурация модификаций ЧОТ которых включает участок ровного тона, оценивается аудиторами как выражающие «дивергенцию».

Для разграничения контуров ЧОТ: а) с модальной и б) с модальноэмоциональной окраской наиболее индикативными оказались диапазон ЧОТ, скорость изменения ЧОТ на обеих ветвях контура, частотный уровень и объем интервала ЧОТ.

Таким образом, положение о том, что просодия своими собственными средствами, без участия лексических, грамматических и стилистических средств, способна выражать прагматические значения, нашло в проведенном исследовании еще одно подтверждение. Изложенный в статье материал иллюстрирует широкие функциональные возможности просодии в организации спонтанной монологической и диалогической речи.

Следующая статья (2) посвящена одной инновации в просодической системе русского языка. В настоящее время наблюдается развитие сложной расчлененной системы фразовых акцентов. Связанное с расширением систем массовой коммуникации явление возможного акцентирования некоторых морфем и служебных слов воспринимается как новшество.

В работе отмечается прежде всего возможность акцентного выделения первых основ композитов (как сложных, так и сложносокращенных слов). То просодическое явление, которое раньше (в

середине XX в.) характеризовало сложные слова на лексическом уровне и терминологически обозначалось как «дополнительное»,

«второстепенное» или «побочное» ударение, теперь заняло прочные позиции в качестве фразового акцента, появление которого полностью определяется семантикой фразы и прагматическими намерениями говорящего. Чаще всего акцентирование первой основы того или иного композита связано с идеей контрастивности. При этом контрастивность может быть как явной, так и скрытой.

Акцентирование первообразных предлогов и даже приставок -явления, появившиеся сравнительно недавно, причем акцентное выделение приставок, повидимому, представляет собой последнее

новшество в просодической системе языка.

Автор связывает эти инновации с развитием средств массовой коммуникации, с расширением сферы публицистической речи. Следует отметить, что эта тенденция была уже заложена в просодической системе русского языка, поскольку было возможно акцентное выделение не только знаменательных слов, но и непервообразных предлогов.

Просодические новшества поддерживают усиление агглютинативных тенденций в морфологии (в частности, более ярко

выраженными, т. е. более «прозрачными», становятся границы между морфемами: между двумя основами композитов, а также между префиксами и корнями).

В последнее время стало возможным произношение

первообразных предлогов и приставок без акцентного выделения, но и без качественной редукции гласного: б['е]зотвётственный,

б['е]зынициативный и т.п.

Из этих изменений в просодической системе следуют некоторые весьма важные следствия для сегментной фонетики русского языка. Во-первых, стало возможным различение гласных [а] и [о], [е] и [и] в первообразных предлогах, т.е. внутри фонетического слова, а также в приставках, т.е. внутри слова. Если раньше подобное различение было допустимо лишь в некоторых лексических подсистемах (заимствованных слов, подсистеме сложных и сложносокращенных слов), то теперь оно стало возможным и внутри слова, и в тех лексических пластах, которые составляют основной лексический фонд языка. Во-вторых, появилась возможность новых маркеров межсловных и межморфемных границ (реализация звонких согласных на этих границах). Акцентирование

предлогов и приставок вносит нечто новое в структуру актуального членения предложения.

В последнее время осознана необходимость коммуникативных исследований и в области фонологии (3), при этом фонетика как бы генетически является коммуникативной наукой, поскольку исследует прежде всего звучащую материю речи.

Фонология как наука связанная, но все-таки не совпадающая с фонетикой, с самого момента зарождения включала в себя элементы коммуникативного подхода, но они всегда были слиты с парадигматической и синтагматической фонологией и не выделялись в отдельную отрасль фонологии.

Парадигматической фонеме в речи соответствует коммуникативная фонема, т.е. вторичный ее коммуникативный символ. Этот вторичный символ характеризуется зачастую несовпадением намерения с реальным воплощением, т.е. отличается от эталона фонемы довольно существенно.

Таким образом, автор приходит к важному понятию, относящемуся к сути коммуникативной фонологии, - это понятие вторичной символизации коммуникативной фонемой речи парадигматической фонемы-образца языка (первая символизирует вторую, являясь ее неточной копией). Вторичная символизация - основной принцип функционирования коммуникативной фонологической системы языка. В целом в собственно семиотическую основу концепции коммуникативной фонологии ложится именно принцип вторичной символизации, суть которого сводится к тому, что нормативная единица-образец, которая одинаково отображена в индивидуальном сознании всех пользователей языка (одинакова у говорящего и слушающего), вторично символизируется корреспон-дирующей единицей в речи, в тексте. При этом коммуникативная единица непосредственно связана с текстовой фонетической реализацией. Ее связь с текстом происходит при посредстве коммуникативной фонемы речи, которая и является вторичным речевым символом парадигматической фонемы языка. В этой связи совершенно очевидной становится проблема сходства эталона и его коммуникативной копии, т.е. проблема изоморфности фонологических единиц речи и языка.

Степень изоморфности или гомоморфности вторичного коммуникативного символа может быть различной, но при этом

«непохожесть» нормативной единицы социолекта и вариативной единицы идиолекта не должна превышать определенных пределов.

Предложена модель восприятия звучащей речи (4), действующая на основе сегментации речевого потока на значимые единицы, звуковые образы которых включают в себя в качестве основных признаков переходные характеристики (фазы экскурсии и рекурсии), признаки паузации и ритмические структуры. Приведены данные о восприятии звонких/глухих синтезированных согласных, соотношении между восприятием некоторых видов речевого воздействия и акустическими параметрами. Акустические параметры (в отличие от акустических коррелятов) не обладают в общем случае собственными критериями интерпретации значения сегментов, однако их изучение позволяет выявить существенные закономерности звучащей речи, необходимые для успешного применения фонетических знаний в области речевых технологий.

Представления автора о модели восприятия сформулированы в виде ряда утверждений:

1. Речевой акт является результатом внутренних информационных процессов высшей нервной деятельности, которые завершаются готовыми алгоритмами управления процессом формирования в речевом аппарате языковых единиц в синтагматической цепи и далее

- движениями артикуляторных органов и звучащей речью.

2. Категориальность (фонематичность) слухового восприятия состоит в том, что фонетическое качество звуков речи может сохраняться при некотором допустимом изменении акустических параметров.

3. Слуховое восприятие речи сопровождается внутренней импрес-сивной речью, что отображается в микродвижениях артикуляторных органов слушающего (принцип «слушаем, говоря»).

4. Распознавание слухом единиц речи можно представить в виде иерархической системы, в которой верхние ярусы обеспечивают распознавание значения слов и интерпретацию их смысла в заданном семантическом контексте на основе речевой компетенции, а нижние ярусы - распознавание звуков на основе спектрально-временных параметров речи.

Между интонацией и синтаксисом существует особое взаимоотношение по принципу замены: чем полнее представлены грамматические средства, тем слабее интонационные признаки во фразе и обратно: чем сильнее интонационные средства, тем слабее могут быть

грамматические. Интонационные признаки не имеют однозначного соответствия с синтаксическими и могут с ними даже расходиться.

Таким образом, интерпретация смысла звучащей речи обеспечивается как языковыми средствами: лексикой, синтаксисом, семантическим контекстом, так и специфическими средствами: видом речевого воздействия, эмоциональной и стилистической окраской, адекватной интонацией, сопровождаемых мимикой и жестами в данном социальном и ситуационном контекстах, которые могут повлиять или даже изменить общее значение высказывания.

В статье (5) рассматриваются проблемы лингвистической и экстралингвистической информативности микроструктуры речевого вокализма.

Исследованию информационной значимости акустических параметров базисного элемента до последнего времени не уделялось должного внимания в силу ряда объективных причин. Одной из них являлось то обстоятельство, что информационные возможности традиционных параметров и характеристик микроструктуры речи для большинства языков были исследованы не до конца. Вторая причина заключалась в труднодоступности самих параметров микроструктуры, затрудняющей процесс их анализа и измерения.

Результаты экспериментальных исследований лингвистической и экстралингвистической информативности физических параметров акустического речевого сигнала являются основополагающими для разработки систем автоматического распознавания и синтеза речи, находящих все большее практическое применение. Основным препятствием на этом пути по-прежнему остаются недостаточная во многих случаях надежность распознавания (особенно для больших словарей) и низкое качество синтезированной речи (особенно для систем с большим коэффициентом сжатия речевого сигнала). Эти обстоятельства заставляют искать дополнительные резервы для повышения эффективности указанных систем. В частности, одним из таких резервов является потенциальная информативность параметров микроструктуры речи, включая базисный элемент речесвязанных гласных.

В работе были получены следующие результаты:

1. Параметры Тн и Тмакс характеризуются определенной стабильностью при смене реализации фонемы и самого базисного элемента в пределах одной реализации, причем стабильности первого параметра примерно вдвое ниже.

2. Параметры Тн и Тмакс в целом отличаются у разных тестовых фонем, причем средняя степень этого отличия у обоих параметров примерно одинакова.

Следовательно, указанные параметры, действительно обладают свойствами интрафонемной вариативности. Это дает основание рекомендовать использовать их в качестве приемлемых признаков классификации в алгоритмах автоматического распознавания гласных фонем.

Изучение состояния судебной фонетики (forensic phonetics) (6) позволяет выделить основные направления, характеризующие современный срез данной отрасли знаний. К приоритетным направлениям могут быть причислены знания, связанные с профессиональной слуховой оценкой речевого сигнала в целях идентификации говорящего и инструментальной обработкой данных с ориентацией на новые технологии. В рамках вышеуказанных направлений к числу активно разрабатываемых могут быть отнесены, например, следующие темы: различные виды произносительной маскировки, идентификация речевых расстройств, речь в состоянии интоксикации (алкогольной, наркотической, медикаментозной), идентификация экспертами артикуляторной базы родного языка говорящего, поиск голосовых стереотипов, идентификация эмоций, определение обликовых характеристик говорящего, имитируемая речь, повышение качества аудиоматериалов, обнаружение фактов монтажа фоно-граммы, эффект фактора «разновременной» записи фонограммы на слуховую идентификацию говорящего, паралингвистические харак-теристики вокализма и консонантизма, влияние эффекта тренировки на процесс голосообразования (фонации), влияние курения на идентифицируемый возраст говорящего, коартикуляторные характеристики говорящего и тип ВНД, зависимость между жестами и голосом в их вербальнокоммуникативном взаимодействии: просодия и кинесика,

экстралингвистическая информация применительно к вокализму, влияние родной лингвистической базы эксперта на идентификацию говорящего на иностранном языке, возможность идентификации говорящего при переключении с одного языка на другой, соотнесение речевого сигнала на уровне слухового восприятия со зрительным образом идентифицируемого говорящего в процессе свидетельского опознания (line-up-methods), межэкспертная вариативность при восприятии качества голоса, влияние различных степеней физического и психического

напряжения на модификацию речевого сигнала, разработка базы данных, разработка автоматизированных и полуавтоматизированных систем идентификации личности по голосу и речи.

Совокупность различных сторон речевой деятельности составляет единый по сути и целостный по форме психологический объект, в который автор включает следующие компоненты:

- механизм, образованный специализированными психо-

физиологическими структурами и динамическими процессами, протекающими в этих структурах;

- непосредственные функции, осуществляемые этим механизмом (психологические и лингвистические феномены);

- функционирование этого механизма в условиях социального взаимодействия людей, т.е. коммуникации.

С проблемой объективности/субъективности методов идентификации говорящего тесно соприкасается проблема верификации говорящего человеком и машиной. Для изучения данной проблемы сравнивались человеческий и автоматический способы верификации на материале высказываний, произнесенных в различных эмоциональных состояниях (нейтральное, счастье, усталость, гнев). В результате выявлено, что изменения таких параметров, как контур основного тона, темп речи, интенсивность, значения формант и т.д., заметно отражаются на результатах работы автоматической системы верификации, а также работы слушающих.

На просодические характеристики речи определенным образом влияет эмоциональное состояние говорящего. В связи с этим заметную роль в судебно-фонетических исследованиях приобретают исследования, связанные с супрасегментными (просодическими) характеристиками.

Просодические параметры несут важную информацию на эмоциональном, синтаксическом и прагматическом уровнях. В этом смысле самыми важными параметрами считаются контур основного тона (ОТ) и длительность.

Важным аспектом рассматриваемой проблемы является совместимость наиболее широко используемых систем анализа ЧОТ.

Интерес представляет исследование такого параметра, как темп, его вариативность в речи одного и того же говорящего (intraspeaker variability - внутридикторская вариативность) и в речи разных говорящих (interspeaker variability - междикторская вариативность).

Другая область в распознавании говорящего по речи - это идентификация говорящего по контурам формант. Положения частотных пиков в спектрограммах относительно устойчивы к спектральным искажениям. Формантные контуры сохраняют стабильность при телефонной передаче и, следовательно, могут служить базой при идентификации говорящего. Существуют различные методы параметризации и классификации формантных контуров (formant tracks).

Идентификация говорящего может также опираться на качество голоса. Долговременный средний спектр считается тесно связанным с качеством голоса.

Значительное место в соответствующих исследованиях занимает слуховое опознание говорящего по голосу.

Слуховое опознание (voice line up) является одним из методов установления личности говорящего. В процессе слухового опознания должены учитываться ряд факторов, в том числе природа и качество используемых образцов голосов (эталонов).

Одним из важнейших средств паралингвистики является произносительная специфика (фонация, артикуляция, просодия) речевого сообщения.

В целях передачи смысловой адекватности устного речевого сообщения первостепенную роль приобретает выявление коннотативных значений, передаваемых не только чисто лингвистическими (лексикограмматическими), но также (а иногда и исключительно) паралингвистическими (фонационно-кинетическими) средствами, включающими весь арсенал особенностей актуализации речевого высказывания, несущие определенную сигнификативную нагрузку.

В настоящее время применительно к теоретическому и прикладному языкознанию в корне изменился подход к изучению акта коммуникации: из узколингвистического он трансформировался в интердисциплинарный, включающий психо-, нейро-, социолингвистические и культурологические составляющие. В связи с расширением сферы знаний о речевом поведении, речевой и текстовой деятельности партнеров по коммуникации возникает интегративная область изучения речи - речеведение. Отправным пунктом для речеведа является индивид, его состояние, причины, побудившие его к общению, а также все приемы и способы, которыми он пользуется в акте коммуникации.

В.В.Потапов

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Потапов В. В.