УДК 612.821
ЛОКАЛИЗАЦИИ ЗВУКА СЛУХОВОЙ СИСТЕМОЙ ЧЕЛОВЕКА В САГГИТАЛЬНОМ НАПРАВЛЕНИИ
© 2005 г О.М. Бахтин, А.И. Самарин
The paper presents 1he results of the measurements of auditory system's ability to localize the sources of sounds arranged along sagittal azimut to subject's head. Sound localization was performed without visual control. The analysis of the data obtained allows to conclude rather low level of this problem solving by human auditory system. The link between successful localization and frequency parameters of sound sygnals was revealed.
Введение
Классическое понимание локализации источника звука базируется на том, что слуховая система демонстрирует высокую разрешающую способность фиксировать положения источника звука только во фронтальной горизонтальной плоскости. Это, видимо, обусловлено боковым расположением органов слуха, которое позволило сформировать механизмы локализации звука, основанные на интерауральной разнице либо по интенсивности, либо по времени прихода звука в правое и левое ухо. В настоящее время эти механизмы достаточно подробно изучены и описаны [1, 2]. С другой стороны, постулируется, что локализация звука для вертикально ориентированных излучателей (или расположенных в передне-заднем направлении) представляется задачей, которая решается слуховой системой значительно хуже, более того, считается, что передне-задний азимут создает условия, практически неразрешимые для слуховой системы человека. Предполагается, что в этой ситуации слуховая система прибегает либо к помощи других сенсорных систем, чаще всего зрительной, либо реализует проблему локализации по «контексту» в соответствии с окружающей обстановкой, либо с помощью движений головы [3, 4].
Однако вопрос о том, может ли слуховая система самостоятельно определять положение источника звука в передне-заднем направлении, остается открытым. В экспериментах по исследованию способности человека определять расстояния до источника звука обнаруживается, что в отсутствии зрительного контроля испытуемые в ряде случаев соотносят звук либо как звучащий сзади, либо спереди, в зависимости от частотных характеристик звука [5, 6]. Эти данные указывают на то, что локализация по саггитальному (передне-заднему) азимуту может быть обусловлена спектральными составляющими звуковых сигналов. Для более детальной проверки нами были проведены исследования, результаты которых изложены в данной статье.
Описание методики
В экспериментах приняло участие 15 мужчин и женщин в возрасте 20-40 лет. Все испытуемые имели отологически нормальное состояние периферических слуховых структур, а по аудиометрическим измерениям состояние их слуховой чувствительности соответствовало возрастной норме. Все испытуемые не имели опыта участия в психоакустических экспериментах и не проходили предварительной тренировки перед основными экспериментами. В обоих экспериментальных сериях участвовали практически одни и те же лица, но с
достаточно большим интервалом (в пределах нескольких дней) между сериями.
В двух экспериментальных сериях использовалось предъявление звуковых сигналов в условиях свободного звукового поля. Ответ испытуемых формировался в результате моноурального прослушивания ипсилате-ральным по отношению к звуковым излучателям ухом.
В 1-й серии звуковые сигналы предъявлялись через 4 излучателя, расположенных на горизонтальной стойке через равные расстояния. Стойка располагалась сбоку от испытуемых на расстоянии 110 см на уровне ушного прохода; она устанавливалась так, что расстояние от слухового прохода до крайних излучателей (1 крайнее положение сзади и 4 крайнее положение впереди) было одинаковым. Угол между двумя соседними излучателями, измеренный на уровне слухового прохода, составлял 20 0.
Звуковые сигналы подавались посредством ЭВМ с использованием звуковой карты и ключа, который управлял подачей звука на соответствующий излучатель. Включение излучателей осуществлялось в случайном режиме, но каждый из 4 излучателей активировался в цикле одинаковое число раз. Таким образом, в цикле, состоящем из 80 предъявлений звука, каждый излучатель включался 20 раз. В первой серии использовались звуковые сигналы в 200, 1000 и 8000 Гц. Длительность звука на каждой частоте составляла 1000 мс, каждое последующее предъявление звука осуществлялось после ответа испытуемого на предыдущий звук. Распределение уровней звукового давления (УЗД), развиваемых используемыми излучателями (измерительный микрофон фиксировался в области слухового прохода), представлено на рис. 1. Для каждой отдельной частоты УЗД лежат в пределах дифференциальных порогов громкости для человека [7].
В каждом отдельном опыте испытуемый работал со звуком только одной частоты. Прослушивание звуковых сигналов осуществлялось в отсутствии зрительного контроля, для чего глаза закрывались светонепроницаемой повязкой, голова фиксировалась в определенном положении. Для привязки пространственного субъективного ощущения к конкретным координатам использовалось виртуальное представление циферблата часов, расположенных горизонтально, таким образом, что значения времени между 6 ч (сзади) и 12 ч (впереди) лежали в области стойки с излучателями. Испытуемые должны были поставить субъективное ощущение пространственного положения звука в соответствие с определенным значением времени на воображаемом циферблате и назвать эту координату времени.
£
св
И
^
И
70п :60-,50-4030 20 100
12 3 4
Номера излучателей звука
200 "О 1000 Гц
8000 Гц
ими в одну группу как звучащие сзади (рис. 2). Прослушивание звукового сигнала частотой 8000 Гц разделило всех испытуемых на две группы. Для одной прослушивание давало основание локализовать все источники звука впереди от себя, а в другой - сзади. Однако можно заметить, что внутри этих группировок локализации отдельных излучателей так же были смещены относительно их истинного положения на стойке, причем 4-й излучатель всегда четко определялся как звучащий несколько впереди.
Ддинамик 1
Рис.1. Распределение уровней звукового давления, формируемых разными звуковыми излучателями. Расположение измерительного микрофона соответствует положению слухового прохода
Во 2-й экспериментальной серии использовался более широкий набор частот: 50, 100, 200, 400, 800, 1000 и 8000 Гц. Весь набор звуковых сигналов в случайном порядке подавался в каждом отдельном цикле либо с 4-го переднего излучателя, либо с 1-го заднего. В остальном процедура звуковой стимуляции и требуемые ответные реакции испытуемых соответствовали таковым в 1-й экспериментальной серии.
На основе анализа ответов испытуемых можно было выделить 4 часовых интервала, в пределах которых испытуемые чаще всего пространственно локализовали источники звука: 6-7, 8-9, 9-10 и 11-12 ч. Получается, что испытуемые каждый раз должны были сделать выбор из 4 альтернативных вариантов. Следовательно, уровень случайного выбора в 2 экспериментальных сериях соответствовал значению вероятности 0,25, а значения выше этого уровня определяли вероятность правильного выбора, правильной локализации источника звука
Результаты экспериментов
1-я экспериментальная серия. УЗД, формируемые звуковыми излучателями, имели достаточно близкие значения, что создавало равные условия относительно силовых характеристик стимулов, прослушиваемых с разных излучателей.
Эксперименты показали, что испытуемые способны пространственно разносить ощущения, возникающие при прослушивании звуков с разных источников. Это наглядно видно на рис.2, где представлено распределение субъективных ощущений в используемых нами часовых координатах. Наиболее успешно испытуемые локализовали источники звука при частоте 200 Гц. Наиболее четко дифференцировались 1 и 4-й излучатели, т.е. при данной частоте сигнала испытуемые с закрытыми глазами достаточно уверенно могли определить, где они слышат звук, спереди или сзади. При частоте звука 1000 Гц испытуемые достоверно идентифицировали положение 4-го источника звука, как звучащего впереди, но остальные излучатели группировались
■ динамик 2
X ▲ динамик 3
X Xдинамик 4
Д
X
■
▲
х . ..
■ !
ж ▲
А Я
200 1000 8000 8000 Частота звукого сигнала, Гц
Рис.2. Локализация пространственного положения звукового излучателя в 1-й экспериментальной серии. Приведены усредненные данные по группе
На рис. 3 представлены значения вероятности правильных ответов испытуемых при прослушивании звуков разной частоты с разных источников звука. Вероятность правильной локализация каждого из 4 излучателей при данной используемой частоте превышает уровень случайного выбора. Следовательно, испытуемые достаточно правильно локализовали пространственное положение источников звука. При этом вероятность правильных ответов для звукового стимула частотой 200 Гц была выше, чем для других частот, особенно для 4-го (переднего) излучателя. Исключение составляет высокое значение вероятности правильной локализации 2-го излучателя при частоте сигнала 1000 Гц.
Рассмотрим распределение ошибочных локализаций (рис.3). При прослушивании звуков с частотами 200 и 1000 Гц характер ошибок соответствовал способности испытуемых к пространственному разделению источников звука. Для этих частот вероятность ошибки для соседних излучателей была выше, чем для пространственно разделенных. Такой характер распределения ошибочных локализаций наблюдался для всех 4 излучателей, но отчетливее всего выражен для 1 и 4-го источников звука (рис. 4). Что касается 8000 Гц, то распределение ошибок не всегда является монотонно убывающей величиной с увеличением расстояния от активного динамика. Например, при активном 1-м динамике испытуемые чаще всего путали его с 4-м, наиболее удаленным.
Таким образом, результаты 1-й экспериментальной серии показали, что испытуемые в состоянии достоверно локализовать источники звука, расположенные по
ii
10
9
8
7
6
саггитальному азимуту. Анализ ответов испытуемых, а также распределение ошибочных локализаций указывает на наличие определенной связи между частотой звука и величиной правильной локализации: низкочастотные звуки локализуются успешнее, чем более высокочастотные.
2. Экспериментальная серия. Обнаруженная частотная зависимость локализации давала основания для
проведения 2-й экспериментальной серии, в которой использовался более широкий набор частот звуковых сигналов. Для управления схемы эксперимента и с учетом результатов 1-й серии испытуемыми осуществлялась локализация только крайних излучателей на 1 и 4 стойке, т.е. самого заднего и самого переднего.-
1
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
А
0 х
%
□ t
□ 1
9
4
X
♦ 200 Гц □ 1000 Гц А 8000 Гц
1
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
♦
А
А ♦
♦ 200 Гц
2 3 4
□ 1000 Гц А 8000 Гц
1
0 ,9 0 ,8 0 ,7 0 ,6 0 ,5 0 ,4 0 ,3 0 ,2 0 ,1 0
C
□
А ♦
9
А
А ♦
1
х
♦ 200 Гц
□ 1000 Гц А 8000 Гц
4
X
1
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
D
□ А
А ♦
♦ 200 Гц
□ 1000 Гц
! ♦
3 4
А 8000 Гц
Рис. 3. Распределение вероятностей правильных локализаций и ошибок при прослушивании разных частот, 1 -я экспериментальная
серия. Ось Х - номера источников звука. Р - величина вероятности. Источники звука: А - 1-й; Б -2-й; В -3-й; Г -4-й. Уровень правильной локализации соответствует значению маркера над активным источником звука. Маркеры над остальными излучателями соответствуют вероятности ошибки
12
О динамик сзади
я я я
9 ■
■ динамик впереди
k
I
{
I
50
100
t
200
400
800
1000 8000
Частота звука, Гц
Рис.4. Локализация излучателей при прослушивании звуков разной частоты. Горизонтальная ось - частота звуковых сигналов; вертикальная ось - используемые часовые координаты. Приведены усредненные данные по группе. Вертикальные линии на графике - стандартная ошибка среднего, р< 0,01 Результаты экспериментов представлены на рис. 4. на способность к пространственному разделению излу-Как и в первой серии, изменение частоты звука влияло чателей. При частоте звука 50 Гц наблюдается досто-
р
р
B
Р
Р
0
8
7
6
верно правильная пространственная идентификация источников звука, однако с ростом частоты звука способность к пространственной селекции источников звука снижается и полностью отсутствует на частоте 8000 Гц. Этот однонаправленный градиент снижения уровня локализации нарушается на частоте 1000 Гц, при которой имеет место внезапное повышение уровня локализации, тут же падающее на частоте 8000 Гц. На этом же рисунке видно, что испытуемые в целом предпочитали локализовать источник звука в области, близкой к 9 ч, т.е. напротив уха, либо несколько сзади себя. Распределение величин вероятности правильных ответов, представленных на рис.5, показывает, что этот показатель как для переднего, так и для заднего излучателей превышает уровень случайного выбора. Вероятность правильной идентификации переднего и заднего источников звука одинакова, но в тех случаях, когда пространственное разделение источников звука достоверно (см. рис. 4 для частот 50 и 1000 Гц), вероятность передней локализации достоверно выше, чем задней (рис.5).
р
50 100 200 400 800 1000 8000 ГЦ
—О—источник звука впереди —■—источник звука сзади ---случайный выбор
Рис.5. Распределение вероятностей правильной локализации источников звука во 2-й серии. Горизонтальная ось Х - частота тестового стимула, Гц; вертикальная - значения вероятности правильной локализации (представлены данные, усредненные по группе ). Вертикальные линии - стандартная ошибка вероятности
Следовательно, нетипичное пространственное разделение для звука частотой 1000 Гц обусловлено в основном высоким уровнем правильной локализации источника звука, расположенного впереди. Вероятность правильного ответа в этом случае равнялась 0.6, такой же уровень положительной локализации наблюдается для переднего источника звука при частоте звука 50 Гц (рис.5). Следует отметить, что зависимость вероятности правильного ответа испытуемых от частоты звука в большей степени, как видно на рис.5, выражена для ситуации прослушивания звука с переднего излучателя.
Итак, результаты двух серий экспериментов показали, во-первых, что человек, используя только слуховую информацию, в состоянии правильно осуществлять локализации источников звука пространственно разнесенных в передне-заднем (саггитальном) направлении. Однако эта способность находится на достаточно низком уровне, что обусловливает и большой процент
ошибочных ответов. Во-вторых, мы обнаружили зависимость такой локализации от частоты звукового сигнала, вследствие чего низкочастотные звуки создают лучшие условия для данной локализации.
Обсуждение
В целом испытуемые справлялись с задачей локализации источников звука, расположенных в передне-заднем направлении не по средней линии головы. Делали они это при отсутствии зрительного контроля и дополнительных контекстных подсказок, при фиксированном положении головы. Таким образом, задача локализации источников звука решалась в основном за счет слуховой системы. Судя по величинам вероятностей правильной локализации, которая при разных экспериментальных условиях превышала уровень случайного выбора, слуховая система может самостоятельно решать данную задачу.
Возникает вопрос, на чем может базироваться локализация источников звуков, расположенных по азимуту в сагиттальном направлении не по средней линии головы. Очевидно, при таком расположении излучателей механизмы, основанные на сравнении характеристик звуков идущих в правое и левое ухо, бесполезны. Би-науральное прослушивание может только подсказать, где находится источник звука - справа или слева, но не даст ответа на вопрос - впереди или сзади. Интенсивности звуков, поступающих с разных динамиков, также не могут выступать в качестве подсказок, поскольку измерения показали, что разница в интенсивностях не превышала уровня дифференциальных порогов.
В связи с вышеизложенным мы обратили внимание на частотные характеристики звуковых сигналов. Действительно в наших экспериментах успешность локализации источника звука повышалась со снижением частоты используемого звука. Другие данные [5, 6] также показывают зависимость отнесения источника звука вперед или назад от частоты звука. Возможно, что в ситуации пассивного прослушивания, когда голова фиксирована и нет «контекстной» подсказки, а также при отсутствии зрительного контроля слуховая система может использовать особенности спектральных характеристик звуковых сигналов. Условия поступления звуков, идущих спереди и сзади к барабанной перепонке, различны в связи с наличием ушной раковины и определенным образом ориентированных складок этой раковины, что в большей степени создает препятствия для звукового сигнала, приходящего сзади. Блауэрт [8] предполагает, что ушная раковина по-разному фильтрует звуки из разных направлений. Есть данные [9] о том, что звуки, отраженные от структур ушной раковины, вызывают временное запаздывание между отраженными и прямыми в пределах 300 мкс, что особенно проявляется на частотах свыше 4000 Гц. Как считает автор, эти запаздывания могут способствовать локализации звуков при моноуральном прослушивании и/или при расположении источников звука в медиальном направлении, но только в срединной плоскости.
Если спектральные особенности звуков действительно играют роль в их локализации при передне-заднем расположении источников, то необходимо предположить во-первых, наличие конкретной динамики
спектральных изменений, соответствующей звукам, приходящим спереди или сзади. Основанием для возникновения таких спектральных изменений могут служить, например, различные акустические условия для саггитального азимута, связанные с тем, что звук, идущий сзади, должен огибать на своем пути ушную раковину, в то время как передний звук непосредственно поступает в слуховой проход. Во-вторых, в памяти тогда должны существовать эталоны таких спектральных изменений, которые могут быть сопоставлены слуховой системой со звуками в условиях реального прослушивания по саггитальному азимуту. О возможном существовании таких эталонов упоминается в работах, связанных с оценкой удаленности источников звука [10].
Выявленная в наших экспериментах зависимость уровня локализации источников звука в передне-заднем направлении от частоты говорит в пользу механизма локализации, основанного на спектральных особенностях звуков.
Открытым остается вопрос о нетипичной пространственной идентификации источника звука частотой 1000 Гц. Почему при такой частоте вдруг резко возрастает вероятность правильной пространственной иден-
НИИ нейрокибернетики РГУ_
тификации источника звука? Результаты изложенных здесь экспериментов не позволяют дать удовлетворительный ответ, но мы надеемся получить его в последующих исследованиях.
Литература
1. Альтман Я А. Локализация звука. Л., 1972.
2. Блауэрт Й Пространственный слух. М., 1979.
3. Thurlow W.R., Mangels J.W., Runge P.S. // J. Acoust. Soc. Amer. 1967. Vol. 42. № 2. Р. 489-493
4. Thurlow W.R., Runge P.S. // J. Acoust. Soc. Amer. 1967. Vol. 42. № 2. Р.480-488.
5. Butler R.A., Levy E.T., Nef W.D. // J. Exper. psychol: Human Percept. Perform. 1980. Vol. 6. № 4. P.745-750.
6. Levy E.T., Butler RA // J. Aud. Res. 1978. Vol. 18. № 1. P. 41-50.
7. Jesteadt W, Wier C.C., Green D.M. // J. Acoust. Soc. Amer. 1977. Vol. 61. P.169-177.
8. Blauert J. // Acoustica. 1969. Vol. 22. P. 205-213.
9. Battean D.W. // Proc. Roy. Soc. (London), 1967. B168. P.158-180.
10. Wiley R.H., Richards D.C. // Behav. Ecol. Sociobiol. 1978. Vol. 3. № 1. P.69-94
7 мая 2OO4 г.