филологические науки -языкознание
Каганов Александр Шлемович ОБ ОДНОМ КРИТЕРИИ ...
УДК 81
ОБ ОДНОМ КРИТЕРИИ ОЦЕНКИ СВОЙСТВ ГОЛОСОВОГО ИСТОЧНИКА ФИГУРАНТА ИДЕНТИФИКАЦИОННОЙ КРИМИНАЛИСТИЧЕСКОЙ ЭКСПЕРТИЗЫ
© 2018
Каганов Александр Шлемович, кандидат технических наук, старший научный сотрудник отдела экспериментальных исследований речи Институт языкознания Российской Академии наук (125009, Россия, Москва, Б. Кисловский пер., 1, стр. 1, e-mail: [email protected])
Аннотация. Статья раскрывает один из возможных путей решения проблемы неполной сопоставимости исходных звукозаписей (т. е. записей, полученных в процессе, например, оперативно-разыскных мероприятий, или тех фонограмм, которые предоставлены для исследования обвиняемым, свидетелем или потерпевшим) и образцов голоса и речи фигуранта криминалистической экспертизы, предоставленных следствием или судом для проведения сравнительного идентификационного исследования. Успешное преодоление данной проблемы, возникающей в процессе криминалистического идентификационного исследования личности по голосу и звучащей речи, требует, в частности, выявления таких индивидуализирующих признаков голосового источника, которые сохраняют свою стабильность даже в условиях различия эмоционального состояния диктора, неодинаковости речевых ситуаций, сопутствующих получению фонограммы, и несовпадения технических характеристик каналов записи исходного и сравнительного речевого материала. Автор приводит в статье данные статистической обработки результатов экспериментов, целью которых являлась оценка устойчивости предложенного автором показателя, характеризующего функционирование источника возбуждения речевого тракта говорящего, - относительного диапазона изменения частоты основного тона DFq Данный показатель продемонстрировал свою стабильность в условиях ограничений, наложенных на начальные условия решения рассматриваемой задачи криминалистической идентификации личности говорящего.
Ключевые слова: судебная экспертиза; криминалистическая идентификация; голосовой источник; звучащая речь; частота основного тона; индивидуализирующий идентификационный признак; эксперимент.
ABOUT ONE CRITERION FOR ASSESSING THE PROPERTIES OF A VOICE SOURCE OF A PERSON INVOLVED IN AN IDENTIFICATION FORENSIC EXAMINATION
© 2018
Kaganov Alexander Shlemovich, candidate of Technical Sciences, senior Researcher of Department of Experimental Speech Studies Institute of Linguistics of the Russian Academy of Sciences (125009, Russia, Moscow, Bolshoy Kislovskypereulok, house 1, building 1, e-mail: [email protected])
Abstract. The article reveals one of the possible ways of solving the problem of incomplete comparability of initial sound recordings (those. records obtained in the process, for example, operational search activities, or those phonograms that are provided for investigation by the accused, witness or victim) and samples of the voice and speech of the person involved in the forensic examination provided by the investigation or court for a comparative identification study. Successful overcoming of this problem arising in the process of forensic identification of the personality by voice and sounding speech requires, in particular, the identification of such individualized features of the voice source that maintain their stability even in conditions of differences in the emotional state of the speaker, the unevenness of the speech situations accompanying the phonogram, and the discrepancy in the technical characteristics of the recording channels of the original and comparative speech material. The author gives in the article the statistical processing results of experiments, the purpose of which was to assess the stability of the indicator proposed by the author, which characterizes the functioning of the source of excitation of the speaker's speech path - the relative range of the pitch frequency DFq. This indicator demonstrated its stability under conditions of limitations imposed on the initial conditions for solving the problem of forensic identification of the speaker in question.
Keywords: forensic examination; forensic identification; voice source; sounding speech; pitch frequency; identification feature.
Известно, что технология идентификационного исследования личности говорящего предполагает сравнение записей его голоса и речи, полученных в результате оперативно-разыскных мероприятий (далее - ОРМ) или предоставленных потерпевшим, свидетелем и др. (т. е. сравнение т. н. «исходных» фонограмм) с образцами голоса и речи подозреваемого, обвиняемого и др., полученными с соблюдением норм уголовно-процессуального кодекса. В качестве образцов голоса и звучащей речи могут использоваться фонограммы публичных выступлений фигуранта экспертизы по радио, телевидению, звукозаписи его интервью (если таковые имеются в распоряжении органа или лица, назначившего экспертизу), а также фонограммы допроса фигуранта следователем, либо образцы, взятые у него в ходе судебного заседания [1, с. 195].
Однако, и из экспертной практики, и из специализированных литературных источников известно, что при производстве экспертизы очень часто возникает проблема неполной сопоставимости этих звучащих текстов [2, с. 111]. Успешное преодоление данной проблемы требует, в частности, выявления таких индивидуализирующих признаков голосового источника, которые сохраняют свою стабильность даже в условиях различия эмоционального состояния диктора, неодинаковости речевых
ситуаций, сопутствующих получению фонограммы, и технических характеристик каналов записи исходного и сравнительного речевого материала.
С целью расширения списка стабильных индивидуализирующих признаков нами был предложен показатель, характеризующий функционирование источника возбуждения речевого тракта говорящего, - относительный диапазон изменения частоты основного тона DFо [3, с. 112]. По своей сути DFо есть не что иное, как интегральная характеристика манеры речи индивидуума: чем монотоннее его манера говорения, тем меньше значение DFо, и наоборот - чем эмоциональнее, экспрес-сионно насыщеннее речь, чем более выражена манера интонирования диктора, тем выше значение относительного диапазона изменения частоты основного тона (далее - ЧОТ).
Проанализируем преимущества применения этого индивидуализирующего признака в экспертной практике и в лабораторных экспериментах, посвященных исследованию голосового источника. Напомним, что данная характеристика есть не что иное, как отношение максимального значения частоты основного тона (среднее значение ЧОТ плюс удвоенное значение среднеква-дратического отклонения (далее - СКО, или с) ЧОТ от среднего значения) к минимальному (среднее значение
Kaganov Alexander Shlemovich philological sciences -
ABOUT ONE CRITERION ... linguistics
ЧОТ минус удвоенное значение с). Согласно нормальному закону распределения вероятность попадания случайной величины (в нашем случае этой случайной величиной является значение частоты основного тона) в интервал ±2с отклонения этой величины от среднего её значения равна 0,96, т. е. составляет 96 %. Признак DFо показал свою устойчивость как в условиях естественных, или полевых экспериментов, т. е. в «живых» звукозаписях, полученных в обстановке ОРМ, так и при проведении экспериментов в лабораторных условиях.
С целью подтверждения высказанного положения приведем результаты одного их наших лабораторных экспериментов. Для проведения эксперимента из массива проанализированных нами (в ходе выполнения криминалистических идентификационных судебных экспертиз) звучащих текстов были отобраны те т. н. «исходные» записи, которые содержали разговоры дикторов мужского поля, проведенные по трактам сотовой связи. Отбор звучащих текстов для описываемого эксперимента обусловлен тремя обстоятельствами:
- во-первых, опыт экспертной практики показывает, что подавляющее число фонограмм, поступающих на криминалистическое идентификационное исследование, представляют собой звукозаписи телефонных разговоров по трактам сотовой связи;
- во-вторых, именно этим условиям записи часто сопутствует наличие в телефонном тракте шумов, помех и частотных искажений, затрудняющих процесс идентификации, и, наконец,
- в-третьих, для данных экспертных ситуаций характерна несопоставимость (на первый взгляд) или неполная сопоставимость исходных и сравнительных звукозаписей.
В этих ситуациях особенно важную роль приобретают те индивидуализирующие идентификационные признаки, которые сохраняют свою стабильность в описанных выше обстоятельствах.
Статистический анализ относительных отклонений срединного значения частоты основного тона речевой продукции дикторов в материале выбранных 24-х исходных записей от средней ЧОТ в сравнительных фонограммах, проведенный по результатам исследования этой выборки, показал, что средневзвешенное относительное отклонение среднего значения ЧОТ Fо составило 18,3 %. Заметим, что данный показатель близок к предельно допустимому значению интраиндивидуаль-ной голосовой изменчивости [4]. В то же время средневзвешенное относительное отклонение относительного диапазона изменения основного тона DFо на данной выборке составило всего 3,8 %. Поясним, что для оценки близости анализируемых параметров была использована метрика, основанная на правиле «ближайшего соседа», описанная в нашей работе [2, с. 46].
Причиной приведенных различий послужили несколько факторов. Первым из этих факторов является неодинаковость ситуаций речевого общения: для каналов мобильной связи характерно, как упоминалось выше, присутствие в них шумов, помех и частотных искажений. Эти факторы часто влекут за собой форсирование голоса абонента, а значит и изменение параметров ЧОТ по сравнению с характерной для данного диктора нормой. С другой стороны, сравнительный речевой материал обычно представляет собой записи, полученные в кабинете следователя или в процессе судебного заседания с помощью обычных бытовых устройств звукозаписи (далее - УЗЗ). В этих условиях от фигуранта, как правило, не требуется форсирование голоса.
Кроме того, необходимо обратить внимание и на различие в эмоциональном состоянии фигурантов описанного эксперимента. Для т. н. «исходных» звукозаписей характерно активное эмоциональное состояние говорящего (как правило, он не предполагает, что его разговор с собеседником записывается - поэтому он, как правило, говорит свободно; часто - если речь идёт о чиновнике 40
высокого уровня - действует напористо, берёт инициативу в разговоре на себя, навязывает собеседнику свою точку зрения). Образец же часто записывается после предъявления фигуранту обвинения в совершении уголовного преступления, в большинстве случаев в присутствии следователя, адвоката, судьи и др. В такой обстановке эмоциональное состояние диктора часто оказывается вялым, иногда скользящим к подавленности. Все эти факторы оказывают на характеристики голосового источника значительное влияние.
Таким образом, описанные ситуации являются характерными для исследования «живых» звукозаписей в том отношении, что в процессе инструментального анализа характеристик ЧОТ следует учитывать фактор низкой сопоставимости фонационных характеристик дикторов на фонограммах, полученных в процессе ОРМ, и на звукозаписях образцов, представленных для сравнения. В первом случае чаще всего приходиться анализировать спонтанную, эмоционально окрашенную разговорную речь (далее - РР). Сравнительный материал, как правило, представляет собой, во-первых, рассказ автобиографии (т. е. монолог), во-вторых, чтение предложенного фигуранту текста. Следует отметить, что текст этот, к сожалению, далеко не всегда является одним из фонетически представительных специальных текстов, рекомендуемых в литературных источниках (см., например, работу [5, с. 268]). Часто для чтения при записи образцов следователи или судьи предлагают первый попавшейся под руку текст: газетную статью, извлечения из уголовно-процессуального или уголовного кодекса и др.
Ещё одним фактором, усложняющим процесс идентификационного исследования, является низкое качество исходного речевого материала, т.е. фонограмм, полученных в процессе ОРМ или предоставленных свидетелями или потерпевшими по своей собственной инициативе. Часто на таких звукозаписях присутствуют сильные посторонние шумы, помехи и искажения в тех частотных областях, которые наиболее "интересны" с точки зрения спектрального анализа. Так, например, в известной работе [6] прямо указывается, что если процесс продуцирования речи сопровождается акустическим шумом с уровнем 80-90 дБ, уровень речи диктора-фигуранта исследования поднимается на 10-15 дБ (т. е. в 3-5 раз) по сравнению с нормой. Это явление сопровождается заметными изменениями значений формант и формы спектра (т.е. изменениями соотношений сигнала в полосах спектра - здесь следует пояснить, что из литературных источников известно, что именно форма спектра определяет акустическое качество звуков [7, с. 5] конкретного индивидуума). При этом форманты (т. е. максимумы в спектре речевого сигнала) являются лишь доступным для речевого аппарата способом достижения необходимых полосных соотношений. В силу указанных факторов проведение спектрального анализа в этих условиях часто становится невозможным.
В описанных обстоятельствах значение тех индивидуализирующих признаков инструментальной, или акустической группы, которые связаны с исследованием характеристик ЧОТ и статистических параметров огибающей основного тона, заметно увеличивается, поскольку современные звуковые анализаторы обеспечивают устойчивое выделение контура основного тона на фоне шумов.
В практике решения задачи криминалистической идентификации личности говорящего аккумулирован значительный опыт акустического анализа фонационных характеристик индивидуума с применением специализированных аппаратно-программных комплексов последнего поколения. Примерами указанных комплексов могут служить комплексы «Justiphone» (г. Орёл) и «ОТ Expert» (г. Москва). При их разработке был использован опыт, накопленный в системах экспертных учреждений Минюста и Минобороны России и описанный в наших
работах (см., например, [2, с. 16])._
Baltic Humanitarian Journal. 2018. Т. 7. № 2(23)
филологические науки -языкознание
Каганов Александр Шлемович ОБ ОДНОМ КРИТЕРИИ ...
В заключение следует сказать, что в процессе анализа акустических признаков, характеризующих работу фонационного аппарата диктора-фигуранта экспертизы, относительный диапазон изменения частоты основного тона DFо продемонстрировал свою стабильность в условиях ограничений, наложенных на начальные условия решения задачи: недостаточную (на первый взгляд) протяженность исходных и сравнительных звучащих текстов; их неполную сопоставимость по эмоциональному состоянию фигуранта; наличие на фонограммах помех, шумов и искажений; различие технических характеристик каналов записи и др.
СПИСОК ЛИТЕРАТУРЫ:
1. Каганов А.Ш. Криминалистическая экспертиза звукозаписей. Монография. - М.: Юрлитинформ, 2005. 272 с.
2. Каганов А.Ш. Криминалистическая идентификация личности по голосу и звучащей речи. Монография. 2-е изд., перераб. и доп. М.: Юрлитинформ, 2012. 296 с.
3. Каганов А.Ш. Криминалистическая идентификация личности по голосу и звучащей речи. Монография. - М.: Юрлитинформ, 2009. 291 с.
4. Рамишвили Г.С., Чикоидзе Г.Б. Криминалистическое исследование фонограмм речи и идентификация личности говорящего. - Тбилиси: Мецниереба, 1991. 265 с.
5. Каганов А.Ш., Назин Л.Ф. Криминалистическая экспертиза видео- и звукозаписей. Краткая энциклопедия. М.: Юрлитинформ, 2014. 280 с.
6. Михайлов В.Г., Златоустова Л.В. Измерение параметров речи / Под ред. М.А. Сапожкова. М.: Радио и связь, 1987. 168 с.
7. Варшавский Л.А., Литвак И.М. Исследование формантного состава и некоторых других физических характеристик звуков русской речи // Проблемы физиологической акустики. М.-Л.: АН СССР, 1955. Т. 3. С. 5-17.
Статья поступила в редакцию 10.05.2018
Статья принята к публикации 26.06.2018