ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013 Управление, вычислительная техника и информатика № 1(22)
УДК 519.24; 621.3; 681.5.1
В.В. Губарев
НЕПАРАМЕТРИЧЕСКИЕ ИЗМЕРЕНИЯ ХАРАКТЕРИСТИК СЛУЧАЙНЫХ СИГНАЛОВ И ПРОБЛЕМЫ ИНТЕРПРЕТАЦИИ И ПРИМЕНЕНИЯ ИХ РЕЗУЛЬТАТОВ
Обсуждаются проблемы, к которым может привести интерпретация и применение результатов непараметрических измерений характеристик случайных сигналов без учета модельных представлений сигналов и условий измерений.
Ключевые слова: случайные сигналы и процессы, характеристики, измерение, оценивание.
Словосочетание «непараметрические измерения» является производным от термина математической статистики «непараметрическое оценивание». Под непараметрическим понимают оценивание характеристик случайных элементов (величин, векторов, функций), при котором не известна (или известна, но не используется) модель оцениваемой функционной или числовой характеристики и/или случайного элемента [1, с. 631; 2, с. 338; 3, с. 134]. Иногда такое оценивание называют свободным от распределения, т.е. от той модели распределения, которой подчиняются выборочные значения случайного элемента [4, с. 628-629], или, в общем виде, свободными от аналитического описания характеристик и/или моделей [3, с. 134]. Однако при этом остаются открытыми те вопросы, которые, как правило, не ставятся при непараметрическом оценивании и, что особенно важно, при непараметрических измерениях. Среди них такие, например, как: «Насколько корректным является такое оценивание (измерение)?», «Насколько корректным являются интерпретация и применение результатов оценивания, особенно измерения?». Ведь измерение является целью для измерителя и только лишь одним из первичных этапов решения различных практических и теоретических прикладных и исследовательских задач.
Цель настоящей работы - рассмотрение именно этих вопросов.
1. Необходимые определения
Для однозначности восприятия материала определимся с используемыми понятиями.
Прежде всего обратим внимание на такие разные понятия, как случайные сигналы и случайные элементы (величины, векторы, функции), а также измерение и оценивание.
Под сигналами будем понимать внутриобъектные физические носители информации, мгновенные значения которых представляют собой различные физические величины [3, с. 34]. Случайные сигналы - те из сигналов, которые можно описать вероятностными моделями, т. е. такие, физическая основа (суть) и условия экспериментального восприятия которых подчиняются требованиям применимости вероятностно-статистического аппарата. В качестве моделей случайных сигналов и их отсчетов (временных, пространственных и т.п.) могут быть, например, модели случайных элементов, в том числе заданные в виде стохастических интег-
ро-дифференциальных, конечно-разностных и т.п. уравнений. Что касается случайных элементов, то это объекты математики. Иными словами, случайные элементы могут рассматриваться лишь как математические образы (модели) случайных сигналов-оригиналов.
Из разных определений измерения (см., например, [5, с. 13]) будем использовать только количественное, понимая под измерением установление соответствия значениям физических величин, характеризующих состояние некоторого материального объекта, значений числового множества из заданной числовой измерительной шкалы. Иными словами, измерение как процесс есть последовательность физических действий, связанных с сопоставлением физической величины с некоторой мерой (единицей измерения) и подсчетом (отсчетом, снятием) количества мер, укладывающихся в размере этой физической величины. В отличие от измерения оценивание есть последовательность математических операций (действий), направленных на вычисление по выборочным значениям (реализациям) случайного элемента эмпирических значений искомой характеристики (этап 1-й - получение эмпирических характеристик) и принятие (обоснование, приравнивание) их в качестве приближенных значений оцениваемой характеристики генеральной совокупности (ГС), т.е. характеристики модели, которой мы пытаемся описать эту генеральную совокупность. При параметрическом или смешанном [3, с. 171] оценивании эта модель ГС или только модель искомой характеристики представляются в аналитическом (формальном) параметрическом виде. При непараметрическом - в виде набора чисел (для числовых характеристик), таблиц «аргумент - значение функции» или графиков для функционных характеристик. В теории оценивания, как разделе математической, в том числе прикладной, статистики, физическая природа исходного числового множества (х1,...,хы), выборочных значений ГС хі, і = 1,N, хі = (хі1,хі 2,...,хіп) не рассматривается. Это рассмотрение есть предмет внимания прикладного специалиста1 (физика, биолога, инженера, экономиста, ...), который в первом приближении в качестве выборочных значений ГС хі, і = 1, N, принимает результаты первичных измерений мгновенных значений (^,.., 4 N) 4г- =(|п, |і2,.., 'ьі п) сигналов, статистического обследования и т.п.
В этом случае оценивание представляет собой набор вычислительных операций над результатами первичных измерений - мгновенных значений сигналов в процессе косвенных измерений2 искомых характеристик случайных сигналов. При более тщательном подходе исходные данные (4^..., 4 .ы-) первичных измерений ставятся в соответствие выборочным значениям ГС (х1,...,хы) с учетом их метрологических (в частности, точностных) показателей и условий (в том числе
1 Ситуация, когда в качестве выборочных значений ГС рассматриваются имитируемые при имитационном моделировании значения не рассматривается. Их можно свести к значениям ГС либо к рассматриваемому случаю, когда выборочными значениями ГС считаются результаты первичных измерений отсчетов сигналов (эмпирические данные).
2 Напомним, что результаты косвенных измерений д получаются путем вычислительных
преобразований д = (,...,4ы) по формулам (•) , связывающим измеряемую харак-
теристику д (параметр, величину) с результатами первичных измерений значений первичных физических величин ( ,..., 4N ) .
используемых модельных представлений) получения (41 ,..., ) . Этот момент в
дальнейшем рассматривать не будем.
Иными словами, измерения есть совокупность физических, математических и логических операций, в то время как оценивание - это последовательность только математических и логических операций. Оценивание может быть составной частью косвенных статистических измерений.
Еще одна важная особенность измерений - обязательное сопровождение их результатов метрологическими показателями качества (что, кстати, зачастую отсутствует) и условиями получения, подтверждающими как достоверность результатов измерения, так и сведения об области их применимости.
2. Цели и задачи непараметрических измерений
Как уже упоминалось, измерение не является, как правило, самоцелью. Его результаты далее обязательно используются их пользователями для достижения каких-то своих целей, решения задач, поставленных ими. От того, какие это задачи, зависит выбор измеряемых характеристик, показателей их качества, условий измерения и т. п. Это ключевой момент планирования, организации и проведения измерений. Рассмотрим, какие это могут быть задачи.
Прежде всего обратим внимание на назначение измерений, т.е. на те цели, для достижения которых требуются измерения каких-то характеристик с таким-то качеством. Это такие, например, цели как гносеологические (получение научных знаний), когнитивные (познавательные), логистические (образовательные), идентификационные (описательные), созидательные (проектные), коммуникабельные, управленческие, метрологические, экспериментально-имитационные и т. д. В свою очередь, в каждом из этих направлений используемые, построенные с помощью измерений модели исследуемых объектов могут выполнять разные функции: передаточные, измерительные, описательные, объяснительные, интерпретаторские, предсказательные, критериальные и т. д.
Например, результаты измерения корреляционно-спектральных характеристик случайных сигналов могут применяться для идентификации динамических систем, определения и предсказания их реакций; идентификации и установления идентичности трактов распространения сигналов; локализации источников шумов и вибраций; выявления скрытых периодичностей и шероховатостей; решения диагностических задач; определения временных задержек и построения на этой основе корреляционно-экстремальных систем, измерителей скоростей бесконтактными методами; оценки качества звуковых полей в закрытых помещениях; выделения слабого сигнала на фоне помех; выявления роли и значимости отдельных источников звука или вибраций, их скоростей и видов и т.п. Все это требует тщательного выбора как измеряемых характеристик, так и требований к качеству результатов измерений и условиям их получения.
4. Проблемные вопросы
4.1. Стационарность и эргодичность
Для конкретизации рассмотрим только измерение собственных и взаимных характеристик д(Х) случайных сигналов 4(0 временного аргумента / или оценивания их аналогов - характеристик 2(Х), X = (Х1,..., Хк), случайных процессов
Х(г) = (Х1(г),..., Хп (г)) (или временных рядов, если г - дискретно), с помощью которых описывается 4(г). Первая проблема, которую мы рассмотрим, учет (или неучет) класса Х(г), т.е. модельное отнесение его к стационарным или нестационарным, эргодическим или неэргодическим (в смысле сходимости траекторных характеристик к совокупным или ансамблевым по вероятности, почти наверное или в среднем квадратическом) по отношению к характеристике Q(X).
Посмотрим, что при этом может получиться, если мы будем непараметрически оценивать Q(X) (или измерять д(Х)), не учитывая класс Х(г). Предположим, что для этого используется траекторная оценка по реализации х(г) (по §(г)) при г е [0,т ].
Допустим, необходимо описать физический объект, работающий в течение интервала времени Г = [г1, г2 ], г2 - г1 = Т < ж, на основе модели стационарного случайного процесса X(г). Возможны два принципиально отличных подхода к такому описанию. Первый связан с использованием стационарной модели X (г) = Хж (г), для которой по определению г е (-ж, ж). Следовательно, данный подход основан на предпосылке, что если бы объект существовал при всех г еГ = (-ж, ж), то он сохранил бы свойство стационарности и, следовательно, мы вправе выбрать такое большое Т ^ж, при котором краевые эффекты не сказываются, т.е. перейти к пределам г1 ^ -ж, г2 ^ж. Хотя об этом явно нигде не говорится, фактически почти во всех исследованиях по статистическим измерениям, а в большинстве случаев и в исследованиях по оцениванию, по статистике случайных процессов постулируется именно этот подход.
Второй подход основан на использовании финитных моделей хг (г), Г = [г^г2 ], | г1 |, | г2 | <ж . В дальнейшем в подобных ситуациях для определенности зачастую будем полагать Г = [0, Т], где г - непрерывный (для процессов) или дискретный (для последовательностей) аргумент. Использование подобного описания не столь очевидно как предыдущего и может осуществляться в следующих вариантах.
Вариант 1. Использование «стационарных» финитных моделей хГ (г), заданных на конечных интервалах, когда значение г гГ не имеет смысла. Стационарность в этом случае понимается как независимость рассматриваемых ансамблевых характеристик Q(X, г, т) от г для всех г, г + т1, г + т2,..., г + тп-1 еГ;
т = (т1,..., тп-1). Трудность такого описания связана со сложностью учета краевых эффектов ансамблевых характеристик при г + т<г1 и г + т> г2.
Вариант 2. Учет нестационарности модели путем замены хГ (г) на нестационарный процесс.
Хн(г) = {ХГ<г) Тг еГ
(0 при г г Г.
Понятно, что ансамблевые характеристики такого процесса подчиняются условиям Q(X, г; т) = а, где а - константа, если хотя бы одно из значений
г, г + т1, г + т2,..., г + тп-1 не принадлежит Г.
Вариант 3. Замена процесса Xг (г) на стационарный X[T ](г), полученный периодизацией XГ (г).
Х[Т](г) = X[г(modТ)] = ХГ(г±кТ), к = 0,1,2,..., где г(modТ) - остаток от деления г на Т.
Ансамблевые характеристики такого процесса будут периодическими по г1, тг-, I = 1, (п -1), с периодом Т, т.е. для них выполняется соотношение
Q(X, г, т) = Q(X, г ± кТ; т ± пТ), к, п = 0,1,2,... . (2)
Вариант 4. Замена процесса ХГ (г) на «эквивалентный» ему стационарный
процесс ХЭ (г), ансамблевые характеристики которого QXэ (X, т) получаются ус-
реднением по траектории (по г) ансамблевых характеристик QXг (X, г, т) на (0,Т):
<2э (Х Т) = Мг {^^ХГ ^ г, т)} =0 хГ (X, т), (3)
где цТ {•} - оператор усреднения по траектории на отрезке [0,Т].
Из изложенного ясно, что при описании реальных объектов вероятностными моделями в статистических измерениях, имитации и т. п. необходимо учитывать способы задания вероятностных моделей, вид исследуемых характеристик (ансамблевые, траекторные или совокупные) и используемый подход к описанию объекта моделью. В частности, в большинстве практических измерений, использующих усреднение по траектории, в явной или неявной форме присутствует замена измеряемых характеристик д на дЭ , согласно (3). Это является результатом
того, что математическая стационарность, строго говоря, не может иметь место в реальных физических системах. Следовательно, какой бы из описанных выше вариантов ни взять, мы обязательно используем его вместе с вариантом 4.
4.2. Существование характеристик
Вторая проблема при непараметрическом измерении д(Х) (оценивании Q(X)) связана с априори принимаемой (сознательно или неосознанно) гипотезой
0 том, что такая характеристика существует.
Это означает, что то математическое выражение, которое лежит в основе дефиниции Q(X), существует (имеет математический смысл) и дает конечный результат в тех условиях, в которых происходит описание 4 (г) моделью Х(г). Например, для числовых моментных характеристик это имеет место, только если для распределений Х(г) разрешима проблема моментов соответствующего порядка. Так, для Х(г) с распределением Коши (например, когда X (г) = У (г)/1 (г), где У (г), 1 (г) - центрированные нормальные (гауссовы) процессы1), разбросы значений непараметрических оценок среднего или среднеквадратического отклонения X(г) не будут сужаться при неограниченном увеличении объема выборки в силу отсутствия математического ожидания и дисперсии Х(г). Тем более не будут иметь смысла при этом оценки корреляционных функций и спектральных
1 Дг) характеризует, например, относительный разброс случайной части У(г) случайного целого 1(г).
плотностей мощности X(г) (в отличие от конкорреляционных [3, с. 91-100]). Следовательно их интерпретация и применение не будут иметь смысла.
4.3. Неучет допустимых и целесообразных областей применимости характеристик
Третья проблема связана с тем, что, если даже измеряемая (оцениваемая) характеристика существует, ее пригодность для достижения поставленной цели, решения поставленной задачи может не всегда иметь место без дополнительных априорных или апостериорных сведений о моделях законов распределения X (Ґ), а интерпретация полученных выводов может дать ложное представление о реальности. Примеры подобных ситуаций представлены на рис. 1, 2.
,(х )
т
Рис. 1. Примеры диаграмм рассеяния, функций регрессии и прямых средней квадратической регрессии
Г у [ А І М 1 і 1 1 і V1 к і
V Жх (х) / Л У і і і ! V,! V 1 ! Жх(х) > Ух і К! і ! жх(х) і і г У х 1 V,
} х с і *! л 1 х і
Параметры Рисунок
а б в г д е ж з и к л м
Рху 0 0,7 -0,6 1 -1 ? 0 0 ? 0 0,7 0,3
Л у/х 0 0,7 0,6 1 1 1 0,5 0 ? 1 1 1
Лх/у 0 0,7 0,6 1 1 1 0 0,7 1 0 1 0,6
Ъсу 0 0,7 -0,6 1 -1 -1 0 0 ? 0 1 0,8
Рис. 2. Примеры статистических (а,б,в,ж,з) и функциональных (г,д,е,иклм) зависимостей и соответствующих им значений характеристик связи случайных величин X и Г: рху - коэффициент корреляции; пу/х, Пх/у - корреляционные отношения; уху -коэффициент конкорреляции; ? - означает, что значение зависит от закона распределения Жх(х)
Так, из рис. 1, а-в видно, что имея только непараметрические оценки функций регрессии тГ (х) и тх (у) и коэффициентов корреляции рхГ , исследователь может сделать вывод об отсутствии связи между случайными величинами X, Г, в то время как между величинами X и Г рис. 1, в существует функциональная связь.
Располагая только непараметрическим значениями оценок рхГ для ситуации рис. 1, д, е, ж, исследователь может заключить, что модельные ситуации рис. 1, д, е, ж аналогичны друг другу, хотя реальности различны. Ошибочность интерпретаций по значению непараметрических оценок рхГ о реальных ситуациях читатель может сам представить, анализируя рис. 2. Рис. 1, 2 лишний раз подтверждают, что непараметрический корреляционный анализ может быть применен только, если гипотеза о линейной регрессионной зависимости между Х и Г соответствует действительности (и то не всегда, см. рис. 1). В противном случае их применение может привести не только к некорректным, но и ошибочным выводам.
Поскольку нормированные корреляционные функции есть коэффициенты корреляции отсчетов X(ґ), X(ґ + т) или Хі (ґ), Хі (ґ + т), і,} = 1, п , а спектральные плотности мощности получаются линейными преобразованиями Фурье от корреляционных функций, все изложенное относительно интерпретации и применения их непараметрических оценок остается в силе. Для подтверждения корректности интерпретаций и приложений необходимы дополнительные сведения о модели X(ґ), полученные, например, нахождением и сопоставлением значений результатов непараметрических измерений (оцениваний) других характеристик (см. рис. 1,
2 и текст далее).
4.4. Неучет условий получения результатов первичных измерений
Наконец, очень важной проблемой являются последствия неучета условий получения результатов первичных измерений мгновенных значений сигналов, сбора, съема данных. Ведь результаты «тупого» непараметрического анализа не обязаны учитывать, с какой достоверностью получены исходные данные, их однородность, полноту, наличие выбросов, влияние мешающих факторов и т.п., а также их стабильность. А такой неучет может привести к очевидным ошибкам при интерпретации и применении результатов непараметрических измерений. Это особенно важно именно при измерениях, поскольку в теории оценивания условия получения выборочных данных обычно постулируются и считаются выполненными.
5. Прикладные примеры
Для иллюстрации изложенного рассмотрим несколько примеров.
Пример 1. Изучение связи между отсчетами X(ґ) и X(ґ + т).
Изучение связи означает решение одной или нескольких из следующих задач: установление наличия или отсутствия связи; выявление характера связи (функциональная или статистическая) и ее вида (линейная или нелинейная, однозначная или неоднозначная), средних направлений связи, силы (тесноты) и степени нелинейности связи.
Рассмотрена пригодность решения прикладных задач на базе разных характеристик (традиционных корреляционных К. Пирсона, полярных, релейных, кон-
корреляционных, полуконкоррреляционных, дисперсионных, корреляционных отношений, а также вектор-характеристик).
Пример 2. Определение временной задержки между X (ґ) и Г (ґ).
Рассмотрены корреляционные методы определения задержки между двумя сигналами |(ґ) и <^(ґ) (или стационарными эргодическими в среднем квадратическом по отношению к рассматриваемым характеристикам корреляционного типа случайным процессам X(ґ) и Г(ґ)), основанные на измерениях аргумента тт максимума взаимной корреляционной функции г^ (т) (оценивании (т)).
Исследуется предпочтительность по степени выраженности экстремума взаимной корреляционной функции и уровню статистических погрешностей разных характеристик связи, указанных в примере 1. Показана зависимость решения о предпочтительности той или иной характеристики от моделей X(ґ), Г(ґ) и условий измерения (оценивания) ее.
Пример 3. Выделение скрытых периодичностей.
Рассматривается решение задачи обнаружения и идентификации периодичностей в аддитивной смеси периодического сигнала и белого шума с помощью корреляционного и спектрального методов. Задача решается аналогично задаче 2. Показывается важность априорных модельных представлений сигналов, в частности выбора измеряемых характеристик, в данной задаче. В частности, рассматривается определение интервала периодичности на основе применения различных видов корреляционных характеристик, «решетчатых» составляющих (или их «взвешенных» аналогов) в спектре при использовании периодограммных традиционных, полярных и конкорреляционных спектральных методов.
6. Рекомендации
Учитывая изложенное, можно предложить следующие рекомендации для организаций непараметрических измерений.
Прежде всего, следует четко представлять себе назначение измерений, цель, для достижения которой нужны результаты. Исходя из этого, сформулировать четкую постановку задачи, включая требования к качеству результатов измерений.
Желательно по-возможности получить как можно более полную априорную модельную информацию о сигнале |(ґ) и условиях измерения (алгоритмы, средства, планы, технологии, сопутствующие факторы и т.п.).
Выбрать наиболее адекватную априорным сведениям и поставленной задаче характеристику для измерения. Например, вместо среднего измерять медиану, вместо стандартного отклонения - интерквантильную широту, вместо корреляционно-спектральных характеристик конкорреляционные [3, с. 91-100] и т.д. Если позволяет постановка задачи, следует предпочесть характеристику, робастную на как можно большем множестве условий измерения, позволяющую точнее решить поставленную задачу (с точки зрения погрешностей при той же выборке, четкости проявления экстремумов и других качеств, свойств характеристик, например, полярная корреляционная функция гауссовского процесса или КФ процесса X3(ґ) быстрее уменьшаются с увеличением лага задержки, чем традиционная).
Перед окончательной интерпретацией и применением результатов измерений следует проверить корректность выбора характеристик, сравнивая выводы, полученные с использованием измеренной характеристики, с выводами, полученными
по другим характеристикам сходного назначения (см. рис. 2), с учетом и без учета мешающих факторов, возможных отклонений условий измерения от приписываемых им и т.п. Либо использовать вектор-модели, вектор-характеристики [3, с. 105-110].
Заключение
В работе рассмотрены проблемы, к которым может привести интерпретация и применение результатов непараметрических измерений, если совсем не учитывать модельные представления об исследуемом сигнале и условиях измерения.
Даны стартовые рекомендации по снижению рисков получения далеких от реальности интерпретаций результатов непараметрических измерений. Приведены примеры, поясняющие излагаемые положения.
Считаю необходимым дальнейшие исследования в этом направлении, в частности, получение теоретических и практических примеров ошибочных выводов по итогам непараметрических измерений и путей предупреждения, непопадания в такие ситуации и выходов из них, в том числе с получением дополнительных знаний о сигналах, основанных на корректном применении результатов непараметрических измерений разных характеристик.
ЛИТЕРАТУРА
1. Вероятность и математическая статистика: Энциклопедия / гл. ред. Ю.В. Прохоров. М.: Большая Российская энциклопедия, 1999. 910 с.
2. Уилкс С. Математическая статистика. М.: Наука, 1967. 632 с.
3. Губарев В.В. Алгоритмы спектрального анализа случайных сигналов: монография. Новосибирск: НГТУ, 2005. 660 с.
4. Кендалл М. Статистические выводы и связи / М. Кенделл, А. Стьюарт. М.: Наука, 1973. 900 с.
5. ГубаревВ.В. Информатика: прошлое, настоящее, будущее. М.: Техносфера, 2011. 432 с.
Губарев Василий Васильевич
Новосибирский государственный технический университет (г. Новосибирск)
E-mail: [email protected]
Gubarev Vasily V. (Novosibirsk State Technical University). Nonparametric measurement of random signals characteristics and problems of theirs results interpretation and application.
Keywods: random signals and processes, characteristics, measurement, estimation.
The concept of nonparametric measurement is introduced. Their similarity and difference from nonparametric estimation, purposes and tasks is considered. The problems connected with measurement of random signals characteristics, disregarding kind of theirs random processes model representations are discussed: the properties of stationary and ergodicity, existence of the model characteristics, similar measured, neglecting of admissible and expedient areas of characteristics applicability and also finding conditions of getting of instant values measurements. The explanatory examples and the methodical recommendations for the organization of nonparametric measurements are given.