Радиофизика
Вестник Нижегородского университета им. Н.И. /Лобачевского, 2007, № 2, с. 91-94
УДК 621.3
ВЫБОР ИНФОРМАЦИОННО-ОПТИМАЛЬНОГО ШАГА ДИСКРЕТИЗАЦИИ НЕПРЕРЫВНЫХ СИГНАЛОВ
© 2007 г. А.А. Логинов, ОА. Морозов, ЕА. Солдатов, В.Р. Фидельман, И.О. Бережной
Научно-исследовательский физико-технический институт Нижегородского госуниверситета им. Н.И. Лобачевского
Поступила в редакцию 9.02.2007
В рамках теоретико-информационного подхода предложен алгоритм выбора шага дискретизации, при котором максимально используется информация о непрерывном сигнале. Предложенный подход,
основанный на оптимизации имеющейся в наборе требований к виду спектра сигнала.
Введение
Основная роль теоремы отсчетов в теории информации заключается в возможности замены непрерывного сигнала дискретной последовательностью его отсчетов без искажения информации. Традиционная формулировка теоремы отсчетов относится к функциям с ограниченным спектром Фурье. Она устанавливает интерполяционную формулу, позволяющую восстановить непрерывную функцию по дискретным равноотстоящим отсчетам. В таком виде эта теорема известна как теорема Котельникова-Шеннона и широко используется в обработке сигналов [1-3].
Вместе с тем, существуют обобщения теоремы отсчетов [3], которые не только расширяют класс сигналов, подвергаемых дискретизации без потери информации, но и предлагают другое понимание этой теоремы. Для этих обобщений принципиально важным следует считать тот факт, что выражение «дискретизация без потери информации» приобретает размытое содержание, зависящее от математического аппарата, который используется для дискретизации и последующего восстановления сигнала. В практическом отношении наиболее существенным является смягчение ограничений, налагаемых на подлежащие дискретизации сигналы. При определении шага дискретизации необходимо отметить, что существуют различные способы дискретизации «без потери информации»: в существующих обобщениях теоремы отсчетов имеется в виду возможность восстановления непрерывного сигнала с финитным спектром на основе некоторой базисной системы функций.
Вместе с тем, в связи с существованием нескольких способов проведения дискретизации
отсчетов сигнала информации, не содержит явных
без потери информации представляется целесообразным поставить вопрос о выборе шага дискретизации в некотором оптимальном с теоретико-информационной точки зрения смысле.
Постановка задачи
В ряде практических задач цифровой обработки данных, таких как фильтрация, спектральное оценивание приходится проводить анализ сигналов в условиях недостаточной информации. Задача обычно имеет множество решений, одинаково хорошо согласующихся с имеющимися данными. Способ выбора решения, наиболее предпочтительного из всех допустимых, может быть основан на поиске максимума информационного функционала [4].
Дискретизация непрерывных процессов приводит к временным рядам, которые имеют различную энтропию. В общем случае будем требовать, чтобы в процессе информационнооптимальной дискретизации реализовывался временной ряд с максимальной энтропией. Такой подход не содержит каких-либо существенных ограничений на вид сигналов. Но для того, чтобы сделать информационно-оптимальный подход вычислительно реализуемым, необходимо задать конкретный класс сигналов. В данной работе мы ограничились классом гауссовских случайных процессов, для которых известен универсальный способ вычисления энтропии. В гауссовском приближении величина шенноновской энтропии [4, 5] временного ряда определяется величиной детерминанта автокорреляционной матрицы (АКМ) [4-6]. Эта энтропия совпадает с энтропией Берга для спектральной плотности мощности гауссовского случайного процесса [4, 7]. Отсюда следует, что информационный оптимум достигается при таком шаге дискретизации когда спектральная плот-
ность мощности имеет экстремум энтропии. Таким образом, мы приходим к правилу максимума детерминанта АКМ: информационнооптимальным является шаг дискретизации АКФ, при котором достигается максимум детерминанта АКМ.
Непрерывный случайный процесс х^) после дискретизации с некоторым шагом становится временным рядом x = (x1, X2xм ) с плотностью распределения вероятности p(x). Его энтропия [6], в общем случае, имеет следующий вид:
p( Хо, х2,... xN) =
1
.N+1 [2пdet R ]Т~
1
х ехр| - 2 хТR хх
p( Хо , Х2,■■■ХN ) = П
1
k =0
42я<7,
ехр
<-_А'
ч2°к у
где 7к - дисперсия реализации случайной величины хк. Энтропия этого распределения вычисляется по следующей формуле [6]:
H = — 1п
2
N 2 П 2пок
k=0
N 2 .
И = 1п[(2п) N+1
det Я
N + —. 2
Результаты и обсуждение
Для численного моделирования была использована модель АКФ, предложенная Писаренко [8, 9]. В соответствии с этой моделью любая дискретизованная АКФ может быть интерпретирована как АКФ суммы белого шума и суперпозиции Ь/ 2 косинусоид. Расчетная формула для моделирования АКФ Писаренко имеет следующий вид:
1 Ь/2
--------2 2 Аі С08(2п//^X
(1)
Для гауссовских марковских процессов порядка N распределение вероятностей для N +1 последовательных отсчетов вычисляется по формуле:
R[к ] = 5{к) +
22 °С + °ш 1=1
Ь = 2п, п<г2 1
22
°С +°ш
(Ь-1)/2 сonst + 2 А х
I=1
(6)
х—cos(2яflkt)
Ь = 2п +1,п<г2 .
(2) где °С - дисперсия суперпозиции синусоид,
где R - автокорреляционная (Ы +1) х (N +1) матрица. Это распределение приводится линейным ортогональным преобразованием к независимым переменным. В этом случае оно имеет следующий вид:
(3)
(4)
Основание логарифма в (4) определяет единицы измерения энтропии. Поскольку величины а2к представляют собой квадраты собственных чисел автокорреляционной матрицы, выражение (4) может быть записано в виде:
(5)
Таким образом, задача определения информационно-оптимального шага дискретизации, соответствующего максимуму энтропии временного ряда в гауссовском приближении, сводится к задаче оценки собственных чисел АКМ обрабатываемых сигналов.
7ш - дисперсия белого шума.
Для вычисления детерминанта АКМ был выбран алгоритм, основанный на сингулярном разложении. Алгоритм включает фильтрацию в пространстве сингулярных чисел с целью исключения из рассмотрения шумовой части сигнала [5], что представляется адекватным решаемой задаче оценки энтропии временного ряда. Величина детерминанта используется в выражении (5) для вычисления энтропии. Зависимость энтропии от частоты дискретизации для трех сигналов, представляющих собой суперпозицию синусоид, приведена на рис. 1.
Вычислительный эксперимент показывает, что зависимость детерминанта АКМ от шага дискретизации имеет единственный максимум в том случае, когда удвоенное число гармонических составляющих в модели АКФ совпадает с порядком АКМ. Если порядок АКМ превышает удвоенное число гармонических составляющих в модели АКФ, наблюдаются несколько максимумов сопоставимой высоты. Это обстоятельство объясняется ролью шумовой составляющей в модели Писаренко.
Для того, чтобы правило максимума детерминанта АКМ имело смысл, когда порядок матрицы больше количества гармонических составляющих, необходимо существование ненулевой дисперсии белого шума, поскольку при отсутствии шума детерминант тождественно равен нулю. Отсюда следует, что спектральные составляющие шума даже при его низкой энер-
о ад
х
I-
■; .11 I I. V.
Рис. 1 Зависимость детерминанта АКМ от частоты дискретизации в случае одной гармоники частоты 7 Гц (а), двух гармоник с частотами 2 и 7 Гц (б) и трех гармоник с частотами 2, 5 и 7 Гц (с)
Рис. 2. Зависимость качества прогноза сигнала от частоты дискретизации в случае произвольного (а) и информационно-оптимального шага дискретизации (б)
гии влияют на величину детерминанта АКМ не меньше, чем гармонические составляющие, заложенные в модели АКФ.
Практическое применение правила максимума детерминанта не должно предполагать, что сигнал сконструирован из гармоник и белого шума. Поэтому выбор порядка матрицы для обеспечения одноэкстремальности должен быть основан не на подсчете числа гармоник, а на каких-либо других соображениях. В работе предлагается воспользоваться тем, что удвоенному числу гармоник в модели Писаренко соответствует порядок авторегрессионной модели (АР) процесса [8, 9]. С учетом этого, сформулируем практическое правило для определения информационно-оптимального шага дискретизации на основе N отсчетов АКФ. Первый шаг заключается в определении порядка L АР модели исследуемого процесса известными методами, например, с использованием критерия Акаике [5]. На следующем шаге находим минимальное собственное число АКМ порядка L • L , и вычитаем его из диагональных элементов матрицы. Затем переходим к матрице
(L-1) • (L-1), и на ее основе определяем оптимальный шаг дискретизации, используя правило максимума детерминанта.
Для иллюстрации эффективности предложенного подхода к дискретизации сигналов произведено компьютерное моделирование решения задачи предсказания сигнала, состоящего из суперпозиции двух синусоид с частотами 2 и 7 Гц. Моделирование проводилось для двух частот дискретизации: информационно-опти-
мальной (рис. 2б) и превышающей ее в два раза (рис. 2а). Коэффициенты предсказания находились на основе решения системы уравнений Юла-Уокера [5] для АКМ, вычисленной согласно выражению (6). По заданному одинаковому числу отсчетов обрабатываемых сигналов (на рис. 2а, б черная линия) в течение фиксированного времени осуществлялось предсказание следующих отсчетов (на рис. 2а, б серая линия). Анализ зависимостей, приведенных на рис. 2, показывает, что в случае информационнооптимального шага дискретизации не происходит искажения (изменения масштаба и формы) предсказываемого сигнала в интервале предсказания.
Заключение
Таким образом, в работе предложен алгоритм определения информационно-оптимального шага дискретизации на основе вычисления детерминанта АКМ обрабатываемого сигнала. В ряде задач оценивания параметров сигналов, основанных на исследовании корреляционной функции (АР модель, метод Кейпона) [5], применение оптимального шага позволяет улучшить обусловленность матриц, что положительно сказывается на результатах дальнейшей обработки.
Для обобщенной теоремы отсчетов выбор шага дискретизации связан с выбором базисной системы функций, на основе которой производится восстановление непрерывного сигнала по его отсчетам. Предлагаемый в данной работе подход позволяет оценивать оптимальный шаг дискретизации без предварительного знания базисной системы функций. Решение вопроса выбора адекватного базиса для восстановления непрерывного сигнала по его отсчетам выходит за рамки данной статьи.
Список литературы
1. Шеннон К. Упрощенный вывод теории сглаживания и предсказания по методу наименьших квадратов. - М.: ИИЛ, 1963. - С. 687.
2. Голд Б., Рейдер Ч. Цифровая обработка сигналов. - М.: Сов. радио, 1973. - 368 с.
3. Джерри А.Д. // ТИИЭР. 1977. № 11. С. 53.
4. Джейнс Е.Т. // ТИИЭР. 1982. № 9. С. 33.
5. Марпл-мл. С.Л. Цифровой спектральный анализ и его приложения. - М.: Мир, 1990. - 551 с.
6. Орлов В.А., Филлипов Л.И. Теория информации в упражнениях и задачах. - М.: Высшая школа, 1976. - 136 с.
7. Burg J.P. Maximum entropy spectral analisis // Proc. 37th Meet. Soc. Exploration Geophysicists. Stanford Thesis, 1975. - 150 с.
8. Макс Ж. Методы и техника обработки сигналов при физических измерениях. - М.: Мир, 1983. - 256 с.
9. Pisarenko V.F. The retrieval of harmonies from a covariance function // Geophis. J. R. Ast. Soc., 1973. -347 с.
CHOOSING THE DATA-OPTIMAL SAMPLING RATE FOR CONTINUOUS SIGNALS
A.A. Loginov, O.A. Morozov, E.A. Soldatov, V.R Fidelman, E.O. Berezhnoy
Within the framework of the information-theory approach we propose an algorithm for choosing the sampling rate, in which information on the continuous sampled signal is used most efficiently. Our algorithm is based on the optimization of sample information and is apparently free of any requirements to the signal spectrum.