УДК 519.22, 53.088
0. В. Шестаков1
СХОДИМОСТЬ ПОЧТИ ВСЮДУ ОЦЕНКИ РИСКА ПОРОГОВОЙ ОБРАБОТКИ ВЕЙВЛЕТ-КОЭФФИЦИЕНТОВ В МОДЕЛИ С КОРРЕЛИРОВАННЫМ ШУМОМ*
В работе рассмотрена задача оценивания функции в модели с коррелированным шумом с помощью процедуры пороговой обработки коэффициентов ее вейвлет-разложения и доказана сильная состоятельность оценки риска такого метода.
Ключевые слова: вейвлеты, оценка риска, сходимость почти всюду, пороговая обработка.
1. Введение. Алгоритмы пороговой обработки коэффициентов вейвлет-разложения функции, описывающей сигнал или изображение, стали популярным средством для подавления шума. Эти алгоритмы удаляют "шумовые" коэффициенты вейвлет-разложения функции, не превышающие заданного порога. Величина порога определяется исходя из параметров шума и предполагаемых характеристик полезного сигнала. Анализ погрешностей (риска) таких методов представляет собой важную практическую задачу, поскольку позволяет оценить качество как самих методов, так и используемого оборудования. В работе [1] показано, что при определенных условиях несмещенная оценка среднеквадратичного риска в модели с коррелированным шумом является состоятельной и асимптотически нормальной. В данной работе доказано, что даже при более слабых условиях эта оценка является сильно состоятельной.
Вейвлет-разложение функции / € Ь2(Ж) представляет собой ряд
где М) = 2*/2ф(2Ч-к), (1)
з,кег
а ф(1) — некоторая материнская вейвлет-функция (семейство {Фзк}^ке2 образует ортонормиро-ванный базис в Ь2(Ж)). Индекс ] в (1) называется масштабом, а к — сдвигом.
В дискретной постановке задачи функция задана в отсчетах на конечном отрезке. Дискретное вейвлет-преобразование представляет собой умножение вектора значений функции / на ортогональную матрицу Ш, определяемую вейвлет-функцией ф. При этом в силу ортогональности матрицы дискретные вейвлет-коэффициенты связаны с непрерывными следующим образом: ^к « 2"Г'/2{/, фзк), где 2,т — количество отсчетов функции / [2]. Далее предполагается, что используются вейвлеты Мейера [2], преобразование Фурье которых обладает необходимым количеством непрерывных производных.
2. Модель данных и оценка риска. В реальных наблюдениях всегда присутствует шум. Рассмотрим следующую модель данных:
Уг = /г + £г, ] = 1, . . . , 2 ,
где {бг, 1, £ Е} — стационарный гауссовский процесс с ковариационной последовательностью Гк = соу(вг, е%Будем полагать, что е$ имеют нулевое среднее и единичную дисперсию.
В данной работе предполагается модель долгосрочной зависимости ~ Ак~а, 0 < а < 1,
+ ОС
А > 0. Как показано в работе [3], случай краткосрочной зависимости, т.е. когда <
— сю
эквивалентен модели с независимым шумом, оценки риска которой изучены в работах [4-6].
1 Факультет ВМК МГУ, доц.; Институт проблем информатики ФИЦ ИУ РАН, ст. науч. сотр., д.ф.-м.н.; е-таП: oshestakovQcs.msu.su
* Работа выполнена при финансовой поддержке РНФ (проект 14-11-00364).
10 ВМУ, вычислительная математика и кибернетика, № 3
В работе [3] показано, что в модели с долгосрочной зависимостью после применения дискретного вейвлет-преобразования получается следующая модель зашумленных вейвлет-коэффициентов:
Xjk = Hk + 2(J^a)£jk, j = 0,...,J- 1, = 2'-1, (2)
j(l-g) Г
£jk =22 / ф^ ¿Вн,
где B#(i) — процесс дробного броуновского движения с H = 1 — а/2. Шумовые коэффициенты £jk имеют стандартное нормальное распределение, но не являются независимыми. Здесь произведена нормировка (зависящая от А и а), которая не ограничивает общности рассматриваемой модели.
Для подавления шума, как правило, используется мягкая пороговая обработка вейвлет-коэффициентов. Ее смысл заключается в удалении достаточно маленьких коэффициентов, которые считаются шумом. К каждому вейвлет-коэффициенту применяется функция рт(х) = sgn(a;) (|ж| — Т)+, т. е. при такой пороговой обработке коэффициенты, которые по модулю меньше порога Т, обнуляются, а абсолютные величины остальных коэффициентов уменьшаются на величину порога.
Среднеквадратичная погрешность (или риск) мягкой пороговой обработки определяется следующим образом:
J-1 2^ — 1 j=0 к=О
Однако вычислить явно Rj(f) нельзя, так как в выражении присутствуют неизвестные величины fijk, поэтому вместо теоретического риска используют его оценку
J-1 2^ — 1
'w) EE'i-^-7']- (з)
j=0 к=о
F[x,T] = (х ^ а2) 1(|ж| < Т2) + (а2 +Т2)1(|ж| > Т2).
Впервые такая оценка была предложена в работе [7], в которой было показано, что ЕF[X2k,T) = = Е(fijk — pT(Xjk))2, т.е. Rj(f) является несмещенной оценкой Rj(f).
В работах [8] и [9] было предложено использовать порог Tj = а-^2 ln2J, где а2 — дисперсия коэффициентов в модели (2) на масштабе j. Было показано, что при таком пороге риск близок к минимальному [8]. Этот порог получил название "универсальный". В дальнейшем будет использоваться именно такой вид порога.
3. Сходимость почти всюду оценки риска. В работе [1] показано, что (3) при определенных условиях гладкости на функцию / является асимптотически нормальной и состоятельной оценкой RJ(f). Оказывается, что эта оценка является также сильно состоятельной даже при более слабых ограничениях.
Приведем вспомогательное утверждение, доказательство которого можно найти в [10].
Лемма. Пусть {Х^, i £ Z} — последовательность случайных величин, таких, что ЖХ^ = О и \Хг\ ^.Ь п. в. для всех i £ Z, где Ь > 0 — некоторая константа. Тогда для любого q € [1,п/2] и любого £ > О
i= 1
> п£ ^ 4ехр
8Ь2
22 1
4Ь\1/2 — да е /
п 2д
(4)
где а(к) — коэффициент а-перемешивания последовательности {Х^, г € 2}. Докажем теперь сильную состоятельность оценки (3).
Теорема. Пусть / € £2(К) и задана на конечном отрезке, тогда имеет место сходимость
Rj(f)-RAf)
2а j
—> 0 я. е. при J ^ ОС
при любом А > 1/2 в случае а ^ 1/2 и любом А > 1 — а в случае а < 1/2.
Доказательство. Для Rj(f) - Rj(f) = Rt + R2, где
некоторого 0 < р < 1 запишем числитель в (5) в виде
М-12^-1 j=о к=о
J-1 2j-1
^ = Е Е №1*>т]
ÏF[Xjfc,T]) .
Рассмотрим сначала Для произвольного 5 > 0 имеем
PJ = Р
> 52
A J
J-1
« Е р
з=Ь>А
2J-1
Е
к=0
№.
2 Т1 jki * J
ÏF[Xffc,T])
> ÎJ_12
-loAJ
(6)
Нетрудно убедиться, что — ст| ^ /''[.V '/)] ^ <tj +7 j. В силу свойств вейвлетов Мейера [3] при каждом j слагаемые в сумме под вероятностью удовлетворяют свойству />перемешивания с коэффициентом р(к) ^ Ск~м, где С и М — положительные константы, и М можно сделать достаточно большим, выбрав соответствующий вейвлет Мейера.
Известно [11], что 4а(к) ^ р(к). Применяя неравенство (4) с q = (ß < 1) отдельно для каждого j в сумме (6) и выбирая М достаточно большим, получаем
PJ
< Cl J max (ехр \-c2 j-^-i+W+iß-*«)]] \ + L L JJ
(7)
где С1, сг — некоторые положительные константы, а о/ убывает по 3 быстрее, чем 2~МоР•7, где М0 — некоторое положительное число, зависящее от М.
Если а ^ 1/2, то ¡3 — 2а < 0, и при ] = 3 правая часть (7) не превосходит с\3ехр [^сг J~32(2A~2+'3}•7]. Поскольку /3 < 1 может быть выбрано произвольно, для того чтобы выполнялось неравенство 2А — 2 + /3 > 0, достаточно потребовать А > 1/2. Если а < 1/2, то можно выбрать /3 < 1 так, что /3 — 2а > 0, и правая часть (7) не превосходит ещ> [— Следовательно, чтобы выполнялось неравенство А — 1 + а > 0, достаточно потребовать А > 1 — а. При таком выборе А
сю
Е
.1=1
PJ < оо,
и в силу леммы Бореля-Кантелли, для любого 6 > 0 событие {|Дг| > 52х'1} осуществляется лишь конечное число раз. Следовательно, К22~х-7 -)0п.в.
Рассмотрим теперь выражение для 1?1. В нем число слагаемых не превосходит 2причем каждое слагаемое не превосходит по модулю
1-е)
где В > 0 — некоторая константа. Следовательно, п. в. При любом 0 < а < 1 и соответствующем А всегда выполнено
А — 1 + а > 0. Таким образом, можно выбрать 0 < р < тт(1, А — 1 + а), такое, что —> О
п. в. Следовательно, справедливо (5).
СПИСОК ЛИТЕРАТУРЫ
1. Ерошенко А. А., Шеетаков О. В. Асимптотические свойства оценки риска при пороговой обработке вейвлет-коэффициентов в модели с коррелированным шумом // Информатика и ее применения. 2014. 8. № 1. С. 36-44.
2. M allat S. A Wavelet Tour of Signal Processing. N.Y.: Academic Press, 1999.
3. Johnstone I.M. Wavelet shrinkage for correlated data and inverse problems: adaptivity results // Sta-tistica Sinica. 1999. 9. N 1. P. 51-83.
4. Маркин А. В. Предельное распределение оценки риска при пороговой обработке вейвлет-коэффици-ентов // Информатика и ее применения. 2009. 3. № 4. С. 57-63.
5. Маркин А. В., Шеетаков О. В. О состоятельности оценки риска при пороговой обработке вейвлет-коэффициентов // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 2010. № 1. С. 26-34. (Markin А. V., Shestakov O.V. Consistency of risk estimation with thresholding of wavelet coefficients // Moscow Univ. Comput. Math, and Cybern. 2010. 34. N 1. P. 22-30.)
11 ВМУ, вычислительная математика и кибернетика, № 3
6. Шее та ко в О. В. Асимптотическая нормальность оценки риска пороговой обработки вейвлет-коэффи-циентов при выборе адаптивного порога // Доклады АН. 2012. 445. № 5. С. 513-515. (Shest ako v О. V. Asymptotic normality of adaptive wavelet thresholding risk estimation // Doklady Mathematics. 2012. 86. N 1. P. 556-558.)
7. Donoho D., Johnstone I. M. Adapting to unknown smoothness via wavelet shrinkage//J. Amer. Stat. Assoc. 1995. 90. P. 1200-1224.
8. Donoho D., Johnstone I. M. Ideal spatial adaptation via wavelet shrinkage // Biometrika. 1994. 81. N 3. P. 425-455.
9. Donoho D., Johnstone I.M., Kerkyacharian G., Picard D. Wavelet shrinkage: asymptopia?// J. R. Statist. Soc. Ser. B. 1995. 57. N 2. P. 301-369.
10. Bosq D. Nonparametric Statistics for Stochastic Processes: Estimation and Prediction. N.Y.: SpringerVerlag, 1996.
11. Bradley R. C. Basic properties of strong mixing conditions. A survey and some open questions // Probab. Surveys. 2005. 2. P. 107-144.
Поступила в редакцию 27.11.15
ALMOST EVERYWHERE CONVERGENCE OF WAVELET THRESHOLDING RISK ESTIMATOR IN THE MODEL WITH CORRELATED NOISE
Shestakov O. V.
In this paper we consider the problem of estimating a function via thresholding its wavelet coefficients in the model of data with correlated noise and prove strong consistency of risk estimator with the adaptive threshold.
Keywords: wavelets, risk estimate, almost everywhere convergence, thresholding.