ISSN 0868-5886 НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2009, том 19, № 4, c. 103-108
= ОБРАБОТКА И АНАЛИЗ СИГНАЛОВ =
УДК 621.391.26
© В. В. Манойлов, И. В. Заруцкий
ВОЗМОЖНОСТИ АЛГОРИТМА СВЕРТОК С ПРОИЗВОДНЫМИ ДЛЯ ОЦЕНКИ ПАРАМЕТРОВ МАСС-СПЕКТРОВ, СОДЕРЖАЩИХ НАЛОЖИВШИЕСЯ ПИКИ
Рассматриваются результаты исследования возможностей алгоритма сверток исходного сигнала со второй и четвертой производными функций, описывающих форму спектральных линий. Приводятся погрешности оценок амплитуд, положений и ширин спектральных пиков после проведения процедуры разделения нало-жившихся пиков для сигналов с разными значениями дисперсии шума, разными значениями амплитуд в наложившихся пиках и разными расстояниями по шкале масс отдельных пиков в мультиплетах. Исследование проведено с помощью вычислительного эксперимента с использованием компьютерных моделей масс-спектрометрических сигналов, искаженных шумами для мультиплетов с различными амплитудами отдельных пиков и различными расстояниями между ними.
Кл. сл.: методы обработки сигналов, масс-спектрометрия, оценка параметров пиков в мультиплетах, анализ погрешностей алгоритмов обработки данных
ПОСТАНОВКА ЗАДАЧИ
Большинство масс-спектрометрических пиков можно описать гауссовой функцией. Как известно, пик гауссовой формы описывается формулой
S (t) = A • exp
( (t - tmax Г 2ц2
(1)
(
Y(t) = Х As • exp
(t -1 )
V max s /
2ц
2
S2(t) =
-1
V ^
f
exp
/
t
\
S4(t) =
(t4 6t2 _ ---+ 3
V ц ц
V 2ц у
Л f exp
j
2
v
2ц2
(3)
(4)
'o У
где А — амплитуда пика; /--полуширина пика; t — независимая переменная; — положение вершины на оси независимой переменной.
Как отмечалось в работах [1-4], масс-спектр можно рассматривать как сумму суперпозиции пиков гауссовой формы. Предположим, что независимая переменная t меняется непрерывно на вещественной оси (- да, да). Таким образом, полезная составляющая спектра равна
В формулах (3) и (4) через /и0 обозначена полуширина пика в функции, описывающей форму пика. Эти функции "подобны" пику в том смысле, что имеют экстремумы при t = 0.
Теперь рассмотрим свертки -S2(t) и S4(t) с отдельно взятым пиком:
У2Г) = - A j
-да да
У,(г) = - A j
( 12 ^
exp
2ц2
S2(t -t)dt,
exp
2
2ц2
S4(t -t)dt.
(5)
(6)
(2)
где 5 — номер пика в спектре; А5 — амплитуда 5-го пика спектра; / — полуширина 5-го пика; tmax 5 — положение вершины 5-го пика спектра.
Рассмотрим подробнее алгоритм оценки параметров масс-спектрометрических пиков, основанный на вычислении сверток с производными четных порядков гауссовых пиков. Выпишем формулы производных гауссианы второго и четвертого порядков:
В формулах (5) и (6) / — полуширина пика в исходном сигнале, А — амплитуда пика в исходном сигнале. Взяв интегралы, получим:
У2(т) = Ацл1'2 1 + (ц/ц )
32
X [(1 - г2/(ц2 + ц2)) • exp (-Т2/(ц2 + ц2))], (7)
У4 (г) = Ацл
2-|5/2
+ (ццо) J :
x (3 - 6г2/(ц2 + ц2)) +
2
х
+т
'/(я2 + Я02)2 • ехр(-т2/(я2 + Я)).
(8)
Из формул (7) и (8) следует:
• при т = 0 >2(т) и >ч(т) имеют абсолютный максимум;
• У2(0) / У4(0) = [1 + (я / Яо)2] / 3;
• если у обеих сверток в одной и той же точке имеются максимумы, то это значит, что на экспериментальной кривой в этом месте расположен пик, а в данной точке — его вершина.
Таким образом, производится обнаружение пика в спектре. Можно доказать, что система функций на основе производных четных порядков {5П(0} является ортогональной. В базисе этой системы может быть представлен сигнал исследуемого масс-спектра. Выполнение операций свертки при п = 2 и п = 4 дает возможность выделить пик в заданной точке оси масс, если он там существует. В дальнейшем по значению сверток в максимуме, используя формулы (7) и (8), можно вычислить полуширину я и амплитуду А обнаруженного пика.
Обозначим значение свертки У2(т) в максимуме как С2, а значение свертки У4(т) в максимуме как С4, тогда
Я - Я0 •
1
зс^ - ^2
V С4
(9)
/
с
А -
1 +
Я
з
2М
Я0
2пя
(10)
Для дискретных отсчетов (7) и (8) имеют вид:
+N
ш) = £ 82(^ )у & - и), (11)
I--N +N
ш) = £ S4(tí) ж - ^).
(12)
I=-N
Здесь оказалось возможным перейти от интегрирования по бесконечному интервалу к конечным суммам, т. к. гауссова функция и ее производные быстро убывающие — уже на расстоянии в несколько Я0 уменьшаются до машинного нуля (т. е. становятся по модулю меньше минимального положительного вещественного компьютерного числа).
/V
у» /V 1
Рис. 1. Сигнал с наложившимися гауссовыми пиками со степенью наложения 0.375 без добавления шума, отношение амплитуд 2 : 1. Сплошная линия — суммарный пик, штриховая линия и линия с точками — отдельные пики в дуплете
Рис. 2. Сигнал с наложившимися пиками, полученными из экспериментальных данных, со степенью наложения 0.395 без добавления шума, отношение амплитуд 4 : 1.
Сплошная линия — суммарный пик, штриховая линия и линия с точками — отдельные пики в дуплете
МОДЕЛИРОВАНИЕ СИГНАЛА,
СОДЕРЖАЩЕГО НАЛОЖИВШИЕСЯ ПИКИ, ДЛЯ ИССЛЕДОВАНИЯ И ОЦЕНКИ ПАРАМЕТРОВ АЛГОРИТМА СВЕРТОК С ПРОИЗВОДНЫМИ
Для исследования возможностей указанного выше метода оценки параметров сигналов, содержащих наложившиеся пики, использовались модели двух типов:
1) масс-спектр представляет собой совокупность пиков, форму которых можно описать гауссовыми функциями с различными амплитудами и ширинами;
2) описание формы пиков масс-спектра основано на реальных экспериментальных данных, полученных на масс-спектрометре с квадрупольным анализатором.
Модели каждого из двух типов имеют наложившиеся пики и аддитивный шум. Степень наложения определяется параметром N = / / L, где / — полуширина пика в соответствии с формулой (1), L — расстояние между центрами нало-жившихся пиков. Шум, добавляемый к моделям пиков двух типов, генерировался с помощью датчика случайных чисел, имеющих плотность рас-
пределения, соответствующую нормальному закону с задаваемой программно дисперсией и нулевым математическим ожиданием.
На рис. 1 представлена модель двух наложив-шихся пиков гауссовой формы со степенью наложения N = 0.375. Для данной модели L = 4, / = 1.5. Соотношение амплитуд 2 : 1 (амплитуда большого пика 1500, малого пика 750).
На рис. 2 представлена модель двух наложив-шихся пиков, форма которых соответствует экспериментальным данным, полученным на масс-спектрометре с квадрупольным анализатором. Наложившиеся пики получены путем сближения одиночных пиков реального масс-спектра.
На рис. 3 и 4 представлены те же модели сигналов соответственно, что и на рис. 1, 2, но нало-жившиеся пики сдвинуты относительно друг друга до степени наложения N = 1.
На рис. 5 и 6 представлены те же модели сигналов, что и на рис. 3, 4, но с добавлением шума. Отношение сигнал/шум (К) определяется как отношение амплитуды минимального пика к среднему квадратичному отклонению дисперсии шума. Для представленных моделей отношение сигнал/шум К = 10.
2500
Рис. 3. Сигнал с наложившимися гауссовыми пиками со степенью наложения 1 без добавления шума, отношение амплитуд 2 : 1.
Сплошная линия — суммарный пик, штриховая линия и линия с точками — отдельные пики в дуплете
гл
/
т 1 £ ч \ • \
у % \ V V
Рис. 4. Сигнал с наложившимися пиками, полученными из экспериментальных данных, со степенью наложения 1 без добавления шума, отношение амплитуд 4 : 1.
Сплошная линия — суммарный пик, штриховая линия и линия с точками — отдельные пики в дуплете
Рис. 5. Сигнал с наложившимися гауссовыми пиками со степенью наложения 1 с добавлением шума, отношение амплитуд 2 : 1. Отношение сигнал/шум R = 10
Рис. 6. Сигнал с наложившимися пиками, полученными из экспериментальных данных со степенью наложения 1 с добавлением шума, отношение амплитуд 4 : 1.
Отношение сигнал/шум R = 10
Табл. 1. СКО оценок параметров отдельных сигналов в дублетах (М = 0.85) с соотношением амплитуд 5 : 1 при различных отношениях сигнала к шуму
Сигнал/ шум СКО оценки, %
Амплитуда Ширина
гаусс квадр гаусс квадр
10 3 3 0.1 0.1
50 0.5 0.8 0.05 0.05
100 0.1 0.3 0.05 0.05
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ НА МОДЕЛЯХ СИГНАЛОВ АЛГОРИТМА СВЕРТОК С ПРОИЗВОДНЫМИ ДЛЯ ОЦЕНКИ ПАРАМЕТРОВ МАСС-СПЕКТРОВ, СОДЕРЖАЩИХ НАЛОЖИВШИЕСЯ ПИКИ
Для определения возможностей указанного алгоритма с помощью вычислительного эксперимента определялись средние квадратичные отклонения (СКО) оценок отдельных параметров сигналов в дублетах при различных реализациях налагаемого шума. СКО оценок параметров отдельных сигналов в дублетах с соотношением амплитуд (5 : 1) по результатам проверки алгоритма "свертка с производными ..." при различных отношениях сигнала к шуму и степени наложения N = 0.85 для пиков гауссовой формы (гаусс) и эксперимен-
тальных данных квадрупольного масс-спектрометра (квадр) представлены в табл. 1.
СКО оценок параметров дублетов для отдельных сигналов с соотношением амплитуд 5 : 1 по результатам проверки алгоритма "свертка с производными ..." при различной степени наложения N и отношении сигнал/шум 50 для пиков гауссовой формы (гаусс) и экспериментальных данных квадрупольного масс-спектрометра (квадр) представлены в табл. 2.
Погрешность положения центра пика для всех случаев не превышала шага дискретизации по оси масс.
СКО оценок параметров дублетов для отдельных сигналов с различным соотношением амплитуд по результатам проверки алгоритма "свертка с производными..." при степени наложения N = 0.85
Табл. 2. СКО оценок параметров отдельных сигналов в дублетах с соотношением амплитуд 5 : 1 при различной степени наложения (Я = 50)
Степень наложения N СКО оценки, %
Амплитуда Ширина
гаусс квадр гаусс квадр
0.75 0.5 0.6 0.05 0.05
0.85 0.5 0.8 0.05 0.05
1.00 1.0 1.0 0.1 0.1
Табл. 3. СКО оценок параметров отдельных сигналов в дублетах (Ы = 0.85) с различным соотношением амплитуд при R = 50
Отношение амплитуд СКО оценки, %
Амплитуда Ширина
гаусс квадр гаусс квадр
5 : 1 0.5 1.5 0.05 0.05
10 : 1 0.5 1.7 0.05 0.05
20 : 1 1.6 1.9 0.1 0.1
пики, дают информацию о пригодности такого алгоритма для использования в практической работе при обработке данных со степенью наложения пиков в мультиплетах, не превышающей единицы, и с соотношением амплитуд, не превышающим двадцати. Достоинством алгоритма является низкая погрешность определения положения центров пиков при различных отношениях амплитуд одиночных пиков в мультиплетах.
СПИСОК ЛИТЕРАТУРЫ
1. Разников В.В., Разникова М.О. Информационно-аналитическая масс-спектрометрия. М.: Наука, 1991. 248 с.
2. Гуревич А.Л., Могильницкий А.М., Русинов Л.А. и др. Автоматизация обработки масс-спектро-метрической информации. М.: Энергия, 1978. 182 с.
3. Сирвидас С.И., Заруцкий И.В., Ларионов А.М., Манойлов В.В. Использование метода сверток с производными базовых функций для обна-
и отношении сигнал/шум Я = 60 для пиков гауссовой формы (гаусс) и экспериментальных данных квадрупольного масс-спектрометра (квадр) представлены в табл. 3. При получении данных в табл. 3 по программе, реализующей рассматриваемый алгоритм, после обнаружения в мульти-плете пика с максимальной амплитудой из исходных данных вычитался пик с амплитудой, вычисленной по формуле (10), и формой, соответствующей экспериментальным данным одиночного пика квадрупольного масс-спектрометра (квадр). При увеличении отношения амплитуд до 40 : 1 положения центров пиков оставались практически неизменными, а СКО оценки амплитуды малого пика составляло от 2.5 до 16 % в зависимости от реализации шумового сигнала.
ЗАКЛЮЧЕНИЕ
Рассмотренные возможности алгоритма на основе сверток с производными для оценки параметров масс-спектров, содержащих наложившиеся
ружения и разделения пиков в экспериментальных данных // Dspa'99. Доклады. Т. 1. С.105.
4. Сирвидас С.И., Заруцкий И.В., Ларионов А.М., Манойлов В.В. Обнаружение, разделение и оценка параметров масс-спектрометрических пиков методом свертки экспериментальных данных с производными гауссовых функций // Научное приборостроение. 1999. Т. 9, № 4. С. 84.
Институт аналитического приборостроения РАН, Санкт-Петербург
Материал поступил в редакцию 3.06.2009.
CAPABILITY OF THE ALGORITHM ON THE BASE CONVOLUTION PROCESSING SIGNALS WITH DERIVATIONS OF PEAK SIGNALS FORM FOR THE ESTIMATION OF MASS-SPECTRA PEAK PARAMETERS IN MULTIPLETS
V. V. Manoylov, I. V. Zarutsky
Institute for Analytical Instrumentation RAS, Saint-Petersburg
The results of investigation of algorithm on the base of convolution processing signals with derivations of peak signals form for estimation parameters mass-spectra peak in multiplets are discussed. The investigation is realized with the help of computational experiment on the base models of mass-spectral peaks with different amplitudes and different distance between single peaks in multiplets.
Keywords: methods for signal processing, mass-spectrometry, peak parameter estimation in multiplets, analysis of algorithm processing data errors