Научная статья на тему 'Обработка данных сенсорного массивав газоанализаторах типа «Электронный нос»'

Обработка данных сенсорного массивав газоанализаторах типа «Электронный нос» Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
218
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Скутин Е. Д., Земцов А. Е., Нелин А. Г., Леонов В. Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обработка данных сенсорного массивав газоанализаторах типа «Электронный нос»»

УДК 620.18: 537.311.33

Е.Д. Скутин, А.Е. Земцов, А.Г. Нелин, В.Е. Леонов Омский государственный технический университет, г. Омск

ОБРАБОТКА ДАННЫХ СЕНСОРНОГО МАССИВА В ГАЗОАНАЛИЗАТОРАХ ТИПА «ЭЛЕКТРОННЫЙ НОС»

Новым и перспективным направлением в аналитической химии является использование мультисенсорных газоанализаторов, получивших название «электронный нос» [1]. Основу таких устройств составляет массив сенсоров, каждый из которых характеризуется «перекрестной» чувствительностью к широкому набору или целому классу аналитов. Важнейшим преимуществом мультисенсорных систем является при этом то, что массивы из перекрестночувствительных сенсоров дают более низкие погрешности при определении нескольких ана-литов по сравнению с массивами, включающими только высокоселективные сенсоры.

Применение сенсорных массивов с перекрестной чувствительностью кроме компенсации недостаточной селективности сенсоров позволяет снизить предел обнаружения по сравнению с аналогичными сенсорами, используемыми отдельно. Выигрыш в селективности и в пределе обнаружения с помощью массива сенсоров даже при анализе относительно простых по составу смесей газов и паров может превышать порядок. В случае анализа смесей сложного состава эффект может оказаться еще более значительным. Использование хемометриче-ских методов для обработки откликов сенсоров позволяет до некоторой степени компенсировать недостаточную селективность сенсоров и проводить количественное определение концентрации компонентов в смесях газов и паров.

Способность систем типа «электронный нос» к распознаванию и идентификации многокомпонентных газовых смесей является весьма перспективной для аналитической практики. Результатом работы мультисенсорной системы при этом может быть интегральная оценка анализируемой смеси по ее химическому образу или «отпечатку пальцев». Этот вид анализа совершенно нетипичен не только для единичных газовых сенсоров, но и для других традиционных методов. Химический образ может совпадать или не совпадать для различных анализируемых смесей и на этом основании делается вывод об их идентичности или различии. Особенно необычно то, что электронный нос может различать смеси неизвестного состава без какой-либо предварительной информации о качественном или количественном составе образцов. Однако, для проведения классификации и идентификации с помощью электронного носа необходима предварительная калибровка сенсорного массива.

Имеется большое сходство сенсорного «электронного носа» с его биологическим прототипом. Однако высокая специфичность некоторых видов обонятельных рецепторов делает в настоящее время невозможным создание точной копии человеческого носа. Техническая реализация □ это всегда компромисс между высокой специфичностью и обратимостью сенсоров, поскольку высокая специфичность требует сильного и необратимого взаимодействия между целевым аналитом и сенсором.

414

В настоящее время для разработки сенсорных массивов доступен достаточно широкий ассортимент сенсоров с различными принципами преобразования. Но в конкретном приложении следует использовать не все доступные сенсоры, а необходим их отбор по наибольшей пригодности в достижения цели будущего приложения, с точки зрения максимальной эффективности сенсоров в обнаружении требуемых аналитов.

«Электронный нос» уже в настоящее время имеет многочисленные применения и оказывает помощь в решении многих проблем, связанных с обеспечением гарантий качества пищевых продуктов, при мониторинге объектов окружающей среды и контроле чистоты воздуха внутри помещений, в сферах безопасности и военного дела, здравоохранении и фармацевтике. Прогнозируемые на ближайшее будущее объемы применения устройств «электронный нос» в различных областях показаны на рис. 1.

Развлечения

3%

Бытовая техника

СО/

Добывающая

промышленность

6%

Машиностроение

7%

Наука

В%

Экология

16%

Контроль продуктов 10%

Сельское хозяйство 12%

Безопасность

15%

Рис.1. Сферы и прогно-зируемые объемы применения различных вариантов систем

«электронный нос»

Обработка данных. Важная составляющая «электронного носа» - адекватные методы обработки данных сенсорного массива. Для этого могут использоваться различные методы, в том числе методы распознавания образов и многомерной калибровки. Выбор конкретного метода обработки данных зависит как от особенностей решаемой аналитической задачи, так и от параметров чувствительности сенсоров, например, нелинейности отклика, степени кор-релированности отклика разных сенсоров массива и так далее. Задачи обработки данных можно свести к трем основным: распознавание и изучение структуры данных; классификация и идентификация; количественный анализ - определение концентраций веществ и других количественных параметров. Краткий обзор методов анализа данных имеется в работе Скотта и др. [2].

При распознавании и изучении структуры данных проводится оценка их воспроизводимости и детектирование выбросов показаний, визуальное изучение структуры данных, обнаружение в данных кластеров и так далее. Для этих целей используются методы неуправляемого обучения, такие как анализ по главным компонентам и некоторые типы искусственных нейронных сетей.

Задачи классификации и количественного анализа решаются, как правило, с помощью методов управляемого обучения. Для классификации могут применяться такие методы, как, например, линейный дискриминантный анализ, многомерные регрессии и искусственные нейронные сети. Если априорная информация об образцах отсутствует, то классификация также может проводиться с помощью методов неуправляемого обучения.

Для определения концентраций компонентов смеси находят градуировочные зависимости с помощью методов многомерной калибровки, наиболее распространенные из которых включают регрессию по главным компонентам и дробным наименьшим квадратам, а также искусственные нейронные сети.

В представленной работе среди рассмотренных выше методов обработки данных, при учете особенностей решаемых аналитических задач, предпочтение было отдано методу главных компонент (МГК, PCA □ principal component analysis). Этот метод дает возможность при обработке больших массивов данных осуществлять не только их визуализацию, но и сжатие. Сейчас МГК является не только наиболее популярным способом сжатия данных, но и дает основу для других аналогичных хемометрических методов, включая эволюционный факторный анализ, оконный факторный анализ, итерационный целевой факторный анализ, а также многих методов классификации.

Вычисление главных компонент сводится к сингулярному разложению матрицы данных или к вычислению собственных значений и собственных векторов ковариационной мат-

415

рицы исходных данных. С математической точки зрения метод главных компонент - это декомпозиция исходной 20-матрицы X, то есть представление ее в виде произведения двух 20-матриц T и P:

A

у

/ j a a

X = TP1 + E = t pl + E.

a=1

В этом уравнении T называется матрицей счетов, P - матрицей нагрузок, а E - матрицей остатков. Число столбцов ta в матрице T и pa в матрице P равно эффективному (химическому) рангу матрицы X. Эта величина A называется числом главных компонент.

Визуализация данных □ представление данных эксперимента или результатов теоретического исследования в наглядной форме. При визуализации множество данных ортогонально проецируется на плоскость первых двух главных компонент (или 3-мерное пространство первых трех главных компонент). Плоскость проецирования является, по сути плоским двумерным «экраном», обеспечивающим «картинку» данных с наименьшими искажениями. Такая проекция будет оптимальна (среди всех ортогональных проекций на разные двумерные экраны) в трех отношениях:

1. Минимальна сумма квадратов расстояний от точек данных до проекций на плоскость первых главных компонент, то есть экран расположен максимально близко по отношению к облаку точек.

2. Минимальна сумма искажений квадратов расстояний между всеми парами точек из облака данных после проецирования точек на плоскость.

3. Минимальна сумма искажений квадратов расстояний между всеми точками данных и их «центром тяжести».

В представленной работе метод главных компонент реализован в программе Matlab 6.5, Matlab-код которой представлен ниже:

function [T, P] = pcanipals(X, numberPC)

[X_r, X_c] = size(X); P=[]; T=[];

416

if lenfth(numberPC) > 0 pc = numberPC{1}; elseif (length(numberPC) == 0) & Xr < X c

pc = Xr; else

pc = Xc;

; k = I—1 p 0

P1 = rand(X c, 1) 1 T = X * P1 ; d0 = T1'*T1;

P1 = -X 1 T X/ (T1 ' * T1))'; P1 = P1/norm(P1); T1 = X * d 1 P * 1 T = 1 T

while d - d0 > 0. 0001 ;

P1 1 T = * X/ 1 T * T1)) ; P1 = P1/norm(P1); T1 = X 1 P * d О = T I—1 1 *T1;

P1 1 T = * X/ 1 T * T1)) ; P1 = P1/norm(P1); T1 = X 1 P * d = T1'*T1;

end

X = X - T1 * P1; P = cat(1, P, P1'); T = [T,T1];

end

Разработанная программа может быть использована для обработки данных сенсорного массива методом главных компонент при идентификации многокомпонентных газовых смесей и способна оказать ощутимую пользу для аналитической практики.

Библиографический список

1. Скутин, Е. Д. Мультисенсорные газоаналитические системы «электронный нос». Разработка, применение и перспективы / Е. Д. Скутин. - Омск : Изд-во ОмГТУ, 2009. - 224 с.

2. James, D. Chemical sensors for electronic nose systems / James, D.[et al.] // Microchim. Acta. - 2005. - V. 149. - P. 1-17.

i Надоели баннеры? Вы всегда можете отключить рекламу.