Научная статья на тему 'Возможности классификации спектров лазерно-индуцированной флуоресценции бактерий в воде на длине волны 290 нм с использованием нейронных сетей'

Возможности классификации спектров лазерно-индуцированной флуоресценции бактерий в воде на длине волны 290 нм с использованием нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
139
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛАЗЕРНО-ИНДУЦИРОВАННАЯ ФЛУОРЕСЦЕНЦИЯ / БАКТЕРИИ / ЛИДАР / НЕЙРОННЫЕ СЕТИ / КЛАССИФИКАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Артемьев Александр Владимирович, Суханов Александр Яковлевич

В статье проведён анализ для выбора оптимальной нейронной сети, позволяющей решать задачу классификации бактерий по спектрам флуоресценции, рассмотрен метод полуколичественной оценки вклада бактерий в спектр флуоресценции.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Артемьев Александр Владимирович, Суханов Александр Яковлевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Возможности классификации спектров лазерно-индуцированной флуоресценции бактерий в воде на длине волны 290 нм с использованием нейронных сетей»

Стандартизация всегда стояла на страже здоровья и безопасности труда людей. Достаточно большая часть стандартов устанавливали уровень необходимого освещения, излучения, запыленности, шума, силы тока и т.д.

В последнее время значение стандартов охраны здоровья и безопасности труда в практике работы отечественных предприятий усиливается. Наряду с требованиями получения международного сертификата системы качества ИСО 9000, многие иностранные партнеры казахстанских предприятий требуют и наличия международного сертификата системы охраны здоровья и безопасности труда, отвечающего требованиям международного стандарта OHSAS 18001: 2007 (Occupational health and safety management systems).

Данный стандарт способствует созданию в организации системы работы, максимально уменьшающей возможность появления нештатных ситуаций, которые могли бы повлечь за собой угрозу здоровью персонала, получению травм и увечий, поломке оборудования и т.д. [2].

Сейчас крупные торговые компании при закупке у производителя продуктов питания требуют обязательного соответствия этим стандартам. И, если предприятие надеется привлечь солидных, иностранных партнеров или инвесторов, внедрение европейских стандартов безопасности производства становятся вопросом первостепенной важности.

Умелая реализация принципов и механизмов стандартизации, метрологии, сертификации и менеджмента качества способствует ускорению процесса эффективного реформирования отечественной экономики и интеграции республики в мировую экономику.

Список литературы

1. Аскаров Е.С. Стандартизация, метрология и сертификация: учебное пособие. 3-е издание. Алматы: Юрист, 2007. 292 с.

2. Основы стандартизации, метрологии, сертификации и менеджмента качества: учебное пособие / под ред. Л.П. Ильиной. Алматы: Казахстанская ассоциация маркетинга, 2003. 564 с.

ВОЗМОЖНОСТИ КЛАССИФИКАЦИИ СПЕКТРОВ

ЛАЗЕРНО-ИНДУЦИРОВАННОЙ ФЛУОРЕСЦЕНЦИИ

БАКТЕРИЙ В ВОДЕ НА ДЛИНЕ ВОЛНЫ 290 НМ

С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

1 2 Артемьев А.В. , Суханов А.Я.

1Артемьев Александр Владимирович - магистрант; 2Суханов Александр Яковлевич - кандидат технических наук, доцент, кафедра автоматизированных систем управления, факультет систем управления, Томский государственный университет систем управления и радиоэлектроники Институт оптики атмосферы им. В.Е. Зуева Сибирское отделение Российской академии наук, г. Томск

Аннотация: в статье проведён анализ для выбора оптимальной нейронной сети, позволяющей решать задачу классификации бактерий по спектрам флуоресценции, рассмотрен метод полуколичественной оценки вклада бактерий в спектр флуоресценции.

Ключевые слова: лазерно-индуцированная флуоресценция, бактерии, лидар, нейронные сети, классификация.

Повышение качества жизни людей требует анализа качества воздуха, воды на наличие бактерий, вирусов и различных патогенных веществ. Современные оптические методы на основе лазерно-индуцированной флуоресценции открывают широкие возможности по идентификации и количественной оценке тех или иных видов патогенных веществ, многие из которых относят к условно патогенным и составляют нормальную флору организма, но в больших количествах могут вызывать те или иные заболевания при снижении иммунитета. Метод лазерно-индуцированной флуоресценции основан на освещении среды лазером на определенной длине волны, в результате возникает флуоресцирующее свечение в процессе длящихся переходов молекул вещества из одного квантового состояния в другое с излучением квантов света, в результате на приемном устройстве возможно регистрировать определенный спектр, который может быть уникален для обнаруживаемого вещества. В данном случае длина волны индуцирующего излучения равна 290 нм.

В медицинской и биологической практике довольно часто применяются способы обнаружения бактерий и вирусов основанные на методе ПЦР (полимеразная цепная реакция), который позволяет в основном определить наличие возбудителя того или иного заболевания, но для условно-патогенных бактерий может быть важной количественная оценка присутствия в исследуемом материале, воздухе или воде или в биологических жидкостях человека. Таким образом, развитие методики ЛИФ является важной задачей, в том числе методик классификации веществ по полученным спектрам флуоресценции. Современные направления ЛИФ для обнаружения бактерий включают, создание флуоресцентных лидаров обнаружения бактерий и органических аэрозолей воздухе и воде [1-4], в биологическом материале, проводятся исследования направленные на получение сечений флуоресценции различных органических веществ [4-7]. В работе [4] за 2015 год приводится обзор методов LIF разработанных за последние два десятка лет для обнаружения биологических агентов и углеводородов, приводятся сечения поглощения и спектры флуоресценции некоторых биологических агентов для различных длин волн возбуждения.

В наших исследованиях и работах [8-12] посвященных анализу возможностей применения лазерно-индуцированной флуоресценции для зондирования органических аэрозолей в качестве метода идентификации используется метод нейронных сетей. Данная работа посвящена применяемому нами методу предобучения нейронной сети и сравнительной оценке алгоритмов обучения нейронных сетей вида многослойный персептрон и выработке рекомендаций по структуре сети и алгоритму ее обучения, применяемых в задаче классификации условно-патогенных органических аэрозолей и агентов в водной среде.

Спектры лазерно-индуцированной флуоресценции бактерий в воде взяты из работы [5]. В работе [12] уже были приведены возможности классификации бактерий с использованием нейронных сетей и алгоритма предобучения нейронной сети на основе псевдообратных матриц. Приводилась задача обнаружения самого сильного по вкладу в общий спектр флуоресценции патогенного органического вещества в условиях высокого зашумления спектра. В данной работе приводится возможность определения уровня вклада какой-либо бактерии в общий спектр, выделено пять градаций вклада. Также решается задача по определению наличия какой-либо бактерии.

Показано, что применение комбинированного алгоритма обучения на основе предобучения нейронной сети методом псевдообратных матриц и дообучения обратным распространением ошибки (ОРО) [13] дает лучшие результаты по точности, чем применение одного алгоритма на основе псевдообратных матриц. Данный метод также дает лучшие результаты по сравнению с методом обратного распространения ошибки по скорости обучения и необходимости подбора темпа обучения, а в

некоторых случаях и по точности. Устраняются проблемы связанные с параличом сети и убывающим градиентом [14]. Тем не менее, следует отметить, что для данной задачи при подборе соответствующего темпа обучения в алгоритме ОРО и количестве эпох обучения превосходящем в несколько раз количество эпох используемых в комбинированном алгоритме достигается тот же результат (но это соответственно требует больших в несколько раз временных затрат и подбора темпа обучения). При этом отдельно алгоритм ОРО не всегда приводит к оптимальному результату.

Нейронная сеть, как известно, представляет собой совокупность соединенных между собой нейронов, каждый из которых математически реализует взвешенное суммирование входов нейрона и применение к сумме функции активации, обычно представляющей собой сигмовидную функцию. В общем случае нейронная сеть позволяет аппроксимировать многомерную функцию, представляя собой параметрический алгоритм решения какой-либо задачи. Но предварительно нейронную сеть обучают, что требует по времени и сложности больших затрат, чем занимает работа уже обученной сети, стандартным алгоритмом для обучения многослойной нейронной сети является метод стохастического градиента (примеры обучения подаются в случайном порядке, обычно по одному), определение градиента осуществляется методом обратного распространения ошибки. Таким образом, необходимо создать обучающую выборку, представляющую собой набор примеров, где какому-то входному вектору соответствует выходной.

В нашем случае будем ставить в соответствие входному спектру, вектор, содержащий значения относительного вклада каждого из спектров отдельных бактерий, таким образом, сумма элементов данного вектора будет равна 1. А входной спектр представляет собой нормированную взвешенную сумму спектров отдельных бактерий:

где ci - относительный вклад 1-й бактерии, fi (л) - спектр бактерии, e - шум.

Аналогичным образом создается тестовая выборка. Рассматривается равномерный и гауссовый шум. Уровень шума задается как относительно всего спектра, по максимальному уровню, так и относительно каждого отдельного отчета.

Рассматривается 11 различных бактерий и спектр без присутствия бактерий

(bacilus Subtilis Niger, Enrerococcus Faecalis, EnterobacterAerogenes, EnterococcusFaecium, Escherichia Coli, Lactobacillus Plantarum, LactobacilusBrevis, Lactoccus Lactis, Micrococcus Luteus, Pediococcus, Staphylococcus Epidermis). На рисунке 1 приведены примеры нескольких спектров бактерий.

(1)

Рис. 1. Примеры спектров флуоресценции некоторых бактерий

Для обучения сети предлагается упомянутый выше комбинированный алгоритм с предварительным обучением первого слоя на базе псевдообратных матриц (ПОМ), а затем дообучения алгоритмом ОРО.

Предварительно часть нейронов первого слоя заменяют на нейроны весовые коэффициенты, которых рассчитываются по следующей формуле:

Ж = ¥-'(У) • ХТ •(X • Хт +о1У\ (3)

где X - матрица входных примеров, У - матрица выходных примеров. Затем прогоняются примеры обучения с использованием метода стохастического градиента.

Рассмотрим задачу определения бактерии дающей максимальный вклад в спектр для четырех флуорофоров. Обучающие примеры включают флуорофоры с относительным вкладом менее 0.8 и флуорофором с относительным вкладом более 0.8.

Используются нейронные сети с различным числом слоев и нейронов в слое, вариации нейронов первого слоя 5-30 нейронов, каждый с 143 входами, второй слой с 10-40 нейронов, и третий слой (последний, в случае однослойной нейронной сети он же и первый) 5 нейронов.

При обучении сети на основе ПОМ и ОРО на незашумленных входных примерах, и при подаче тестовой выборки с шумом 1% . Количество промахов сети равно 60%, при обучении сети на основе ОРО на незашумленных данных и подаче на вход такой сети тестовой выборки с шумом количество промахов 9%. При увеличении количества эпох обучения, ошибка растет, что связано с переобучением сети на незашумленной обучающей выборке. Таким образом, целесообразно производить обучение на зашумленных данных.

При обучении сети на зашумленных данных в 10%, дообучение сети с ПОМ нейронами требует 200 эпох при количестве промахов 2%, по сравнению с 5% промахов при обучении одним ОРО за 2000 эпох. Одна эпоха это прогон всех примеров в обучающей выборке.

Если обучать сеть на примерах с максимальным возможным уровнем до 50% (с различным максимальным уровнем зашумления в примерах, с наихудшей ситуацией шум 50%, с наилучшей 0%). Ошибка отдельно алгоритма ОРО с 400 эпохами обучения составляет 18%, с применением комбинированного алгоритма достаточно 200 эпох, чтобы достичь 6% ошибки.

При уровнях шумов выше 10% применение совместно ПОМ и ОРО дает более высокую точность, чем применение ОРО отдельно при относительных уровнях

шумов, для абсолютных уровней шумов результаты отличаются незначительно. Следовательно, комбинированный алгоритм оказывается эффективнее как по скорости вычислений, так и по точности. На рисунке 2 приведена абсолютная ошибка обучения с помощью ПОМ и ОРО распознавания вклада в спектры четырех флуорофоров в зависимости от количества нейронов в первом слое, при количестве нейронов равным пяти (то есть совпадающим с количеством классов), ошибка равна ошибке распознавания однослойной нейронной сетью с ПОМ. Таким образом, применение ПОМ по сравнению с комбинированным алгоритмом менее точное, и оптимально брать количество нейронов первого слоя в четыре-пять раз больше количества классифицируемых флуорофоров (выходов сети).

га 0.021 п ю

I 0,02:

0

ОС 0,019-

1

01

а.0,018-и

1 0,017-

I-

2

§0,016-и

ю

0,015 — 5

Рис. 2. Абсолютная ошибка сетей на тестовой выборке при различном количестве нейронов в первом слое (5 нейронов равно количеству выходов нейронной сети)

Для задачи распознавания наличия бактерии рассматриваются все 11 бактерий и вводится порог определения, наличие выше относительного вклада 0.1, или 0.01, отсутствие ниже. Для надежного определения точного наличия бактерии лучше использовать уровень 0.1, для надежного определения отсутствия бактерии лучше использовать уровень 0.01. При уровне шума 10%, количество ошибок распознавания наличия бактерий 0.1%-0.4%, отсутствия 9%-10%, при этом алгоритму ОРО требуется 2000 эпох, алгоритму с предобучением ПОМ требуется 200 эпох. Достигаемые уровни ошибок примерно одинаковые, эффективность комбинированного алгоритма в скорости обучения. При большем, чем 4000 эпох алгоритма ОРО начинается переобучение сети.

Далее рассмотрим определение уровня вклада каждого спектра бактерии в общий спектр. Происходит разбиение значений относительного вклада каждого спектра бактерии в общий спектр флуоресценции на пять уровней, оценивается правильность определения номера уровня - (0-0.2, 0.2-0.4, 0.4-0.6, 0.6-0.8, 0.8-1.0).

Если задать максимальный относительный шум 50% в тестовой и обучающей выборке, то для 4000 эпох обучения алгоритмом ОРО средний процент промахов в интервал размеров 0.2 составляет 6.1656% , для 400 эпох 6.7164%. При применении 200 эпох с предобучением процент промахов составляет 5.53% .

Средняя ошибка определения уровня вклада бактерий при шуме 20% в спектр для двухслойной сети с предобучением равна 9.7%, для однослойной 12%, и для трехслойной 10%. Таким образом, оптимальной сетью будет сеть двумя слоями и предобучением. Увеличение количества слоев до 4-х и более не дает выигрыша.

Очевидно, что количество промахов во втором случае больше почти в два раза в связи с тем, что в первом случае присутствуют примеры ошибка, в которых менее 20%.

Рассмотрим различные схемы применения алгоритма обратного распространения ошибки и различные виды функций активации (рисунок 3). Анализируя снижение ошибки можно сказать, что лучшим вариантом является использование rmsprop и функции активации relu, а также алгоритма AdaGrad.

Рис. 3. Снижение ошибки обучения при использовании сигмовидной функции активации во всех нейронах, сигмовидной в последнем слое и ограниченно-линейной в остальных слоях совместно с алгоритмом КМБРгор, совместно со стандартным алгоритмом (а), снижение ошибки при применении различных правил градиентного спуска (б)

Заключение

В соответствии с проведенным анализом оптимальной сетью для решения различных задач классификации бактерий по спектрам флуоресценции будет сеть с двумя слоями, количеством слоев в первом слое больше в несколько раз количества нейронов в выходном слое, предобучением методом псевдообратных матриц первого

слоя и дообучением обратным распространением ошибки. Наиболее оптимальным вариантом модификации алгоритма обратного распространения ошибки является ADAGrad и RMSProp.

Рассмотрен метод полуколичественной оценки вклада бактерий в спектр флуоресценции, а также метод оценки наличия бактерий и отсутствия с помощью нейронных сетей, который эффективен даже при достаточно высоких уровнях шумов. Метод оценки вклада бактерий в общий спектр флуорисценции на основе нейронных сетей при гауссовом шуме в 20% дает ошибку для предложенного комбинированного алгоритма 9.7% при 200 эпохах дообучения.

Список литературы

1. Gabey A.M., Stanley W.R., Gallagher M.W., Kaye P.H. The fluorescence properties of aerosol larger than 0.8 цш in urban and tropical rainforest locations // Atmos. Chem. Phys. 11. 5491-5504, 2011.

2. Макогон М.М. Результаты испытаний мобильного сканирующего флуоресцентно-аэрозольного лидара // Оптика атмосферы и океана, 2011. Т. 24. № 03. С. 232-235.

3. Ghervase L., Carstea E.M., Pavelescu G., Savastru D. Laser induced fluorescence efficiency in water quality assessment // Romanian Reports in Physics. Vol. 62. №. 3. P. 652-659, 2010.

4. Yong-Le Pan. Detection and characterization of biological and other organic-carbon aerosol particles in atmosphere using fluorescence // Journal of Quantitative Spectroscopy & Radiative Transfer 150, 2015. P. 12-35.

5. Cabredo S., Parra A., Anzano J. Bacteria spectra obtained by laser induced fluorescence // J. Fluoresc, 2007. V. 17. P. 171-180.

6. Giamarchi P., Stephan L., Salomon S., Le Bihan A. Multicomponent determination of a polyaromatic hydrocarbon mixture by direct fluorescence measurements // J. Fluoresc, 2000. V. 10. P. 393-402.

7. Pan Y.L., Hill S.C., Santarpia J.L., Brinkley K., Sickler T., Coleman M., Williamson C., Gurton K., Felton M., Pinnick R.G., Baker N., Eshbaugh J., Hahn J., Smith E., Alvarez B., Prugh A., Gardner W. Spectrally-resolved fluorescence cross sections of aerosolized biological live agents and simulants using five excitation wavelengths in a BSL-3 laboratory // Opt Express, 2014 Apr. 7. 22 (7). P. 8165-8189.

8. Гришин А.И., Креков Г.М., Крекова М.М., Матвиенко Г.Г., Суханов А.Я., Тимофеев В.И., Фатеева Н.Л., Лисенко А.А. Исследование органического аэрозоля растительного происхождения с помощью флуоресцентного лидара // Оптика атмосферы и океана, 2007. Т. 20. № 04. С. 328-337.

9. Креков Г.М., Крекова М.М., Матвиенко Г.Г., Ковшов А.В., Суханов А.Я. Статистическое моделирование трансспектральных процессов при лазерном зондировании окружающей среды. 2. Лазерно-индуцированная флуоресценция; результаты модельных оценок // Оптика атмосферы и океана, 2007. Т. 20. № 03. С. 262-272.

10. Креков Г.М., Крекова М.М., Лисенко А.А., Суханов А.Я. Идентификация малых патогенных примесей в атмосфере на основе метода искусственных нейронных сетей // Аэрозоли Сибири. 15 Рабочая группа. Тез. докладов. Томск, 2008. С. 41.

11. Grishin A.I., Krekov G.M., Krekova M.M., Matvienko G.G., Sukhanov A.Ja., Fateeva N.L., Timofeev V.I. Study of organic aerosol of photogenic origin with fluorescent lidar // Intern. Journal of Remote Sensing, 2008. V. 29. №. 9. P. 2549-2565.

12. Суханов А.Я., Креков Г.М. Распознавание спектров флуоресценции бактерий и полиароматических углеводородов. Всероссийская конференция «Математические методы распознавания образов». ММРО-15. г. Петрозаводск, 11-17 сентября 2011 г.: Сборник докладов. М.: МАКС Пресс, 2011. 618 с. C. 514-517.

13. Rumelhart D.E., Hinton G.E. and Williams R.J. Learning representations by back-propagating errors // Nature. 323. 533-536, 1986.

14. Glorot X., Bengio Y. Understanding the difficulty of training deep feed forward neural networks // JMLR W&CP. № 9. P. 249-256, 2010.

БИБЛИОТЕКИ ИНСТИТУТОВ, ВУЗОВ И КОЛЛЕДЖЕЙ

ВО ВЬЕТНАМЕ Хюинь Н.Т.Т.

Хюинь Нгуен Тхать Тхао - аспирант, кафедра издательского дела и книговедения, Московский политехнический университет, г. Москва

Аннотация: в настоящей статье рассматривается роль библиотеки институтов, вузов и колледжей во Вьетнаме. Модернизация информационно-библиотечных систем в вузах - сейчас важное требование. Это интенсивное вложение, чтобы обеспечить подъем качества подготовки в обстановке, в которой вузовское образование Вьетнама претерпевает глубокие сдвиги в целях удовлетворять новые требования дела индустриализации, модернизации страны. Ключевые слова: книговедение, учебное издание, типология, библиотечное дело.

Что касается специальных библиотек, то во Вьетнаме их сеть строится по ведомственно-отраслевому принципу и дополняется территориальным. Однако эта сеть размещена неравномерно: в основном сосредоточена в научно-исследовательских институтах, на крупных промышленных предприятиях и в некоторых провинциях. По данным на 2000 г. во Вьетнаме действует 38 библиотек министерств, органов министерского уровня и подчиненных Правительству органов, 220 библиотек научно -исследовательских институтов, 223 библиотек вузов и колледжей.

В это число входят библиотеки различных институтов в рамках Национального Центра Естественных Наук и Технологий (бывшей Академии Наук Вьетнама): математики, прикладной механики, биологической технологии, геофизики, информационной технологии и др.; Библиотека Национальной Академии Политологии имени Хошимина, Библиотека Национальной Академии Администрации; библиотеки 223 вузов и колледжей страны.

Библиотеки и центры информации исследовательских институтов, вузов и колледжей внесли и вносят действенный вклад в обслуживание отряда исследовательских, преподавательских кадров и студентов различных специальностей: экономики, естественных наук, техники, общественных и гуманитарных наук, культуры и искусства, дипломатии, военного дела и т.д.; в обеспечение подъема качества подготовки и научных исследований.

В вузах сложилась трехступенчатая структура организации библиотечного обслуживания, включающая центральную библиотеку, библиотеки-филиалы на факультетах и отделения факультетских и институтских библиотек при кафедрах, кабинетах и лабораториях. Центральная библиотека осуществляет общее организационно-методическое руководство, централизованное комплектование, обработку фондов, книгохранение, библиографическую работу. Для обслуживания читателей создается система специализированных читальных залов и кабинетов.

Во Вьетнаме почти все вузы отдают себе отчет о роли информации в управлении и подготовке специалистов, поэтому сами строят и вводят в действие свои внутренние компьютерные сети. Однако наблюдается очень разная степень участия в построении

i Надоели баннеры? Вы всегда можете отключить рекламу.