Научная статья на тему 'Видовая идентификация иксодовых клещей по фотографиям с помощью нейронной сети'

Видовая идентификация иксодовых клещей по фотографиям с помощью нейронной сети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
204
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЧЛЕНИСТОНОГИЕ / ИКСОДОВЫЕ КЛЕЩИ / МАШИННОЕ ОБУЧЕНИЕ / НЕЙРОННЫЕ СЕТИ / КЛАССИФИКАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Коровкин Анатолий Михайлович

Мониторинг иксодовых клещей помогает установить изменения экологической обстановки в исследуемом регионе и предсказывать возможные волны переноса патогенных вирусов и микроорганизмов. В подобной статистике в данный момент нуждаются Министерство здравоохранения, санэпидемстанция, и другие государственные и частные службы. Ситуация осложняется необходимостью в высококвалифицированных специалистах и сложностью определения по справочникам. Для решения существующих проблем нужны программные средства, упрощающие идентификацию иксодовых клещей. Целью данного исследования является разработка экспертной системы для идентификация иксодовых клещей по фотографиям с использованием нейронных сетей. При разработке были использованы нейронные сети AlexNet и VGG. В результате получены приемлемые результаты для использования специалистами в реальных задачах. Для предоставления доступа клиента к серверной части разработан публичный

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Коровкин Анатолий Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESTful API.Monitoring of ixodidae helps to detect changes in the ecological situation in the region under investigation and predict possible waves of transport of pathogenic viruses and microorganisms. In such statistics, the Ministry of Health, Sanitary-Epidemiological Station, and other public and private services are in need at the moment. The situation is complicated by the need for highly qualified specialists and the difficulty in determining by directories. To solve existing problems, software tools are needed to simplify the identification of ixodidae ticks. The purpose of this research is the development of an expert system for the identification of ixodid ticks from photographs using neural networks. As a result, neural networks such as AlexNet and VGG were used. Acceptable results were obtained for use by specialists in real objectives. To provide client access to the server part, a public RESTful API is created.

Текст научной работы на тему «Видовая идентификация иксодовых клещей по фотографиям с помощью нейронной сети»

УДК 004.852

ВИДОВАЯ ИДЕНТИФИКАЦИЯ ИКСОДОВЫХ КЛЕЩЕЙ ПО ФОТОГРАФИЯМ

С ПОМОЩЬЮ НЕЙРОННОЙ СЕТИ Коровкин Анатолий Михайлович

Магистрант Факультета информационных технологий, Новосибирский Национальный Исследовательский Государственный Университет 630090, Новосибирск, ул. Пирогова, 1, e-mail: [email protected]

Аннотация. Мониторинг иксодовых клещей помогает установить изменения экологической обстановки в исследуемом регионе и предсказывать возможные волны переноса патогенных вирусов и микроорганизмов. В подобной статистике в данный момент нуждаются Министерство здравоохранения, санэпидемстанция, и другие государственные и частные службы. Ситуация осложняется необходимостью в высококвалифицированных специалистах и сложностью определения по справочникам. Для решения существующих проблем нужны программные средства, упрощающие идентификацию иксодовых клещей. Целью данного исследования является разработка экспертной системы для идентификация иксодовых клещей по фотографиям с использованием нейронных сетей. При разработке были использованы нейронные сети AlexNet и VGG. В результате получены приемлемые результаты для использования специалистами в реальных задачах. Для предоставления доступа клиента к серверной части разработан публичный RESTful API.

Ключевые слова: членистоногие, иксодовые клещи, машинное обучение, нейронные сети, классификация.

Цитирование: Коровкин А.М. Видовая идентификация иксодовых клещей по фотографиям с помощью нейронной сети // Информационные и математические технологии в науке и управлении. 2018. № 3 (11). С. 73-80. DOI: 10.25729/2413-0133-2018-3-08

Введение. В настоящее время отсутствуют исследования в области классификации и определения иксодовых клещей с помощью методов машинного обучения и алгоритмов принятия решений.

В связи с тем, что мониторинг и оперативное исследование изменений популяций разных видов иксодовых клещей важно для оценки экологической и эпидемиологической обстановки [1], специалистам в области акарологии требуются программные средства, способные помочь в идентификации и разгрузить экспертов. Создаваемый программный продукт будет полностью заменять бумажные справочники-определители, помогая эксперту сделать выводы с помощью машинного обучения, определяя принадлежность к виду и полу клеща по предоставленной фотографии [3, 4, 5].

Такая система обеспечит эффективную работу как служб по контролю и противодействию распространения эпидемий, так и исследователей в области экологии и зоологии. Практическое применение электронного справочника определителя видового разнообразия не только иксодовых клещей, но и других членистоногих по предоставленным фотографиям, имеют важное значение в эпидемиологии и эпизоотологии многих природно-

очаговых заболеваний, таких, как ККГЛ, туляремия и другие трансмиссивные вирусные инфекции. Материалы будут использованы не только в научной и образовательной области, но и в процессе работы практическими работниками здравоохранения, ветеринарии, сельского хозяйства и др., а также при проведении целенаправленных противоэпидемических и профилактических мероприятий.

Основная часть. В качестве данных использовались фотографии иксодовых клещей из коллекции в ГУ КООЗ МЗ РК "Кызылординская противочумная станция". Данные отобраны в максимально возможном объеме на данный момент. Были сделаны три фотографии каждой особи: сверху, снизу и сбоку. В связи с небольшим объемом данных (5,196 фотографий), данные были дополнительно аугментированы, что в результате дало 47,223 файлов. В качестве аугментации были применены оптические искажения и искажения цветов.

В выборке представлены два вида и два пола. На изображении приведен пример собранных данных (рис. 1).

Нуа1отта asiaticum Нуа1отта эсирепэе

9

Рис. 1. Пример исходных данных

Для первоначального эксперимента выбрана модель AlexNet [8].

Проведены эксперименты с архитектурой [9, 13] сверточной нейронной сети [6, 7] AlexNet с алгоритмами оптимизации Adam [2, 10] и стохастическим градиентным спуском (SGD [11, 12]).

Алгоритм оптимизации Adam показал себя намного хуже, чем обычный стохастический градиентный спуск с константно заданным шагом. Его точность была от 0.4 до 0.8 в зависимости от порядка подачи данных на обучение. В результате было решено использовать алгоритм стохастического градиентного спуска для оптимизации модели.

Также выполнен ряд экспериментов по подбору шага стохастического градиентного спуска (Learning Rate, LR). По результатам экспериментов с уменьшением LR (рис. 2) подобрано оптимальное значение, равное 0.0001.

Рис. 2. Зависимость потерь и точности от LR

В результате все последующие обучения нейронных сетей были проведены с использованием полученного шага. Это значение оказалось универсальным для всех проверенных в рамках этой работы топологиях сверточных нейронных сетей.

Далее проводились эксперименты по классификации по разным категориям:

• по полу,

• по виду,

• по виду и полу одновременно.

В данных экспериментах были использованы сырые, не аугментированные данные. Результат представлен на следующей диаграмме (рис. 3).

Рис. 3. Точность и потери после обучения AlexNet на неаугментированных данных (25 эпох, 1704 примеров обучения, 1136 тестирования)

Следующим был проведен эксперимент с тренировкой сети на аугментированных данных, который, как и ожидалось, показал улучшенный результат точности в задаче классификации по полу. Его результат составил 98.6%. Зависимость изменения точности обучения от эпохи представлена на следующих графиках (рис. 4, 5).

Рис. 4. Зависимость точности классификации по полу от эпохи (асс - точность на обучающей выборке, уа1_асс - точность на тестируемой выборке)

Рис. 5. Зависимость потерь классификации по полу от эпохи (loss - потеря на обучающей выборке, val loss - потеря на тестируемой выборке)

Зависимость точности определения по четырем классам (два пола и два вида) в зависимости от эпохи видна на следующих графиках (рис. 6). Тесты проводились на трех различных топологиях нейронных сетей - AlexNet, VGG16 и VGG19 [14, 15] (Very Deep Convolutional Networks for Large-Scale Image Recognition).

5 10 15 20 25

Рис. 6. Зависимость точности классификации по полу и виду моделей VGG16, VGG19 и А1ех№1 от эпохи (асс - точность на обучающей выборке, уа1_асс - точность на

тестируемой выборке)

На рис. 6 приведено сравнение работы трех нейронных сетей - это AlexNet, VGG16 и VGG19. Их результаты точности на тестовой выборке по истечении 25 эпох равны 0.9392, 0.9684 и 0.9592 соответственно, на основании чего можно сделать вывод, что лучшее соответствие набору данных и лучшие результаты показала модель VGG16.

Заключение. В результате исследования были выявлены топологии нейронных сетей, в достаточной мере удовлетворяющие поставленной задачи классификации выбранной области знаний. Полученный результат точности определения позволяет использовать текущие модели на практике. В дальнейшем планируется проведение дополнительных испытаний с целью улучшения полученных результатов.

С использованием результатов исследования разработана экспертная система Artropodia ©Коровкин А.М. Калмакова М. А., на которую получено свидетельство о регистрации авторского права №0802 от 28 марта 2018-го года в министерстве юстиции Республики Казахстан [16].

СПИСОК ЛИТЕРАТУРЫ 1. Калмакова М.А., Матжанова А.М., Бодыков М.З., Искаков Б.Г., Саякова З.З. Иксодовые клещи (Асаппа, Ixodidae) - эктопаразиты мелких млекопитающих, носителей возбудителей особо опасных инфекций в природных очагах Кызылординской области

Казахстана // Труды международного совещания «Териофауна России и сопредельных территорий». (Х съезд Териологического общества при РАН, Москва, 1-5 февраля 2016 г.) Москва. Товарищество научных изданий КМК. 2016. С. 158

2. Adam: A Method for Stochastic Optimization. Режим доступа: https://arxiv.org/abs/1412.6980 (дата обращения Май 23, 2018)

3. An introduction to computing with neural nets. Режим доступа: https://ieeexplore.ieee.org/abstract/document/1165576/ (дата обращения Май 22, 2018)

4. Convolutional Neural Network Committees for Handwritten Character Classification. Available at: https://ieeexplore.ieee.org/abstract/document/6065487/ (accessed Май 29, 2018)

5. Convolutional Neural Networks (LeNet) — DeepLearning 0.1 documentation. Режим доступа: http://deeplearning.net/tutorial/lenet.html (дата обращения Июнь 03, 2017)

6. Convolutional neural networks are fantastic for visual recognition tasks. Режим доступа: http://cv-tricks.com/cnn/understand-resnet-alexnet-vgg-inception/ (дата обращения Май 23, 2018)

7. Heusel M., Ramsauer H., Unterthiner T., Nessler B., Hochreiter S. GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium // In Advances in Neural Information Processing Systems 30 (NIPS 2017) Available at: https://papers.nips.cc/paper/7240-gans-trained-by-a-two-time-scale-update-rule-converge-to-a-local-nash-equilibrium (accessed May 23, 2018)

8. ImageNet Classification with Deep Convolutional Neural Networks. Available at: https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf (дата обращения Май 23, 2018)

9. Inside An Ai 'brain' - What Does Machine Learning Look Like? Режим доступа: https://www.graphcore.ai/posts/what-does-machine-learning-look-like (дата обращения Mай 23, 2018)

10. Kingma D.P., Ba J.L. Adam: a Method for Stochastic Optimization. International Conference on Learning Representations. 2015. Pp. 1-13.

11. Large-Scale Machine Learning with Stochastic Gradient Descent. Available at: https://link.springer.com/chapter/10.1007/978-3-7908-2604-3_16 (accessed Май 25, 2018)

12. Stochastic Gradient Descent Tricks. Режим доступа: https://link.springer.com/chapter/10.1007%2F978-3-642-35289-8_25 (дата обращения Май 21, 2018)

13. Top 10 machine learning frameworks. Режим доступа: http://bigdata-madesimple.com/top-10-machine-learning-frameworks/ (дата обращения Апрель 20, 2018)

14. Very Deep Convolutional Networks for Large-Scale Image Recognition. Режим доступа: https://arxiv.org/abs/1409.1556 (дата обращения Май 30, 2018)

15. Visual Geometry Group. Режим доступа: http://www.robots.ox.ac.uk/~vgg/ (дата обращения Июнь 03, 2017)

16. Свидетельство о регистрации авторского права № 0802 от 28 марта 2018-го года. Министерство Юстиции Республики Казахстан

UDK 004.852

IDENTIFICATION OF IXODIDAE SPECIES FROM PHOTOS WITH NEURAL NETWORK Anatoliy M. Korovkin

Undergraduate of the Faculty of Information Technology, Novosibirsk State University 630090, Novosibirsk, str. Pirogova, 1, e-mail: [email protected]

Abstract. Monitoring of ixodidae helps to detect changes in the ecological situation in the region under investigation and predict possible waves of transport of pathogenic viruses and microorganisms. In such statistics, the Ministry of Health, Sanitary-Epidemiological Station, and other public and private services are in need at the moment. The situation is complicated by the need for highly qualified specialists and the difficulty in determining by directories. To solve existing problems, software tools are needed to simplify the identification of ixodidae ticks.

The purpose of this research is the development of an expert system for the identification of ixodid ticks from photographs using neural networks. As a result, neural networks such as AlexNet and VGG were used. Acceptable results were obtained for use by specialists in real objectives. To provide client access to the server part, a public RESTful API is created.

Keywords: arthropods, ixodidae, machine learning, neural networks, classification.

References

1. Kalmakova M.A., Matzhanova A.M., Bodykov M.Z., Iskakov B.G., Sayakova Z.Z. Iksodovye kleshchi (Acarina, Ixodidae) - ektoparazity melkikh mlekopitayushchikh, nositeley vozbuditeley osobo opasnykh infektsiy v prirodnykh ochagakh Kyzylordinskoy oblasti Kazakhstana [Ixodid mites (Acarina, Ixodidae) — ectoparasites of small mammals, carriers of pathogens of especially dangerous infections in natural foci of the Kyzylorda region of Kazakhstan] // Trudy mezhdunarodnogo soveshchaniya «Teriofauna Rossii i sopredel'nykh territoriy». (KH s"yezd Teriologicheskogo obshchestva pri RAN, Moskva, 1-5 fevralya 2016 g.) = Proceedings of the international meeting "Theriofauna of Russia and adjacent territories". (The 10th Congress of the Theriological Society at the Russian Academy of Sciences, Moscow, February 1-5, 2016). Moscow. Tovarishchestvo nauchnykh izdaniy KMK = KMK Scientific Press. 2016. P. 158/ (in Russian)

2. Adam: A Method for Stochastic Optimization. Available: https://arxiv.org/abs/1412.6980 (accessed May 23, 2018)

3. An introduction to computing with neural nets. Available at: https://ieeexplore.ieee.org/abstract/document/1165576/ (accessed May 22, 2018)

4. Convolutional Neural Network Committees for Handwritten Character Classification. Available at: https://ieeexplore.ieee.org/abstract/document/6065487/ (accessed May 29, 2018)

5. Convolutional Neural Networks (LeNet) — DeepLearning 0.1 documentation. Available at: http://deeplearning.net/tutorial/lenet.html (accessed June 03, 2017)

6. Convolutional neural networks are fantastic for visual recognition tasks. Available at: http://cv-tricks.com/cnn/understand-resnet-alexnet-vgg-inception/ (accessed May 23, 2018)

7. Heusel M., Ramsauer H., Unterthiner T., Nessler B., Hochreiter S. GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium // In Advances in Neural Information Processing Systems 30 (NIPS 2017) Available at: https://papers.nips.cc/paper/7240-gans-trained-by-a-two-time-scale-update-rule-converge-to-a-local-nash-equilibrium (accessed May 23, 2018)

8. ImageNet Classification with Deep Convolutional Neural Networks. Available at: https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf (accessed May 23, 2018)

9. Inside An Ai 'brain' - What Does Machine Learning Look Like? Available at: https://www.graphcore.ai/posts/what-does-machine-learning-look-like (accessed May 23, 2018)

10. Kingma D.P., Ba J.L. Adam: a Method for Stochastic Optimization // International Conference on Learning Representations. 2015. Pp. 1-13.

11. Large-Scale Machine Learning with Stochastic Gradient Descent. Available at: https://link.springer.com/chapter/10.1007/978-3-7908-2604-3_16 (accessed May 25, 2018)

12. Stochastic Gradient Descent Tricks. Available at: https://link.springer.com/ chapter/10.1007%2F978-3-642-35289-8_25 (accessed May 21, 2018)

13. Top 10 machine learning frameworks. Available at: http://bigdata-madesimple.com/top-10-machine-learning-frameworks/ (accessed April 20, 2018)

14. Very Deep Convolutional Networks for Large-Scale Image Recognition. Available at: https://arxiv.org/abs/1409.1556 (accessed May 30, 2018)

15. Visual Geometry Group. Available at: http://www.robots.ox.ac.uk/~vgg/ (accessed June 03, 2017)

16. Certificate of registration of copyright No. 0802 dated March 28, 2018. Ministry of Justice of the Republic of Kazakhstan

i Надоели баннеры? Вы всегда можете отключить рекламу.