Таврический научный обозреватель --^ауг^шепсе
УДК: 004.912
Исследования выполняются по 1 этапу контракта № 875АГС1/17621 в рамках программы «Старт» Фонда содействия развитию малых форм предприятий в научно-технической сфере по теме: «Разработка программного продукта по комплексной автоматизации операций распознавания рукописных символов, верификации и документооборота при решении задач проведения аттестации учащихся образовательных организаций» (шифр заявки «С1-05607»).
Бахтенко Е. А.
аспирант
Кафедра Автоматики и вычислительной техники (АВТ) Вологодский государственный университет
Баланин Е. О.
аспирант
Кафедра Информационных систем и технологий (ИСиТ) Вологодский государственный университет
АНАЛИТИКА СРЕДСТВ АВТОМАТИЗАЦИИ ОБРАБОТКИ БЛАНКОВ В КОНТЕКСТЕ РЕШЕНИЯ РАБОЧИХ ЗАДАЧ ПРИ ПРОВЕДЕНИИ АТТЕСТАЦИИ УЧАЩИХСЯ ОБРАЗОВАТЕЛЬНЫХ ОРГАНИЗАЦИЙ
В работе произведена оценка современного состояния технических средств, используемых для автоматизации работы с бланками в рамках проведения государственной итоговой аттестации учащихся образовательных организаций. Рассмотрены основные средства обработки и анализа данных, определен принцип работы и специфика предметной области.
Ключевые слова: аттестация, автоматизация, распознавание, бланки, аналитика.
В настоящее время при проведении аттестации учащихся образовательных организаций требуются программные продукты, обеспечивающие решение следующих задач: распознавание рукописных символов, распознавание штрих-кодов, определение структуры печатного документа, верификация, организация работы в многопользовательском режиме, формирование отчетности и экспорт данных. Входными данными при этом выступают скан-версии аттестационных бланков и листов, а также ведомостей и протоколов, в объемах, исчисляемых сотнями тысяч экземпляров.
Основными средствами для обработки и анализа подобной информации выступают распределенные программные комплексы, которые используют различные методы распознавания (сравнение с эталоном и т.п.) и различные архитектурные решения (работа через браузер, единое прикладное приложение и т.п.) [1]. Анализируя широко тиражируемые решения, можно утверждать, что конкретных конфигураций, которые бы не предлагали избыточного функционала, а имели бы готовые пакетные решения для исследуемой предметной области без привязки к платным операционным системам и библиотекам, на рынке не представлено.
В свою очередь это определяет необходимость реализации единого пакетного программного решения, которое смогло бы решить вышеперечисленные задачи, и не было бы привязано к платным внешним компонентам. Отдельной приоритетной подзадачей является разработка алгоритмической базы и реализация компонентов по распознаванию и верификации рукописных символов именно в контексте предметной области, что позволило бы повысит скорость работы, снизить общее число ошибок, избавить обслуживающий персонал от избыточных действий по настройке и подготовке к эксплуатации.
3
Таврический научный обозреватель www.tavr.science
Приведём пример некоторых технических моментов, требующих решения на примере ABBYY Recognition Server (в контексте предметной области).
Жесткая структура компонентов требует избыточное число машин (компьютеров), а именно «Менеджер сервера», «Станция сканирования», «Станция обработки», «Станция индексирования», «Станция верификации», «Консоль удалённого администрирования».
Привязка к платным операционным системам семейства Windows. Во-первых, это означает как минимум покупку и ежегодное продление одной или нескольких ОС Windows Server и множества ОС типа Windows 7 и Windows 8. Во-вторых, это означает завышенные системные требования и необходимость наличия отдельных компьютеров, т.к. основные сервера и рабочие станции работают на системах семейства Unix (например, Debian). В-третьих, это несет проблемы, связанные с использованием различных файловых систем. В-четвертых, это создает кадровые проблемы, т.к. возникает необходимость держать в штате специалистов по работе с различными операционными системами. В-пятых, это вызывает проблемы с масштабируемостью, т.к. при колебании объема обрабатываемых данных требуется закупка новых лицензий, что невозможно осуществлять в сжатые сроки, которые установлены регламентом проведения государственной аттестации учащихся.
Решение носит общий характер и не имеет готовой версии продукта для использования в задачах, связанных с автоматизацией аттестации с учетом всех требований регламента.
Конечно, не стоит забывать, что с технической точки зрения основные задачи — распознавание содержания и структуры документа, организация верификации и передачи данных, их хранение и обработка. Принцип работы — интеграция гетерогенных источников информации и унификация рабочих данных в среде единого программного комплекса в составе информационного пространства образовательной организации [2].
Специфика предметной области — требования к продукту регламентируются законодательством.
Основные регламентирующие документы:
1. Федеральный закон РФ «О персональных данных», N 152-ФЗ от 27.07.2006.
2. Федеральный закон от 29 декабря 2012 г. № 273-Ф3 «Об образовании в Российской Федерации».
3. Формат предоставления данных ГИА-9 для субъектов, не использующих АИС Г(И)А — Федеральная база данных государственной итоговой аттестации по образовательным программам основного общего образования.
4. Правила формирования и ведения федеральной информационной системы обеспечения проведения ГИА.
5. Порядок проведения ГИА по образовательным программам среднего общего образования.
6. Регламент проведения ГИА.
Создание типового решения повлечет качественное изменение продукции (услуг):
1. Появится пакетное решение, адаптированное для избранной предметной области. Наличие готовых конфигураций. Сокращение времени развертки.
2. Отпадает необходимость приобретения дополнительного оборудования (Windows-based рабочих станций) и сопутствующего платного программного обеспечения (Windows Server и т.п.).
3. Сопутствующее решение по резервированию данных, а значит снижение рисков потери информации.
4. Решение будет адаптировано к программно-аппаратной среде региональных центров обработки информации (РЦОИ).
Литература
Таврический научный обозреватель www.tavг.science
1. Бахтенко Е. А., Зайцев В. Н. Инструментальная среда автоматизированной разработки веб-интерфейсов. // Материалы всероссийской научной конференции «Молодые исследователи — регионам» — Вологда: ВоГТУ, 2010. — Т.1. — С. 29-30.
2. Бахтенко Е. А., Измайлов И. А. Проектирование базы данных системы оперативного прототипирования и обновления многокомпонентных информационных систем // Сборник статей по материалам XXXVII международной заочной научно-практической конференции «Научная дискуссия: инновации в современном мире» — М., Изд. «Интернаука», 2015. — С. 15-19.