ВЫБОР ПРОГРАММНОЙ АРХИТЕКТУРЫ ПРИ РАЗРАБОТКЕ СИСТЕМЫ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА УЧЕБНОГО ПРОЦЕССА В ВЫСШЕМ УЧЕБНОМ ЗАВЕДЕНИИ
Зиберт Андрей Оскарович
аспирант Хакасского государственного университета,
РФ, г. Абакан E-mail: zib-andrey@inbox. ru
Мирошниченко Виктория Валентиновна
студент Хакасского государственного университета,
РФ, г. Абакан E-mail: [email protected]. ru
A CHOICE OF SOFTWARE ARCHITECTURE IN THE PROCESS OF ELECTRONIC DOCUMENT FLOW SYSTEM DESIGN OF TEACHING AND LEARNING ACTIVITIES IN HIGH EDUCATIONAL INSTITUTIONS
Zibert Audrey
Post-graduate student, Khakas State University,
Russia, Abakan
Miroshnichenko Viktoria
Student, Khakas State University, Russia, Abakan
АННОТАЦИЯ
В статье рассматривается архитектура автоматизированных
информационных систем, рассматриваются 3 ключевых компонента систем, а также приводятся результаты исследования производительности
программных продуктов, использующихся при построении информационных систем.
Зиберт А.О., Мирошниченко В.В. Выбор программной архитектуры при разработке системы электронного документооборота учебного процесса в высшем учебном заведении // Universum: Технические науки : электрон. научн. журн. 2014. № 11 (12) .
URL: http://7universum.com/ru/tech/archive/item/1757
ABSTRACT
Software architecture of automated data system is presented in the article; three key components of systems are considered. The authors show research results of software products efficiency used in the process of IT systems.
Ключевые слова: электронный документооборот, учебный процесс.
Keywords: electronic document flow, learning process.
Процесс разработки информационной системы может достаточно сильно отличаться в зависимости от назначения системы, сроков ее внедрения, опыта разработчиков и т. д.
В настоящее время существует ГОСТ 34.601-90 «Автоматизированные системы. Стадии создания». Согласно этому ГОСТу выделяются следующие первоначальные этапы разработки автоматизированных систем [1]:
1. Формирование требований к АС.
2. Разработка концепции АС
На этапе формирования требований к автоматизированной системе было выявлено, что в базе данных должно содержаться записей о более чем 15 000 студентах университета для хранения информации. В это количество должны входить как обучающиеся студенты, так и отчисленные из университета по различным причинам, в том числе и с присвоением квалификации. При этом в некоторых таблицах может быть порядка 70 000 записей. С системой должно работать около 100 пользователей. Также в системе должно быть не менее 20 автоматически формируемых отчетов, которые будут изменяться в соответствии с требованием нормативных документов либо потребностей сотрудников университета. Одной из основных функций системы должно стать формирование отчетов и документов в форматах .docx и ж^х, чтобы впоследствии пользователи системы могли работать с этими документами. Функционально система должна состоять из следующих блоков:
1. Клиент.
2. Серверная часть.
3. База данных.
В качестве клиентского приложения может быть использовано либо полностью отдельное клиент-серверное оконное приложение, написанное с использованием, например, RAD технологии, либо клиентская часть должна представлять собой веб-клиент, работающий в веб-браузере. Но в связи с тем, что в процессе работы системы могут происходить постоянные обновления отчетов, то каждое такое изменение потребовало бы обновления программной части клиентского приложения. В случае использования веб-клиента такой проблемы бы не было, так как в данном случае необходим только перезапуск клиентской части пользователя, о чем его можно уведомить, например, с помощью электронной почты. Кроме того, использование веб-клиента предоставляет возможность абстрагироваться от программной платформы пользователя, будь то Linux или Windows платформа или даже мобильный клиент. Используемые технологии современных веб-приложений достаточно стандартизированы, что позволяет запускать подобные системы практически на любых устройствах с разной архитектурой. В случае использования отдельного клиента было бы необходимо создавать и поддерживать клиентскую программу для всех используемых платформ, что привело бы к дополнительным расходам, связанным с поддержанием и развитием информационной системы. В связи с этими ограничениями при работке информационной системы был сделан выбор в пользу веб-клиента.
В связи с выбором веб-клиента в качестве клиентской части выбор серверной части системы был сделан в пользу веб-сервера. В качестве вебсервера рассматривались платформы Apache и IIS. По своей сути оба этих сервера являются достаточно производительными. Но в связи с тем, что одной из основных задач веб-сервера будет формирование отчетов и документов в формате .docx и .xlsx, то для выявления наиболее оптимальной программной
платформы веб-сервера было произведено исследование производительности этих серверов.
По содержимому файлы в формате .docxи .xlsx представляют собой заархивированные в формат сжатия данных zip наборы XML файлов. В данных файлах содержится текстовая часть документа, описание стилей и правил оформления текста и т. д. [2; 3].
Для проведения сравнения производительности веб-серверов использовался следующий алгоритм: формирование файла в формате .docx и .xlsx объемом 2500 символов. Формировалась несколько файлов:
1. Просто текст, без форматирования.
2. Текст, с применением минимального оформления для всего текста (применение выравнивания, размера шрифта и выделений текста).
3. Текст с применением оформления для разных частей текста.
В качестве аппаратной платформы тестирования использовалось следующее оборудование:
• Процессор: Intel Хeon 2,0 ГГц
• ОЗУ: 8 гб
• Дисковая подсистема — 1 ТБ RAID 5 SAS.
Затраты времени на формирование файлов приведены в таблице 1.
Как видно из таблицы, с задачами формирования документа без форматирования оба веб-сервера справляются примерно одинаково. Но в случае добавления в формирующие файлы различного форматирование веб-сервер IIS справляется значительно лучше, чем сервер Apache.
Также для преобразования данных непосредственно из базы используется технология XSL. Она является стандартной, но компания «Майкрософт» разработала дополнения, которые упрощают работу при формировании содержимого XML-файла. Например, для форматирования даты из американского формата (в котором хранятся все даты в SQL) в русский требуется всего одна функция. Без использования дополнительных библиотек от «Майкрософт» необходимо написать несколько строк кода, чтобы
выполнить то же самое. Встроенные библиотеки от кампании «Майкрософт» работают только на IIS, т. к. он принадлежит им же. На Apache эти библиотеки работать не будут.
Дополнительно в связи с тем, что в будущем планируется использование asp.net сценариев, недоступных для Apache, выбор был сделан в пользу вебсервера IIS.
В качестве системы управления базами данных рассматривались решения от Microsoft SQL Server 2012 и My SQL версии 5.5. В ходе первоначального анализа был получена схема данных, приведенная на рисунке 2. Наиболее типичный запрос при работе с базой данных выполняется при импорте данных в базу из файлов Excel и Word. Для этого создается временная таблица, в которую импортируются все данные из файлов, и остается пустая колонка для заполнения её идентификаторами.
Таблица 1.
Затраты времени на формирование файла
IIS 7.5, мс. Apache 1.3, мс.
Формат .docx, обычный текст 450 430
Формат .docx, форматирование для всего текста 1300 2100
Формат .docx, оформления для разных частей текста 2050 4300
Формат .xslx, обычный текст 700 730
Формат^^, форматирование для всего текста 1500 1700
Формат .xlsx, оформления для разных частей текста 2500 6000
Заполнение происходит при выполнении запроса, в котором сопоставляются данные из временной таблицы и основной таблицы. При полном совпадении во временной таблице заполняются идентификаторы совпавших значений. Различие в реализации данного запроса в СУБД Microsoft SQL Server и My SQL заключается в отсутствии оператора FULLJOIN в среде My SQL, за счет чего пришлось бы использовать связку операторов LEFTJOIN, JOIN, RIGHTJOIN и объединять все операторы SELECT посредством UNION. Тогда пришлось бы столкнуться с проблемой, если в одной из таблиц были поля в формате XML, то оператор UNION бы не сработал, т. к. не смог бы устранить повторы по XML полям. Проблема решилась бы путем
использования оператора UNIONALL, но тогда появлялись бы повторы в результирующих выборках, и это могло бы доставить определенные неудобства при обработке данных.
Рисунок 2. Схема данных
Для сравнения производительности серверов баз данных использовались запросы, содержащие в себе информацию для обновления 100, 500 и 1000 записей. Результаты работы запросов приведены в таблице 2.
Таблица 2.
Время выполнения запроса
Microsoft SQL server 2012, мс. MySQLv5.5, мс.
Обновления 100 записей 1300 2700
Обновления 500 записей 6530 10800
Обновления 1000 записей 11790 21600
Из таблицы видно, что за счет выполнения большего количества операций My SQL сервер показывается меньшую производительность, и Microsoft SQL Server 2012 является более оптимальным вариантом для использования в создаваемой информационной системе.
Таким образом, для решения задачи разработки автоматизированной системы электронного документооборота учебного процесса Хакасского государственного университета была выбрана связка IIS версии 7.5 и Microsoft SQL Server 2012, которые показали производительность выше других продуктов.
Список литературы:
1. ГОСТ 34.601-90. Автоматизированные системы. Стадии создания [Текст]/ — Введ. 01.01.1992. — М. : Изд-во стандартов, 1992.
2. Excel (.xlsx) Extensions to the Office Open XML SpreadsheetML / [Электронный ресурс]. — Режим доступа: http://msdn.microsoft.com/en-us/library/dd922181(v=office.12).aspx (дата обращения: 25.10.2014).
3. Word Extensions to the Office Open XML (.docx) / [Электронный ресурс]. —
Режим доступа: http://msdn.mLcrosoft.com/en-
us/library/dd773189(v=office.12).aspx (дата обращения: 25.10.2014).