УДК 519.688
Вестник СПбГУ. Сер. 10, 2013, вып. 4
В. М. Буре, П. А. Карпенко, М. В. Свиркин
ИНФОРМАЦИОННО-ЛОГИЧЕСКАЯ МОДЕЛЬ И РЕАЛИЗАЦИЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОГО КОМПЛЕКСА «ПРИЕМ В ВЫСШЕЕ УЧЕБНОЕ ЗАВЕДЕНИЕ»
1. Введение. Статья посвящена формализации предметной области и автоматизации процесса приема в высшее учебное заведение России (уровень федерального или национального исследовательского университета). В статье, согласно законодательству Российской Федерации, регламентирующему процесс приема в высшее учебное заведение, политике вуза в области реализации учебного процесса и выполнении контрольных цифр приема, проводится анализ предметной области - приема абитуриентов, строится информационно-логическая модель процесса приема и анализируется программная реализация разрабатываемого информационно-аналитического комплекса.
В соответствии с новыми целями и задачами по автоматизации процесса приема в университет в настоящее время решается задача создания расширенного программного комплекса, который включал бы в себя не только информационно-аналитическую обработку данных по приему, но и весь процесс приема абитуриентов с использованием современных информационных технологий.
Методологической основой информационно-аналитического обеспечения разрабатываемого расширенного программного комплекса является методология информационно-аналитического программного комплекса [1].
При постановке задач по автоматизации проведения приема в Санкт-Петербургский государственный университет (СПбГУ) руководство университета особое внимание уделяло вопросам предоставления открытой информации, удобства работы с системой при поступлении для абитуриентов, оперативности обработки информации и полноты получения отчетов. При этом, согласно техническому заданию, разрабатываемый программный комплекс приема является составной частью создаваемого общего программного комплекса, включающего в себя прием абитуриентов, учебный процесс, внеучебную работу студентов и трудоустройство выпускников.
В основу выбора программных средств по реализации программного комплекса приема была положена идеология применения таких средств, которые были бы удобны в использовании для абитуриентов, работников приемной комиссии, руководителей университета различных уровней. Применяемые информационные технологии должны быть доступны для всех лиц, задействованных в процессе приема, удобны, надежны в работе и должны работать в реальном режиме времени.
В статье, в соответствии с изложенными выше принципами, рассматриваются следующие аспекты разработки расширенного программного информационно-аналитического комплекса:
Буре Владимир Мансурович — доктор технических наук, профессор, 199034, Санкт-Петербургский государственный университет; e-mail: [email protected].
Карпенко Павел Алексеевич — аспирант, 199034, Санкт-Петербургский государственный университет; e-mail: [email protected].
Свиркин Михаил Владимирович — кандидат физико-математических наук, доцент, 199034, Санкт-Петербургский государственный университет; e-mail: [email protected].
© В. М. Буре, П. А. Карпенко, М. В. Свиркин, 2013
Рис. 1. Диаграмма сущности предметной области приема в СПбГУ
1) анализ сущностей предметной области приема в вуз, описание функционала решаемых задач с учетом специфики СПбГУ (рис. 1);
2) выбор и обоснование использования аппаратных средств;
3) использование соответствующих информационных технологий и программных средств создания программного комплекса;
4) разработка развитой системы администрирования и прав доступа для пользователей разного уровня компетенции;
5) вопросы импорта и экспорта данных;
6) информационно-аналитический блок обработки данных, математические методы обработки информации.
2. Анализ и формализация предметной области — прием в СПбГУ. В соответствии с Федеральным законом Российской Федерации от 10 ноября 2009 г. № 259-ФЗ «О Московском государственном университете имени М. В. Ломоносова и Санкт-Петербургском государственном университете» и программой развития СПбГУ основными задачами СПбГУ являются обучение и подготовка кадров высшей квалификации - магистров, аспирантов и докторантов, проведение научных исследований, привлечение в СПбГУ через олимпиадное движение талантливой молодежи. Таким образом, наряду с традиционными задачами приема абитуриентов на первый курс бакалавриата и специалитета, возникает еще ряд специфических задач по приему в магистратуру, например наличие различных форм для поступления в магистратуру, разные виды магистерских программ - с двойным дипломом, включенным образованием и т. д. Для качественного проведения приема Управление по приему СПбГУ уделяет большое внимание вопросам анализа контингента поступающих в университет, проведению профориентационной работы и олимпиадам. В программном комплексе все информационные потоки данных рассматриваются в разрезах:
• университета;
• факультетов;
• направления подготовки;
• формы и основы обучения;
• предметов вступительных экзаменов;
• регионов;
• олимпиад.
Вся импортируемая и вводимая в систему информация записывается в соответствующих таблицах базы данных. Далее информация обрабатывается с помощью специализированных модулей и служит основой принятия объективных управленческих решений.
3. Аппаратные средства реализации программного комплекса. СПбГУ является крупным образовательным центром, в состав которого входят 24 факультета, на которых обучаются более 20 тыс. студентов. Ежегодно на программы бакалавриата и подготовки специалиста поступают более 4 тыс. человек и около 2 тыс. - на программы магистратуры.
В период приемной кампании размещение комиссий по приему документов проводится в разных зданиях, поэтому для эффективной работы требуется распределенная, надежная и защищенная сеть. Для организации сетевого окружения выбрана базовая топология компьютерной сети - активная звезда (рис. 2). Согласно Федеральному
Направления подготовки
Рис. 2. Топология компьютерной сети - активная звезда
закону Российской Федерации от 27 июля 2006 г. № 152-ФЗ «О персональных данных», для программного обеспечения такого уровня выдвигается ряд требований по обеспечению безопасности хранения персональных данных. СПбГУ имеет аттестованную
Федеральной службой по техническому и экспортному контролю (ФСТЭК России) локальную компьютерную сеть. Для хранения данных применяется база данных Microsoft SQL 2008. Программное обеспечение написано на платформе .NET.
Характеристики используемого сервера для хранения базы данных: Microsoft Windows Server 2008 R2 Enterprise 64bit, 8-ядерный процессор 4xIntel Xeon E7-L8867 @ 2.13 GHz, 24 Гб оперативной памяти, Microsoft SQL Server Standard Edition (64 bit).
Характеристики используемого терминального сервера: Microsoft Windows Server 2008 R2 Enterprise 64 bit, 4-ядерный процессор 2хIntel Xeon E7-L8867 @ 2.13 GHz, 128 Гб оперативной памяти.
4. Информационные технологии и программные решения. Для решения поставленной перед нами задачи применялась клиент-серверная архитектура, что позволило перенести всю нагрузку с клиентских машин на мощные серверы. Понятие архитектуры «клиент-сервер» в системах управления предприятием связано с делением любой прикладной программы на три основных компонента. Ими являются:
• компонент представления (визуализации) данных;
• компонент прикладной логики;
• компонент управления базой данных [2].
В программном комплексе в качестве клиента используется терминальный сервер. Это решение позволило применять для пользователей менее мощные рабочие станции, что в итоге экономит бюджет СПбГУ. Комплекс имеет удобный интерфейс для экспорта данных в любой формат и возможность импорта данных по заданному шаблону.
5. Администрирование программного комплекса. Для ввода данных поступающих в СПбГУ абитуриентов в программном комплексе реализована идеология применения Личного кабинета поступающего. Используемый подход позволяет абитуриенту на своем компьютере в электронном виде подать заявление и заполнить его в режиме онлайн. На данный момент для поступающих на программы магистратуры существует возможность подачи заявления в электронной форме с приложением полного сканированного комплекта документов. Введение данного модуля позволило значительно сократить время внесения данных о поступающих в информационной системе «Прием», теперь приемная комиссия только проверяет введенные поступающим данные.
Для удобства поступающих в зданиях, где расположены комиссии по приему документов, разворачивается компьютерный класс общего доступа, куда может прийти поступающий и заполнить заявление. При возникновении вопросов можно обратиться к волонтерам из числа студентов СПбГУ.
Для администрирования прав доступа к информации вводятся несколько уровней доступа (роли):
1. Технический секретарь - первичный ввод и проверка введенных поступающими данных, формирование личного дела поступающего.
2. Ответственный секретарь - общая организация работы приемной комиссии на уровне образовательной программы по приему документов, создание протоколов о допуске, проверка личных дел, первичная проверка поступающих по льготному типу конкурса.
3. Советник проректора по направлениям видов деятельности - общий контроль работы комиссий по приему документов, допуск до участия в конкурсе поступающих по льготному типу конкурса.
4. Ректорат - анализ и контроль общей информации процесса приема, анализ статистических отчетов и принятие управленческих решений.
5. Администратор (группа сопровождения) - общая настройка системы, внесение данных о структуре приемной кампании.
6. Шифровальная группа - шифрование и расшифровка экзаменационных работ поступающих в случае проведения экзаменов в вузе.
В программном комплексе реализована иерархическая структура отчетов (выходных форм). Иерархия отчетов подразумевает следующие уровни лиц, потребителей статистических отчетов:
1) отчеты для внешних органов (правительство РФ, Министерство образования РФ, Российский союз ректоров и т. д.) - такого вида отчеты формируются ежегодно, с определенной периодичностью. Данные отчеты являются основой для анализа приема в СПбГУ на «макроуровне»;
2) отчеты для ректората СПбГУ - текущая и сводная информация о ходе приемной кампании, отчеты о конкурсной ситуации и т. д. Отчеты являются основой для принятия оперативных управленческих решений на уровне университета, а также формирования политики в области приема в СПбГУ;
3) отчеты для комиссии по приему документов - анализ и контроль правильности введения и обработки данных. Ограничены только определенным направлением подготовки;
4) отчеты для поступающих - сведения о конкурсной ситуации, сведения о дате подачи документов, рейтинговый список, формируемый по окончанию приемной кампании.
6. Информационно-аналитический и математический модули программного комплекса. Информационно-аналитический и математический модули программного комплекса включают в себя математическую обработку данных, аналитику, визуализацию и отчетные формы на трех уровнях.
Первый уровень - статистический анализ исходных данных, получение основных числовых характеристик рассматриваемых сущностей. Для более детальной статистической обработки данных в нужных разрезах на основе многокритериального отбора генерируются соответствующие отчеты. Для наглядного представления обработанных данных используются средства визуального отображения данных, диаграммы и графики (рис. 3, 4).
а
б
350
350
300 -
300
271
баллов
Прикладная математика Прикладные Фундаментальная и информатика математика и физика информатика и информационные технологии
ч Мах сумма * баллов
Min сумма " баллов „ Avg сумма баллов
Фундаментальная и прикладная химия
Химия
Химия, физика и механика материалов
Рис. 3. Диаграмма распределения суммы баллов по ЕГЭ а - по направлению «химия»; б -по направлению «процессы управления».
Абитуриенты, % 25
12 24
12 24 36 48
84 100 Баллы
Рис. 4- Плотности распределения по предмету ЕГЭ «Математика» а - по СПбГУ; б -по направлениям «математика, механика»; в - по направлениям «география, геоэкология»; г - по направлению «экономика».
Второй уровень - определение зависимостей, характеризующих рассматриваемые данные с помощью системы статистических коэффициентов связи, идентификации законов распределения, проведения анализа однородности данных, оценки параметров распределения и их изменений в зависимости от факультета и условий приема. Основным методом математического исследования на этом уровне является использование методологии применения кривых Пирсона и совокупности коэффициентов, описывающих вероятностную связь между рассматриваемыми случайными величинами.
Третий уровень - получение оценок сводных показателей, качественный анализ данных и подготовка принятия объективных управленческих решений.
Особое внимание при создании математического обеспечения программного комплекса уделяется вопросам нахождения оценок, изменения законов и параметров распределения, в зависимости от выбранных факторов, например таких как формы и основы обучения. Также большое внимание уделяется изучению законов распределения баллов ЕГЭ на разных факультетах и по различным предметам, оценкам влияния дополнительных факторов (победы в олимпиадах) и других факторов по успеваемости.
Применение традиционных методик статистического анализа данных часто ограничивается особенностями собранной информации. Так, данные, представляющие собой измерения в номинальной шкале, анализируются с помощью таблиц сопряженности и соответствующих методик анализа данных [3]: точного критерия Фишера, критерия Пирсона хи-квадрат, коэффициента каппы Коэна и модифицированной каппы Коэна. При анализе данных, измеренных в порядковых шкалах, используются коэффициенты ранговой корреляции Спирмена и Кендалла.
На рис. 3 видно, как распределяется сумма баллов ЕГЭ среди зачисленных. Черным цветом отображена минимальная сумма баллов, очевидно, что эти баллы были набраны поступающими, которые были зачислены по льготному типу конкурса. Темно-серым цветом изображены средние суммы баллов поступивших на программы
бакалавриата и подготовки специалиста; как видно из рис. 3, а, с более высокими баллами ЕГЭ поступили на специальность «Фундаментальная и прикладная химия», на рис. 3, б - что на направление «Фундаментальная информатика и информационные технологии» средний балл выше, чем на других направлениях. Отсюда можно сделать вывод, что поступающие проявляют больший интерес к фундаментальным направлениям и специальностям, при прочих равных условиях. Светло-серым цветом изображены максимальные суммы баллов.
На рис. 4 показаны плотности распределения по предмету ЕГЭ «Математика»: видно, что происходит сильный разброс баллов ЕГЭ; самый максимальный пик (рис. 4, а) приходится на баллы 68-70 - это говорит о высокой подготовке поступающих в университет, пик, находящийся на уровне 48-50 баллов, скорее всего, свидетельствует об уровне подготовки по математике поступающих на гуманитарные направления, по льготным типам конкурса, а также на места с оплатой стоимости обучения. По сравнению с картиной по всему университету (рис. 4, а) на направления «математика, механика» (рис. 4, б) поступают более подготовленные по математике абитуриенты, максимальный пик смещается к уровню 84-86 баллов, а также высок процент поступающих со 100-балльным результатом по ЕГЭ «Математика». На рис. 4, в изображена плотность распредения по направлениям «география, геоэкология», по сравнению с рис. 4, а максимальный пик смещается к уровню 60-62 баллов, это говорит о менее подготовленных по математике поступающих, но нужно учитывать, что математика для данных направлений не профильный предмет. На рис. 4, г видно опять смещение по сравнению с рис. 4, а, здесь математика для направления «экономика» является профильным предметом, максимальный пик смещается к уровню 72-74 балла, появляется дополнительный пик на уровне 82-84 баллов - это свидетельствует о достаточно высокой подготовке по математике поступающих на данное направление.
Заключение. На примере СПбГУ была разработана методология автоматизации процесса приема в высшее учебное заведение. На основе анализа и формализации предметной области, построения информационно-логической модели приведена реализация программного комплекса, охватывающего весь спектр задач по автоматизации процесса приема. Изложены основные положения по использованию аппаратных средств, информационных технологий и программных решений рассматриваемого комплекса, освещены вопросы администрирования и возможности его математического и информационно-аналитического модулей. В качестве иллюстрации работы этих модулей приведены диаграммы дескриптивной статистики и графики плотности распределения баллов ЕГЭ.
Литература
1. Буре В. М, Свиркин М. В., Степанов А. Г. Методология построения информационно-аналитического программного комплекса деятельности организационных систем // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2012. Вып. 2. С. 75—80.
2. Васкевич Д. Стратегии клиент/сервер: руководство по выживанию для специалистов по реорганизации бизнеса. Изд. 2-е / пер. с англ. Киев: Диалектика; Информейшн Компьютер Энтерпрайз, 1996. 398 с. (Vaskevich D. Client Server Strategies. A Survival Guide For Corporate Reengineers.)
3. Тюрин Ю. Н., Макаров А. А. Статистический анализ данных на компьютере. М.: Финансы и статистика; Инфра-М, 1997. 384 с.
4. Fleiss J. L. Statistical methods for rates and proportions. 2nd ed. New York: John Wiley, 1981. 740 p.
Статья рекомендована к печати проф. Л. А. Петросяном. Статья поступила в редакцию 30 мая 2013 г.