Научная статья на тему 'Методология обработки информации для системы автоматизированной аналитики электронных образовательных ресурсов образовательной организации'

Методология обработки информации для системы автоматизированной аналитики электронных образовательных ресурсов образовательной организации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
134
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЗАЦИЯ / AUTOMATION / АГРЕГИРОВАННАЯ ИНФОРМАЦИЯ / AGGREGATED INFORMATION / АНАЛИТИКА / ANALYTICS / ВАЛИДАЦИЯ / VALIDATION / ИНФОРМАЦИЯ / INFORMATION / ОБРАЗОВАТЕЛЬНЫЕ ОРГАНИЗАЦИИ / EDUCATIONAL ORGANIZATIONS / СТАНДАРТИЗАЦИЯ / STANDARDIZATION / СТРУКТУРИРОВАНИЕ / STRUCTURING / УНИФИКАЦИЯ / UNIFICATION / ЭЛЕКТРОННЫЕ ОБРАЗОВАТЕЛЬНЫЕ РЕСУРСЫ / ELECTRONIC EDUCATIONAL RESOURCES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гришан Игорь Александрович

Настоящая статья посвящена вопросам методологии обработки информации об электронных образовательных ресурсах в целях разработки системы автоматизированной аналитики электронных образовательных ресурсов образовательных организаций по материалам Объединенного фонда электронных ресурсов «Наука и образование».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гришан Игорь Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

This article is devoted to the methodology of processing information about electronic educational resources in order to develop a system of automated analysis of electronic educational resources of educational institutions based on the materials of the joint Fund of electronic resources "Science and education".

Текст научной работы на тему «Методология обработки информации для системы автоматизированной аналитики электронных образовательных ресурсов образовательной организации»

Методология обработки информации для системы автоматизированной аналитики электронных образовательных ресурсов образовательной организации

Гришан Игорь Александрович старший научный сотрудник федеральное государственное бюджетное научное учреждение "Институт управления образованием Российской академии образования" (495) 625-20-24, (903) 829-27-49. [email protected]

Аннотация

Настоящая статья посвящена вопросам методологии обработки информации об электронных образовательных ресурсах в целях разработки системы автоматизированной аналитики электронных образовательных ресурсов образовательных организаций по материалам Объединенного фонда электронных ресурсов «Наука и образование».

This article is devoted to the methodology of processing information about electronic educational resources in order to develop a system of automated analysis of electronic educational resources of educational institutions based on the materials of the joint Fund of electronic resources "Science and education".

Ключевые слова

автоматизация, агрегированная информация, аналитика, валидация, информация, образовательные организации, стандартизация, структурирование, унификация, электронные образовательные ресурсы automation, aggregated information, analytics, validation, information, educational organizations, standardization, structuring, unification, electronic educational resources

Введение

В соответствии с Приказом Минобрнауки России №1399 от 09.11.2016 "О внесении изменений в показатели мониторинга системы образования" образовательных организаций внесен показатель "Наличие собственных электронных образовательных и информационных ресурсов". База Данных Объединенного фонда электронных ресурсов «Науки и образования» (ОФЭРНиО) содержит информацию об электронных и информационных ресурсах, разработанных 745 учреждениями и организациями, среди которых 672 вуза страны. В соответствии с проектом №27.9383.2017/БЧ разрабатывается автоматизированная аналитическая система электронных образовательных ресурсов (ЭОР) образовательных организаций (ОО), разработанных пользователями ОФЭРНиО - университетами, колледжами, школами страны, что позволит органам управления образования использовать данные ОФЭРНиО для мониторинга образовательных организаций по данному показателю. Основой автоматизированной аналитической системы является агрегированная информация, полученная в результате обработки информации об электронных образовательных и информационных ресурсах.

Проблемам обработки информации в целях ее агрегирования и посвящена настоящая статья.

Нормативно-правовое обеспечение данного вопроса

Формирование информационно-образовательной среды на основе внедрения информационно-коммуникационных технологий и электронных образовательных ресурсов является одним из приоритетных направлений развития российских университетов. В контексте данной статьи важными представляются следующие нововведения:

• Государственное задание на проект «Нормативно-правовое регулирование отношений в сфере образования и отраслевая регистрация произведений науки», во второй части «Отраслевая регистрация произведений науки»;

• Приказ Минобрнауки № 1399 от 09.11.2016 "О внесении изменений в показатели мониторинга системы образования", в соответствии с которым в мониторинг образовательных учреждений внесен новый показатель «наличие собственных образовательных электронных и информационных ресурсов»;

• Постановление Правительства Российской Федерации № 376 от 31 марта 2017 года, в соответствие с которым в структуру государственной программы «Развитие образования» интегрируется ряд приоритетных проектов по направлению стратегического развития «Образование», в том числе проект «Современная цифровая образовательная среда в Российской Федерации»;

Объект исследования: образовательные организации страны.

Предмет исследования: произведения науки в форме электронных образовательных ресурсов (рис. 1)

Методы исследования: унификация, стандартизация, верификация, валидация, статистический, контент-аналитический

Цель исследования: совершенствование методологии обработки слабоструктурированной информации об электронных образовательных ресурсов в целях получения агрегированной аналитической информации по показателям деятельности образовательных организаций, в части создаваемых ими электронных образовательных ресурсов в различных срезах, с учётом временного фактора, позволяющей оценить динамику создания электронных ресурсов (Рис. 1).

Рис.1. Разновидности результатов интеллектуальной деятельности и форм представления произведений науки

Автоматизация обработки и преобразования исходной информации об электронных образовательных ресурсах по показателям деятельности

образовательных организаций, позволяет оценивать динамику создания электронных ресурсов (Рис. 2)

Рис. 2 Блок-схема автоматизированной аналитической системы электронных образовательных ресурсов образовательных организаций

Сегодня информационно-программное обеспечение Объединенного фонда электронных ресурсов «Наука и образование» - это 29784 файлов, 1 сайт. Главным информационным ресурсом ОФЭРНиО является База Данных.

База Данных ОФЭРНиО содержит 29 взаимосвязанных таблиц, содержащих 66 объектов информации об электронных образовательных ресурсах, в частности:

1.Номер ОФЭРНиО

2. Дата регистрации в ОФЭРНиО

3. Наименование разработки

4. Реферат

5. Ключевые слова

6. Тип ЭВМ

7. Инструментальные средства, использованные для разработки

8. Тип и версия ОС

9. Оперативная память

10. Объем разработки

11. Срок окончания разработки

12. Разновидность разработки

13. РТО (количество листов)

14. Министерство/ведомство

15. Организация-разработчик

16. Автор(ы)

17. Субъект РФ

18. Город

19. Адрес

20. Телефон

21. Эл. Почта

22. Интернет-адрес

23. ББК

24. ГРНТИ

25. УДК

26. Код разработки по ЕСПД

27. № журнала

28. Раздел журнала

29. № газеты

30. Отрасль н/х (по группам)

31. Отрасль науки (по группам)

32. Наименование отраслей хозяйства страны (конкретные)

33. Наименование областей хозяйства страны (конкретные)

34. Специальность

35. Специализация

36. Учебный предмет/дисциплина

37. Уровни образования

38. Подуровни высшего образования

39. Форма обучения

40. Вид средства обучения

41. ОКПО организации, предоставляющей ИК в ОФЭРНиО

42. Телефон организации, предоставляющей ИК в ОФЭРНиО

43. Город месторасположения организации, предоставляющей ИК в ОФЭРНиО

44. Сокращённое наименование министерства (ведомства)

45. Полное наименование организации, предоставляющей ИК в ОФЭРНиО

46. Сокращённое наименование организации, предоставляющей ИК в ОФЭРНиО

47. Адрес организации, предоставляющей ИК в ОФЭРНиО

48. Наименование отделения ОФЭРНиО

49. Номер отделения ОФЭРНиО

50. The organization Name

51. The author

52. The working out Name

53. The Abstract (summary)

54. Keywords

55. Исходящий номер (письма)

56. Дата исходящего письма

57. ФИО автора-исполнителя письма (при регистрации от имени автора-индивидуала)

58. ФИО доверенного лица-исполнителя письма (при регистрации от имени авторского коллектива)

59. ФИО исполнителя письма (при регистрации от имени организации)

60. Депонировано

61. Город издания научной рукописи

62. Год издания научной рукописи

63. Кол-во страниц научной рукописи

64. Ссылка размещения РТО на портале

65. Ссылка размещения депонированного ресурса на портале

66. doi рекламно-технического описания

В целях структурирования, унификации, стандартизации входной информации об электронных образовательных ресурсах разработана free software RegOFERNiO [4] - программа автоматизированной разработки комплекта документов для регистрации электронных образовательных ресурсов. Полученная исходная информация, содержащая 66 объектов, автоматизировано пополняет Базу Данных ОФЭРНиО, подвергаясь обработке программой black_list_maker_v_1 [5], позволяющей:

• отсеять повторные записи для очистки массива исходных записей Базы Данных;

• удалить из текстовых полей Базы Данных невидимых, не читаемых символов: наподобие табуляции, перевода строки возврата каретки, букв русского и английского языков одинакового написания - очистка данных (Рис. 3, шаг 3).

В настоящее время эта программа используется для формирования Базы Данных ОФЭРНиО; формирования «черных списков» - списков допущенных к регистрации, но незарегистрированных авторами ЭОР; для организации семантического поиска информации в Базе Данных ОФЭРНиО.

Рис.3 Последовательность процесса обработки исходной информации

Применение механизмов ЕТЬ и маппирования к данным из целевой системы (Рис. 3., шаг 4), отличительная черта которых - направленность на пакетную обработку данных, улучшают значения следующих показателей системы автоматизированной аналитики ЭОР ОО:

• время сбора и обработки первичной исходной информации;

• повышение качества исходной информации (RowData);

• повышение качества выходной аналитической информации (QeanData);

• время, затрачиваемое на информационно-аналитическую деятельность;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• время на представление информации в публичном или закрытом информационном пространстве;

• визуализация динамических изменений в процессах создания ЭОР в наблюдаемых образовательных организациях.

Рис. 4 Алгоритм обработки информации целевой системы для автоматизированной аналитической системы ЭОР ОО

Полученная на выходе процесса обработки исходной информации агрегированная информация подлежит обработке программой collector_stat [6], позволяющей осуществить статистическую обработку Базы Данных ОФЭРНиО в целях анализа электронных образовательных ресурсов образовательной организации по 46 показателям.

В рамках разработки автоматизированной аналитической системы выделены следующие функциональные подсистемы, которые в соответствии с совершенствованием методологии обработки данных о ЭОР образовательных организаций подлежат процессу модернизации (Табл. 1):

Таблица 1.

Состав автоматизированной аналитической системы ЭОР образовательных

организаций

ПОДСИСТЕМА ЗАДАЧИ

Подсистема сбора, формирования исходных данных, прохождение первого уровня валидации Разработка и модернизация программы автоматизированной подготовки документов к регистрации RegOFERNiO, разработка автоматизированного функционала защиты и валидации данных на первом уровне проверки Разработка/доработка необходимого функционала формирования данных для достижения целей автоматизированной аналитической системы ЭОР ОО

Подсистема сбора, обработки и валидации данных на 2-ом уровне после загрузки из первичных источников для загрузки в централизованное хранилище данных Автоматизация процедур сбора данных из систем источников, загрузка данных в область временного, хранения

Обработка и преобразование и автоматизация валидации извлечённых данных, выявление некорректных записей, для дальнейшей корректировки несоответствий. Разработка/доработка/модернизация программного обеспечения collector_stat. для достижения целей системы онлайн-мониторинга ОУ

Разработка программного обеспечения collector_stat с добавлением функционала формирования и преобразования исходных данных в шаблоны формата HTML, для формирования контента аналитико-динамических витрин, агрегированных данных

Подсистема обеспечения доступа к контенту аналитико-динамических витрин автоматизированной аналитической системы ЭОР ОО на стороне сервера Разработка серверных подсистем контейнеров для приёма, хранения, обеспечения доступа и визуализации данных системы онлайн-мониторинга ОУ

Подсистема загрузки/выгрузки данных в/из централизованного хранилища, обеспечение валидации на 3-ем уровне Разработка механизмов для выявления некорректных записей в централизованном хранилище на стороне сервера. Корректировка и приведение данных на стороне сервера в централизованном хранилище в корректное состояние

Разработка программного обеспечения выгрузки данных со стороны сервера

Доработка и модернизация программного обеспечения механизмов валидации данных при загрузке данных на сервер

В рамках проекта, в 2017 году, был разработан исследовательский прототип автоматизированной аналитической системы ЭОР ОО на примере Омского государственного технического университета, который позволил уточнить многие позиции обработки исходной информации, включая визуализацию результатов работы системы. Ниже представлены скриншоты web-страниц портала с исследовательским прототипом ААС ЭОР ОО

Рис. 5 Исследовательский прототип автоматизированной аналитической системы электронных образовательных ресурсов образовательной организации, размещенный на портале ОФЭРНиО (главная страница)

Рис. 6 Первый динамический экран визуализации результатов работы системы автоматизированной аналитики ЭОР ОО

Заключение

Резюмируя все вышесказанное, формируются следующие выводы:

1. С 2016 года электронные образовательные ресурсы являются показателями мониторинга образовательных организаций.

2. Электронные образовательные ресурсы регистрируются в ОФЭРНиО на основании комплекта документов, описывающих их.

3. Информация в документах на регистрацию ЭОР является слабоструктурированной, что потребовало разработки программного обеспечения, осуществляющего структурирование, унификацию, стандартизацию, очистку, маппирование, валидацию, агрегирование информации для статистической и динамической ее обработки в целях мониторинга образовательных организаций по ЭОР по 46 срезам Базы Данных ОФЭРНиО в режиме реального времени.

Литература

1. Приказ Министерства образования и науки Российской Федерации от 09.11.2016 г. № 1399 "О внесении изменений в показатели мониторинга системы образования, утвержденный приказом Министерства образования и науки Российской Федерации от 15 января 2014 г. № 14"

2. Постановление Правительства Российской Федерации № 376 от 31 марта 2017 года

3. Постановление от 25 августа 2017 года №1007.

4. Галкина А.И., Гришан И.А. Программа RegOFERNiO /М.: ЦИТИС - № 50201000683 от 30.04.2010

5. Галкина А.И., Гришан И.А. Программа black_list_maker v. 1.0 /М.: ЦИТИС - № АААА-А17-117041810029-2 от 30.01.2018

6. Галкина А.И., Гришан И.А. Программа collector_stat v. 1.0 /М.: ЦИТИС - № АААА-А17-117041810029-2 от 23.10.2017

i Надоели баннеры? Вы всегда можете отключить рекламу.