УДК 65.011.56, 65.012.226
М. П. Головин, А. А. Городилов, Ю. Ю. Якунин, Е. А. Юдкин СТРУКТУРА ДАННЫХ ДЛЯ ПРЕДСТАВЛЕНИЯ ОТЧЕТОВ
Рассмотрены принципы организации и представления данных отчетов разных видов для хранения и последующей обработки математическими методами.
В государственных организациях и крупных бизнес-структурах существуют достаточно большие объемы документооборота, в том числе и отчетных данных. Отчеты, как правило, делятся на три уровня: отчеты, собираемые с подведомственных учреждений; отчеты, подготавливаемые внутри организации; отчеты для внешних структур.
Существующие системы документооборота позволяют решить только часть задач, связанных с автоматизацией процессов подготовки, согласования, контроля и хранения документов. Как правило, такие системы имеют документно-ориентированную структуру хранения данных. Такая структура данных значительно затрудняет и делает практически невозможной обработку собираемых отчетных данных. Так, эти данные сводятся вручную в общие формы, также вручную переносятся в отчеты с новым содержанием или формой, что не позволяет проводить их статистическую обработку.
Для решения этой проблемы в Политехническом институте Сибирского федерального университета по контракту с Агентством профессионального образования и науки (АПОН) администрации Красноярского края была разработана АИС «Профобразование» [1], нацеленная на решение задачи сбора данных с учреждений профобразования, аккумуляции этих данных в АОН для их последующей обработки и мониторинга процессов.
Одной из важных задач, решаемых АИС «Профобразование», является оперативное формирование отчетов по запросам вышестоящих организаций, где форма запроса может носить непериодический и произвольный характер. Для их удовлетворения в сжатые сроки необхо-
димо иметь единую базу данных по всем учреждениям. Кроме решения задачи сбора данных и формирования сводных отчетов, АИС «Профобразование» также позволит решить задачу получения любых данных, имеющихся в базе данных АПОН за любой период (по месяцам, кварталам, годам). Эти данные в дальнейшем могут быть использованы и для других целей, например для прогнозирования потребности в профессиональных кадрах [2].
Структура отчета. Для формирования отчетов различной структуры был выполнен анализ форм отчетов, собираемых АПОН. В ходе анализа выявлены следующие компоненты структуры отчетов:
- титульный лист (представляет общую информацию об объекте и периоде);
- раздел отчета (делит отчет на логические части);
- таблица раздела (содержит структуру и данные);
- классификатор (это составной элемент таблицы);
- показатель (также составной элемент таблицы).
Классификаторы. Классификатор (справочник) - качественная (аналитическая) характеристика объекта. Классификатор представляет собой набор связанных объектов или таблиц, состоящих из произвольного количества атрибутов и связей. В качестве примера приведем два связанных между собой классификатора -«Направление подготовки» и «Специальность подготовки» (рис. 1, 2). В данном примере связь производится по коду направления.
Каждый атрибут классификатора может иметь собственный тип данных (например, целые числа, вещественные числа, дату, время и т. д.). Структура классификато-
Код Название Укрупненная группа
Математика 01
0102 Математика. Прикладная математика 01
0103 Математика. Компьютерные науки 01
0104 Информационные технологии 01
0105 Прикладная математика и информатика 01
01 ое Прикладная математика и Физика 01
0107 Физика 01
0108 Радиофизика 01
01ОЭ Механика 01
0110 Механика. Прикладная математика 01
0201 Химия 02
0202 Биология 02
0203 Геология 02
0204 География 02
0205 География и картография 02
0206 Г идрометеорология 02
0207 Почвоведение 02
0208 Экология и природопользование 02
0301 Философия 03
0302 Политология 03
Рис. 1. Направление подготовки 23
ров и связей между ними может задаваться в произвольной форме.
Показатели. Показатель - количественная характеристика объекта. Показатель представляет собой иерархическую структуру и может носить произвольный характер (рис. 3).
Обозначим структуру показателей следующим образом (рис. 4).
Индексом в верхней части показателя обозначается уровень иерархии (или вложенности) показателя. Так, показатель с индексом 1 находится на самом верхнем уровне и не входит в состав других показателей, а показатель с индексом т находится на т-м уровне иерархии и подчиняется показателю с индексом т - 1.
Индекс в нижней части справа обозначает номер показателя в составе другого показателя или нумерацию показателей высшего уровня. Индексом в нижней части слева обозначается номер родительского показателя (индекс снизу справа), в состав которого он входит. Если этот индекс равен нулю, значит у этого показателя нет родителя, т. е. он не входит в состав другого показателя.
Показатели могут иметь любое количество уровней иерархии и любое количество элементов на уровне. В дальнейшем показатели будут обозначаться буквой П.
Каждый показатель может иметь собственный тип данных, как и значения классификаторов. В отличие от классификаторов, показатели могут иметь списочный тип, который представляет собой список строковых зна-
чений. Показателям с таким типом ставится в соответствие одно строковое значение списка.
Каждый показатель принадлежит какой-либо категории. Структура категорий имеет структуру, аналогичную структуре самих показателей.
Рис. 4. Иерархическая структура показателей
Объекты и периоды. Под объектом будем понимать любую структурную единицу в регионе, которая представляет статистические данные. В общем случае объект является классификатором. В частном случае это могут быть, например, учреждения профобразования (рис. 5).
Период - временной промежуток, имеющий дату начала и окончания, который может измеряться в днях, месяцах, кварталах и годах. Каждый элемент данных объекта соответствует какому-либо промежутку времени. Такое
Код И Название Направление подготовки
010100 Математика 0101
010101 Математика 0101
010200 Математика. Прикладная математика 0102
010300 Математика Компьютерные науки 0103
010400 Информационные технологии 0104
010500 Прикладная математика и информатика 0105
010501 Прикладная математика и информатика 0105
010502 Прикладная магемагика(по областям) 0105
010503 Математическое обеспечение и администрирование информационных систем 0105
010600 Прикладные математика и Физика 0106
010700 Физика 0107
010701 Физика 0107
010702 Астрономия 0107
010703 Физика Земли и планет 0107
010704 Физика конденсированного состояния вещества 0107
Рис. 2. Специальность подготовки
- ,
- “t
Выбыло учащихся, всего
В- "Г и-
Выбыло учащихся по болезни, всего (комплексный показатель)
“Т Выбыло учащихся по болезни, вечерние (сменные) профессиональные училища и отделения
Выбыло учащихся по болезни, дневные образовательные учреждения, всего (комплексный показатель)
Выбыло учащихся по болезни, переподготовки механизаторских кадров “Т Выбыло учащихся по болезни, подготовка водителей для Вооруженных Сил РФ Выбыло учащихся по болезни, профессиональные училища в И ТУ Минюста России Выбыло учащихся по болезни, специальные профессиональные училища Выбыло учащихся по другим причинам, всего (комплексный показатель)
Выбыло учащихся по другим причинам, вечерние (сменные) профессиональные училища и отделения £ Выбыло учащихся по другим причинам, дневные образовательные учреждения, всего (комплексный показатель) “Т Выбыло учащихся по другим причинам, переподготовки механизаторских кадров
Выбыло учащихся по другим причинам, подготовка водителей для Вооруженных Сил РФ ^ Выбыло учащихся по другим причинам, профессиональные училища в ИТУ Минюста России “Т Выбыло учащихся по другим причинам, специальные профессиональные училища Выбыло учащихся, вечерние (сменные) профессиональные училища и отделения Выбыло учащихся, дневные образовательные учреждения, всего
Рис. 3. Пример структуры показателей
соответствие позволяет выполнять анализ в функции времени.
Таблицы. Таблица - это совокупность показателей, значений классификаторов и значений их пересечений. Столбцы таблицы представляют собой набор показателей в вертикальной иерархии и значения классификаторов, каждое из которых, является дочерним по отношению к показателям (рис. 6). А у показателя дочерними могут быть значения только одного классификатора.
Строки таблицы представляют собой совокупность показателей, классификаторов и их значений (см. таблицу).
Возможны три варианта структуры строк таблицы:
- показатели без классификаторов;
- классификаторы без показателей;
- совокупность показателей и справочников.
Значения таблицы соответствуют пересечению столбцов
и строк. Приведем пример таблицы, сочетающей в себе все варианты пересечений (рис. 7). Столбцы таблицы состоят из показателей (2, 6, 7, 8) и справочников (3, 4, 5). Показатель «В том числе по профессиям» (7, 8) является двухуровневым и состоит из значений классификатора «Профессии НПО».
Таким образом, проведенный авторами анализ структур отчетов позволил разработать следующие системы:
- универсальную систему хранения классификаторов с динамически создаваемой структурой данных и связей между ними;
- систему показателей, позволяющую хранить любую иерархическую структуру с неограниченным количеством вложений;
- систему формирования отчетов, оперирующую классификаторами и показателями и позволяющую динамически задавать структуру отчетов;
- систему формирования сводных отчетов, позволяющую просматривать собранные данные и динамически формировать отчеты по показателям, справочникам, учреждениям, периодам.
п
п,к-
/1\
Рис. 6. Связь показателей 2-го уровня со значениями классификатора
0*2 о*2 31 , 32 , 33
Полное наименование Краткое Наиь И ндекс ИНН Адрес Г ород Регион
Профессиональное училище № 59 ПУ-59 6Є3230 2437010606 ул. Дружбы народ ов,18 Т уруканск Красноярский край
Профессиональное училище № 6 ПУ-Є 603800 2415002023 ул.Красная,53 Иланский Красноярский край
Профессиональное училище № 60 ПУ-Є0 683613 2440000244 ул. ЭйдеманаЛ 7 Канск Красноярский край
Профессиональное училище № 61 ПУ-61 682600 2425004340 ул. 0 ктябрьская,62 Минусинск Красноярский край
Профессиональное училище № 62 ПУ-62 6Є2200 2427000380 ул.Курчатова,2 Назарово Красноярский край
Профессиональное училище № 63 ПУ-ЄЗ 683920 2440000686 ул.Трактовая,9 Уяр Красноярский край
Профессиональное училище № 65 ПУ-65 682110 2409002025 ул.Восточная,55 Большой Улуй Красноярский край
Профессиональное училище № 66 ПУ-6Є 683430 2407004490 ул. П артизанская,41 Богучаны Красноярский край
Профессиональное училище № 67 ПУ-67 6Є3491 2420005887 ул.Колисниченко,10 Кодинск Красноярский край
Профессиональное училище № 68 ПУ-68 683974 2448001466 ул. Стуаенческая/1 А Ирша Красноярский край
Профессиональное училище № 69 ПУ-69 683830 2428002165 ул.Лазо,43 Красноярск Красноярский край
Профессиональное училище № 7 ПУ-7 682020 2444002229 ул.Деповская,3 Б огогол Красноярский край
Профессиональное училище № 70 ПУ-70 683716 2410000061 ул. Ц ентральная,45 Шеломки Красноярский край
Рис. 5. Пример объектов (учреждения профобразования)
Структура строк таблицы
Показатели Классификаторы
К К 2
Пі з? з!д М 311,2 зі2 М
П 2 321 31 32Л 32 32,2 31 322 32
№ строки Показатель Вид собственности организации Название отр а ели Наименование предприятия Кол-во человек В то м числе п о пр о фессиям:
Автомеханик Водитель кат. В
1 2 3 4 5 6 7 8
01 Него сударственный Транспорт ООО " Элис" 15 7 8
02 Него сударственный Транспорт ООО"Зенит-м" 17 4 13
03 Выпущенн 0, направленно на работу Него сударственный Транспорт ООО " Элис" 5 1 4
04 Него сударственный Транспорт ООО"Зенит-м" 6 3 3
05 Поступило на учебу в вузы Г о суд ар ств енный Транспорт КГТУ 5 1 4
Г о суд ар ств енный Транспорт СибГАУ 7 4 3
Об Призвано на военную слубу 6 4 2
Рис. 7. Таблица отчета «Выпуск и направление учащихся» 25
Разработанная структура отчетных данных легла в основу создания структуры сводных отчетов и логической структуры базы данных для АИС «Профобразование».
Библиографический список
1. Техническое задание на разработку автоматизированной информационной системы мониторинга состоя-
ния готовности учреждений начального и среднего профессионального образования к переводу в форму негосударственных организаций : отчет о НИР : № 113 6у / Сиб. федер. ун-т , Политехн. ин-т ; рук. М. П. Головин. Красноярск, 2006.
2. Рынок труда и рынок образовательных услуг в субъектах Российской Федерации / В. Н. Васильев, В. А. Гуров, Е. А. Питухин [и др.]. М. : Техносфера, 2006.
M. P. Golovin, A. A. Gorodilov, Yu. Yu. Yakunin, E. A. Yudkin
STRUCTURE OF DATA FOR REPORT REPRESENTATION
It is considered the principles of organization and presentation of various reports data for filing and the foolowing mathematical analysis.
ХЦК 681.3
П. В. Зеленков, И. В. Ковалев, М. В. Карасева, С. В. Рогов
МУЛЬТИЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ РАСПРЕДЕЛЕННОЙ СИСТЕМЫ НА ОСНОВЕ ТЕЗАУРУСА
Предложена модель, решающая проблему одноязычного представления информации в информационно-управ-ляющих системах и проблему организации, хранения и обработки информации в современных распределенных мультилингвистических корпоративных системах поддержки принятия решений.
В настоящее время разработано множество моделей для представления распределенных систем (РС) вычисления и обработки информации. Их частными случаями являются информационные системы, корпоративные информационные системы и интенсивно развивающиеся системы поддержки принятия решений. Одним из перспективных направлений при создании новых моделей распределенных систем является применение словарей, или тезаурусов. Однако большинство этих моделей строится на основе одноязычного представления информации или учитывает многоязычность неявно.
Авторами была разработана модель РС, использующая тезаурусы, выполненные на основе мультилингвис-тической технологии [1]. Эта технология направлена в первую очередь на решение проблемы многоязычного представления информации в информационно-управля-ющих системах [2], поскольку в современных условиях даже небольшие корпоративные информационные системы, как правило, уже работают в мультилингвистичес-ком режиме.
Рассмотрим следующее определение мультилингви-стического тезауруса Т слов Т. (где i - языковое множество; у - терм в языковом множестве), сформированное на базе положений, представленных ниже и отвечающих следующим условиям:
1) имеется непустое подмножество Т с Т, называемое множеством дескрипторов;
2) имеется симметричное транзитивное рефлексивное отношение К с ТхТ, такое, что:
- ti * ti2 л tiRti2 ^ (t,i е Т0) v (^2 е 70);
- t,i е То ^ (3ti е
Отношение R называется синонимическим отношением, а слова t , t. , отвечающие этому отношению, - это синонимические дескрипторы;
3) имеется транзитивное и несимметричное отношение К с Т X T, называемое обобщающим отношением.
В случае если два дескриптора t , t удовлетворяют отношению t e t , то полагается, что дескриптор t более общий, чем дескриптор ti2.
Элементы множества Т/Т называются множеством
о
аскрипторов.
Таким образом, информационную систему с применением тезауруса можно представить в виде четверки (Т, D,, М, 5), где Т - мультилингвистический тезаурус с дескрипторным множеством Т; D. - коллекция разноязычных документов; М. - множество разноязычных вопросов; 5 ^ 2D - отображение, сопоставляющее каждому независимому от языковой принадлежности вопросу множество разноязычных документов.
Пусть описание любого документа d. е D. представлено в виде
t(d)=(ti, hv •••, tJ
и удовлетворяет условию: ни один из двух дескрипторов не встречаются в одном t.(d.), если они удовлетворяют отношению К.
Можно также считать, что каждый вопрос m. е M. представлен в форме, аналогичной описанию разноязычных документов.