Научная статья на тему 'Механизмы обработки информации в системах с изменяющимися во времени схемами описания данных'

Механизмы обработки информации в системах с изменяющимися во времени схемами описания данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
86
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Квасов Д. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Механизмы обработки информации в системах с изменяющимися во времени схемами описания данных»

• интегральная форма F(t) - функция распределения:

F(t)=P(t* <t)=Jf(t)dt=1 ~A(m'mM) . (2) о A(m)

В (1,2) t, t* - неслучайная и случайная величины; Р - оператор вероятности; m =T2/D - порядок распределения закона Эрланга (D - дисперсия случайной величины); h=1/T - параметр распределения (Т - математическое ожидание случайной величины).

Гамма-функция A(m) находится по формуле:

A(m)=Jzm-1 -e~zdz .

(3)

Неполная гамма-функция A(m,x ) находится по формуле:

A(m,x)=Jzm-1 e~zdz ,

(4)

где параметр x в нашем случае принимает значение x=mht.

Введем обозначение

A(m,x)_ A(m,mht) V(t)=- ~

(5)

A(m) A(m)

тогда функция распределения (2) принимает вид: F(t)=1-V(t). (6)

Для вычисления функции (5) существует специальная таблица, а также разработаны алгоритмы, позволяющие рассчитать ее при любых значениях аргументов т, h и t.

С целью практического использования закона

распределения Эрланга и для оценки вероятностных характеристик совокупности эмпирических данных, являющихся реализациями непрерывной случайной величины, по этим данным необходимо определить следующие числовые характеристики: Т , В и т - оценки математического ожидания, дисперсии и порядка распределения Эрланга соответственно.

Для определения оценок Г и В при большом (несколько десятков) количестве наблюдений N в математической статистике применяются следующие формулы:

1 N 1 N 2

Т=-% ; В=а1 =—Т(ь -т) . (7) N1=1' 8 N-1^ ' '

Полученные по зависимостям (7) значения Т и В позволяют оценить порядок распределения

Т)2

Эрланга по формуле: тп-

D

(8)

Практическая ценность изложенного метода заключается в возможности использования его для аппроксимации достаточно широкого круга эмпирических распределений, каждое из которых характеризуется своим порядком распределения т. При т=1 - экспоненциальное распределение; при 0 < т < 1 - распределение с дисперсией (неравномерностью) больше, чем в экспоненциальном распределении; при т~8 - распределение, близкое к нормальному, а при т дисперсия убывает до нуля, и распределение стремится к закону единичной функции, характеризующей неслучайную величину.

о

x

МЕХАНИЗМЫ ОБРАБОТКИ ИНФОРМАЦИИ В СИСТЕМАХ С ИЗМЕНЯЮЩИМИСЯ ВО ВРЕМЕНИ СХЕМАМИ ОПИСАНИЯ ДАННЫХ

Д.С. Квасов, к.т.н. (Владимирский государственный университет)

Огромное количество существующих в настоящее информационных систем функционирует на основе так называемых классификаторов - линейных или древовидных списков параметров, позволяющих описывать информацию с некоторой точки зрения.

Одной из основных особенностей по обработке информации, которую должна учитывать подобная система, является периодическое изменение схем, описывающих данные. Под схемой понимается совокупность параметров определяющих некоторый информационный срез. Следует учитывать, что в каждый момент времени данные должны представляться в соответствии с актуальным на данный период классификатором и со связанной с ним схемой. При этом должна присутствовать возможность сопоставления информации

за разные исторические периоды. В настоящей статье предлагается один из вариантов решения данной проблемы.

Под классификацией будем понимать группу классификаторов, описывающих одну и ту же информацию, но в разные временные периоды.

Выделим два вида классификаций:

• базовые классификации, содержащие условно постоянную информацию (к таким классификациям относятся в первую очередь те, которые идентифицируют временную принадлежность различных данных: «года», «периоды»);

• классификации, содержащие периодически изменяемую информацию.

Классификаторы, входящие в состав одной и той же классификации могут различаться как структурой, так и своим содержанием. Базовые

классификации представлены единственным классификатором, практически не изменяющимся с течением времени (возможно только его дополнение, а изменение информации в нем или ее удаление запрещено).

Определяющим атрибутом классификатора, является его период действия - временной интервал, заключенный между датой начала периода 1р

и датой конца 1ц , р <ц . Период действия уникальным образом идентифицирует классификатор, с его помощью задается порядок на множестве группы. Классификатор А предшествует классификатору В, в этом случае А и В имеют смежные периоды: и [t1,tr] соответственно,

р <ц <г . Исключено существование классификаторов с пересекающимися периодами действия. Таким образом, объединение периодов действия классификаторов дает непрерывный период существования группы [t0,T ] .

Содержание классификатора будем определять конечным множеством кодов. Код имеет основное числовое представление (код может быть представлен буквенно-цифровой комбинацией, составленной по определенным правилам), задающее его уникальность в пределах классификатора и строковую расшифровку в виде наименования. Систему кодов предлагается задавать в виде иерархической структуры (конкретное правило формирования кода можно задавать в зависимости от смысловой нагрузки классификаторов).

Ассоциация классификаторов - это необходимый механизм для осуществления связи систем кодов двух классификаторов. Имеет смысл ассоциировать классификаторы, имеющие единую структуру данных, то есть принадлежащие одной классификации. Кроме того, эти классификаторы должны иметь соприкасающиеся периоды, иначе говоря, быть смежными.

Ассоциирование должно выполняться по принципу «один-к-одному», это означает, что код одного классификатора может быть связан только одним кодом другого классификатора. Соблюдение данного принципа связано с необходимостью ассоциации несмежных классификаторов транзи-тивно через последовательность смежных.

Таким образом, задача ассоциации двух классификаторов А={а1,...,ап} и В={Ъ1,...,Ът} состоит в задании бинарного отношения между множествами их кодов: Я с Ах В .

Для этого отношения необходимо выполнение условия, чтобы любой элемент из области определения отношения В(Я) был связан отношением с одним и только одним элементом области значений Е(Я) и наоборот. Другими словами, отношение должно быть биективным: (аЯЬ )л ( аЯЪ')« Ь = Ь'; (аЯЬ )л (аЯЬ )« а=а .

Возможны различные варианты задания отношения ассоциации классификаторов, среди которых выделяются: прямая ассоциация по числовому коду, косвенная и смешанная ассоциации.

Прямая ассоциация по числовому коду. Как правило, числовое представление кода классификации не меняется в течение длительного периода. Принимая во внимание его уникальность в рамках самого классификатора, приемлемо задание ассоциации по равенству этих числовых кодов. Отличительной особенностью данного способа ассоциации является то, что, он имеет достаточно простую реализацию на практике и предоставляет быстрый алгоритм связывания классификаторов.

Косвенная ассоциация. При вводе в действие с какого-либо периода классификатора с новой системой кодов становится невозможным задание прямой ассоциации. Поэтому возникает потребность задания отношения косвенно. При этом отношение может быть задано таблично, по смысловой нагрузке, возложенной на наименование строки классификатора. Следовательно, таблица отношения может быть получена по соответствию наименований кодов классификаторов. Задача соответствия наименований разрешается с помощью оценки релевантности символьных строк.

Смешанная ассоциация. Слияние двух описанных ранее подходов при задании отношения делает механизм ассоциации наиболее гибким. Приоритет между вариантами должен устанавливаться в зависимости от конкретной ситуации.

Для выбора актуального классификатора, необходимого как для представления данных, так и для построения цепочки ассоциаций, предлагается ряд правил.

Чтобы выбрать из группы классификатор, необходимо знать временной интервал, за который требуются данные. Для определения данного интервала используется механизм пересечения базовых классификаторов. Базовый классификатор входит в состав базовой классификации и является у нее единственным. Особенность построения базового классификатора заключается в том, что он не имеет периода действия (является бессрочным), однако каждая его строка имеет свой период действия. Периоды действия строк в пределах одного классификатора могут пересекаться. Периоды действия строк и периоды действия справочников существенно различаются, если у классификатора период задается с помощью двух полных дат (день, месяц, год), то у строки базового справочника даты могут быть неполными (например, 1 августа -31 августа, без указания года и т.п.)

При определении параметров отбора надо учитывать, чтобы среди них обязательно были базовые классификации. Условием достаточности количества привязанных базовых классификаций является то, что в пересечении периодов строк базовых классификаторов образуется временной ин-

тервал, у которого начальная и конечная даты полные (день, месяц, год). В соответствии с полученным интервалом и будет отобран соответствующий ему классификатор.

Таким образом, предложенный вариант позволяет достаточно эффективно учитывать изменения классификаторов и связанных с ними схем с течением времени.

РАЗРАБОТКА ПРОГРАММ ДЛЯ МОНИТОРИНГА ФИНАНСОВОЙ ДОКУМЕНТАЦИИ В СИСТЕМЕ ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ

Н.Н. Николаев, О.В. Андреев, д.х.н. (Институт дистанционного образования, г. Тюмень)

Система дистанционного образования переживает подъем. Например, в 2000-2001 учебном году в Тюменском государственном университете (ТюмГУ) принято 230 человек для обучения на основе дистанционных методов. В следующем году контингент дистанционно обучающихся студентов составил 709 человек, а еще через год он увеличился до 1648 человек. Возрос и преподавательский состав, возникли сложности с учетом данных об оплате преподавательского труда. Появилась необходимость в специальном программном обеспечении для ведения электронного документооборота.

Введение электронной документации обеспечивает: экономию времени на создание документа, оперативность и достоверность представления нужных документов, уменьшение расходов на управление за счет высвобождения людских ресурсов, возможность работы с документами дистанционно (Власов А. И. Лыткин С.Л. Краткое практическое руководство разработчика информационных систем на базе СУБД Oracle. // Библ. журн. "Информационные технологии". М., 2000).

При ведении бумажных архивов трудно отследить данные об оплате труда преподавателей. В институте дистанционного образования (ИДО) ТюмГУ реализована уникальная система расчета, в которой учитывается место проведения занятия, звание и научная степень преподавателя и т.д. Сложность ручного ведения архивов, нестандартная система расчета оплат выявляют необходимость локальной автоматизации работы отдела экономического анализа и финансового контроля (ОЭАиФК). Существующие программные модули требуют индивидуальной настройки и не подходят для информатизации для разработанной системы оплаты труда. Объект автоматизации - ОЭАиФК, предмет автоматизации - первичная финансовая документация об оказании образовательных услуг преподавателями по программам, реализуемым с применением дистанционных образовательных технологий (ДОТ) для ИДО.

Целью работы было проектирование и написание комплекса программ для автоматизации работы специалистов ОЭАиФК по актам от преподавателей. Для этого проведено предпроектное обследование ОЭАиФК в виде опроса сотрудни-

ков экономического отдела на предмет сбора требований к разработчикам и учета специфических особенностей учета первичной финансовой документации. В результате был составлен список необходимых задач:

1) учет документооборота первичной документации от преподавателей:

- проектирование реляционной структуры предметной области: виды услуг по программам, реализуемым с использованием ДОТ, сведения о контрактах преподавателей с ИДО, акты приема-передачи услуг, расценки по видам услуг;

- ввод исходных данных предметной области: данные о преподавателях, данные о контрактах; данные о расценках по видам услуг;

- создание форм ввода первичной информации: акта приема-передачи (предоставления) услуг с расшифровкой аудиторных занятий, акта приема-передачи (предоставления) услуг по программам, реализуемым с применением ДОТ;

2) мониторинг движения средств: создание формы с таблицей вывода совокупных данных;

3) распечатка архивной документации согласно утвержденным формам актов приема-передачи (предоставления) услуг:

- формы акта приема-передачи (предоставления) услуг с расшифровкой аудиторных занятий;

- формы акта приема-передачи (предоставления) услуг по программам, реализуемым с применением ДОТ.

Сумма оплаты работы преподавателя рассчитывается одним из следующих способов:

1) умножение количества часов работы преподавателя на коэффициент, хранимый в базе данных, который характеризуется набором атрибутов: {degree, status, type_work, town}, где degree - научное звание преподавателя, status - научная степень преподавателя, type_work - тип работы (проведение лекций, семинаров, практикумов и т.д.), town - населенный пункт, в котором проведена работа;

2) умножение типа работы преподавателя (проверка курсовых, создание тестов и т.д.) на объем выполненной преподавателем работы.

Основой информационной системы служит специально разработанный комплекс, реализую-

i Надоели баннеры? Вы всегда можете отключить рекламу.