Автоматика. Информатика. Управление. Приборы
УДК 004.9
Б01: 10.17277/уе81тк.2018.03.рр.382-399
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОБРАБОТКИ ИНФОРМАЦИИ В СИСТЕМЕ УПРАВЛЕНИЯ ЭЛЕКТРОННЫМ ДОКУМЕНТООБОРОТОМ
М. Н. Краснянский1, А. Д. Обухов1, И. Л. Коробова2
Кафедры: «Компьютерно-интегрированные системы в машиностроении» (1), «Системы автоматизированной поддержки принятия решений» (2), ФГБОУВО «ТГТУ», г. Тамбов, Россия; [email protected]
Ключевые слова: математическое моделирование; многоуровневые графы; обработка документов; система электронного документооборота; электронный документооборот.
Аннотация: Разработана математическая модель обработки информации в системах управления электронным документооборотом (СУЭД). Модель используется для формализации структуры документов и их жизненного цикла, оптимизации процессов обработки, взаимодействия и движения документов с учетом факторов адаптации СУЭД под структуру деятельности пользователей при работе с документами и позволяет осуществить теоретико-множественный анализ процессов обработки информации и их реализацию в алгоритмическом и программном обеспечении. Впервые представлена модель многоуровневых графов обработки информации, используемая для формализации информационных потоков в системе документооборота.
Введение
Системы управления электронным документооборотом (СУЭД) получили широкое распространение за счет постоянно растущих объемов информации, высоких требований к надежности хранения, скорости обработки и передачи данных, необходимости перехода от бумажного документооборота к электронному [1]. Реализация масштабных, сложноорганизованных СУЭД является трудоемким и длительным процессом, требующим значительного количества ресурсов. Их развитие и адаптация под конкретные задачи, разработка универсальных проектных решений с использованием передовых информационных технологий становится актуальной задачей, решить которую без использования методов системного анализа и математического моделирования невозможно [2 - 5].
Однако на текущем уровне развития информационных технологий разработка достаточно эффективных СУЭД уже не является трудновыполнимой задачей с инженерной точки зрения. Поэтому получение наиболее оптимальных в плане производительности и экономической эффективности информационных систем невозможно без этапа математического моделирования, подробной формализации объектов и процессов документооборота, их оптимизации на этапе проектирования информационной системы.
Одним из ключевых вопросов при разработке СУЭД является реализация необходимого набора операций обработки данных, поэтому еще на этапе математического моделирования СУЭД важно четко представлять какие операции над документами будут реализованы в информационной системе и каким способом. Для этого требуется проанализировать информационные потоки организации, выделить основные этапы жизненных циклов документов, операции, приводящие к смене их состояний и перемещению от одного исполнителя к другому. Подобного рода формализация требует разработки соответствующей математической модели, учитывающей внутреннюю структуру документов и позволяющей сформулировать процесс изменения данных, движения информации в организации на различных уровнях масштабирования.
При проведении анализа подходов к моделированию процессов документооборота можно выделить основные типы математических моделей: теоретико-множественные; теоретико-графовые; автоматные; функциональные; дескриптор-ные; мультиагентные с определением их сильных и слабых сторон [6, 7]. На основе проведенного анализа сделано следующее заключение: модель обработки информации в СУЭД, построенная на основе теоретико-графовой модели, позволит формализовать и оптимизировать структуру документа, процессы его движения и взаимодействия с пользователями в рамках общей структуры документооборота, а также будет отличаться достаточной полнотой и универсальностью.
Исследования в области обработки документов в последние годы в основном посвящены применению машинного обучения для распознавания текста, классификации и поиска документов [8 - 12]. Данная задача, безусловно, является актуальной и станет темой дальнейших исследований в направлении обработки информации в СУЭД. Однако, по нашему мнению, необходимо прорабатывать вопросы именно фундаментальных исследований в области формализации обработки информации, разработки теоретической базы описания процессов движения и взаимодействия документов, а на ее основе осуществлять разработку подходов к применению машинного обучения для поиска, маршрутизации и классификации документов в СУЭД.
Рассмотрим математическую модель обработки информации в СУЭД, которая позволит провести теоретико-множественный анализ структуры документов, формализовать процесс движения документов на разных уровнях масштабирования и, наконец, сформировать общую структуру документооборота организации с учетом требований ко времени доставки документов.
Математическая модель обработки информации в СУЭД
Анализ подходов к моделированию обработки информации в СУЭД, формализации документов и процессов их взаимодействия и движения показал, что оптимальным подходом к решению данных задач является использование аппарата теорий множеств и графов, с помощью которого возможно четко сформулировать структуру документов, информационных потоков, документооборота организации в целом, после чего перейти к ее оптимизации.
Схема процессов обработки информации в СУЭД представлена на рис. 1. Таким образом, на основе входных данных о количестве документов, сроках работы с ними, перечне возможных операций над документами с учетом условий их доставки и факторов адаптации СУЭД под модель деятельности исполнителей необходимо сформировать структуру документооборота организации в формализованном виде, включающую множество операций обработки данных и структур информационных потоков на разных уровнях детализации.
— Число документов —
Предельные сроки работы с документами Перечень возможных
--Множество формализованных
операций над документами
Модель обработки _ Множество структур _
информации в СУЭД информационных потоков
_Структура электронного_
документооборота
операции над документами -Условия доставки документов -
—Условия адаптации под модель деятельности исполнителей—
Рис. 1. Схема процессов обработки документов в СУЭД
Представим математическую модель обработки информации MPI в СУЭД в кортежном виде [13 - 15]
MPI (U, P, O) = S, (1)
где S - структура электронного документооборота организации, под которой будем понимать формализованное представление в виде кортежной модели множества объектов документооборота U, меняющих свои состояния в результате проведения операций O множеством пользователей P;
S = (U, P, O, E, T, G ), (2)
где U = {щ|/ = 1, nU} - множество объектов документооборота (документов); P = = 1, nP} - множество пользователей; O = { ог|/ = 1, nO} - множество
операций, выполняемых над объектами; nU, nP, nO - общее число объектов, пользователей и операций соответственно; E - множество воздействий на объекты как внешних, так и внутренних; T - множество дискретных моментов времени; G - множество графов обработки информации в СУЭД.
Каждому документу ui соответствует некоторое множество состояний Ci ,
каждое из которых определяет содержимое и атрибуты объекта в определенный промежуток его жизненного цикла
щ ^ C, (3)
где Ci ={ сгу|у = 1, nCi} - множество состояний объекта ui, nCi - число таких состояний. Для обозначения состояния ciJ- документа ui, используемого при обработке данных в конкретных операциях, примем обозначение ui (ciJ- ). Каждое
состояние определяется как кортеж из множества атрибутов объекта и их значений в заданный промежуток времени Tcij
у
С j =1
: ({(агп . ¿]п )| агп 6 Аг . ¿г]п 6 Вг] .п = 1. Ыг }. ТСЦ ) . (4)
где Аг ={ аг-п | п = 1, пАг} - множество атрибутов объекта иг с соответствующим им множеством значений атрибутов рг = {Вц | ] = 1, пСг} для каждого состояния С]
Вц =Ц]п|п = йр]}. (5)
где пАг - число атрибутов объекта; ТС].. = {1т} - множество моментов времени, в которые существует состояние С] .
Воздействия разделяются на внешние EE и внутренние 1Е : E = EE 1Е. Внешние воздействия EE = {ее^ | ^ = 1, W е} включают в себя распоряжения министерств, новые законы и стандарты, заказы от сторонних организаций и прочие воздействия, осуществляемые извне. Внутренние воздействия 1Е = = 1, Wi}
формируются на основе внешних либо самостоятельно внутри организации. Воздействие направлено на получение конкретного результата - документа или некоторого их множества, которые удовлетворяют условиям, поставленным воздействием, что в общем виде можно представить следующим образом
= (и *, P*, O*,T *), (6)
где и*, Р*, O*, Т * - множества документов, пользователей, операций и временных ограничений, заданных воздействием соответственно.
Система управления электронным документооборотом накладывает особые требования к надежности хранения информации, что выражается в необходимости предоставления данных не только о текущем состоянии объекта, но и его прошлых и даже возможных состояниях. В качестве примера возможных состояний объекта могут выступать различные редакции документа либо набор необработанных данных, необходимый в дальнейшем при создании других документов. Совокупность всех этих состояний отражает жизненный цикл документа.
Структуру движения документа (то есть переход объекта из одного состояния в другое) опишем графическим способом при помощи ориентированных графов. Во-первых, это позволяет проследить весь жизненный цикл объекта, во-вторых, отобразить в удобной и понятной форме осуществляемые над объектом воздействия, и, наконец, такая форма наглядно показывает структуру документооборота в целом, позволяя выделить излишне перегруженные действиями участки [16, 17].
Однако процессы обработки информации не ограничиваются только жизненным циклом документов, поэтому предлагается использовать следующую модель многоуровневых графов для их формализации.
Первый уровень масштабирования - уровень обработки состояния документа, отражающий процессы перемещения информации в рамках одного состояния при выполнении конкретной операции (рис. 2, а). В формализованном виде граф
имеет следующий вид: О1 = {р^}, 0Ь]- = (с, О1).
Второй уровень масштабирования - уровень обработки жизненного цикла документа, отражающий процессы преобразования информации в документе при выполнении ряда операций, начиная с его создания и заканчивая уничтожением документа в рамках СУЭД (рис. 2, б). В формализованном виде принимает вид:
02 ={02,-}, 02,- = (с,, О2 ).
Третий уровень масштабирования - уровень обработки информационного потока, отражающий процессы создания, движения и уничтожения множества документов под влиянием некоторого множества воздействий Е, в результате которых заданным набором пользователей формируется необходимое подмножество документов требуемого типа (рис. 2, в). В формализованном виде принимает
вид: 03 = {03w}, ^ = (и,Е).
Четвертый уровень масштабирования - уровень обработки данных в информационном пространстве организации, отражающий процессы формирования, перенаправления, оптимизации информационных потоков, организации внутренних и внешних связей между ними под влиянием некоторого множества воздействий Е , в результате которого руководством организации формируется требуе-
мая структура документооборота (рис. 2, г). В формализованном виде такой граф можно представить следующим образом: О4 = {04^ }, р4к = (^, Е).
а)
б)
в)
Рис. 2. Модель многоуровневых графов обработки информации в СУЭД:
а, б - уровни обработки состояния и жизненного цикла документа соответственно; в, г - уровни обработки информационного потока и данных в информационном пространстве организации соответственно
Таким образом, становится возможным формализовать процессы движения и обработки информации на разных уровнях, начиная с самого низкого и заканчивая высшим - уровнем документооборота организации в целом. Отличительной особенностью представленной многоуровневой системы является то, что каждый из уровней - вершина в графе более высокого уровня, что позволяет отслеживать все процессы изменения информации в организации (и за ее пределами) за счет перемещения по графу как в пределах одного уровня, так и «поднимаясь» или «опускаясь» при необходимости на другие уровни.
Представленная модель многоуровневых графов отличается от их классического представления тем, что каждой вершине графа к-го уровня соответствует граф (к-1)-го уровня. Обозначим данные связи в общем виде следующим образом:
0к =(0Ук, 0Ек), 0Ук ^ 0к-1, (7)
где 0к - граф к-го уровня; 0¥к, 0Ек - вершина и ребро графа к-го уровня соответственно.
Классификация операций обработки документов в СУЭД
Множество операций, рассмотренных в статье, позволяет осуществлять смену состояний документа и выполнять поставленные внешними и внутренними воздействиями задачи. В формализованном виде сформулируем общий вид операций oi:
ol : (U,n'Prn, tl, ew ) ^ (Uout ^Pout, tl + Atl);
Uin = {иi I иi e U} Uout = {Ui I U e U *};
Pin = {lPq e P *}, Pout = {lPq e P *};
Atl < Ц *, Ц * e T*, ew =(U*,P*,O*,T *),
где Uin, Uout - множество документов на входе и выходе операции соответственно; Pn, Pout - множества пользователей отправителей (инициаторов операции) и получателей (исполнителей операции) соответственно; Ц, Ati, Ц * - моменты времени начала выполнения операции, общее время осуществления операции, максимальное время завершение операции соответственно; ew - воздействие (внешнее или внутреннее), в соответствие с которым осуществляется операция.
Представленное соотношение отражает общий вид операций над документами, однако, при создании СУЭД необходима реализация и, следовательно, формализация на этапе проектирования конкретных операций обработки информации. Их также можно классифицировать в зависимости от того уровня масштабирования обработки информации, к которому они относятся [18].
На первом уровне осуществляется работа непосредственно с информацией в рамках одного состояния документа, поэтому к данному классу операций
O1 e O будут относиться операции чтения o\ и редактирования oW данных. Рассмотрим их подробнее.
Операцией чтения данных o\ будем называть функцию, описывающую процесс чтения данных из состояния ciJ- объекта ui пользователем pq в некоторый буфер bf:
o1 : (ui (cij ), Pq, tl , ew )(bf Pq , tl + Atl ); bf = {(, di]n)} , {(, di]n)} e cl}; ui e U*, pq e P*, Atl < tl *, tt * e T*; ew = (U*,P*, O*, T *),
при ограничениях:
(10)
AL (, pq, o\ )> AL0 (o\ );
AV(,< read >) = True,
где AL(-) - функция, определяющая уровень доступа пользователя pq к объекту
ui при выполнении операции Ог. Уровень доступа может определяться различными соотношениями (например, на основе дискретной, атрибутной или ролевой моделей [19]); ALo() - требуемый уровень доступа для выполнения операции o\; A V(•) - функция, ставящая в соответствие атрибуту < read > объекта uj значения True или False.
Операцией редактирования данных oW будем называть функцию, описывающую процесс изменения данных в состоянии cjJ- объекта uj пользователем pq :
0W : (ui (Cj ), Pq , Ч , ew ) ^ (u (Cj ), Pq , Ч + Al ) ;
{(, djjn )}{(, d*jn )} {(, djjn )}e Cj, {(, d*n )}
ui e Uj, pq e P*, Atl < tl *, tl * e T*; ew = (U *, P*, С*, T *),
при ограничениях:
AL (uj, pq, 0W )> AL0 (0W );
A V (ui, < write >) = True,
e cu;
(11)
(12)
где функции AL и AV аналогичным способом осуществляют проверку уровня доступа пользователя к выполнению операции и атрибута объекта ui .
Ко второму уровню операций обработки данных относятся операции С2 e С, работающие уже с отдельными состояниями документа и формирующие его жизненный цикл, начиная от создания и заканчивая удалением из системы 2 2 2 2
документооборота: oa, od, ow, ou - операции создания объекта, сжатия состояний, сохранения изменений документа в новое состояние, объединения состояний соответственно.
Операцией создания объекта oa будем называть функцию добавления нового документа ui во множество объектов U, осуществленную пользователем pq
в соответствии с заданными множеством значений атрибутов Data * под влиянием воздействия ew :
ol : (Data*.Pq.tl.) ^ ( (СЛ).^out.tl +Atl);
(14)
ui ^ cib ci1 = ({(ain,di1n) I «in e Ai, di1n e Data*} ^); (13)
u e U*, Pq e P*, Pout e P*, At, < tt *, tt * e Г*; ew =(U *, P*, О*, T *).
Таким образом, пользователь , имея набор входных значений параметров объекта Data *, формирует новый объект ui в начальном состоянии сц. Данный объект должен принадлежать некоторому подмножеству объектов, необходимых для достижения результата воздействия ew. Далее документ отправляется множеству исполнителей Pout e P *, причем создатель документа также может принадлежать их числу (pq e Pout) •
Операция сжатия состояний о2 будет, в отличие от предыдущей, не расширять граф состояний документа, а сжимать его путем исключения лишних состояний с точки зрения некоторых правил. Данная операция осуществляется на основе
- п*
выделения некоторого подмножества удаляемых состояний Ci и их последующего исключения из жизненного цикла документа ui:
od : (ui, Pq , tl, ew )^(ui, Pq, tl + Atl ); * *
Cf ^ Cf \ Cf , Cf e Cf;
C* = { I Yd (cij ) = 0} Yd (cj ) = { ()}; At, < tl *, tl * e T*, ew = (U*, P*, О*, T *),
при ограничениях:
AL(щ,pq,oJ)> ALo (o2);
A V (ui, < write >) = True, A V (, < delete >) = True; 3
Yd (cj ) = Z ydx (cj); (16)
x=1
, , С1, если 3djt = d'lkt или 3djt С dikt,
yd1 (cj ) = j0
[0, в противном случае;
, ч С1, если cij требуется для ew2 ф ew,
yd 2 ( ) = ]0 11 (17)
[0, в противном случае;
, , jX если cij обраЗовано ol (ui, Px, t, ew2 ), Px ф Pq, ew2 ф ew, yd 3{ cij)- i
[0, в противном случае,
где Yd (C) - множество условий ценности состояния: Yd (cj) > 0, если состояние
cij удовлетворяет условиям yc/x (cij), Yd (cj ) = 0 в противном случае; d'^ - значения атрибутов некоторых состояний c, являющихся ключевыми или конечными для объекта ui ; yd1 - функция, принимающая положительное значение, если
(15)
(18)
атрибуты состояния cij входят в значения атрибутов d(или равны им); yd2 -функция, принимающая положительное значение, если состояние cij необходимо для выполнения другого воздействия ew2 ^ ew ; yd3 - функция, принимающая положительное значение, если состояния {cj} образованы в результате операций других пользователей px, отличных от исполнителя данной операции pq .
Стоит заметить, что набор функций ydx может быть различным для каждой
конкретной ситуации сжатия состояний и включать как перечисленные функции,
*
так и некоторые другие их вариации. Таким образом, подмножество Ci состоит из элементов, не удовлетворяющих условиям, поставленным пользователем или текущей задачей в рамках множества воздействий. После проведения операции сжатия в объекте сохраняются только состояния, необходимые для дальнейшей работы.
Операцией сохранений изменений документа oW после его редактирования будем называть функцию изменения данных, то есть значений атрибутов и содержимого объекта ui , пользователем pq , приводящую к появлению нового состояния clk :
ow : (ui (cij ), pq, tl, ew )-(u (cik ), pq, tl +Atl ); cij — cik, cik = ({(ain, dikn Tcik );
{or (u (j ), pq , tl, ew )} + {oW (u (j ), pq , tl, ew )} — Dik ; ui e U*, pq e P*, Atl < tl *, tl * e T*; ew = (U*, P*, O*,T *), при ограничениях:
AL(ui,pq,oW)> AL0 (oW), AV(ui,< write >) = True. (19)
Значения атрибутов Dik формируются после выполнения некоторого множества операций чтения o1r и редактирования o1w данных, после чего сохраняются в новом состоянии cik .
Операцией объединения oy будем называть функцию образования нового состояния cik объекта ui , осуществленную пользователем pq путем частичного слияния значений атрибутов от нескольких состояний. Операция oy отличается от уже рассмотренных операций изменения объекта тем, что происходит переход не из одного состояния в другое, а сразу несколько состояний {c^ } участвуют в процессе образования нового. Представим это соотношениями:
oU : (u , pq, tl, ew ) — (ui (cik ) , pq , tl + Atl ) ;
{or (ui ({{ }), pq, tl, ew )} + {oW (ui ({{ }), pq , tl, ew )} + oW (ui (cik ), pq, tl, ew ) — cik; (20)
C = {{ I Yu (cj) > 0}, с* e Ci, cik = ({n, dikn )} Tcik);
ul e U*, pq e P*, Atl < tl*, tl* e T*, ew = (U*,P*, С*, T *),
при ограничениях:
AL(u, pq, oj) > ALo(o|j); (21)
A V(ui, < read >) = True; AV(ui, < write >) = True, где Ygj (cij) - условие объединения, принимающее положительное значение, если состояние cij участвует в объединении, то есть значения атрибутов dijn присутствуют среди новых значений dikn (равны им или входят в них); равно нулю в противном случае.
Таким образом, новое состояние cik образуется путем выполнения некоторого
* *
множества операций чтения и редактирования данных из состояний {c^ } e Ci, где
Ci - подмножество состояний документа ui , участвующих в объединении, после чего следует сохранение полученных данных в новом состоянии cik . Третий уровень обработки данных включает операции
воздействующие уже на документы и их объединения в рамках выполнения заданий. При-
3 3 3 3 3 мер таких операций: oc, od, op, ord, om - операции копирования, удаления,
перемещения, переадресации документа и движения документа
в рамках информационного потока соответственно.
3
Операцией копирования документа oc будем называть функцию, осуществляющую перенос структуры и содержимого из объекта ui в объект uk :
o3 : (ui, pq , tl, ew )—(uk , pq , tl +Atl ) ;
{{ (ui ({cij }) , pq , tl, ew )} + { (uk ({cij }) , pq , tl, ew )} — uk ; (22)
ui,uk e U*, pq e P*, Atl < tl*, tl* e T*, ew = (U*,P*, O*,T *), при ограничениях:
AL (ui, pq, oc3 )> ALo (o3 );
A V (ut, < read >) = True; AV (ui, < write >) = True.
(23)
3
Операцией удаления документа od будем называть функцию, осуществляющую удаление объекта ui и всех его состояний:
od: (ui,pq,ч,ew)- (0ч +Atl);
{ : (ui (cij), pq, tl, ew)1 j =1, nCi}—'0; (24)
At; < Ц*, Ц* e T*, ew = (U*,P*,O*,T *),
при ограничениях:
AL (ui, pq, o3 )> AL0 ( );
AV (ui, < write >) = True; AV (ut, < delete >) = True.
(25)
3
Операцией перемещения документа вр будем называть функцию, осуществляющую перемещение структуры и содержимого из объекта в объект ик с последующим удалением исходного:
op : (ui, Pq, tl, ew ) —(uk , Pq , tl + Atl); { (ui ({cj }), Pq, tl, ew )} + {oW (uk ({cj }) , Pq , tl, ew )} — uk;
0р ( , Pq , tl , ew )-0;
uk e U*, Pq e P*, Atl < tl *, tl * e T*, ew = (U*, P*, O*, T *)
при ограничениях:
AL (Ui,Pq,ojP) > ALo (ojP), AV(u,< read >) = True; AV(ui,< write >) = True; AV(,< delete >) = True.
(27)
3
Под операцией переадресации документа будем понимать функцию, перенаправляющую документ от пользователя р„ некоторому множеству полу-
чателей Pout:
opd: (ui,Pq,tl,ew)— (u,pout,ti +Atl);
{ (ui ({}),pout,ti,ew)} - Щ, pout = {Pq}, Pout e P*; (28)
ul e U*, Pq e P*, Atl < tl *, tl * e T*, ew = (U*, P*, O*, T *),
при ограничениях:
AL(ui,Pq,opd) > ALq (opd), AV(ui,< read >) = True. (29)
Операция движения документа в рамках информационного потока докумен-
р
та om используется для перехода документа uk из-под влияния текущего воздеи-ствия ew в рамки другого ew2 :
орР: (ui, Pq,tl,ew) — (ui,Pout, tl +Atl ), ui e U* — ui e U2*;
ut e U2*, Pq e P*, Pout e P2*, Atl < tl*, Ц * e T*; (P0)
ew =(U*, P*, O*,T *), ew2 =(U2*,P2*, O*,T *),
при ограничениях:
AL(ui,Pq,ор) > AL0 (ор), AV(ui,< move >) = True, (P1)
где условие < move > отражает возможность перемещения документа под требования нового воздеиствия ew2 .
На четвертом уровне обработки данных операции O4 e O осуществляют изменение не конкретных документов, а управление информационными потоками организации в целом. На данном уровне абстракции не выделяются отдельные документы, а рассматриваются только некоторые их множества в рамках информационных потоков структурных подразделений [20, 21]. Такими операциями являются:
- o^f - формирование нового информационного потока в виде некоторой
подсистемы документооборота Sk в результате некоторого воздействия ew (внешнего или внутреннего):
oawf : ew — Sk, Sk = (Uk, Pk, Ok, Ek ),
S*6 S Uk6 U, Pk6p O*6 ° Ek = )u(eew};
- o^wf - перенаправление информационного потока, приводящее к изменению структуры управляющих воздействий Ek в рамках системы Sk , что в свою очередь оказывает влияние на общую структуру документооборота и приводит
о*
к переходу к новому состоянию системы Sk :
o4pwf : (Uk,Pk,Ok,Ek) — (Uk,Pk,Ok,E*),
v ' (33)
Sk — Sk, Ek ={ew}u(eew} Ek6E;
- ojwf - расширение информационного потока, приводящее к добавлению
новых воздействий на информационный поток и появлению новых элементов
* * * *
структуры документооборота U*, Pk, O*,E* и связей между ними:
o4wf : (Uk . Pk . Ok . Ek ) — (Uk ^ U*; Pk ^ Pb Ok ^ O**. Ek ^ E* ) .
(34)
Sk — S*, E* = { }u{eew}, Uk 6 U, P* 6 P, Ok* 6 O, E* 6 E;
- ouiwf - сжатие информационного потока, приводящее к сокращению числа
воздействий на информационный поток и исключению из структуры документо-
* * * *
оборота элементов U* , P*, O*, E* и связей между ними:
°Êwf : (Uk, Pk, Ok,
Ek) —(u* /U*, P* /P*, O* /O*,
(35)
S* — S*, E* = {ew}и{е4}, U* 6 U, p* 6 P, O* 6 O, E* 6 E;
- o/wf - передача данных между информационными потоками, осуществляющая переход информации из одного потока S* в другие {Sm} :
olf : (U*, Pk, O*,E* ) —{(, Pm, Om, Em )},
Um ç U*, Um 6 U, Pm 6 P, Om 6 O, Em 6 E.
Таким образом, рассмотрены процессы обработки информации в СУЭД на примере классификации конкретных операций на разных уровнях масштабирования. Данная классификация позволяет оценить процессы обработки и перемещения информации в рамках отдельных состояний, документов, информационных потоков и организации в целом. Такая универсальность и масштабируемость позволит формулировать процессы движения и взаимодействия документов в организациях различной направленности и размеров.
Постановка задачи оптимизации обработки информации в СУЭД
Разработав математическую модель обработки информации, можно сформулировать озвученную в начале статьи задачу уже в формализованном виде [22].
Необходимо для СУЭД на основе закономерностей математической модели обработки информации MPI (U, P, O) и входных данных о первоначальном количестве и структуре документов U0, пользователях P0, работающих с ними, и требуемого набора операций O0 найти такой вектор переменных x = (U, P, O)
из множества всех допустимых решений X, при которых полученная структура документооборота S стремится к оптимальной S *
MPI (U,P, O) = S ^ S*, (37)
в соответствии с рядом принятых ограничений:
- структура документооборота отвечает требованиям внешних и внутренних воздействий
* / * * \ * * E = ( EE u IE )ç E, E e S, E e S ; (38)
- воздействия (внутренние и внешние) не противоречат друг другу
et & -ej, Ve,, e] e E, i ф j) ; (39)
- структура позволяет проследить полный жизненный цикл любого документа
(Vwi eU )3G (ui, O ) e S ; (40)
- нагрузка на каждого отдельного пользователя не превышает максимально допустимую
(vPq e P) Tq < Tq; (41)
- полномочий каждого пользователя достаточно для выполнения поставленных перед ним задач
( Vpq e P) AL (ui, Pq, ot ) > ALo (ot ) ; (42)
- время выполнения операций над документами не превышает максимально допустимое
(VA// e T) < (43)
- число переадресаций документа сведено к необходимому минимуму
X ord ^ mm; (44)
O
- число исполнителей стремится к минимальному с учетом необходимости привлечения всех обязательных лиц
XPout ^ mm; (45)
P
- операции над документами, не требующие обязательного контроля, должны быть максимально автоматизированы
X о/
OAUTO--► 1, (46)
Xо/
O
где S, S * - полученная оптимальная и заданная идеализированная структуры
*
документооборота соответственно; Tq, Tq - текущая нагрузка исполнителя pq
и максимально возможная соответственно; Oauto e O - множество автоматизированных операций обработки информации.
Таким образом, можно говорить о постановке задачи структурно-параметрического синтеза СУЭД, когда, с одной стороны, требуется определить оптимальную структуру документооборота по набору входных переменных, с другой - найти экстремальные параметры математической модели, обеспечивающие выполнение всех введенных ограничений.
Заключение
Рассмотрены подходы к формализации процессов обработки, движения и взаимодействия документов. Анализ показал, что в настоящее время отсутствует теоретическая база, формализующая процессы обработки информации в СУЭД. Для решения данной проблемы сформулирована математическая модель, позволяющая формализовать структуру документов, их движение и взаимодействие в течение всего жизненного цикла, оптимизировать процессы обработки информации с учетом факторов адаптации СУЭД под структуру деятельности пользователей при работе с документами. Представленная модель позволяет осуществить теоретико-множественный анализ процессов обработки информации и их реализацию в алгоритмическом и программном обеспечении.
В рамках представленной математической модели впервые разработана модель многоуровневых графов обработки информации в СУЭД, позволяющая формализовать и анализировать данный процесс на разных уровнях масштабируемости, начиная с уровня состояния и заканчивая структурой документооборота в целом. Данная модель является универсальной, что не ограничивает ее использование какой-то определенной предметной областью и не накладывает ограничений на масштабы организации, документооборот которой исследуется.
В процессе выполнения научных исследований осуществлена постановка задачи оптимизации процессов обработки информации в СУЭД, относящаяся к классу комбинаторных задач структурно-параметрического синтеза, решение которой позволит при выполнении принятых ограничений и закономерностей математической модели определить конечную структуру документооборота организации в формализованном виде.
Работа выполнена при финансовой поддержке Министерства образования и науки РФ в рамках гранта Президента РФ МК-1666.2018.9.
Список литературы
1. Проектирование информационных систем управления документооборотом научно-образовательных учреждений : монография / М. Н. Краснянский [и др.]. -Тамбов : Изд-во ФГБОУ ВПО «ТГТУ», 2015. - 216 с.
2. Chen H. Business Intelligence and Analytics: from Big Data to Big Impact / H. Chen, R. H. L. Chiang, V. C. Storey // MIS Quarterly : Management Information Systems. - 2012. - Vol. 36, No. 4. - P. 1165 - 1188.
3. The Evolution, Challenges, and Future of Knowledge Representation in Product Design Systems / S. K. Chandrasegaran [et al.] // Computer-Aided Design. - 2013. -Vol. 45. - P. 204 - 228. doi: 10.1016/j.cad.2012.08.006
4. Ghani, E. K. Development of Integrated Information Management System Service Quality Model in an Accounting Faculty / E. K. Ghani, K. Muhammad, J. Said // International Journal of Business and Social Science. - 2012. - Vol. 3, No. 7. - P. 245 - 252.
5. Anvari, A. An Investigation of Innovation in Higher Educational Environments A Consideration of Five Substructures (Technical, Administrative, Information Systems, Information Technology and Knowledge Management) / A. Anvari, G. A. Alipou-rian, R. M. A. Taleb-Beidokhti // Middle-East Journal of Scientific Research. - 2012. -No. 11 (9). - P. 1278 - 1285. doi: 10.5829/idosi.mejsr.2012.11.09.3780
6. Гудов, А. М. Выбор архитектуры системы распределенных информационных хранилищ на основе решения задачи оптимизации стоимости документопо-токов / А. М. Гудов, В. В. Мешечкин, С. Ю. Завозкин // Вестн. Кемер. гос. университета. - 2011. - № 3. - С. 13 - 19.
7. Гмарь, Д. В. Система электронного документооборота вуза / Д. В. Гмарь, В. В. Крюков, К. И. Шахгельдян // Новые информационные технологии и менеджмент качества : материалы VII Междунар. науч. конф., Белек, Турция, 21 - 28 мая
2010 г. I М-во образования и науки Рос. Федерации, ФГУ «Гос. науч.-исслед. ин-т информ. технологий и телекоммуникаций» (ФГУ ГНИИ ИТТ «ИНФОРМИКА»), Европ. центр по качеству [и др.]. - Белек, Турция, 2010. - С. 64 - 66.
8. Hierarchical Attention Networks for Document Classification I Z. Yang [et al.] II Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. - 2016. - P. 1480 - 1489. doi: 10.1865CIv1IN16-1174
9. Le, Q. Distributed Representations of Sentences and Documents I Q. Le, T. Mikolov II Proceedings of the C 1st International Conference on International Conference on Machine Learning, Beijing, China, 21-26 June, 2014. - 2014. - Vol. C2. -P. 1188 - 1196.
10. Towards Content-Oriented Patent Document Processing: Intelligent Patent Analysis and Summarization I S. Brügmann [et al.] II World Patent Information. -2015. - Vol. 40. - P. C0 - 42. doi: 10.1016Ij.wpi.2014.10.00C
11. Jordan, M. I. Machine Learning: Trends, Perspectives and Prospects I M. I. Jordan, T. M. Mitchell II Science. - 2015. - Vol. C49, No. 6245. - P. 255 - 260. doi: 10.1126Iscience.aaa8415
12. TensorFlow: A System for Large-Scale Machine Learning I M. Abadi [et al.] II Proceedings of the 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI '16), 2-4 November, 2016, Savannah, GA, USA. - 2016. -Vol. 16. - P. 265 - 28C.
1C. Model of Documents Management for Academic and Research Universities on Basis Set Theory I A. V. Ostroukh [et al.]. American-Eurasian J. Agric. & Environ. Sci. - 2015. - No. 15 (5). - P. 824 - 8C1, doi: 10.5829Iidosi.aejaes.2015.15.5.126C9
14. Algorithm for Structural and Parametric Synthesis of Electronic Document Management System of Research and Education Institution I M. N. Krasnyanskiy [et al.] II Journal of Applied Sciences. - 2016. - Vol. 16, No. 7. - P. CC2 - CC7. doi: 10.C92CIjas.2016.CC2.CC7
15. Formulation of the Problem of Structural and Parametric Synthesis of Electronic Document Management System of Research and Education Institution I M. N. Krasnyanskiy [et al.] II Global Journal of Pure and Applied Mathematics. - 2016. -Vol. 12, No. C, P. 2C95 - 2409.
16. Object-Oriented Model for Life Cycle Management of Electrical Instrumentation Control Projects I J. Zhou [et al.] II Automation in Construction. - 2015. - Vol. 49. -P. 142 - 151.
17. Hierarchical Spatio-Temporal Visual Analysis of Cluster Evolution in Electro-corticography Data I S. Murugesan [et al.] II Proceedings of the 7th ACM International Conference on Bioinformatics, Computational Biology, and Health Informatics, 02-05 October, 2016, Seattle, WA, USA. - 2016. - P. 6C0 - 6C9.
18. Padmanabhan, T. R. Operations for Text Processing I T. R. Padmanabhan II Programming with Python. - Springer, Singapore, 2016. - P. 1C7 - 174.
19. Обухов, А. Д. Разграничение доступа к информации в системе электронного документооборота I А. Д. Обухов, М. Н. Краснянский II Виртуальное моделирование, прототипирование и промышленный дизайн : материалы II-й Между-нар. науч.-практ. конф. : в 2 т. I под общ. ред. В. А. Немтинова. - Тамбов, 2015. -Т. 2. - С. C09 - C1C.
20. Kirikova, M. Viable Systems Model Based Information Flows I M. Kirikova, M. Pudane II New Trends in Databases and Information Systems. - Springer, Cham, 2014. - P. 97 - 104. doi: 10.1007I978-C-C19-0186C-8_11
21. Weske, M. Business Process Management Architectures I M. Weske II Business Process Management. - Springer, Berlin, Heidelberg, 2012. - P. CCC - C71.
22. Laguna, M. Business Process Modeling, Simulation and Design I M. Laguna, J. Marklund. - CRC Press, 201C. - 524 с.
A Mathematical Model of Information Processing in the Electronic Document Management System
M. N. Krasnyanskiy1, A. D. Obukhov1, I. L. Korobova2
Departments of Computer-Integrated Systems in Engineering (1), Automated Systems of Decision-Making Support (2), TSTU, Tambov, Russia; [email protected]
Keywords: electronic document management; EDMS; mathematical modeling; document processing; multi-level graphs.
Abstract: The article deals with the development of a mathematical model of information processing in electronic document management systems. The model is used to formalize the structure of documents and their life cycle, to optimize the processes of processing, interaction and movement of documents, taking into account the factors of adaptation of the EDMS under the structure of user activity when working with documents. The model carries out a theoretical-multiple analysis of the information processing of the processes and their algorithmic realization and software implementation. Also, for the first time, a model of multilevel graphs of information processing used for the formalization of information flows in the document management system is presented. The studies can be used to describe the processes of document management and problems of optimization of document flow and processing at different levels of scaling.
References
1. Krasnyanskiy M.N., Karpushkin S.V., Ostroukh A.V., Obukhov A.D., Kasato-nov I.S., Bukreyev D.V., Karpov S.V., Dedov D.L. Proyektirovaniye informatsionnykh sistem upravleniya dokumentooborotom nauchno-obrazovatel'nykh uchrezhdeniy : mo-nografiya [Designing information management systems for document management of scientific and educational institutions: monograph], Tambov: Izdatel'stvo FGBOU VPO "TGTU", 2015, 216 p.
2. Chen H., Chiang R.H.L., Storey V.C. Business intelligence and analytics: from big data to big impact, MIS Quarterly: Management Information Systems, 2012, vol. 36, no. 4, pp. 1165-1188.
3. The evolution, challenges, and future of knowledge representation in product design systems, S. K. Chandrasegaran [et al.], Computer-Aided Design, 2013, vol. 45, pp. 204-228, doi: 10.1016/j.cad.2012.08.006
4. Ghani E.K., Muhammad K., Said J. Development of integrated information management system service quality model in an accounting faculty, International Journal of Business and Social Science, 2012, vol. 3, no. 7, pp. 245-252.
5. Anvari A., Alipourian G.A., Taleb-Beidokhti R.M.A. An Investigation of Innovation in Higher Educational Environments-A Consideration of Five Substructures (Technical, Administrative, Information Systems, Information Technology and Knowledge Management), Middle-East Journal of Scientific Research, 2012, no. 11 (9), pp. 1278-1285, doi: 10.5829/idosi.mejsr.2012.11.09.3780
6. Gudov A.M., Meshechkin V.V., Zavozkin S.Yu. [Choice of Architecture of Distributed Information Stores System Based on the Solution of the Information Flows Cost Optimization Problem], Vestnik Kemerovskogo gosudarstvennogo universiteta [Bulletin of Kemerovo State University], 2011, no. 3, pp. 13-19. (In Russ., abstract in Eng.).
7. Gmar' D.V., Kryukov V.V., Shakhgel'dyan K.I. [Electronic document management system of the university], Novye informatsionnye tekhnologii i menedzhment kachestva [New information technologies and quality management], Proceedings of the 7th International Conference, 21-28 May, 2010, Belek, Turkey, 2010, pp. 64-66. (In Russ.).
8. Yang Z. [et al.] Hierarchical Attention Networks for Document Classification, Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2016, pp. 1480-1489, doi: 10.18653/v1/N16-1174
9. Le Q., Mikolov T. Distributed representations of sentences and documents, Proceedings of the 31st International Conference on International Conference on Machine Learning, Beijing, China, 21-26 June, 2014, 2014, vol. 32, pp. 1188-1196.
10. Brügmann S. [et al.]. Towards content-oriented patent document processing: Intelligent patent analysis and summarization, World Patent Information, 2015, vol. 40, pp. 30-42, doi: 10.1016/j.wpi.2014.10.003
11. Jordan M.I., Mitchell T.M. Machine learning: Trends, perspectives, and prospects, Science, 2015, vol. 349, no. 6245, pp. 255-260, doi: 10.1126/science.aaa8415
12. M. Abadi [et al.] TensorFlow: A System for Large-Scale Machine Learning, Proceedings of the 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI '16), 2-4 November, 2016, Savannah, GA, USA, 2016, vol. 16, pp. 265-283.
13. Ostroukh A.V., Krasnyanskiy M.N., Karpushkin S.V., Obukhov A.D. Model of Documents Management for Academic and Research Universities on Basis Set Theory, American-Eurasian J. Agric. & Environ. Sci., 2015, no. 15 (5), pp. 824-831, doi: 10.5829/idosi.aejaes.2015.15.5.12639
14. Krasnyanskiy M.N., Ostroukh A.V., Karpushkin S.V., Obukhov A.D. Algorithm for Structural and Parametric Synthesis of Electronic Document Management System of Research and Education Institution, Journal of Applied Sciences, 2016, vol. 16, no. 7, pp. 332-337, doi: 10.3923/jas.2016.332.337
15. Krasnyanskiy M.N., Ostroukh A.V., Karpushkin S.V., Obukhov A.D. Formulation of the Problem of Structural and Parametric Synthesis of Electronic Document Management System of Research and Education Institution, Global Journal of Pure and Applied Mathematics, 2016, vol. 12, no. 3, pp. 2395-2409.
16. Zhou J. [et al.]. Object-oriented model for life cycle management of electrical instrumentation control projects, Automation in Construction, 2015, vol. 49, pp. 142-151.
17. Murugesan S. [et al.]. Hierarchical spatio-temporal visual analysis of cluster evolution in electrocorticography data, Proceedings of the 7th ACM International Conference on Bioinformatics, Computational Biology, and Health Informatics, 02-05 October, 2016, Seattle, WA, USA, 2016, pp. 630-639.
18. Padmanabhan T.R. Operations for Text Processing, Programming with Python, Springer, Singapore, 2016, pp. 137-174.
19. Obukhov A.D., Krasnyanskii M.N. [Differentiation of access to the information in the electronic document management systemа], Virtual'noe modelirovanie, prototipirovanie i promyshlennyi dizain [Virtual simulation, prototyping and industrial design], Proceedings of the Second International Scientific and Practical Conference, Tambov, 2015, vol. 2, pp. 309-313. (In Russ., abstract in Eng.)
20. Kirikova M., Pudane M. Viable systems model based information flows, New Trends in Databases and Information Systems, 2014, pp. 97-104, doi: 10.1007/978-3-319-01863-8_11
21. Weske M. Business process management architectures, Business Process Management, 2012, pp. 333-371.
22. Laguna M., Marklund J. Business process modeling, simulation and design, CRC Press, 2013, 524 p.
Mathematisches Verarbeitungsmodell der Informationen im Steuersystem mit Hilfe des elektronischen Dokumentenverkehrs
Zusammenfassung: Der Artikel ist der Entwicklung eines mathematischen Informationsverarbeitungsmodells in elektronischen Dokumentenmanagementsystemen gewidmet. Das Modell wird verwendet, um die Dokumentstruktur und deren Lebenszyklus zu formalisieren, die Prozesse der Verarbeitung, Interaktion und Bewegung der Dokumente unter Berücksichtigung der Faktoren der Anpassung der SUED an die Struktur der Aktivitäten der Benutzer bei der Arbeit mit Dokumenten zu optimieren. Es ermöglicht die Durchführung der theoretischen Mehrfachanalyse der Prozesse der Verarbeitung der Informationen und deren Umsetzung in der algorithmischen und Softwareversicherung. Im Rahmen dieses Artikels ist auch zum ersten Mal das Modell der mehrstufigen Graphen der Informationsverarbeitung vorgestellt, das für die Formalisierung der Informationsströme im System des Dokumentenverkehrs verwendet wird. Die durchgeführten Studien können verwendet werden, um die Prozesse der Arbeit mit Dokumenten zu beschreiben und die Aufgabe der Optimierung der Wege der Bewegung und Verarbeitung von Dokumenten auf verschiedenen Ebenen der Skalierung zu stellen.
Modèle mathématique du traitement de l'information dans le système de la gestion électronique des documents
Résumé: L'article est consacré à l'élaboration d'un modèle mathématique du traitement de l'information dans les systèmes de la gestion des documents électroniques. Le modèle est utilisé pour formaliser la structure des documents et leur cycle de vie, optimiser les processus du traitement, de l'interaction et de la circulation des documents en tenant compte des facteurs de l'adaptation du système à la structure de l'activité des utilisateurs lors du traitement des documents et permet d'effectuer une analyse théorique et multiple des processus du traitement Pour la première fois, est présenté le modèle de la graphique du traitement de l'information utilisée pour formaliser les flux de l'information dans le système du traitement des documents. Les études peuvent être utilisées pour décrire les processus du traitement des documents et pour définir les objectifs de l'optimisation du traitement des documents à différents niveaux d'échelle.
Авторы: Краснянский Михаил Николаевич - доктор технических наук, профессор, ректор ФГБОУ ВО «ТГТУ»; Обухов Артём Дмитриевич - кандидат технических наук, старший преподаватель кафедры «Компьютерно-интегрированные системы в машиностроении»; Коробова Ирина Львовна - кандидат технических наук, доцент, заведующий кафедрой «Системы автоматизированной поддержки принятия решений», ФГБОУ ВО «ТГТУ», г. Тамбов, Россия.
Рецензент: Муромцев Дмитрий Юрьевич - доктор технических наук, профессор кафедры «Конструирование радиоэлектронных и микропроцессорных систем», проректор по научно-инновационной деятельности, ФГБОУ ВО «ТГТУ», г. Тамбов, Россия.