Научная статья на тему 'Модельные представления данных на основе прямого тензорного исчисления'

Модельные представления данных на основе прямого тензорного исчисления Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
592
109
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ ДАННЫХ / ТЕНЗОРНОЕ ИСЧИСЛЕНИЕ / ДИАДА / ИНВАРИАНТ / ТЕНЗОРСИ СООТНОШЕНИЯ / ТЕНЗОРСИ ПРЕДИКАТА / DATA MODEL / TENSOR CALCULUS / DYAD / INVARIANT / TENSORS RATIO / TENSORS PREDICATE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Макарычев Петр Петрович, Артамонов Дмитрий Владимирович

Актуальность и цели. В информационных системах анализ данных, как правило, выполняется с точки зрения множественности измерений. Концептуально модельные представления строятся на основе таких понятий, как объект, класс, отношение. Для формализованного описания данных используются матричное исчисление, алгебра кортежей, тензорное исчисление. Материалы и методы. Данные могут быть представлены в виде обобщенной тензорной модели, которая может интерпретироваться в различные предметные области. Результаты. Разработана модель представления классов, объектов и отношений в предметном пространстве информационной системы. Модель отличается прямой тензорной формой записи отношений, арифметических и логических операций. Классы (объекты) предметного пространства задаются в виде диад, характеризующих предметное пространство. Предметные пространства «Звезда», «Снежинка» и «Созвездие» задаются в виде тензоров второго порядка неупорядоченной совокупности диад, ассоциированных с классами. Разработано тензорное представление запросов к реляционным структурам данных, арифметических и логических операций. Рассмотрены процедуры обработки и анализа данных. Приведен пример реализации кластерного анализа данных. Выводы. Предложено тензорное модельное представление реляционных структур данных. Представление обеспечивает формализованное описание простых и сложных запросов к базам данных, арифметических и логических операций, процедур обработки и анализа данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Макарычев Петр Петрович, Артамонов Дмитрий Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODEL-BASED PRESENTATIONS OF DATA ON THE BASIS OF DIRECT TENSOR CALCULUS

Background. In information systems, data analyses are usually performed from the point of view of the plurality of measurements. Conceptual model representations are based on concepts such as an object, a class, a relation. For a formalized description of data one uses matrix calculus, algebra of tuples and tensor calculus. Materials and methods. Data can be presented in the form of a generalized tensor model, which may be interpreted in different subject areas. Results. The authors developed a model of representation of classes, objects and relationships of the subject space of information systems. The model has a direct tensor notation of relations, arithmetic and logical operations. Classes (objects) of the subject space are defined in the form of dyads that characterize the object space. The subject spaces "Star", "Snowflake" and "Constellation" are specified in the form of tensors of the second order disordered aggregate dyads associated with the classes. The researchers developed a tensor representation of queries in relational data structures, arithmetic and logical operations, reviewed procedures for data processing and analysis, and described an example of cluster analysis implementation. Conclusions. The authors have suggested the tensor model representation of relational data structures. The representation provides formalized description of simple and complicated queries to databases, arithmetic and logical operations, procedures of data processing and analysis.

Текст научной работы на тему «Модельные представления данных на основе прямого тензорного исчисления»

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

УДК 681.3

DOI 10.21685/2072-3059-2016-3-1

П. П. Макарычев, Д. В. Артамонов

МОДЕЛЬНЫЕ ПРЕДСТАВЛЕНИЯ ДАННЫХ НА ОСНОВЕ ПРЯМОГО ТЕНЗОРНОГО ИСЧИСЛЕНИЯ

Аннотация.

Актуальность и цели. В информационных системах анализ данных, как правило, выполняется с точки зрения множественности измерений. Концептуально модельные представления строятся на основе таких понятий, как объект, класс, отношение. Для формализованного описания данных используются матричное исчисление, алгебра кортежей, тензорное исчисление.

Материалы и методы. Данные могут быть представлены в виде обобщенной тензорной модели, которая может интерпретироваться в различные предметные области.

Результаты. Разработана модель представления классов, объектов и отношений в предметном пространстве информационной системы. Модель отличается прямой тензорной формой записи отношений, арифметических и логических операций. Классы (объекты) предметного пространства задаются в виде диад, характеризующих предметное пространство. Предметные пространства «Звезда», «Снежинка» и «Созвездие» задаются в виде тензоров второго порядка - неупорядоченной совокупности диад, ассоциированных с классами. Разработано тензорное представление запросов к реляционным структурам данных, арифметических и логических операций. Рассмотрены процедуры обработки и анализа данных. Приведен пример реализации кластерного анализа данных.

Выводы. Предложено тензорное модельное представление реляционных структур данных. Представление обеспечивает формализованное описание простых и сложных запросов к базам данных, арифметических и логических операций, процедур обработки и анализа данных.

Ключевые слова: модель данных, тензорное исчисление, диада, инвариант, тензорси соотношения, тензорси предиката.

P. P. Makarychev, D. V. Artamonov

MODEL-BASED PRESENTATIONS OF DATA ON THE BASIS OF DIRECT TENSOR CALCULUS

Abstract.

Background. In information systems, data analyses are usually performed from the point of view of the plurality of measurements. Conceptual model representations are based on concepts such as an object, a class, a relation. For a formalized description of data one uses matrix calculus, algebra of tuples and tensor calculus.

Materials and methods. Data can be presented in the form of a generalized tensor model, which may be interpreted in different subject areas.

Results. The authors developed a model of representation of classes, objects and relationships of the subject space of information systems. The model has a direct tensor notation of relations, arithmetic and logical operations. Classes (objects) of the subject space are defined in the form of dyads that characterize the object space. The subject spaces "Star", "Snowflake" and "Constellation" are specified in the form of tensors of the second order - disordered aggregate dyads associated with the classes. The researchers developed a tensor representation of queries in relational data structures, arithmetic and logical operations, reviewed procedures for data processing and analysis, and described an example of cluster analysis implementation.

Conclusions. The authors have suggested the tensor model representation of relational data structures. The representation provides formalized description of simple and complicated queries to databases, arithmetic and logical operations, procedures of data processing and analysis.

Key words: data model, tensor calculus, dyad, invariant, tensors ratio, tensors predicate.

Введение

Как известно, тензорное исчисление представляет собой математическое средство, с помощью которого формулируются инвариантные соотношения между величинами изучаемых объектов. В теории информационных систем признание принципа инвариантности означает, что объекты существуют независимо от субъективных систем координат (измерений) предметного пространства, заданных наблюдателем [1, 2]. В современном тензорном исчислении используются три формы записи соотношений: координатная (арифметическая, индексная), матричная и безындексная (прямая). При координатной форме тензор представляется в виде набора чисел , в котором

индексы а... 8 пробегают значения от 1 до n > 1. Эта форма очень практична и широко распространена [2]. При бескоординатной форме описания тензора индексы не пробегают целочисленные значения, а рассматриваются как метки, несущие информацию о типе тензора и возможных операциях над тензором [3]. Матричное представление предполагает соблюдение соответствия между размерностью матрицы и рангом тензора, между строками, столбцами и индексами [4].

Все три формы практически равнозначны. Однако матрицы сами по себе не соответствуют структурам данных информационных систем, представленным в виде сущностей реляционных баз данных. Безындексная форма концептуально более предпочтительна в том смысле, что тензоры естественно рассматривать не как наборы чисел, а как некоторые линейные отображения. Безындексная форма представления тензоров обеспечивает несложное преобразование к индексной и матричной формам представления. В данной работе приводится обоснование применимости безындексной формы записи тензорных модельных представлений данных, алгебраических и логических операций.

Тензорное представление предметного пространства

На рис. 1 приведена структура обобщенной реляционной модели данных «Снежинка» (хранилища данных), содержащая измерения и факты [5].

В качестве измерений модель содержит сущности (классы): «Кафедра», «Факультет», «Научный Руководитель», «Научная Специальность», «Аспирант» и «Показатель». Сущность «Запись» содержит факты о деятельности аспирантов. Каждый экземпляр сущности соответствует записи оценки деятельности аспиранта по одному из показателей. Факт фиксируется с указанием номера записи п и времени выполнения записи t. Линии связи между сущностями отражают функциональные зависимости между ключевыми атрибутами сущностей (п, t) ^ h, p; h ^ г, s; г ^ k,d .

Рис. 1. Структура модели данных «Снежинка»

Для построения тензорного модельного представления расположим и зафиксируем классы предметного пространства в следующей последовательности: A = (^p,г,s,k,d,(п,t)) = (h,p,г,s,k,d,z).

Предположим, что ^ p, г,..., z и el, e2, eз,..., e7 являются тензорами первого ранга (векторами), характеризующими классы и отношения классов предметного пространства информационной системы. Размерности векторов равны. Векторы-столбцы ^ p, г,..., z пространства 71 характеризуют функциональные отношения между классами, а векторы-строки el, e2, eз,..., e7 пространства Т2 - отношение заданного порядка в последовательности А. В этом случае для сущностей измерений ^ p, г,..., d и сущности фактов z рассматриваемого предметного пространства тензоры первого ранга имеют вид (рис. 1):

hT = (т11 0 т31 т41 0 0 0); e1 = (п1 0 0 0 0 0 0); pT = (0 т22 0 0 0 0 0); e2 = (0 п2 0 0 0 0 0);

гТ = (0 0 т33 0 т53 т63 0); e3 = (0 0 п3 0 0 0 0); sT = (0 0 0 т44 0 0 0); e4 = (0 0 0 п4 0 0 0); ^ = (0 0 0 0 т55 0 0), e5 = (0 0 0 0 п5 0 0); dT = (0 0 0 0 0 т66 0), e6 = (0 0 0 0 0 п6 0);

T

z = (m17

т27 0 0 0 0 т77); е7 = (0 0 0 0 0 0 п7) . (1)

Значение каждого элемента тц, i = 1,2,...,7, вектора пространства 71 равно количеству байт, необходимых для регистрации атрибутов экземпляра сущности (объекта класса). Значения элементов ту,i Ф у, i = 1,2,...,7,

j = 1,2,...,7, векторов пространства Т] равны количеству байт, необходимых для регистрации внешних ключей сущностей модели данных. Векторы пространства 72 содержат элементы Пу, у = 1,2,...,7, значения которых определяются количеством экземпляров сущностей (объектов класса). Каждую упорядоченную пару векторов (Ь ® е1,р ®е2,...,г ® е7) из пространств 71,72 можно рассматривать как единое целое (диаду векторов), представляющее собой элемент множества прямого декартового произведения двух векторных пространств [1]. Например, для сущности «Научный Руководитель» диада имеет следующий вид:

r ® e3 =

0 0

m33 0

m53 m63 0

[0 0 n3 0 0 0 0] =

0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0

m33n3 0

m53n3 m63n3 0

0 0 0 0 0 0 0

где тззПз - количество байт в записи данных о научном руководителе, m53п3, тбзПз - количество байт, содержащихся в записях внешних ключей.

При этом предметное пространство может быть определено как тензор второго ранга, заданный суммой диад:

V = Ь ® е1 + р ® е2 + г ® е3 +... + г ® е7. (2)

Таким образом, тензор V является конечной неупорядоченной совокупностью упорядоченных пар тензоров первого ранга. След каждой диады в (2) равен скалярному произведению тензоров первого ранга:

й-(а®ei) = а• е,-, ае{Ь,р,г,...,г], i = 1,2,...,7,

составляющих диаду.

Для модели данных, представленной на рис. 1, тензор второго ранга, характеризующий предметное пространство в матричной форме, имеет вид

V =

mnn1 0

m31n1 m41n1 0 0 0

0

m22n2 0 0 0 0 0

0 0

m33n3 0

m53n3 m63n3 0

0 0 0

m44n4 0 0 0

0 0 0 0

m55n55 0 0

0 0 0 0 0

m66n6 0

my]n7 m27n7 0 0 0 0

m77n7

№ 3 (39), 2016 Технические науки. Информатика, вычислительная техника Таким образом, след тензора второго ранга определяется формулой

1х(У) = 1г(Ъ• e1 + p• e2 + г • eз +... + z• e7) = ^. т.п..

Эта важная характеристика тензора второго ранга является одним из

т

инвариантов и обладает следующим свойством: ) = ) .

Пусть определен второй вариант предметного пространства типа «Звезда» с тем же набором объектов (сущностей). Данное пространство имеет такую же размерность, но число уровней иерархии равно двум [5]. Для этого пространства тензор имеет вид

W =

ШцЩ 0

т31«1 т41п1

«51«! m61n1 0

0

т22«2 0 0 0 0 0

0 0

т33«3 0 0 0 0

0 0 0

т44«4 0 0 0

0 0 0 0

«55«5 0 0

0 0 0 0 0

т66«6 0

т17«7 «27«7 0 0 0 0

т77«7

Предположим, что для тензора второго ранга V определитель

det V Ф 0 и имеется обратный тензор V такой, что V• V = V • V=E . В этом случае, используя скалярное произведение двух тензоров, можно определить тензор преобразования предметных пространств. Например:

N = W • V_1.

При этом скалярное произведение тензора второго ранга N на тензор первого ранга представляет собой линейное преобразование объектов одного пространства в объекты другого пространства. Это линейное преобразование осуществляется следующим образом:

Ь = N • a, (3)

h , p , r ,..., z j.

Рассмотренный выше подход к заданию тензорного модельного представления данных можно использовать при анализе различных информационных и технических систем. Введенные в рассмотрение тензоры второго ранга V, W характеризуют не только структуру предметного пространства информационной системы. Одновременно тензоры V, W содержат компоненты количественных характеристик: общее число экземпляров в одной сущности (количество строк в таблице), объем хранимых данных (атрибутов, байт, бит) в одном экземпляре сущности (строке таблицы). Например, пусть диада г ® eз образована из тензоров следующего вида:

гТ = (0 0 т33 0 т53 т63 0) e3 = (0 0 п3 0 0 0 0),

где т33 = 233, «5з = 10, «6з = 10 , n3 = 17 .

Очевидно, что след диады имеет вид

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

К(г ®ез) = тз 3П3 = 3961 байт

и общий объем данных, соответствующий в структуре данных сущности «Научный Руководитель» (см. рис. 1), равен

7

^ = 2 (г ® е3)у,3 = т3,3П3 + т5,3П3 + т6,3П3 = 4301 байт.

у=1

Аналогично можно определить и объемы данных для остальных шести диад (объектов) модели данных «Снежинка». В результате получим общий объем данных в структуре предметного пространства «Снежинка»:

7 7 7 7

Qv = 22^,у = УПУ = 5.521 • Ю4 байт. (4)

i у i )

При этом объем хранимых данных в структуре предметного пространства «Звезда» составит

7 7 7 7

Qw = 22Щ-У = 22mi,уПу = 5.663• 104 байт . (5)

i у=1 i у=1

Из выражений (4), (5) видно, что объем данных, хранимых в структуре «Звезда», увеличился.

Тензорное модельное представление объектов

Каждую сущность предметного пространства можно представить в виде суммы диад. Например, для сущности «Аспирант» сумма диад

^5 = И ® е1 + г ® е3 + 5 ® е4,

где q - символ сущности; И, г, 5 - метки, отражающие элементы диад, значения которых могут быть отличны от нуля.

Таким образом, предметное пространство, соответствующее модели данных «Снежинка», как тензор второго ранга V, может быть задано неупорядоченной последовательностью сумм диад:

V = яИ'5 + я р + яГ, а + я 5 + яи + яа + я а, р. (6)

В выражении (4) верхние и нижние символы в неупорядоченной последовательности диад не являются индексами. Это метки, которые определяют структуры диад и возможные действия с диадами. Нижние метки соответствуют первичным ключам сущностей, верхние - внешним ключам сущностей. В результате выполнения операции преобразования N линейного предметного пространства (6) имеем

W = NV = яИ ^и, а + Яр + Яг + Я5 + яи + яа + я^, р. (7)

Из выражения (7) следует, что линейное преобразование N связано с уменьшением уровней иерархии за счет операции денормализации применительно к сущности «Аспирант», представленной в выражении (7) суммой

г Г, к, << ,

из 5 диад д^ (рис. 2).

Рис. 2. Структура модели данных

Рассмотрим применение тензорного исчисления при разработке модельного представления и анализа данных на уровне сущностей. Если воспользоваться понятием тензорси (3), то класс объектов «Аспирант» можно представить в виде функциональных графиков. При этом представлении классов (сущностей) определяется закон формирования функциональных графиков (к, г) и (к,^ из множеств Н,Я, S , где Н - множество аспирантов (экземпляров сущности), Я - множество руководителей, S - множество научных специальностей. Согласно этому подходу графики дк, дк , соответствующие суммам диад, не содержат пар с одинаковыми нижними и различными верхними метками. В этом представлении сумму диад д^ можно рассматривать как объединение двух функциональных графиков дк= дк и дк ,

сумму диад д^s,к,< - четырем функциональным графикам.

При проектировании модели данных содержание каждой диады должно быть раскрыто как можно более полно. Например, для сущности «Кафедра» из рассматриваемой модели данных диада qк = k ® el может быть суммирована с диадами, отражающими функциональную зависимость неключевых атрибутов от первичного ключа (к, а^, (к, а^),...,(к, ат ) :

4^1"^^ат = k ® el + ^ ® e2 + a2 ® eз +... + am ® em+1,

где k - вектор первичного ключа; al, a2,..., am - векторы неключевых атрибутов сущности.

Следует отметить, что математический объект q<k1'a2,...,ат в алгебре

кортежей рассматривается как С-кортеж, представляющий собой множество элементарных кортежей [к,а1,а2,...,ат] одной и той же размерности или

многоместное отношение [5]. На основе элементарных кортежей и C -кортежей в алгебре кортежей вводятся и другие структуры данных и операции: операций алгебры множеств, операции с атрибутами, включая перестановку атрибутов, добавление фиктивного атрибута и элиминацию атрибута. Аналогичные операции могут быть осуществлены и использованием тензорного представления структур данных.

Таким образом, сущность в модели данных можно рассматривать как сумму диад или кортеж функциональных графиков:

qkd{a],a2,...,a?) = qk;d Uq^"г—am = £,d,ai.a2-am .

В выражениях (6), (7) возможные типы атрибутов: Int {Целое число), Real {Действительное число), Date {формат MM/DD/YY), Text (Строка), List {Список значений, разделенных запятой), Command {Команда - выполняемая строка).

Над диадами можно осуществлять преобразования, описываемые тен-зорси соотношений и тензорси предикатов [3]. Например, операцию сложения значений атрибутов b = ai + a2 можно представить как тензорси

g1b = (+ b ), а операцию умножения значений атрибутов b = ai • a^ -

a1, a2 \ a1, a2 I

тензорси g 2b = (xb ). При этом запись операции сложения атрибутов

a1, a2 \ a1, a2 I

диады с использованием суффиксной формы будет выглядеть следующим образом:

^^qj^i,^a4 = qhsc^,a2,a3glii4 = qh^q^^i,a2,a3 (+a4 )

Аналогично можно выполнять запись и логических операций типа v, а .

Например: ^а] ), (а] ), /, },kе i1,2,...,m} и т.д.

В работе [5] введен тензорси предикатов, обозначающий множество действий над множеством пар атрибутов (a, b} . Результаты действий принимают значения из множества ^ = {0,1}. Следуя работе [5], будем задавать тензорси предикатов в виде символа у, снабженного метками и обозначающего множество вычислений над множествами пар атрибутов. Например, запись Yafb эквивалента записи {<0fb). На месте символа «< » в тензорси

предикатов могут быть символы «<», «=» и др. Эти вычисления характерны для двухместных предикатов, имеющих значение «истина» или «ложь».

С использованием принятых соглашений простой запрос на формирование списка научных руководителей, имеющих научную степень «кандидат технических наук, «ктн», можно записать в следующем виде:

qr,sqal,a2,nкmн",a4 = qk,sqaua2,a3,a4 \

qh qh = qr qh \= a3," ктн "J ,

где суффикс, отражающий формирование факта наличия в составе научных руководителей лиц со степенью «кандидат технических наук».

Область применения

Эффективная работа с реляционными базами данных осуществляется на основе запросов. Для описания запросов, как правило, используют язык QBE (Query By Example, язык запросов по образцу) или язык SQL (Structured Query Language, структурированный язык запросов). Однако данные языки предназначены в основном для управления данными конкретной базы данных. Вместе с тем на начальном этапе проектирования базы данных целесообразно проведение анализа объектов и операторов, обеспечивающих доступ к данным пользователя формализованными методами. Один из эффективных подходов к этому анализу осуществляется на основе тензорного исчисления в форме безындексной записи соотношений.

Рассмотрим возможности прямой формы записи тензоров на примере кластерного анализа неиерархическим методом. Предположим, что имеется

множество объектов A : q^, k = 1,2,...,m, i = 1,2,...,p, и множество центров кластеров B : , l = 1,2,...,n.

Первый шаг. Для фиксированного k е{1,2,...,m} формируем тензор

разности между атрибутами центров кластеров и атрибутами выбранного объекта (функциональный график):

qb = q^*_ qa, i = 1,2,..., n, i = 1,2,..., p.

Второй шаг. Вычисляем свертку тензоров и формируем тензор qa,c :

c bi bl ai, c ai , c 7 1 т

qi = qi 0qi , qi = qi ^qi, l = l^..^n .

Третий шаг. Определяем расстояния d от объекта qa* до центров всех

k

кластеров qai, i = 1,2,...,n, и формируем тензор qai,d . При этом

q"d = qci (sqrt<di = l2—n,

где sqrt c - функция извлечения корня квадратного (d = 4C) .

Четвертый шаг. Определяем минимальное расстояние от объекта до

ai, c, d n

центра кластера qi i из множества B :

a, e dl - в \ qk* = qi ^minD(d)

где 0(<) - домен значений атрибута < в функциональном графике д1.

Пятый шаг. Размещаем выбранный объект в кластере I. Другими сло-опреде. торой < = е :

вами, определяем в функциональном графике д< значение метки I, для ко-

l,a, в,a, c,d | , i i I q * = q * qi I match d I, Hk* Hk* Hl | (e,qd) y

где match {e d) - функция определения значения метки центра кластера l, до

которого расстояние от объекта qe,fi минимально, e = match{e, ql).

k

Рассмотрим реализацию кластерного анализа в среде математического пакета Mathcad. Поскольку пакет не поддерживает тензорного представления,

то воспользуемся матричной формой. Пусть A - множество объектов qa ,

k = 1,2,...,N, i = 1,2,...,6; B - множество заданных центров кластеров qa , l = 1,2,3, i = 1,2,...,6 . Множества A,B заданы таблично. Ввод выполнен с применением операции импорта из базы данных. Листинг {рис. 3) содержит множество B и фрагмент множества A.

A :=

/WW

1 2 3 4 5 6

1 4.9 5.1 4.3 6.2 5.1 3.1

2 6.8 7.2 6.2 8.3 7.1 5.2

3 5.2 5.2 4.1 6.1 5.2 3

4 6.7 7.2 7.1 8.1 7.3 7.1

5 4.9 5.2 4.2 6.2 5.1

Б

1 2 3 4 5 6

1 6.7 6.7 6.6 6.6 6.6 6.5

2 5 5 5 5 5 5

3 7 7 7 7 7

Рис. 3. Импорт данных

Решение задачи размещения объектов в кластерах (листинг) приведено на рис. 4. Программа разработана с использованием встроенных функций пакета МаШса^

Результаты кластерного анализа приведены в листинге вывода данных (рис. 5). В этом листинге столбцы с номерами 1-6 содержат значения атрибутов, столбец 7 - номера кластеров.

Приведенный пример кластерного анализа является не единственным. Тензорное представление данных может быть использовано в различных методах интеллектуального анализа данных и методах искусственного интеллекта.

Заключение

Рассмотренные выше модельные представления данных позволяют сделать следующие выводы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. При проектировании реляционных баз данных может эффективно использоваться безындексная форма записи тензорных модельных представлений предметных пространств, классов и объектов.

2. С использованием безындексной формы записи тензоров возможна запись арифметических и логических операций над тензорами первого ранга, представляющими объекты предметного пространства информационной системы.

Рг(А .В) :=

"определение количества объектов и центров" ш ••— rows(A"j п rows (В)

"определение количества параметров объектов" р <- cols(B) for te l..m

for q е 1.. n — 1

"выделение объекта и центра кластера" U <— submatrix(A ,k ,k, 1 ,р) W <— submatrix(B , q, q, 1 ,p) "вычисление расстояний объект-центры" V <- U - W

v-v'

"вычисление минимального рассюяния" Dj.; < min(S)

"размещение объекга в кластере" Ак;Р+1 |match(Dk :Sj|

Рис. 4. Размещение объектов в кластерах

Рис. 5. Вывод результатов

3. Безындексная форма записи тензоров обеспечивает формализованную запись двухместных предикатов над множеством пар атрибутов объектов предметного пространства.

4. На основе безындексной формы тензорных модельные представлений данных можно анализировать параметры структур данных, реализуемость простых и сложных запросов к реляционным базам данных.

Список литературы

1. Арменский, А. Е. Тензорные методы построения информационных систем / А. Е. Арменский. - М. : Наука, 1989. - 152 с.

2. Крон, Г. Тензорный анализ сетей : пер. с англ. / Г. Крон ; под ред. Л. Т. Кузина, П. Г. Кузнецова. - М. : Сов. радио, 1978. - 720 с.

3. Чижухин, Г. Н. Тензорная методология в дискретной системотехнике / Г. Н. Чижухин, Ю. Г. Бочкарева. - Пенза : Изд-во ПГУ, 2006. - 184 с.

4. Кулик, Б. А. Алгебраический подход к интеллектуальной обработке данных и знаний / Б. А. Кулик, А. А. Зуенко, А. Я. Фридман. - СПб. : Изд-во Политехн. ун-та, 2010. - 235 с.

5. Макарычев, П. П. Построение моделей классов и объектов с применением тензорной методологии / П. П. Макарычев, Н. А. Попова // Университетское образование : сб. ст. XVII Международная науч.-метод. конф. - Пенза : Изд-во ПГУ, 2013. - С. 457-458.

References

1. Armenskiy A. E. Tenzornye metody postroeniya informatsionnykh sistem [Tensor methods of information system building]. Moscow: Nauka, 1989, 152 p.

2. Kron G. Tenzornyy analiz setey: per. s angl. [Tensor analysis: translation from English]. Moscow: Sov. radio, 1978, 720 p.

3. Chizhukhin G. N., Bochkareva Yu. G. Tenzornaya metodologiya v diskretnoy siste-motekhnike [Tensor methodology in discrete systems engineering]. Penza: Izd-vo PGU, 2006, 184 p.

4. Kulik B. A., Zuenko A. A., Fridman A. Ya. Algebraicheskiy podkhod k intellektual'noy obrabotke dannykh i znaniy [Algebraic approach to intelligent treatment of data and knowledge]. Saint-Petersburg: Izd-vo Politekhn. un-ta, 2010, 235 p.

5. Makarychev P. P., Popova N. A. Universitetskoe obrazovanie: sb. st. XVII Mezhdu-narodnaya nauch.-metod. konf. [University education: proceedings of XVII International scientific and methodological conference]. Penza: Izd-vo PGU, 2013, pp. 457458.

Макарычев Петр Петрович

доктор технических наук, профессор, заведующий кафедрой математического обеспечения и применения ЭВМ, Пензенский государственный университет {Россия, г. Пенза, ул. Красная, 40)

E-mail: [email protected]

Makarychev Petr Petrovich Doctor of engineering sciences, professor, head of sub-department of computer application and software, Penza State University (40 Krasnaya street, Penza, Russia)

Артамонов Дмитрий Владимирович

доктор технических наук, профессор, кафедра автономных информационных и управляющих систем, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40)

E-mail: [email protected]

УДК 681.3 Макарычев, П. П.

Модельные представления данных на основе прямого тензорного исчисления / П. П. Макарычев, Д. В. Артамонов // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2016. - № 3 (39). -С. 3-15. БОТ 10.21685/2072-3059-2016-3-1

Artamonov Dmitriy Vladimirovich Doctor of engineering sciences, professor, sub-department of autonomous information and control systems, Penza State University (40 Krasnaya street, Penza, Russia)

i Надоели баннеры? Вы всегда можете отключить рекламу.