УДК 681.3
СОЗДАНИЕ КОМПЛЕКСА ПРОГРАММ НА ОСНОВЕ ПРОСТРАНСТВЕННОЙ СХЕМЫ ВЗАИМОДЕЙСТВИЯ ОБЪЕКТОВ
С.А. Прохоров, д.т.н..; И.М. Куликовских, к.т.н.
(Самарский государственный аэрокосмический университет им. академика С.П. Королева (национальный исследовательский университет), врфртг-ги)
Рассматривается возможность создания комплекса программ для анализа данных в рамках систем интеллектуального анализа данных «Data Mining» со ступенчатой платформой анализа данных. В связи с этим предлагается новое решение для создания программных продуктов, ориентированных на поэтапную обработку исходной информации, в виде пространственной схемы взаимодействия объектов, которая позволит снизить временные и ресурсные затраты на получение конечного программного продукта. Разработанная пространственная схема построена на основании следующих базовых понятий: пространство функциональных преобразований, пространство функциональных расширений, пространство характеристических расширений; ключ перехода от одного пространства к другому на различных уровнях. На основе разработанной пространственной схемы создана структурная схема комплекса программ для корреляционно-спектрального интеллектуального анализа данных, который, согласно проведенному анализу рынка аналогичных продуктов, является уникальным с точки зрения класса решаемых задач. Математические модели, положенные в основу данного программного продукта, основаны на методе ортогональных разложений функциональных характеристик в ряды Фурье, а для реализации скрытого уровня анализа данных была создана технология аналитической обработки данных, содержанием которой являются организация функционирования и реализация созданных механизмов поиска скрытых закономерностей. Применение пространственной схемы взаимодействия объектов позволяет снизить трудоемкость разработки программного обеспечения автоматизированных систем научных исследований, обработки информации и управления и может быть рекомендовано как разработчикам автоматизированных систем - программистам, так и аналитикам, занимающимся проектированием сложных программных комплексов.
Ключевые слова: интеллектуальный анализ данных, пространственная схема, метод ортогональных разложений, комплекс программ.
CREATION OF SOFTWARE SYSTEM ON THE BASIS OF SPATIAL OBJECT INTERACTION DIAGRAM Prokhorov S.A., Ph.D.; Kulikovskikh I.M., Ph.D. (Samara State Aerospace University, [email protected])
Abstract. The article looks into the possibility of software system creation for data analysis within Data Mining systems with a staged platform of data analysis. In this regard a new solution is provided for software products creation focused on incremental processing of the initial information in the form of a spatial object interaction diagram, which will allow time and resource expenditures required to obtain the final software product to be reduced. The developed spatial diagram is built on the basis of the following fundamental notions: functional transformation space, functional enhancement space, characteristic enhancement space, key of transition from one space to the other at multiple levels. On the basis of the developed spatial diagram the structural diagram of software system for correlation and spectral data mining was created, while this kind of analysis, according to the research at the market of the analogous products, is unique in terms of the class of current problems. Mathematical models taken as a basis for this software product are based on Fourier orthogonal decomposition of functional characteristics, and for implementation of a hidden level of data analysis the analytical processing technique was created, which consists in functioning management and implementation of created search mechanisms for hidden regularities. Using spatial object integration diagram reduces the labour intensity of software development for automated systems of scientific research, control and data processing, and can be recommended to the designers of automated systems -programmers, as well as to the analysts involved in designing of complex software systems.
Keywords: data intelligent analysis, spatial scheme, orthogonal transformation, software.
В последнее время широкое применение получили программные продукты интеллектуального анализа данных «Data Mining», являющиеся междисциплинарной областью и развивающиеся на базе широкого пласта знаний: экспертные системы, информационный поиск, оперативная аналитическая обработка, теория БД, хранилища данных, эффективные вычисления, статистика, ней-росети, распознавание образов [1-3]. Большинство систем интегрируют сразу несколько подходов, но каждая имеет ключевую компоненту.
Особенностью данных систем является наличие трехуровневой платформы анализа данных: поверхностный уровень, глубокий и скрытый [3]. Для построения систем «Data Mining», имеющих
вложенные структуры в виде уровневой платформы, была разработана пространственная схема взаимодействия объектов (см. рис. 1). Приведем нотацию представленной схемы: П - пространство (уровень 1) функциональных преобразований; П - альтернативное пространство (уровень 1) функциональных преобразований; ПП^ - подпространство (уровень 2) функциональных расширений пространства (уровень 1) функциональных преобразований (/ - номер текущего функционального расширения); ППП|П^ - подпространство (уровень 3) функциональных преобразований подпространства (уровень 2) функциональных расширений пространства (уровень 1) функцио-
п
пп[пА] пп{л |
ппНп a ] — пп п(Ф,(л)! пп[п] пп{л}
п
пп1
[п]
пп1
[п]
Рпп1{фл
ппп[п] ппп{ф,}
Рис. 1
нальных преобразований; ППП^ - подпространство (уровень 3) функциональных преобразований подпространства (уровень 2) функциональных расширений альтернативного пространства (уровень 1) функциональных преобразований; ПП|П| - подпространство
(уровень 2) характеристических расширений пространства (уровень 1) функциональных преобразований; ПП|П}1 - подпространство (уровень 2) характеристических расширений альтернативного пространства (уровень 1) функциональных преобразова-
ний; ппп^д)} - подпространство (уровень 3) функциональных преобразований подпространства (уровень 2) характеристических расширений пространства (уровень 1) функциональных преобразований и т.д.;»— - ключ, показывающий переход от одного пространства к другому (точкой обозначено исходное пространство или подпространство).
Рассмотрим пример создания программного продукта интеллектуального корреляционно -спектрального анализа данных в рамках систем «Data Mining» с помощью описанной выше пространственной схемы взаимодействия объектов. В качестве ключевой компоненты были выбраны эффективные вычисления, базирующиеся на широком использовании метода ортогональных разложений функциональной характеристики в ряды Фурье [4-7]. На
рисунке 2 представлена структурная схема программного продукта в соответствии с пространственной схемой, изображенной на рисунке 1.
Как было отмечено, разработка программного продукта в рамках «Data Mining» предполагает наличие ступенчатой платформы анализа данных, каждый уровень которой включает набор программ в соответствии с представленной структурной схемой (см. рис. 2). Опишем программное наполнение каждого из уровней.
Поверхностный уровень содержит программы
- ввода и интерпретации данных;
- построения и преобразования корреляционной функции (КФ) (включает часть программы, связанной с построением КФ);
- построения простейших ортогональных функций;
- построения модели КФ в простейших базисах;
- построения модели спектра в простейших базисах;
- имитационного моделирования;
- обработки внешних данных;
- формирования отчетов.
Комплекс программ с программой, реализующей технологию аналитической обработки
Программа построения и преобразования КФ
Программа генерации данных
Программа загрузки данных из файла
Программа восстановления данных по аналитическому выражению
Программа ввода и ин-терпрета-ции данных
Программа построения обобщенных функций
Программа построения простейших ортогональных функций
Программа построения функциональных характеристик
Программа построения обобщенных характеристик
Программа построения модели фазовой КФ в обобщенных базисах
Программа построения функциональных характеристик
Программа построения обобщенных характеристик
Программа построения модели КФ в простейших базисах
Программа построения модели фазового спектра в обобщенных базисах
Программа построения модели спектра в простейших базисах
Программа построения функциональных характеристик
Программа построения обобщенных характеристик
КОМПЛЕКС ПРОГРАММ
Программа имитационного моделирования
Программа обработки внешних данных
Программа формирова-
ния отчетов
Рис. 2
Глубокий уровень содержит программы
- построения и преобразования КФ (включает часть программы, связанной с преобразованием КФ);
- построения обобщенных ортогональных функций;
- построения модели КФ в обобщенных базисах;
- построения модели спектра в обобщенных базисах.
Скрытый уровень представляет собой программу, реализующую технологию аналитической обработки данных (рис. 3).
Предлагаемая технология включает следующие этапы: формирование набора данных, его распределение, построение моделей в рамках аналитического подхода [6, 7], реализация механизмов поиска скрытых закономерностей.
На первом этапе формируется исходный набор данных: происходит загрузка данных из файла либо генерирование совокупности выборок, подлежащих дальнейшему анализу. На втором этапе сформированные наборы данных распределяются по анализируемым характеристикам (/ - порядок анализируемой характеристики). На третьем этапе осуществляется построение корреляционно -спектральных характеристик (функциональных и обобщенных) в рамках аналитического подхода. На последнем этапе выполняется поиск скрытых закономерностей на основе разработанных механизмов по полученным моделям корреляционно-спектральных характеристик.
Механизмы поиска скрытых закономерностей могут иметь самую разную структуру. В терминах
«Data Mining» выделяют пять стандартных типов: ассоциация, последовательность, кластеризация, классификация, прогнозирование. В связи с этим предлагаются следующие механизмы поиска скрытых закономерностей в рамках аналитического подхода: построение функциональной зависимости анализируемой корреляционно-спектральной характеристики /(X); построение пары функциональных зависимостей f(X,) и f(Xi+1) в фазовой плоскости; выполнение аналитических
преобразований , j dX, d над функцио-
нальной зависимостью F(f(X,), f(Xi+1)).
Таким образом, разработанная пространственная схема взаимодействия объектов позволяет создавать программные продукты, предполагающие наличие поэтапной обработки исходной информации. При этом построение данной схемы производится на различных уровнях создания конечного продукта:
- на уровне программного кода при описании математических моделей, положенных в основу работы программного модуля;
- на уровне объектов и модулей при описании конечной программы, входящей в комплекс программ;
- на уровне формирования комплекса на основе имеющихся программ в зависимости от поставленной задачи.
Применение пространственной схемы взаимодействия объектов позволит снизить ресурсные и временные затраты на получение конечного продукта, а при создании комплекса программ в рам-
Формирование
наборов данных □□□□
□□ □□□□□
Распределение наборов данных
□ □ □ □ □
Построение моделей в рамках аналитического подхода
Спектральный анализ '
Корреляцион ный _анализ
4
f (X)
Механизм 1
f (X,,)
f (X)
Механизм 2
F (f (K),f (V)) £X,, JdX, ■ d
dX
Механизм 3
Реализация механизмов поиска скрытых закономерностей
Механизм N
Рис. 3
X
ках систем «Data Mining» организовать ступенчатую платформу анализа данных.
Литература
1. Data Mining Community's Top Resource. URL: http://www.kdnuggets.com (дата обращения: 01.06.12).
2. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? USA, California, Tandem Computers Inc., 1996.
3. Дюк В.А. Data Mining - интеллектуальный анализ данных. СПб: СПИИ РАН: URL: http://www.inftech.webservis.ru/it/ database/datamining/ar2.html (дата обращения: 01.06.2012).
4. Джексон Д. Ряды Фурье и ортогональные полиномы; [пер. с англ.]. М., Л.: Глав. изд-во иностран. лит-ры, 1948.
5. Дедус Ф.Ф., Махортых С.А., Устинин М.Н., Дедус А.Ф. Обобщенный спектрально-аналитический метод обработки информационных массивов. Задачи анализа изображений и распознавания образов. М.: Машиностроение, 1999. 357 с.
6. Прохоров С.А., Куликовских И.М. Численно-аналитический подход к вычислению интегралов при построении ортогональных моделей // Вестн. СамГТУ: Физматнауки. 2009. № 2 (19). С. 140-146.
7. Прохоров С.А., Куликовских И.М. Применение метода ортогональных разложений для выявления зависимостей между характеристиками ортогональных базисов // Аналитические и численные методы моделирования естественно-научных и социальных проблем: сб. стат. IV Междунар. науч.-технич. конф. Пенза: Приволж. дом знаний, 2009. С. 81-83.
References
1. Data Mining Community's Top Resource, available at: www.kdnuggets.com (accessed 01.06.12).
2. Tandem Computers Inc., Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? USA, California, 1996.
3. Duke V.A., St. Petersburg Institute for Informatics and Automation of RAS, available at: www.inftech.webservis.ru/it/da-tabase/datamining/ar2.html (accessed 01.06.2012).
4. Jackson D., Ryady Furye i ortogonalnye polinomy (Fourier Series and Orthogonal Polynomials), Moscow, Leningrad, Glavnoe izdatelstvo inostran. lit-ry, 1948.
5. Dedus F.F., Makhortykh S.A., Ustinin M.N., Dedus A.F., Obobshchenny spektralno-analiticheskiy metod obrabotki informa-tsionnykh massivov. Zadachi analiza isobrazheniy i raspoznavaniya obrazov (Generalized Spectral-Analytic Method of Information Array Processing. Problems of Image Analysis and Pattern Recognition), Moscow, Mashinostroyenie, 1999, 357 p.
6. Prokhorov S.A., Kulikovskikh I.M., Vestnik Samarskogo Gos. Tekhnich. Univ, 2009, no.2 (19), pp. 140-146.
7. Prokhorov S.A., Kulikovskikh I.M., Sbornik statey IV mezhdunarodnoy nauchno-tekhnicheskoy konferentsii «Analitiches-kiye i chislennye metody modelirovaniya estestvenno-nauchnykh i sotsialnykh problem» (Collection of Articles of the IV International Scientific and Technical Conference «Analytical and Numerical Methods of Science and Social Problem Simulation»), Penza, Privolzhsky Dom Znaniy, 2009, pp. 81-83.
УДК 681.3
САМАРСКАЯ ШКОЛА ПРОФЕССОРА С.А. ПРОХОРОВА ПО ПРИКЛАДНОМУ АНАЛИЗУ СЛУЧАЙНЫХ ПРОЦЕССОВ
А.В. Иващенко, к.т.н.; И.М. Куликовскихк.т.н.
(Самарский государственный аэрокосмический университет им. академика С.П. Королева (национальный исследовательский университет), [email protected], [email protected])
Описываются основные результаты работы кафедры информационных систем и технологий Самарского государственного аэрокосмического университета под руководством профессора С.А. Прохорова в области прикладного анализа случайных процессов, временных рядов и потоков событий. Выделена проблема и описаны главные этапы аппроксимативного анализа вероятностных характеристик для произвольной вероятностной характеристики, для корреляционно-спектрального анализа и для взаимного корреляционно-спектрального анализа. Указаны результаты, полученные в ходе исследований в области разработки технологии и ПО автоматизированных систем прикладного анализа случайных процессов, содержащие математическое описание, методы и алгоритмы моделирования случайных процессов, потоков событий и неэквидистантных временных рядов; методы и алгоритмы анализа законов распределения, характеристических функций, корреляционно--спектральных функций, структурных функций; решение задач вторичной обработки временных рядов, включающих идентификацию случайных процессов по виду функциональной характеристики, аппроксимацию законов распределения, характеристических, корреляционных, структурных функций, спектральных плотностей мощности параметрическими моделями, представляющими собой как функции заданного вида, так и ортогональные функции экспоненциального типа. Приведено описание функциональности комплекса автоматизированных систем, позволяющих решать разнообразные прикладные задачи анализа случайных процессов и временных рядов. Даны также примеры реальных задач, при решении которых использовались указанные методы и алгоритмы прикладного анализа случайных процессов: в физике, акустике, океанологии, медицине, машиностроении и в других областях, где необходима обработка случайных процессов с различными характеристиками.
Ключевые слова: случайные процессы, временные ряды, случайные потоки, корреляционно-спектральный анализ, ортогональные функции, автоматизированная система.
SAMARA SCHOOL OF PROFESSOR S.A. PROKHOROV ON APPLICATION ANALYSIS
OF RANDOM PROCESSES
Ivaschenko A. V., Ph.D.; Kulikovskikh I.M., Ph.D.
(Samara State Aerospace University, [email protected], [email protected])