Логико-комбинаторный алгоритм фрагментации двумерных экспериментальных данных для задач "Cut-Glue" аппроксимации
Р.А. Нейдорф, О. Т. Ярахмедов Донской государственный технический университет, Ростов-на-Дону
Аннотация: Построение математических моделей технических объектов чаще всего связано с математической обработкой экспериментальных данных. Из-за существенно нелинейных взаимозависимостей внутренних переменных аппроксимация таких данных с использованием известных подходов, (полиномиальных разложений, сплайн-аппроксимация и пр.), затруднительна. Кроме того, она связана с большими погрешностями. Проведены исследования по созданию и обоснованию метода «Cut-Glue» аппроксимации, альтернативного существующим методам. При реализации метода «Cut-Glue» выделяются три подзадачи: фрагментации, аппроксимации, а также мультипликативно-аддитивной обработки результатов, полученных при решении двух первых подзадач. Начальной является подзадача фрагментации экспериментальных данных. Она является подготовительным этапом для последующих этапов реализации метода «Cut-Glue» аппроксимации. Для ее решения используются логико-комбинаторные особенности, а также условия дискретного разбиения многомерных данных. Он позволяет рассмотреть максимально возможное количество всевозможных решений при поиске наилучшего, т.е. создать условия для оптимизации решения подзадачи фрагментации. Метод «Cut-Glue» аппроксимации реализует принципиально новый подход и обеспечивает высокое качество решения задач экспериментального математического описания существенно нелинейных технических объектов. Для реализации подзадачи фрагментации разработано программное средство «ExpDataFragmentation», на первом этапе исследований ориентированный на двумерные задачи. В статье описываются сущность и возможности реализованного в нем функционала. Удобный пользовательский интерфейс содержит множество варьируемых параметров для гибкой настройки и обеспечивает удобный структурированный вывод информации на всех этапах. Это позволило провести большое количество демонстрационных экспериментов. Ключевые слова: аппроксимация, оптимизация математическая модель, комбинаторика, логические условия, эвристические алгоритмы, моделирование, программный комплекс, фрагментация.
Введение
Современные технические системы характеризуются существенной нелинейностью составляющих их объектов [1]. Из-за этой особенности, во время моделирования различных систем [2] возникает множество трудностей. Для построения их математических моделей (ММ) используется различные аппроксимационные подходы [3-5], в том числе, направленные на фрагментирование массивов экспериментальных данных (ЭД). Это связано с
тем, что фрагменты можно аппроксимировать значительно более простыми ММ. Чаще всего используются: кусочная аппроксимация, сплайн-аппроксимация и методы радиальных базисных функций. Данная работа описывает кардинально новый подход к аппроксимации ЭД, получивший название «Cut-Glue» аппроксимации (CGA) [6-11]. Данный метод обладает очевидным преимуществом перед аналогами, так как в результате его применения ММ представляется единой аналитической функцией. Как инструмент анализа и обработки данных CGA показал себя очень эффективным и перспективным методом построения ММ нелинейных технических объектов. Начальным этапом любого из этих методов является разбиение ЭД на их фрагменты (ФЭД) с менее выраженной нелинейностью. Это значительно увеличивает возможность точного описания каждого отдельного ФЭД, а совокупное использовании алгоритма CGA повышает точность совокупного описания всего массива ЭД. Поэтому задача эффективного фрагментирования данных чрезвычайно актуальна. Она является важным, определяющим подготовительным этапом к любому методу, ориентированному на фрагментарную аппроксимацию. В связи с этим в данной статье разработан и исследован один из возможных и, судя по результатам исследований, перспективных алгоритмов к фрагментации ЭД, основанный на логико-комбинаторном подходе. В силу сложности этой задачи в общей постановке, а также существенных трудностей наглядной демонстрации результатов для многомерных ММ, алгоритм и поддерживающее его программное средство (ПС) ориентированы на решение двумерных задач. Однако он строится с учетом возможности расширения функционала на многомерный случай.
Постановка задачи
Необходимо разработать логико-комбинаторный алгоритм фрагментации (ЛКАФ) экспериментально полученного массива ЭД на фрагменты - ФЭД. Алгоритм должен опираться регулярную прямоугольную структуру ЭД с сохранением размера шага варьирования переменных по каждой из двух осей факторного пространства. Он должен обеспечивать вариативное формирования всех (или значительной части) возможных вариантов разбиения. Основным свойством ЛКАФ должна быть высокая вариабельность и разнообразие структур разбиения. На его основе необходимо спроектировать и реализовать ПС исследовательско-демонстрационного назначения и протестировать его результативность.
Концептуальная модель логико-комбинаторного алгоритма фрагментации двумерных экспериментальных данных
Форма представления фрагментируемых ЭД.
Исследуемое пространство представляет собой упорядоченное множество ЭД, которое может быть представлено ^-мерным параллелипипедом в факторном пространстве. Ставится задача разбиения полного массива ЭД на его фрагменты - ФЭД, которые должны также быть представлены параллелипипедами в том же ^-мерном факторном пространстве. Возможен и другой подход, когда представление в факторном пространство заменяется N -мерной матрицей, построенной из значений ЭД, если N -мерную матрицу определить, как «^мерную параллелепипедную таблицу чисел». Однако такой подход требует решения непростой и сугубо математической задачи - построения специальной теории многомерных матриц. Поэтому в данной работе авторами рассматриваются примеры именно в факторном пространстве.
:
Пример подобных ЭД схематично проиллюстрирован на рисунке 1. двумерным массивом данных в двумерном декартовом пространстве, характерным для результатов экспериментов, спланированных регулярным изменением координат (факторов), когда значения фактора х1 представлено
одинаковыми п-ками для любого у^, и, наоборот, значения фактора у^ представлено одинаковыми т-ками для любого х±.
Рисунок 1 - Схема 2-мерных экспериментальных данных
Иными словами,
(Х1)
где - координаты по осям х и у; п - количество фактора по оси х; т -количество фактора по оси у.
Стоит отметить, что деление факторных осей во многих экспериментах по сугубо предметным причинам может оказаться неравномерным из-за неодинаковых шагов варьирования факторов, т.е. значения х1 Е [1;п] и
у С ; могут распределяться не одинаково и не равномерно. Кроме того,
изменение факторов х1 и у^ могут по тем же предметным причинам оказаться
асинхронными. Однако такой вариант исключает применение как представление в декартовом пространстве, так и в псевдоматричной форме, и затрудняет математическое описание ЭД и аналитическую работу с ним. Поэтому в настоящем исследовании мы ограничимся представлением ЭД именно параллелипипедом в ^мерном декартовом факторном пространстве.
На рисунке 2 приведена исходная основа 2-мерного пространства ЭД для дальнейшей демонстрации этапов фрагментации, которая ограничена размерами в шагах варьирования 6x5, как показано на рисунке 2, то есть
У1 5 4 3 2 1
1&-А)
0 123 45 6 X
Рисунок 2 - Схема примера ЭД для заполнения ФЭД
Особенности представления фрагментов ЭД
Следует акцентировать внимание еще на одном существенном аспекте характера фрагментации данных описанной в данном подпункте структуры. Этот аспект является следствием одной из важнейших парадигм метода СОЛ. Согласно этой парадигме все соседние ФЭД должны иметь общие данные по границам их взаимных контактов. Для произвольной размерности объекта исследования и математического описания это будут гипервершины, т.е.
точки из ЭД в подпространстве нулевой размерности, гиперрёбра, т.е. отрезки прямых с точками из ЭД в подпространстве первой размерности, гиперграни, т.е. прямоугольники, образованные ЭД, в подпространстве второй размерности, и т.д. вплоть до гиперграней в подпространстве размерности N — 1.
Таким образом, очевидно, что объединение всех фрагментов представляет собой исследуемое пространство данных полностью. Для рассматриваемого в статье 2-мерного варианта фрагментации это условие выразится отношением:
5- ', ■ ■ У. - i, (Х2)
где - 2-мерный фрагмент разбиения; р - количество фрагментов; S - все
множество ЭД (S - от «snippet»).
Кроме того, пересечение соседних фрагментов есть подмножество элементов, образующих их общую границу:
Я Г S- =£?:,■;=£?; , (Х3)
где и $g стыкующиеся фрагменты, a — fflfc, (В - от «border») -
сливающиеся грани.
Ввиду сложностей иллюстрации объектов исследования высокой размерности, а также очевидности наследования общих положений преобразований при повышении размерности, дальнейшее описание подхода к фрагментации ЭД приводится на примере двумерных факторных данных.
Пример представления ЭД фрагментами
Пусть для полученных для дальнейшей аппроксимации ЭД, представленных прямоугольником в 2-мерном евклидовом пространстве
некоторым образом построен его фрагментированный вариант, представленный на рисунке 3 схематически.
На примере этого разбиения можно наглядно продемонстрировать некоторые описанные раннее особенности фрагментации. Так, например, рассмотрим отрезок-ребро, содержащий точки ЭД (rf^d^a) где d - данное
(от «data»), первый нижний индекс - по оси абсцисс, второй - по оси ординат. Он является общей гранью для фрагментов 2 и 3.
Рисунок 3 - Пример готового разбиения ЭД
При этом другой отрезок-ребро фрагмента 2, содержащий точки ЭД являются полноценной общей гранью только для него, а для 1-го
фрагмента это лишь часть, общего с отрезками 2 и 4-ребра Или, в
случае данного с координатами которое образует общую вершину для
ФЭД 2, 3, 4 и 5. Если рассмотреть фрагмент под номером 5, то видно, что все данные в этом фрагменте являются граничными и являются смежными с соседними фрагментами.
Основные принципы генерации двумерных ФЭД
Любой корректный алгоритм представляет собой совокупность последовательных шагов, т.е. схему действий, приводящую к желаемому результату. Поэтому необходимо построить математические модели исходных, промежуточных данных и результатов, сформулировать и обосновать методику их преобразований, и условия реализации каждого этапа этих преобразований. В двумерном случае преобразования заключаются в разбиении ЭД, заданного прямоугольником в факторном пространстве его независимых переменных, на возможные варианты покрытия этого пространства прямоугольниками меньших размеров, на которые наложены определенные ограничения, связанные с рассмотренными выше условиями (Х.2) и (Х.3), а также с сущностью решаемой задачи -аппроксимации каждого ФЭД с допустимой точностью.
Этапами комбинаторного алгоритма фрагментации (КАФ), которые описываются в настоящей работе на примере двумерных ЭД, являются перечисленные далее преобразования.
1. На обязательном для любого алгоритма этапе инициализации, он ориентирован на принятие решений в условиях полного размера ЭД -h = (Лдл h^j- и его исходной топологии. В примере на рис. 3 - й = (6, 5).
Поэтому КАФ настроен на работу с исходными предельно допустимыми входными параметрами для ФЭД: минимальная (¿fi^*") и максимальная
(Дй™®*) координатные длины сторон фрагмента S, где с Е (с от
«coordinate»). Таким образом, на этапе инициализации длины сторон ФЭД генерируются в интервалах заданных соотношением:
Разумеется, всегда имеют определенные ограничения и известны пользователю КАФ. В дальнейшем планируется усовершенствовать данный
ДЙ^11 Ма £ М
(Х4)
этап автоматическим адаптационным подбором данных величин на основе циклического анализа исследуемых структур разбиения на итоговую точность аппроксимации.
На следующих за инициализацией этапах КАФ осуществляется построение фрагментной структуры разбиения путем последовательного заполнения двумерного пространства ЭД генерируемыми ФЭД.
2. На втором после инициализации этапе (первом в цикле последовательной фрагментации) автоматически или пользователем КАФ выбирается сторона (граница ЭД), начиная с которой пространство ЭД будет последовательно заполняться фрагментами. Для конкретизации дальнейшего описания рассмотрением примера за начало фрагментации выберем нижнюю границу ЭД на рис. 3.
3. Далее реализуется поиск точек ЭД, которые расположены ближе всего к стороне начала фрагментации, то есть к оси Ох. При этом они будут либо граничными точками ЭД, то есть иметь значение координаты у = 1(в
начале процесса фрагментации), либо гранями ФЭД уже сформированного ранее набора. Последнее возможно, когда ФЭД уже заполнили выбранную начальную крайнюю грань ЭД. Оба примера представлены на рисунке 4, на котором предполагаемые найденные наборы точек обведены красным контуром.
Математические условия поиска стартовых граней для генерации к уже сформированных фрагментам следующих ФЭД выражаются условиями:
= = та* 0) ^ У™^ = тЬСК-О
(Х5)
(Х6)
а Ь
Рисунок 4 - Примеры наборов точек для старта
4. Далее из набора точек уже сформированных в поле ЭД фрагментов выбираются крайние (угловые), которые ограничены по другой оси либо границами ЭД, либо границами других фрагментов. На примере рисунка 4а данными точками являются - и а для 4Ъ - с?з а, а также ¿.,3 -
а ; г. Рисунок 4а иллюстрирует ситуацию в самом начале фрагментации
(данные на стартовой грани не принадлежат ни одному фрагменту). Рисунок 4Ь иллюстрирует промежуточную итерацию фрагментации, когда некоторый набор данных уже разбит на фрагменты, при этом точки старта будут располагаться на гранях получившихся фрагментов, а не на границе исходных ЭД.
5. На следующем шаге из сформированного к его началу набора данных случайно выбирается одна точка, которая и станет стартовой для генерации ФЭД на данной итерации. Ее условно можно обозначить ^д^кгг^ _ ^ где ^ _ координата точки старта по оси Ох; I - координата
точки старта по оси Оу.
6. На длины сторон Прежде чем генерировать фрагмент из точки аЕ^яг£,
примем за стартовые ограничения на длины сторон фрагментов следующие значения: Дй^ = ¿й^ = 2 и = = 5, которые , возможно,
будут корректироваться в силу некоторых ограничений.
:
7. Нетрудно убедиться, что первое изменение ограничения возникает, когда в процессе фрагментации вычисленное координатное ограничение становится меньше заданного на этапе инициализации значения В
результате уменьшается до величины, которая не будет выходить за
пределы ЭД:
¿й^еслил-З
■w
[п - к.
start?
если П — &
sta-rt
(Х7)
где п, т - размеры ЭД по осям Ох и Оу; d,
точки по оси с.
start
координаты стартовой
8. Второе ограничение возникает, когда в результате сгенерированного фрагмента по оси остается меньше данных чем Другими словами, у
следующего фрагмента по оси не будет выполнено условие ограничений на длину стороны. Поэтому должно быть уменьшено до значения,
которое позволит поместиться по оси еще одному фрагменту:
~ - Л^ - Ай™* если - 4,*"* - Дй™* < Дй™^ (Х8)
где п, т - размеры ЭД по осям Ох и Оу; d,
stent
координаты стартовой
точки по оси с; стах - размер ЭД по оси с.
9. Учитывая описанные в предыдущих ограничения и особенности, генерируется длины сторон очередного фрагмента на очередной итерации.
В результате итеративного выполнения описанных шагов, происходит постепенное построение структуры разбиения ЭД.
На основе описанного подхода ЛКФ было спроектировано и разработано программное средство (ПС) "Experimental Data Fragmentation by
Logical-Combinatorial Fragmentation Method" (EDF_LCFM). Данное ПС было разработано в среде Microsoft Visual Studio 2017 средствами языка программирования C#. Решение поставленных задач проведено на ПК c процессом Процессор Intel Core 2 Quad Q9400 и 8Gb оперативной памяти.
Примеры вариантов фрагментации ЭД с использования «EDF_LCFM»
В качестве демонстрационного примера были рассмотрены ЭД размерностью 50x50 с ограничением сторон в диапазоне [5;10]. На рисунке 4(a), 4(b) и 4(c) приведены примеры полученных разбиений.
Рисунок 4. Примеры полученных разбиений в результате работы
EDF_LCFM.
На рисунке 5(а) приведен пример полученного разбиений для ЭД не равностороннего формата ЭД размерностью 70x40 с ограничениями генерируемых сторон в диапазоне [5;10]. На рисунке 3(Ь) приведен пример полученного разбиения для ЭД большой размерности ЭД (150x150) с ограничениями генерируемых сторон в диапазоне [5;10]. Очевидно, что разработанный алгоритм показывает высокую эффективность при решении задачи фрагментации, при различных значениях настроечных параметров и форматов ЭД. Разработанное ПС позволяет наглядно демонстрировать все особенности процесса ЛКФ.
а Ь
Рисунок 5. Примеры полученных разбиений: а - разбиение ЭД размерностью 100x50, Ь - разбиение ЭД размерностью 150x150.
Для оценки вариативности получаемых разбиений были проведены дополнительные эксперименты. В качестве задачи рассматривался полигон размером 70x100. Стороны фрагментов генерировались в диапазоне [5;10]. Выборка результатов делалась из 10000 экспериментов. В качестве оценки принималось количество полученных в результате фрагментов. На рисунке 6 представлена диаграмма полученных результатов в процентах. Из диаграммы на рисунке 6 видно, что алгоритм показывает высокую степень вариативности. В проведенных экспериментах получен достаточно широкий диапазон сформированных компоновок фрагментов. Для детального анализа необходимо провести ориентированные статистические исследования. Время, затрачиваемое на получение одного разбиения, варьировалось от ~0,0004 до ~0,02 секунды, но, по результатам проведенных 10000 экспериментов, занимает, в среднем, ~0,0006 секунды.
Рисунок 6. Диаграмма вариативности разбиения по количеству полученных
фрагментов.
Стоит отметить некоторые особенности алгоритма ЛКФ. В процессе выполнения учитываются необходимые условия фрагментации в рамках метода «Cut-Glue» [6-11]. Принимая во внимание, что представленный алгоритм является примитивным, но при этом показывает высокую эффективность в рамках рассмотренной задачи, принято решение продолжить его дальнейшую модификацию и изучение, в целях повышения его эффективности и гибкости, а также оценки границ применимости в рамках поставленной задачи.
Заключение
Разработанный авторами подход ЛКФ показал приемлемые качественные и количественные результаты при решении задач различной сложности. Проверка проводилась на задачах с разбиением от 10 до 150. Во всех испытаниях алгоритм не допустил ошибок при фрагментации. Результаты
его испытаний показали целесообразность продолжения исследований в выбранном направлении. Можно сделать вывод, что разработанный программный инструмент отвечает всем необходимым условиям и позволяет найти требуемое разбиение.
Благодарности
Работа выполнена при финансовой поддержке РФФИ, проект №18-0801178/18 А; доложена на МНК САУиОИ и опубликована при финансовой поддержке РФФИ, проект №18-07-20056 Г.
Литература
1. Boeing, G. Visual Analysis of Nonlinear Dynamical Systems: Chaos, Fractals, Self-Similarity and the Limits of Prediction. / G. Boeing // 2016. Systems. 4 (4). Pp 37-54.
2. Семенякина А.А., Никитина А.В., Хачунц Д.С., Кузнецова И.Ю., Проценко С.В. Аппроксимация 3-й краевой задачи схемами повышенного порядка точности / Инженерный вестник Дона, 2015, №4. URL: ivdon.ru/ru/magazine/archive/n4y2015/3449.
3. Лоран П.-Ж. Аппроксимация и оптимизация: Пер. с англ. / П.-Ж. Лоран // Издательство «Мир», Москва: — 1975. — 496 с.
4. De Boor, С. A practical guide to splines. — 1978. Springer. 341 p.
5. Buhmann, Martin D. Radial Basis Functions: Theory and Implementations / D. Buhmann, Martin // Cambridge University Press, — 2003. — 272 p.
6. Нейдорф Р. А., Черногоров И.В. Оптимизация результатов метода "Cut-Glue" аппроксимации экспериментальных данных с использованием роевого алгоритма / Инженерный вестник Дона, 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5175
7. Neydorf R., Sigida Y. Identification of Traction and Power Characteristics of Air-Screw Propulsors in Mathematical Description of Airship, // SAE 2014
Aerospace Systems and Technology Week, September 23 - 25 2014 - Cincinnati, OH, USA// SAE Technical Paper 2014-01-2134, — 2014.
8. Neydorf R., Bivariate "Cut-Glue" Approximation of Strongly Nonlinear Mathematical Models Based on Experimental Data // SAE Int. J. Aerosp. 8 (1). -2015. Pp 47-54,
9. Neydorf R. and Neydorf A. Technology of Cut-Glue Approximation Method for Modeling Strongly Nonlinear Multivariable Objects. Theoretical Bases and Prospects of Practical Application // SAE Technical Paper 2016-01-2035, — 2016.
10. Neydorf R., Iarakhmedov O. Structural-parametric optimization of the experimental data decomposition into approximated fragments // MATEC Web Conf. XIII International Scientific-Technical Conference "Dynamic of Technical Systems" (DTS-2017). — 2017. — Volume 132. — 6 P.
11. Neydorf R., Chernogorov I., Polyakh V., Yarakhmedov O., Goncharova Y., Vucinic D. Comparative Analysis of Heuristic Algorithms for Solving Multiextremal Problems // International Journal on Advances in Systems and Measurements. vol. 10, №1&2. 2017. PP. 86-99.
References
1. Boeing, G. Visual Analysis of Nonlinear Dynamical Systems: Chaos, Fractals, Self-Similarity and the Limits of Prediction. 2016. Systems. 4 (4). Pp 3754.
2. Semenyakina A.A., Nikitina A.V., Xachuncz D.S., Kuzneczova I.Yu., Procenko C.V. Inzenernyj vestnik Dona (Rus), 2015, №.4. URL: ivdon.ru/ru/magazine/archive/n4y2015/3449.
3. Loran P.-Zh. Approksimaciya i optimizaciya [Approximation and optimization]: Per. s angl. Izdatelstvo «Mir», Moskva: 1975. 496 p.
4. De Boor, C. A practical guide to splines. 1978. Springer. 341 p.
5. Buhmann, Martin D. Radial Basis Functions: Theory and Implementations Cambridge University Press, 2003. 272 p.
6. Nejdorf R.A., Chernogorov I.V. Inzenernyj vestnik Dona (Rus), 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5175.
7. Neydorf R., Sigida Y. SAE 2014 Aerospace Systems and Technology Week, September 23 - 25 2014. Cincinnati, OH, USA.SAE Technical Paper 2014-012134, 2014.
8. Neydorf R., SAE Int. J. Aerosp. 8 (1). 2015. Pp 47-54,
9. Neydorf R. and Neydorf A. SAE Technical Paper 2016-01-2035, 2016.
10. Neydorf R., Iarakhmedov O. MATEC Web Conf. XIII International Scientific-Technical Conference "Dynamic of Technical Systems" (DTS-2017). 2017. Volume 132. 6 P.
11. Neydorf R., Chernogorov I., Polyakh V., Yarakhmedov O., Goncharova Y., Vucinic D. International Journal on Advances in Systems and Measurements. vol. 10, №1&2. 2017. PP. 86-99.