Научная статья на тему 'Фрактальный анализ временных рядов как статистический метод диагностики технологических процессов и систем'

Фрактальный анализ временных рядов как статистический метод диагностики технологических процессов и систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
244
79
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кочегин А. А., Шендалева Е. В.

Рассматривается возможность применения фрактального анализа рядов характеристик технологических процессов и систем и прогнозирования их дальнейшей динамики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Фрактальный анализ временных рядов как статистический метод диагностики технологических процессов и систем»

Секция «Математические методы моделирования, управления и анализа данных»

УДК 519.248

А. А. Кочегин Научный руководитель - Е. В. Шендалева Омский государственный технический университет, Омск

ФРАКТАЛЬНЫЙ АНАЛИЗ ВРЕМЕННЫХ РЯДОВ КАК СТАТИСТИЧЕСКИЙ МЕТОД ДИАГНОСТИКИ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ И СИСТЕМ

Рассматривается возможность применения фрактального анализа рядов характеристик технологических процессов и систем и прогнозирования их дальнейшей динамики.

Все технологические процессы, влияющие на качество продукции, должны контролироваться. Однако только использование хорошо организованной системы входного контроля еще не гарантируют обеспечения высокого качества готовой продукции. Необходимо управлять технологическим процессом, понижая влияние дестабилизирующих факторов, что можно достичь, располагая достаточной информацией о состоянии и возможностях процессов.

В условиях, когда предъявляются повышенные требования к качеству управления технологическими процессами, актуальными являются вопросы разработки новых и обоснованного применения известных методов диагностики и обработки измерительной информации для целей выработки адекватных решений по управлению технологическими процессами.

Возможное применение фрактальных характеристик для целей диагностики процессов связано с тем, что графики временных рядов замеров, снятых при нормальной работе объектов контроля управления, часто имеют самоподобную фрактальную структуру, что является следствием пространственно-временной фрактальности явлений, определяющих эволюцию рассматриваемых процессов и систем процессов. Установление факта фрактальности некоторого измеряемого параметра позволяет во многих случаях установить характерные особенности поведения объекта управления.

Основной характеристикой фрактальных структур является размерность Б, введенная Хаусдорфом для компактного множества параметров в произвольном метрическом пространстве. Фрактальная размерность является показателем сложности пространственно-временного распределения характеристик объекта управления. Анализируя чередование участков замеров с различной фрактальной размерностью и то, как на процессы воздействуют внешние и внутренние факторы, можно определять будущее поведение, диагностировать и предсказывать нестабильные состояния. Немаловажным моментом здесь является наличие критического значения фрактальной размерности временных рядов, при приближении к которому процесс или система теряет устойчивость и переходит в нестабильное состояние.

На практике при попытке вычислить Б непосредственно возникает серьезная проблема. Она связана с тем, что реальные временные ряды всегда имеют минимальный масштаб структуры. Существует более простой способ фрактального анализа временных рядов - метод накопленного отклонения или метод нормированного размаха с использованием логарифми-

ческого показателя Хёрста. Согласно этому методу анализируется размах суммы отклонений данных от среднего арифметического, нормированный путем деления на стандартное отклонение. Суммы отклонений подсчитываются для различных периодов времени и для различного количества последовательных моментов времени, которые выступают в качестве масштаба измерения.

Показатель Хёрста таким образом определяется из следующего соотношения:

R/S = (aN)H, (1)

где R/S - нормированный размах (отношение размаха временного сигнала к стандартному отклонению наблюдений); N - число наблюдений; а - константа; Н -показатель Хёрста. Он количественно характеризует меру упорядоченности амплитуд измеряемого параметра во времени, уровень хаотичности временного сигнала и его фрактальные характеристики. Для надежного вычисления H требуется довольно большой репрезентативный масштаб, содержащий несколько тысяч данных.

Для хаотических сигналов, в отсутствие статистической корреляции амплитуд временных рядов значение H = 0,5. При наличии же некоторого запаздывания, «памяти тренда», показатель Н увеличивается. Исследования многих авторов, связанные с изучением разнообразных естественных процессов, в большинстве случаев идентифицируют показатель Н в диапазоне 0,7-0,9 [1-3].

Для самоафинных кривых величины Н и D связаны друг с другом зависимостью Н = 2 - D. При подсчете Н и D по реальным кривым это равенство выполняется только приближенно и может быть использовано для проверки достоверности оценок фрактальных характеристик.

Показатель Херста имеет в применении к временным рядам содержательный смысл. Значения Н и D характеризуют меру «изломанности» процесса. При Н < 0,5 (D > 1,5) значения ряда резко изменяются, процесс обладает долговременной знакопеременной тенденцией. Когда Н приближается к 0, график ряда стремится заполнить собой плоскость, превратиться из линии в плоскую фигуру, что соответствовало бы D = 2. При Н = 0,5 (D = 1,5) ряд обладает свойствами так называемого «белого шума», т. е. значения ряда абсолютно независимы и между ними нет каких-либо автокорреляций. При 0,5 < Н < 1 (1 < D < 1,5) в ряде имеются автокорреляции и накопление изменений приводит к появлению долговременной тенденции к возрастанию или убыванию. Эта тенденция может

Актуальные проблемы авиации и космонавтики. Информационные технологии

быть проявлением длинного непериодического цикла. Значения ряда при этом приближенно выстраиваются вдоль линии, выражающей такую тенденцию, и в пределе, когда Н = 1, совпадают с этой линией, размерность которой будет Б = 1 [4].

Использование фрактальных свойств временных рядов измерений для целей диагностики технического состояния процессов и систем требует очень большого объема данных (порядка тысячи экспериментальных замеров) Поэтому к результатам исследований, полученных при значительно меньших объемах экспериментальных данных, следует относиться с осторожностью.

Библиографические ссылки

1. Пригожин И., Стенгерс И. Порядок из хаоса. Новый диалог человека с природой ; пер. с англ. М. : Эдитариал УРСС, 2000.

2. Федер Е. Фракталы. М. : Мир, 1991.

3. Мандельброт Б. Фрактальная геометрия природы ; пер. с англ. М. : Ин-т компьютерных исследований, 2002.

4. Сериков А. Е. Фрактальный анализ временных рядов // Социология 4М. Научный журнал РАН. М. : ИС РАН. 2006. № 22.

© Кочегин А. А., Шендалева Е. В., 2011

УДК 519.68

Р. И. Кузьмич Научный руководитель - И. С. Масич Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ПРИМЕНЕНИЕ ЛОГИЧЕСКИХ АЛГОРИТМОВ КЛАССИФИКАЦИИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ДИАГНОСТИКИ МЕДИЦИНСКИХ ЗАБОЛЕВАНИЙ1

Рассматривается эффективность разработанного логического алгоритма классификации для решения задач диагностики медицинских заболеваний: рака молочной железы и гепатита.

Большинство задач диагностики, привлекающих внимание исследователей в медицине, может быть сформулировано следующим образом. Имеется выборка данных, которая состоит из двух непересекающихся множеств и «-мерных векторов. Каждый вектор соответствует некоторому пациенту, векторы множества соответствуют пациентам, находящимся в некотором медицинском состоянии (например, болен или имеет осложнение заболевания), а векторы

не соответствуют этому состоянию. Компоненты векторов, называемые признаками, представляют собой результаты определенных измерений, тестов. Эти компоненты могут быть численными, номинальными или бинарными.

Задача состоит в том, чтобы на основании имеющейся выборки данных (классифицированных ранее наблюдений) извлечь информацию о состоянии «нового» пациента, наблюдение которого не содержится в выборке. Главная цель решения таких задач - на основе анализа данных и вычислительных систем диагностики определить индивидуальную терапию для пациента.

В основе предлагаемого подхода к классификации данных лежит метод, происходящий из теории комбинаторной оптимизации и называемый логическим анализом данных.

Разработанный алгоритм классификации данных состоит из этапов, на каждом из которых требуется решение серии задач комбинаторной оптимизации. Критерий и ограничения в задачах заданы псевдобулевыми функциями, характеризующимися наличием свойств унимодальности и монотонности. От эффективности решения этих задач зависит точность и трудоемкость метода.

Построение эффективных правил и модели классификации является сложной комбинаторной задачей. Результаты ее решения определяются видом сформированных критериев и ограничений, а также используемыми алгоритмами оптимизации [1].

Разработанный алгоритм классификации данных рассмотрим на примере задачи диагностики рака молочной железы.

Для проведения испытаний использовалась выборка данных, состоящая из 211 пациентов со злокачественной опухолью (положительные объекты) и 357 объектов с доброкачественной опухолью (отрицательные объекты). 20 % из них использовалась для тестирования и в построении решающей модели не участвовала. В результате бинаризации из 30 признаков было получено 120 бинарных признаков.

В табл. 1 представлены результаты испытаний с использованием двух оптимизационных моделей: с ограничением, исключающим захват правилом объекта другого класса, и с ограничением, позволяющим покрытие правилом нескольких объектов другого класса. Приведены средние значения покрытий и степени для наборов правил.

Следующей задачей диагностики, к которой применен разработанный алгоритм классификации данных, является задача диагностики гепатита.

В испытании участвовали 32 положительных (летальный исход) и 123 отрицательных (выжившие) объектов. 15 % выборки использовалось при тесте. Бинарных признаков 37 из 20 исходных. В табл. 2 представлены результаты испытаний с использованием двух оптимизационных моделей.

1 Работа выполнена при финансовой поддержке гранта Президента РФ (код проекта МК-463.2010.9).

i Надоели баннеры? Вы всегда можете отключить рекламу.