Научная статья на тему 'Система интеллектуального анализа данных технического диагностирования устройств железнодорожной автоматики и телемеханики'

Система интеллектуального анализа данных технического диагностирования устройств железнодорожной автоматики и телемеханики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНИЧЕСКОЕ ДИАГНОСТИРОВАНИЕ / АДАПТИВНОСТЬ / ОЦЕНКА ТЕХНИЧЕСКОГО СОСТОЯНИЯ УСТРОЙСТВА / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / БАЙЕСОВСКАЯ СЕТЬ ДОВЕРИЯ / EQUIPMENT'S TECHNICAL STATE EVALUATION / TECHNICAL DIAGNOSTICS / ADAPTIVITY / INTELLECTUAL DATA ANALYSIS / BAYESIAN TRUST NETWORK

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горишний Дмитрий Владимирович

Техническое диагностирование является одной из важных составляющих процесса обеспечения бесперебойного функционирования устройств железнодорожной автоматики и телемеханики (ЖАТ). В статье рассматривается применение вероятностной модели зависимостей при разработке базы знаний автоматизированной системы интеллектуального анализа данных о диагностических состояниях устройств ЖАТ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

intellectual data analysis system for technical diagnostics of railway automation and telemechanics equipment

Technical diagnostics is one of the most important components of railway automation and telemechanics equipment ensuring faultless operation of railway automatics and telemechanic devices. The article provides a description of the development intellectual data analysis system, using probabilistic dependencies model for knowledge base. The purpose of the system is to process railway equipment diagnostic data.

Текст научной работы на тему «Система интеллектуального анализа данных технического диагностирования устройств железнодорожной автоматики и телемеханики»

 График, отображающий изменение коэффициента эффективности

Аналогичными методами можно осуществлять оптимизацию по критериям равномерности загрузки заводов-изготовителей, преимущественного применения оборудования определенного типа (с высоким качеством изготовления) и т. д.

Применение предложенных методов позволит осуществлять принятие управленческих решений на основе применения математических методов анализа и оптимизации большого числа данных, содержащихся в технической документации и регистрации в системе электронного документооборота процессов ее перемещения и обработки, представления результатов этого анализа в удобной для восприятия больших объемов информации графической форме.

Применение формальных математических методов для оптимизации принятия решений на всех уровнях управления позволит сократить затраты на приобретение и доставку оборудования, сократить время выполнения заказов, улучшить равномерность загрузки предприятий, выпускающих оборудование и, следовательно, сократить сроки выполнения работ по капитальному строительству и ремонту систем СЦБ.

Библиографический список

1 Интегрированная система проектирования и ведения технической документации / М.Н. Василенко, В.Г. Трохов, П.Е. Булавский, Б.П. Денисов // Автоматика, связь, информатика. - 2000. - № 9. - С. 29-32.

2 Василенко, М.Н. Организация электронного документооборота на полигоне Октябрьской железной дороги при реконструкции и модернизации систем автоматики и телемеханики / М.Н. Василенко, Б.П. Денисов, П.Е. Булавский // Вестник Ростовского Государственного университета путей сообщения. - 2008. - № 4. - С. 67-72.

3 Зорич, В.А. Математический анализ МЦНМО / В.А. Зорич. - М., 2002.

УДК 656.25.004.58 + 06

Д.В. Горишний

СИСТЕМА ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ТЕХНИЧЕСКОГО ДИАГНОСТИРОВАНИЯ УСТРОЙСТВ ЖЕЛЕЗНОДОРОЖНОЙ АВТОМАТИКИ И ТЕЛЕМЕХАНИКИ

Введение. Техническое диагностирование является одной из важных составляющих процесса обеспечения бесперебойного функционирования устройств железнодорожной автоматики и телемеханики (ЖАТ). Массовое внедрение автоматизированных систем диагностирования создает предпосылки для модернизации технологии обслуживания устройств ЖАТ и перехода на обслуживание устройств «по состоянию» [1].

Для успешного решения этих задач системы диагностирования должны не только обеспечивать получение достоверной информации о состоянии устройства в режиме реального времени, но и обладать рядом дополнительных свойств и характеристик, таких как:

- высокий уровень автоматизации деятельности эксплуатационного персонала;

- масштабируемость;

- адаптивность и способность к обработке трудноформализуемой, нечеткой информации;

- способность к раннему обнаружению отклонений в работе устройств, к формированию оценок технического состояния устройств.

Некоторые из этих свойств, как, например, автоматизацию работы персонала и масштабируемость, можно реализовать с помощью применения стандартных программно-аппаратных средств.

Другие же свойства - адаптивность, способность к обработке нечеткой информации, к формированию оценок технического состояния - можно обеспечить только при использовании методов интеллектуального анализа данных.

1 Интеллектуальный анализ данных в системах ТДМ

Под интеллектуальным анализом данных (ИАД) понимается комплексный автоматизированный процесс обработки исходных (т.н. «сырых») данных, с целью извлечения первоначально неизвестных и потенциально полезных знаний, скрытых закономерностей, корреляций и т.д. Зарубежными аналогами термина ИАД являются Data Mining («добыча» данных) и Knowledge Discovery in Databases (обнаружение знаний в базах данных) [2].

С помощью методов ИАД решаются следующие основные задачи:

- классификация;

- регрессия;

- поиск ассоциативных правил;

- кластеризация.

Продукционные и статистические методы, часто применявшиеся ранее при создании экспертных и аналитических систем, в настоящее время используются реже, хотя в отдельных случаях также себя оправдывают. Например, продукционные методы эффективны при небольшом количестве правил (продукций), т.е. если предметную область можно достаточно полно описать ограниченным набором утверждений. Применение статистических методов оправданно при обработке данных за длительные периоды времени, если речь идет об отказах и предотказах, т.е. о единичных событиях, либо при обработке данных за произвольные периоды времени, если анализируются числовые ряды, содержащие измеренные значения параметров устройств.

Анализ функциональности ведущих систем технического диагностирования и мониторинга железнодорожной отрасли РФ, в числе которых АПК-ДК, АСДК и АДК-СЦБ, показал, что в области диагностирования устройств ЖАТ методы интеллектуального анализа данных пока практически не используются [3, 4, 5]. Функции экспертных систем в вышеперечисленных системах реализованы лишь частично.

В случае диагностирования устройств ЖАТ описать всю предметную область небольшим набором утверждений не представляется возможным, в силу многообразия типов и подтипов устройств и существенных различий в алгоритмах их функционирования, т.о. применение продукционных методов себя не оправдывает.

Примнение статистических методов ограничено, во-первых, малой частотой возникновения аварийных ситуаций на отдельно взятом устройстве, а во-вторых - тем фактом, что около половины всех отказов устройств СЦБ являются внезапными [6], что не позволяет точно предсказать отказ устройства по измеренным значениям его параметров (тока, напряжения и т.д.).

Основная ценность диагностики заключается, прежде всего, в своевременном выявлении возникновения отказа устройства. После того, как произошел серьезный отказ, его обнаружение само по себе мало полезно [6]. Даже при условии мониторинга устройства в режиме реального времени, устранение возникшего отказа потребует ряда временных задержек, обусловленных действующей технологией обслуживания устройств ЖАТ.

Соответственно, для снижения количества возникающих отказов необходим переход на технологию технического обслуживания (ТО) устройств ЖАТ «по состоянию», чтобы основанием для ТО был не только план-график, но и оценка текущего состояния устройства.

Таким образом, в исследованиях, направленных на дальнейшее развитие систем ТДМ, весьма актуальными являются задачи предупреждения отказных и предотказных ситуаций, и модернизации технологии ТО устройств ЖАТ.

2 Описание предлагаемой системы интеллектуального анализа данных

Для решения вышеописанных задач предлагается разработать автоматизированную систему интеллектуального анализа данных, выполняющую следующие основные функции:

- ведение и актуализация базы знаний, содержащей модели зависимостей между сбоями;

- формирование оценок технического состояния диагностируемых устройств ЖАТ;

- информирование эксплуатационного персонала о возможных сбоях.

Функциональность и эффективность системы ИАД-ЦТДМ в значительной степени обусловлены использованием в ЦТДМ механизма унификации: данные о состояниях и параметрах устройств ЖАТ поступают в систему в унифицированном формате. В табл. 1 приведены основные определения унификации, использованные при проектировании структуры системы ИАД-ЦТДМ.

Основные определения унификации

Таблица 1

Термин Определение

Модель устройства или группы устройств ЖАТ в системе

ТДМ, участвующей в информационном обмене. В процессе обмена в

каждый момент времени объект характеризуется состоянием, набо¬

ром диагностических ситуаций и набором значений параметров.

Унифицированный объект Каждый унифицированный объект относится к определенному

унифицированному типу объектов. Унифицированные типы объек¬

тов объединяют схожие по функциональности устройства ЖАТ, со¬

стояния которых можно описать однотипно, например, рельсовая

цепь (РЦ), стрелка, устройство электропитания

Структура данных, характеризующая тип измеряемой величи¬

Унифицированный параметр ны (например - напряжение, сопротивление, выдержка времени

и т. д.), измеренное значение и, соответственно, единицы измерения

Структура данных, характеризующая работоспособность уст¬

Унифицированное диагно¬ ройств ЖАТ или проведение специализированных технологических

стическое состояние операций, при этом объект может одновременно находиться в не¬

скольких совместных диагностических ситуациях. Включает в себя

штатные состояния и сбои (предотказы и отказы)

В силу существенных различий между наборами возможных унифицированных диагностических состояний различных типов устройств ЖАТ, для каждого унифицированного типа требуется отдельный фрагмент базы знаний, структура которого отражает вероятностные причинно-следственные зависимости между сбоями данного типа устройств.

В качестве логической структуры базы знаний системы предлагается применить вероятностную модель на основе одного из методов интеллектуального анализа данных - байесовской сети (БС). Выбор БС обусловлен возможностью составления полной и наглядной модели зависимостей между объектами рассматриваемой предметной области (например, между возможными состояниями устройства) и использования вычислительно эффективных алгоритмов вероятностного вывода [7, 8, 9]. Полнота модели зависимостей определяется на основе мнений группы экспертов.

Формальные средства байесовских сетей были разработаны для обеспечения эффективного представления неопределенных знаний и проведения на их основе строгих рассуждений. Это позволило преодолеть многие проблемы систем вероятностных рассуждений, возникавшие в 19601970-х гг.; байесовский подход стал одним из доминирующих в таких направлениях исследований искусственного интеллекта, как формирование рассуждений в условиях неопределенности и экспертные системы. Данный подход позволяет организовать обучение на основе опыта и сочетает в себе лучшие достижения классического искусственного интеллекта и нейронных сетей [8].

Байесовские сети (БС) объединяют в себе технологии машинного обучения и визуализации данных, и весьма удобны для описания сложных процессов и событий с неопределенностью. БС представляют собой графические модели событий и процессов на основе объединения подходов теории вероятностей и теории графов. Их название связано, прежде всего, с байесовским правилом вероятностного вывода [10].

Основная идея построения графической модели - понятие модульности, т.е. разложения сложной системы на простые элементы. Связи, отражающие зависимости, объединяют элементы в упорядоченную систему и характеризуются условными вероятностями совместной реализации событий, основными параметрами такой модели.

Модель фрагмента базы знаний (ФБЗ) описывается с помощью формальной системы S, характеризуемой четверкой:

S = ( D, L, P),

где D - множество базовых элементов (диагностических состояний);

L - множество причинно-следственных связей между элементами;

P - множество условных вероятностей (вероятностей реализации состояний с учетом его причинно-следственных связей).

Таким образом, база знаний системы ИАД-ЦТДМ представляет собой множество K:

K — {‘SbS2,■■■,SN },

где Si - модель фрагмента базы знаний, і — 1,2,...,N;

N - количество фрагментов базы знаний (определяется количеством типов устройств).

Графическое представление ФБЗ - ориентированный ациклический граф БС, вершинам которого соответствуют возможные диагностические состояния D данного типа устройств, а ребрам -причинно-следственные связи L между состояниями.

Семантически ФБЗ - структурированный набор данных, достаточный для выполнения расчета изменения распределения вероятностей реализации перехода устройства в некоторое диагностическое состояние, при заданных условиях (например, при определенном наборе предшествующих состояний), и выставления оценки технического состояния устройства, т.е. реализации отображения:

O: Di х H х F x P0 x Pt ^ M,

где Di - текущее диагностическое состояние устройства;

H - вектор предыдущих диагностических состояний устройства (история изменений);

S - модель фрагмента базы знаний;

M - оценка технического состояния устройства.

Существует два способа задания структуры БС: экспертный и алгоритмический. Первый способ подразумевает построение структуры модели исключительно с помощью труда экспертов, во втором же способе применяются различные алгоритмы синтеза моделей на основе анализа эмпирических данных, что позволяет автоматизировать наиболее трудоемкие этапы построения модели и привлекать экспертов лишь на уровне финальной верификации.

В качестве примера, на рис. 1 приведена структура ФБЗ для стрелочного привода. Структура зависимостей между ситуациями, а также априорные и условные вероятности получены в результате опроса группы экспертов в области ЖАТ. Ниже перечислены унифицированные диагностические состояния стрелочных приводов, относящиеся к сбоям.

Из состояний, приведенных на рис. 1, к предотказам стрелочных приводов относятся: кратковременная потеря контроля, увеличенное время перевода, контроль срабатывания сигнала взреза стрелки, снижение сопротивления изоляции рабочей цепи, занижение напряжения источника питания рабочей цепи, завышение напряжения источника питания рабочей цепи, завышение рабочего тока перевода. К отказам относятся: отсутствие перевода, потеря контроля, потеря контроля при занятой или замкнутой РЦ, перевод при занятой РЦ.

При инициализации ФБЗ, для каждой вершины графа задается распределение A апостериорных вероятностей, если даны ее родительские вершины, либо априорная (маргинальная) вероятность, если вершина не имеет родителей.

При появлении нового свидетельства, т.е. получении информации о переходе устройства в некоторое диагностическое состояние, соответствующее одной из вершин графа, выполняется процедура вероятностного вывода - вычисляются распределения вероятностей множества искомых переменных, на основе множества переменных свидетельства.

Известные алгоритмы вероятностного вывода подразделяются по степени точности, например алгоритм точного вывода с устранением переменной, алгоритм точного вывода с передачей сообщений, алгоритмы стохастической аппроксимации (оценка веса с учетом правдоподобия, метод Монте-Карло на основе цепи Маркова) и т.д.

Для применения алгоритма пропагации требуется предварительная трансформация графа БС в дерево сочленений, не содержащее даже ненаправленных циклов (в исходной БС ненаправленные циклы допускаются). Трансформация включает в себя несколько шагов:

- морализация - добавление ненаправленных связей между общими родителями каждой из вершин, и замену всех существующих связей на ненаправленные;

- триангуляция - разбиение всех циклов в графе с числом вершин более четырех на «треугольники», т.е. на циклы с тремя вершинами;

- построение дерева смежности и присвоение его ребрам входящих и исходящих сепараторов (специальных структур, предназначенных для хранения пересчитанных таблиц вероятностей).

Алгоритм вероятностного вывода состоит в передаче сообщений от крайних узлов, (т.н. «листьев») к корню дерева посредством сепараторов. Передача сообщения из узла дерева - пересчитанной таблицы условных вероятностей - происходит при одном из следующих условий: либо узел является «листом» дерева, либо все его входящие сепараторы содержат сообщения от смежных узлов.

База знаний системы ИАД реализована на основе СУБД MS SQL Server. В табл. 2 перечислены названия таблиц базы знаний и описание хранящихся в них данных. На рис. 2 показана структура связей между таблицами и состав полей.

Рис. 1. Структура ФБЗ для унифицированного типа устройства «Стрелочный привод»

Таблица 2

Перечень таблиц базы знаний системы ИАД

Название таблицы Описание данных

Uni_Types Унифицированные типы устройств

Uni_States Унифицированные диагностические состояния устройств

Uni_Alarms Уровни тревожности диагностических состояний

DBF_Graphs Фрагменты базы знаний

DBF_Nodes Вершины графов ФБЗ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

DBF_Links Ребра графов ФБЗ

DBF_GraphDependencies Зависимости графов

DBF_TemporalValues Интервалы между событиями, выявленные подсистемой НТО

Рис. 2. Структура связей между таблицами базы знаний системы ИАД

Прототип системы тестируется на реальных данных, поступающих из подсистем ввода сигналов диагностируемых станций, через серверы унифицированного информационного взаимодействия реального времени (СУИВ-РВ).

Схема информационных потоков взаимодействия системы с ПО ЦТ ДМ показана на рис. 3.

Рис. 3. Схема информационных потоков взаимодействия системы ИАД с ПО ЦТДМ

На сервере ИАД обрабатываются как данные, получаемые непосредственно от серверов СУИВ-РВ в режиме реального времени, так и информация из базы данных ЦТДМ, на основе которой выполняется более детальный анализ сбоев. По результатам анализа данных о сбоях в базу знаний вносятся соответствующие корректировки.

Параллельно с системой ИАД функционирует подсистема, основанная на методе нечеткого темпорального описания событий (НТО), основная функция которой - выявление паттернов сбоев устройств выполняется с помощью подсистемы анализа изменения состояний диагностируемых устройств. Под паттерном понимается НТО устойчивой (неоднократно повторявшейся) последовательности сбоев устройства ЖАТ. Применение НТО обусловлено высокими обобщающими характеристиками метода, а также возможностью ранжирования описываемых событий во времени.

Подсистема выявления паттернов сбоев функционирует в режиме реального времени, выполняя краткосрочный (до 1 ч) анализ изменений состояния устройств, на основе которого формируются паттерны сбоев устройств ЖАТ. В период тестовой эксплуатации подсистемы паттерны подлежат обязательной проверке технологами ЦТДМ, в будущем же планируется перевод подсистемы в автономный режим работы. Поддерживается интерактивный режим, в котором подсистема предоставляет пользователю (технологу ЦТДМ) возможность самостоятельно сформировать паттерн искомой последовательности сбоев (изменений состояния устройства) и выполняет в базе данных ЦТДМ поиск последовательностей, удовлетворяющих условиям паттерна.

Информирование эксплуатационного персонала о возможных сбоях будет осуществляться с применением различных средств визуализации, в сочетании с текстовым резюмированием и «нечеткими» оценками уровня технического состояния устройства.

Использовать систему предполагается в составе программного обеспечения Центра технического диагностирования и мониторинга Северо-Кавказской железной дороги (ЦТДМ СКЖД), рабочее название системы - ИАД-ЦТДМ.

Выводы

Разработка и внедрение предлагаемой системы интеллектуального анализа данных технического диагностирования позволит снизить число возникающих отказов за счет их предупреждения. Применение вероятностной модели зависимостей при разработке базы знаний системы ИАД технического диагностирования позволит оценивать вероятность возникновения отказа устройств ЖАТ и соответствующим образом корректировать план-график ТО.

Библиографический список

1 Федорчук, А.Е. Новые информационные технологии: автоматизация технического диагностирования и мониторинга устройств ЖАТ (система АДК-СЦБ) / А.Е. Федорчук, А.А. Сепетый, В.Н. Иванченко. - Ростов н/Д : РГУПС, 2008. - 443 с.

2 Piatetsky-Shapiro, G.I. Knowledge Discovery in Databases / G.I. Piatetsky-Shapiro, W. Fraw-ley. - Cambridge : MIT Press, 1991.

3 Нестеров, В.В. Совершенствование технического обслуживания устройств ЖАТ на основе внедрения систем диагностирования на примере АПК-ДК и АСУ-Ш / В.В. Нестеров // Сб. докл. «ТрансЖАТ-2005». Автоматика и телемеханика на железнодорожном транспорте. - Ростов н/Д, 2005.

- С. 48-52.

4 Аверкиев, С.А. Проблемы проектирования, строительства и сопровождения при эксплуатации автоматизированной системы диспетчерского контроля АСДК «ГТСС-Сектор» / С.А. Аверкиев // Сб. докл. «ТрансЖАТ-2005». Автоматика и телемеханика на железнодорожном транспорте.

- Ростов н/Д, 2005. - С. 3-4.

5 Федорчук, А.Е. Система диагностики, структура построения и технология использования в эксплуатации на примере АДК-СЦБ / А.Е. Федорчук, Е.А. Гоман // Сб. докл. «ТрансЖАТ-2005». Автоматика и телемеханика на железнодорожном транспорте. - Ростов н/Д, 2005. - C. 118-119.

6 Сапожников, В.В. Надежность систем железнодорожной автоматики, телемеханики и связи : учеб. пособие для вузов ж.-д. трансп. / В.В. Сапожников, Вл. В. Сапожников, В.И. Шаманов.

- М. : Маршрут, 2003. - 260 с.

7 Тулупьев, А.Л. Байесовские сети. Логико-вероятностный подход : научное издание / А. Л. Тулупьев, С И. Николенко, А.В. Сироткин. - СПб. : Наука, 2006. - 607 с.

8 Рассел, С. Искусственный интеллект: современный подход / С. Рассел, П. Норвиг. - М. : Вильямс, 2006. - 1408 с.

9 MacKay, D. Information theory, inference and learning algorithms / D. MacKay. - Cambridge University Press, 2005. - 628 p.

10 Murphy, K. A Brief introduction to graphical models and Bayesian networks / K. Murphy.

- Berkeley, 2001. - 19 p.

УДК 519.85 + 06

А.С. Сарьян

АЛГОРИТМ И МЕТОДИКА ОТБОРА ДАННЫХ ДЛЯ МОДЕЛИРОВАНИЯ

Задача управления сложными объектами, каким является сортировочная станция, требует построения адекватных моделей технологических процессов сортировки и процедур принятия оптимальных решений оператором. Показано [1], что ресурсов теории автоматического управления и регулирования недостаточно для обеспечения безопасности и качества роспуска составов. Решение проблемы видится в создании систем интеллектуального функционирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.