Дубяго Марина Николаевна - Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»; e-mail: [email protected]; 347928, г. Таганрог, пер. Некрасовский, 44; тел.: 89508519304; кафедра электротехники и мехатроники; аспирант.
Полуянович Николай Константинович - e-mail: [email protected]; тел.: 88634610421, 89185693365; кафедра электротехники и мехатроники; доцент.
Dubyago Marina Nikolaevna - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +79508519304; the department of electrical engineering and mechatronics; postgraduate student.
Poluyanovich Nikolay Konstantinovich - e-mail: [email protected]; phones: +78634610421, +79185693365; the department of electrical engineering and mechatronics; associate professor.
УДК 625.14:681.3.06
А.И. Долгий, М.М. Железнов
НЕЧЕТКО ВРЕМЕННАЯ МОДЕЛЬ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ В ИНТЕГРИРОВАННЫХ СИСТЕМАХ ДИАГНОСТИКИ ПУТИ
Предлагается гибридный подход к построению интеллектуальных диагностических моделей для интегрированных систем диагностики железнодорожного пути (ИСДП), которые основаны на объединении нескольких типов диагностических моделей, оперирующих структурно временной диагностической информацией. Указанный подход базируется на модели представления нечетких темпоральных образов временных рядов в виде многоуровневой иерархической системы, каждый уровень которой отражает определенные темпо-рально логические концепты знаний, и позволяет организовать извлечение «неявных» знаний из баз данных. Использование такого метода построения может способствовать повышению объективности продукционного вывода ИСДП за счет выявления неточностей, ошибок и «пробелов» в оценке текущего состояния эксплуатируемого участка пути.
Нечетко-временная модель; диагностика; зондирование; сканирование; интегрированные системы; иерархическая система.
A.I. Dolgy, M.M. Zheleznov
FUZZY TEMPORAL MODEL OF INFORMATION REPRESENTATION
IN INTEGRATED SYSTEMS OF THE RAILWAY BED DIAGNOSTICS
The paper proposes a hybrid construction method of intelligent diagnostic models for integrated systems of the railway bed diagnostics (ISRBD) based on combining several types of diagnostic models that operate on structurally-time diagnostic information. This method is based on a representation model of fuzzy temporal patterns of time series in the form of a multilevel hierarchical system in which each level represents some temporal-logical concepts of knowledge and allows organizing the extraction of "implicit" knowledge from databases. Using this method of construction we can improve the objectivity of production output ISRBD, due to inaccuracies, errors, and "gaps" detection in assessment of the current state of the exploited section of the railway bed.
Fuzzy temporal model; diagnostics; probing; scanning; integrated systems; hierarchical system.
Комплексный контроль и диагностика состояния железнодорожного пути включает в себя в качестве обязательных компонент системы диагностики элементов верхнего и нижнего строения пути, а также прилегающих потенциально-
опасных участков земной поверхности [1]. Большинство из применяемых на железных дорогах современных систем диагностики в той или иной степени отвечает требованиям автоматизации процесса анализа получаемых данных.
В то же время перед руководителями причастных служб отрасли стоит непростая задача комплексирования и интеграции всех результатов работы механизмов, так называемой «ласкутной автоматизации» [2] анализа диагностических данных, и на основании этого принятия ряда организационно-технических решений.
Выработка ответственных решений при повышенных требованиях к безопасности движения поездов и целесообразности организационных мер, должна осуществляться на основе комбинирования результатов работы разнородных моделей, использующих различные признаковые пространства переменных, в рамках единой гибридной системы [3].
Механизм смешанного вывода обеспечивает непрерывную генерацию новых целевых фактов, полученных на основе взаимодействия разнородных моделей, в результате чего возникает лавинообразное нарастание дополнительной полезной информации, используемой в процессе принятия решений.
В нынешней стадии развития путевых технологий диагностики, часто сопровождающейся аккумулированием больших массивов данных, необходим эффективный инструмент представления и извлечения полезной информации для последующего формирования базы знаний поддержки принятия решений руководящим составом причастных служб и подразделений ОАО «РЖД».
Рассмотрим пример выборки факторов, влияющих на комплексную оценку текущего и прогнозируемого состояния верхнего и нижнего строения ж.д. пути:
♦ нестабильность по приращению среднего среднеквадратичного отклонения геометрии рельсовых линий (ССКО). Является одним из основных критериев оценки состояния верхнего строения пути, но имеет обширную природу возникновения;
♦ деформативность по данным нагрузочных испытаний. Определяется различными типами нагрузочных устройств, имеет связанные с этим погрешности и носит вспомогательной характер. Является критерием оценки верхнего и нижнего строения пути;
♦ наличие балластных углублений. Является одним из основных факторов состояния нижнего строения пути, влияющих на стабильность верхнего строения пути. Неточность диагностирования часто связана с локализацией стабильных участков, имеющих негоризонтальную литологию, таких как скальные выемки и другие «латентные» деформации автоматически определяемые программными средствами;
♦ динамика развития балластных углублений. Является информативным показателем опасности локализованной деформации подшпального основания. Имеются погрешности, связанные с сезонными изменениями;
♦ деформации земной поверхности, по результатам дистанционного зондирования Земли (ДЗЗ). Локализует деформации земной поверхности, оползневые процессы, прогнозирует устойчивость элементов инфраструктуры, расположенных на земляном полотне и в местах приближения к железнодорожному пути. Данный критерий носит комплексный характер и относится к новому классу диагностических систем, применяемых на ж.д. транспорте. Основные технологические аспекты мониторинга проиллюстрированы на рис. 1 в схематическом виде.
Объективной является необходимость вмешательства в технологический процесс движения поездов и проведения соответствующих мероприятий по обеспечению безопасности, при недопустимых значениях для соответствующих эксплуатационных норм всех перечисленных факторов на одном и том же отрезке пути.
Рис. 1. Технологическая схема мониторинга радиолокационным и оптическим данным космического дистанционного зондирования
Однако зачастую имеет место более «тонкая» и неочевидная связь, обусловленная слабой формализованностью процесса и наличием области нетривиальных закономерностей.
В настоящей статье предлагается гибридный подход к построению интеллектуальных диагностических моделей для интегрированных систем диагностики ж.д. пути (ИСДП), основанных на объединении нескольких типов диагностических моделей, оперирующих структурно-временной диагностической информацией. В основу разрабатываемой концепции представления данных в ИСДП положена модель представления нечетких темпоральных образов временных рядов в виде многоуровневой иерархической системы, каждый уровень которой отражает определенные темпорально логические концепты знаний. Нижний уровень представлен простейшими образами нечетких темпоральных признаков (НТП) и отражает темпорально-логический концепт продолжительности и нечеткости, второй и третий уровни модели представлены образами нечетких темпоральных отношений и структур отражающих все основные темпорально-логические концепты знаний, такие как: продолжительность, одновременность, очередность, совпадение и нечеткость. Так, первый уровень системы можно охарактеризовать значениями нечетких лингвистических переменных, определяющих состояние соответствующих эксплуатационных параметров, по трем значениям: «допустимое», «недопустимое», «опасное», например, N^0 - деформативность по данным нагрузочных испытаний, (1 = 1, 2, 3).
Второй уровень представлен образом ОТНОШЕНИЯ. В основу определения образа нечетко темпорального отношения положен предложенный в [4] подход к формализации нечетких темпоральных отношений, являющийся обобщением темпоральных отношений Алена на случай нечетких событий.
Как известно, любое интервальное временное событие q может быть спроецировано на временную шкалу и представлено парой граничных точек ^ и 1^, называемых соответственно началом и концом интервала. Граничные точки интервала [^ Дк] задаются с использованием характеристических функций-маркеров Рп(0 и Рк©, определенных на временной шкале Т и принимающих единичные значения в точках на-
чала и конца интервала, т.е. Рп(У=1, Рк(У=1. Характеристическую функцию Р^Й, ^]) для четкого временного интервала q можно выразить через характеристические функции его граничных точек следующим образом: РД^, ЭД)= Рп(У& Рк(^,). По аналогии, для НТП q можно ввести понятие нечетких граничных точек, определяемых с помощью нечетких характеристических функций-маркеров Рп(0 и Рк(0. Тогда нечеткая характеристическая функция НТП определится через характеристические функции его граничных точек как (1):
^(М.;]) = МьС^&иЛ-). (1)
Используя представление НТП через их граничные точки можно сформулировать понятие нечетко-темпорального отношения между НТП через точечные отношения между границами НТП. Данной формулировке предпошлем следующие рассуждения.
Пусть а, в темпоральные события, которым на временной шкале Т соответствуют интервалы [С, ^а], [^в, ^/]; Р1,Р2,Р3,Р4 - характеристические функции граничных точек ^а, ^а, 1пв, соответственно, г1* - одно из 13 темпоральных отношений Алена [5]. Тогда темпоральное отношение а г1* в может быть однозначно представлено через отношения между граничными точками интервалов рпа, ^а], йЛ ^/] путем отображения их на временную шкалу Т в строго упорядоченную последовательность временных отсчетов ^Д2,.. .Дк , (к < 4).
Примечание. Число таких отсчетов к в зависимости от семантики отношения может быть равно числу граничных точек (четырем), однако может быть и меньше, поскольку для некоторых типов отношений возможны ситуации, когда границы разных интервалов проецируются на один и тот же временной отсчет.
Заметим, что порядок следования спроецированных на временную шкалу граничных точек однозначно определяется семантикой отношения. Например, для темпорального отношения а Г^е в (ПЕРЕКРЫТИЕ) получается следующий порядок следования ^а< ^а< ^в< ^/. Учитывая, что граничные точки ^а, ^а, ^в, ^ задаются на временной шкале при помощи соответствующих характеристических функций Р1, Р2, Р3, Р4 факту упорядочивания граничных точек на временной шкале в соответствии с семантикой отношения Л* можно сопоставить отображение Ш*:(РЬ..., Р4} ^ (и,..., 1;к} (к < 4), упорядочивающее соответствующим образом граничные характеристические функции. Используя данное отображение можно формализовать логическое условие (2), которому должны удовлетворять граничные точки интервалов рпа, ^а], рпв, ^/], находящихся в отношении Л* при их проецировании на шкалу Т:
&?=ЛД*:/) = 1, а = 1......п), (2)
где ^ 0=1,2,.,к) - упорядоченные образы граничных точек интервалов [1па, ^а], ЛД ^в], спроецированных на шкалу Т, Ру = Г_1(15), (1=1,.,4).
Конъюнкцию характеристических функций &£_1^,Дс/-*) = 1, входящую в выражение (2), назовем функтором отношения Л и обозначим через Фп*0:1Д2,—Дк). Функтор Фг-еС^Дг/'-Дк) является, по сути дела, к-местным предикатом, принимающим единичное значение на к-упорядоченных временных отсчетах только в том и только том случае, если они являются граничными точка-
*
ми интервалов, находящихся в темпоральном отношении Л .
Понятно, что, поскольку для любого темпорального отношения Л* £ КГ однозначно определен сценарий взаиморасположения граничных точек на временной шкале, то для него и однозначно определен функтор отношения. В табл. 1 приведены функторы для 7 базисных отношений Алена.
Таблица 1
Функторы для 7 базисных отношений Алена
Отношение Функтор
a rts p (ПРЕДШЕСТВУЕТ) Fi(ti)& F2(t2)& F3(t3)& F4(t4), (ti< t2< ts< t/t)
a rtsn p (СТЫКУЕТСЯ) Fl(ti)& F2(t2)& F3(t2)& F4(t3X (t1< t2< t3)
a rtse p (ПЕРЕКРЫВАЕТ) F1(t1)& F2(t2)& F3(t3)& F4(t4), (t1< t3< t2< t4)
a rte p (ВКЛЮЧАЕТСЯ) F1(t1)& F2(t2)& F3(t3)& F4(t4), (t3< t1< t2< t4)
a rtn p (НАЧИНАЕТ) F1(t1)& F2(t2)& F3(t1)& F4(t3), (t1< t2< t3)
a rtk p (ЗАВЕРШАЕТ) F1 (t3< t1< t2)
a rtqu p (СОВПАДАЕТ) F1(t1)& F2(t2)& F3(t1)& F4(t2), (t1< t2)
С использованием понятия функтора факт наличия отношения art * в на интервале [ts, te] формально описывается как (3):
art* в ^ (3ts <t <t2 ...<tk <te), (3)
Frt*(ti,t1,^,t1) = 1, (k < 4).
Опираясь на условие (2.4) характеристическую функции темпорального отношения a rt в можно выразить через функтор (4):
И-rt* ([^s< £е]) maxts<t1<t2<t3<t4<t5 Frt*(tl,tl, , (к < 4). (4)
Возвращаясь к выражению (1), следует признать, что оно диктует определенные ограничения на вид характеристических функций нечетких темпоров в тех случаях, когда мы хотим их выразить через граничные характеристические функции. Однако, как оказывается, на практике эти ограничения не столь существенны. Дело в том, что для большинства практических задач характеристические функции НТП определяются естественным образом через граничные характеристические функции, которые априори задаются условиями задач. Например, это касается НТП, индуцированных четкими интервальными событиями, границы которых неоднозначны в результате погрешности диагностических измерений или позиционирования. Это также касается большого класса НТП, характеристические функции которых определяются на основе величины переменной через граничные точки, задаваемые нечеткими функциями близости значений ВР номинальным значениям.
В предлагаемой методологии интервалы a, в представлены образами НТП, граничные характеристические функции которых определены в классе треугольных функций принадлежности (ТФП). Центрами ТФП являются границы интервалов, а граничные точки оснований ТФП смещены относительно центров по обе стороны на величину, равную половине длительности соответствующего интервала, как показано на рис. 2.
Применяя процедуру вывода с использованием граничных характеристических функций приходим к выводу, что для данной ситуации три нечетких темпоральных образа ОТНОШЕНИЙ a rtse Р, a rtsn Р, a rts Р (ПЕРЕКРЫВАЕТ, СТЫКУЕТСЯ, СЛЕДУЕТ) имеют значения характеристических функций на интервале [ts, te] не ниже 0,9, а, следовательно, с учетом достаточно большого значения истинности данную ситуацию в предлагаемой модели будет представлять единый 0,9-срез нечетко темпорального образа, включающий все три отношения W0,9 = a{rtsn V rts V rtse} p.
и "
0,9 ------------------------------------
и
Рис. 2. Граничные характеристические функции интервалов а, в заданы в классе ТФП
Рис. 3. Пример двух интервальных отношений с нечетко определенными
границами
Например, для двух различных ситуаций, представленных на рис. 3, в настоящей модели будет соответствовать единый нечетко дизъюнктивный образ (НД-образ), который в зависимости от задачи можно заменить более общим вариантом, например, W = а{й^е} в, МБе - «грубо» пересекает.
Третий верхний уровень иерархической модели представлен нечетким темпоральным образом СТРУКТУРА, характеризующим наличие нескольких нечетко темпоральных отношений на заданном временном интервале. Определение. Нечетко темпоральным образом СТРУКТУРА называется двойка
W = дш>, (5)
где w - название структуры; д№- нечеткая характеристическая функция, указывающая на наличие нескольких образов ОТНОШЕНИЙ на заданном временном интервале, включая ДН-образы.
Нечеткая характеристическая функция образа СТРУКТУРА ¡1^ определяется на основе выражения (6).
Фф = & V и (6)
где - нечеткие характеристические функции образов ОТНОШЕНИЙ, входящих в структуру.
Таким образом, наличие нечетко темпорального образа СРУКТУРА на интервале т£ Е, подразумевает наличие одновременно нескольких нечетко темпоральных отношений на этом интервале, а, следовательно, образ СТРУКТУРЫ позволяет отражать более специализированные знания, включающие большее число различных нюансов о временном взаимодействии НТП в структуре исследуемого временного ряда (ВР), нежели просто образ ОТНОШЕНИЯ. Поэтому с практической точки зрения образ СТРУКТУРЫ является более интересным для анализа баз данных ВР и извлечения из них знаний.
При решении практических задач по извлечению знаний в базах данных ВР в форме нечетко темпоральных образов интерес представляют, естественно, не все часто встречающиеся образы, а лишь те из них, которые имеют достаточную сте-
пень выраженности в структуре ВР, т.е. истинность которых на интервале анализа оказывается не ниже некоторого заранее оговоренного порога £ £ (0,1). Поэтому имеет смысл по аналогии с понятием е-срезов для нечетких множеств, используемых в нечетком моделировании в качестве четких представлений нечетких множеств, ввести понятие е-срезов для нечетко темпоральных образов. Определение. е-срезом образа нечетко темпоральной СТРУКТУРЫ W на интервале т£ Е называется четкая темпоральная структура W6, включающая все те и только те имеющиеся в W отношения, истинность которых на данном интервале не ниже е.
При переходе от нечетко темпоральных образов СТРУКТУР к их е-срезам в случаев удобно использовать формальные представления в виде коньюнктивно-дизьюнктивных форм образов (КД-формы), применяемых в темпоральной логике для описания неопределенных отношений. Нечетко темпоральный образ СТРУКТУРЫ является универсальным средством представления нечетких темпоральных знаний о структуре ВР, позволяющим отразить в нем все темпоральные аспекты знаний. Однако при решении практических задач далеко не все типы СТРУКТУР удобны для использования в качестве моделей знаний, а лишь те из них, которые являются интерпретационно пригодными, допускающими не избыточное, компактное представление с использованием небольшого числа простых отношений, легко интерпретируемых специалистами-экспертами в рассматриваемой предметной области. И в этом плане интерес представляют частные типы СТРУКТУР. СТРУКТУРЫ. Важное практическое значение имеют СТРУКТУРЫ последовательного типа. Последовательной нечетко темпоральной СТРУКТУРОЙ называется СТРУКТУРА вида (7).
ST = qii{P}qi2{P},..., qik-i{P}qik, (7)
где qjj е Q - НТП; Р - подмножество темпоральных отношений Алена, включающее следующие три отношения: rtsn (СТЫК), rts (СЛЕДОВАНИЕ), rte
(СОВПАДЕНИЕ).
Таким образом, последовательный образ СТРУКТУРЫ описывает знание, представленное в виде цепочки совпадающих, непосредственно следующих или просто следующих друг за другом НТП, характеризующих наличие тех или иных свойств ВР на соответствующих им интервалах временной шкалы. Последовательные СТРУКТУРЫ обладают рядом достоинств, важнейшим из которых является минимальность представления. Это означает, что последовательная СТРУКТУРА, содержит в явной форме минимально возможное число временных отношений, а отсутствующие отношения в последовательной СТРУКТУРЕ можно однозначно получить с использованием правил вывода темпоральной логики.
В заключение, в качестве примера модели представления нечетко темпорального образа приведем на рис. 4 последовательную СТРУКТУРУ, описывающую одну из потенциально опасных ситуаций, на основе типовых фрагментов во временной последовательности диагностических характеристик для участка железнодорожного пути (8):
ST = BU(b2)frteV(v3)frtseD(d2)frtseS(s3)&frtseN(n2), (8)
где frte - грубо включается, frtse - грубо пересекает, frtsn - грубо стыкуется, BU -наличие балластных углублений, V - динамика развития балластных углублений, D - деформации земной поверхности, по результатам дистанционного зондирования Земли, Sx, S2 - нестабильности по приращению ССКО для разных участков пути, N - деформативность по данным нагрузочных испытаний. Индексы аргументов лингвистических переменных (i = 1, 2, 3) определяют нечеткие состояния эксплуатационных параметров по трем значениям: «допустимое», «недопустимое» и «опасное» соответственно.
s2 s1
1 км ПК 1 +20
2 км ПК 9+10
Рис. 4. Графический пример последовательной структуры
Инструмент представления многофакторного набора диагностических данных помимо формализации процесса анализа позволяет организовать извлечение «неявных» знаний из хранилищ и баз данных, в виде часто встречающихся нечетко темпоральных структур. Использование выявленных аспектов может способствовать повышению объективности продукционного вывода ИСДП, за счет выявления неточностей, ошибок и «пробелов» в оценке текущего состояния эксплуатируемого участка пути.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Железное М.М., Розенберг И.Н. Спутниковый радиолокационный мониторинг объектов железнодорожной инфраструктуры // Автоматика, связь, информатика. - 2010. - № 1.
- С. 2-3.
2. Долгий И.Д. Теоретические основы, методы и средства разработки интегрированных систем диспетчерского управления и централизации на базе интеллектуальных технологий: Автореф. дис. ... док-ра тех. наук. - Ростов-на-Дону, 2012. - 29 с.
3. Долгий И.Д. и др. Гибридные нейростохастические модели обработки первичной информации в системах железнодорожной автоматики // Известия Волгоградского государственного технического университета. - 2011. - № 9.
4. Ковалев С.М. Структурное обобщение нечетко временных признаков в интеллектуальных моделях анализа динамических процессов // Обозрение прикладной и промышленной математики. - М., 2002. - Т. 9. - Вып. 1. - С. 207.
5. Allen J.F. Maintaining knowledge about temporal intervais // In Communications of the ACM.
- 1983. - № 26 (11). - Р. 832-843.
Статью рекомендовал к опубликованию д.т.н., профессор С.М. Ковалев.
Долгий Александр Игоревич - ОАО "Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте"; e-mail: [email protected]; 109029, г. Москва, ул. Нижегородская, 27, стр. 1; тел.: 88632450399; научный сотрудник.
Железнов Максим Максимович - научный сотрудник.
Dolgy Alexander Igorevich - JSC “Research and Design Institute for Information Systems, Automation and Communication rail”; e-mail: [email protected]; 27, Nijnegorodskaya street, way 1, Moscow, 109029, Russia; phone: +78632450399; research associate
Zheleznov Maxim Maximovich - research associate.