Механизм хранения состояний
Поскольку схема данных изменяется во времени, может возникнуть ситуация, когда схема данных изменилась настолько, что приложения, ранее работавшие с СУБД, более не могут корректно работать с получаемыми данными или сама СУБД уже не в состоянии обрабатывать запросы, основанные на представлении о предыдущем состоянии схемы данных. Для этого предлагается использовать механизм сохранения состояний. Каждый раз, когда схема данных корректируется, текущее состояние схемы сохраняется и фиксируется. В случае возникновения проблем совместимости СУБД может попытаться применять последовательные переходы между сохраненными состояниями до тех пор, пока не найдет совместимое. Это позволит сторонним приложениям всегда получать необходимый результат в независимости от того, насколько устарело представление о схеме данных, заложенное в данное приложение.
Представление данных на низком уровне
Низкий уровень - это уровень, отвечающий за хранение данных и общую архитектуру. Требования, предъявляемые к хранилищу:
1 Универсальность формата данных. Формат должен предоставлять возможность представления данных любой сложности.
2 Высокая скорость доступа к данным.
3 Экономное использование дискового пространства.
4 Функции обнаружения и коррекции ошибок.
В качестве способа представления данных на низком уровне предлагается BSON, который является бинарным аналогом формата JSON, позволяющего формировать и описывать структуры любой сложности, а за счет двоичного представления данных оптимизируется размер и скорость их обработки.
Библиографический список
1 Buneman, Peter. Tutorial on semi-structured data / Peter Buneman // Symposium on Principles of Database Systems. - 1997.
2 Brewer, Eric A. A Certain Freedom: Thoughts on the CAP Theorem / Eric A. Brewer // Proceeding of the IXXX ACM SIGACT-SIGOPS symposium on Principles of distributed computing.
- New York : ACM, 2010. - Vol. 1.
3 Browne, Julian. Brewer's CAP Theorem / Julian Browne // SOSP. - 2009.
4 Кузнецов, С. Транзакционные параллельные СУБД: новая волна / С. Кузнецов // Труды Ин-та системного программирования РАН. - М. : Ин-т системного программирования РАН, 2011.
- Т. 20. - С. 2079-8156.
5 Климанская, Е.В. Методы обработки слабоструктурированных данных в автоматизированных системах на железнодорожном транспорте // Е.В. Климанская, А.В. Чернов, В.И. Янц // Известия вузов. Сев.-Кавк. регион. Серия «Технические науки». - 2013. - № 1. - С. 18-23.
Bibliography
1 Buneman, Peter. Tutorial on semi-structured data / Peter Buneman // Symposium on Principles of Database Systems. - 1997.
2 Brewer, Eric A. A Certain Freedom: Thoughts on the CAP Theorem / Eric A. Brewer // Proceeding of the IXXX ACM SIGACT-SIGOPS symposium on Principles of distributed computing.
- New York : ACM, 2010. - Vol. 1.
3 Browne, Julian. Brewer's CAP Theorem / Julian Browne // SOSP. - 2009.
4 Kuznetsov, S. Transactional parallel DBMSs: the new wave / S. Kuznetsov // Proceedings of the Institute for System Programming of Russian Academy of Sciences. - Moscow : Institute for System Programming of Russian Academy of Sciences, 2011. - Vol. 20. - P. 2079-8156.
5 Klimanskaya, E.V. Methods of processing of semi-structured data in automated systems on railway transport / E.V. Klimanskaya, A.V. Chernov, V.I. Janz // Proceedings of the universities. North-Caucasus region. Series «Technical sciences». - 2013. - № 1. - P. 18-23.
УДК 656.2 + 06
Д. С. Гвоздев, М.Д. Линденбаум, В.В. Храмов, С.М. Ковалев
АНАЛИЗ РЕЗУЛЬТАТОВ РАБОТЫ И ОЦЕНКА ЭФФЕКТИВНОСТИ ГИБРИДНОЙ МОДЕЛИ ИДЕНТИФИКАЦИИ ПОДВИЖНЫХ ЕДИНИЦ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА
В работе [1] был предложен новый подход к автоматизации процесса классификации подвижных единиц железнодорожного транспорта (далее «объект») на основе гибридной модели, объединяющей модели идентификации графических изображений кузова и бортового номера вагона с нейросетевой моделью классификации и привлечением дополнительных данных из натурного листа поезда.
Подробно рассмотрено логическое и функциональное устройство предлагаемой модели. В рамках предложенного подхода разработана новая структура системы принятия решения, основанная на применении кворумного резервирования источников первичной информации.
Данная работа посвящена результатам кластерного анализа обработки реальных исходных данных и методам оценки вероятностей идентификации подвижных единиц железнодорожного транспорта, а также методам вероятностной оценки эффективности предлагаемого кворумного резервирования источников первичной информации.
Перейдем к описанию метода оценки вероятностей идентификации объекта на основании графического изображения его бортового номера.
Очевидно, что существует некоторая вероятность ошибки идентификации любого из символов бортового номера, следовательно, необходим математический аппарат, учитывающий возможные ошибки идентификации. Поскольку процесс идентификации символов основан на вычислении числовых коэффициентов (характеристик) их контура, необходимо определить, каким образом эти коэффициенты скомпонованы в некотором «-мерном пространстве признаков. С этой целью возьмем эталоны каждого из символов (цифры 0...9) и рассчитаем для них числовые коэффициенты. Размерность признакового пространства включает в себя 32 оси координат. Результаты расчетов сведем в табл. 1.
Таблица 1
Числовые коэффициенты для эталонов цифр
Кластеры Символы Признаки
Х1 Х2 Х31 Х32
5 «0» -3,91 2,63 1,11 0,53
2 «1» -11,47 -5,01 -0,33 -0,10
6 «2» -7,53 -6,18 0,18 0,14
9 «3» -23,92 -17,73 0,11 0,07
8 «4» -2,05 1,89 11,01 -23,82
3 «5» -102,67 -123,38 -0,77 0,35
0 «6» -3,21 1,86 3,44 -0,58
1 «7» -0,40 2,60 0,40 0,25
4 «8» -4,19 2,46 0,78 -0,33
7 «9» -13,57 14,40 0,96 0,66
Полученные результаты расчетов объединим в кластеры с помощью программного комплекса Deductor, реализующего алгоритм самоорганизующихся карт Кохонена. Результаты кластеризации представим на рис. 1.
В табл. 1, в столбце «Кластеры» указаны результаты размещения символов (цифр) по кластерам. Рис. 1, а отображает расположение кластеров (0.9) по отношению друг к другу. Кластеризация выполнена на гексагональном растре в виде двумерных карт. Каждая ячейка матрицы расстояний (рис. 1, б) отображает расстояние между векторами объектов. Здесь цвет каждой ячейки характеризуется числовым значением.
Рис. 1. Кластеризация числовых коэффициентов для эталонов цифр:
а - кластеры; б - матрица расстояний
Значения каждой ячейки варьируются в диапазоне [0,001; 1,6] (от синего цвета к красному), если цвет точки темно-синий, следовательно, расстояние между соседними точками ~ 0,001. Границы между кластерами обозначены сплошной линией черного цвета. На рис. 1, б видно, что межкластерные границы сильно отличаются от содержимого самих кластеров, что свидетельствует о хорошей разделимости признакового пространства.
Также можно заметить, что длина и степень разделимости кластеров каждой границы различны. Обладая информацией о длинах границ и расстояниях между кластерами, мы можем определить степень разделимости самих кластеров. Здесь чем больше значение граничного коэффициента, тем меньше вероятность перепутать соседние кластеры в процессе идентификации. С целью описания степени разделимости между кластерами введем следующие обозначения:
£к1, к2 - длина границы между кластерами к\ и к2. В качестве единицы измерения длины границы принимаем количество ячеек гексагонального растра;
Сг, ¿1, к2 - степень разделимости 1-й ячейки на границе кластеров ¿1 и ¿2, / = 1 ... Ьк1, к2;
Сгр, к1, к2 - степень разделимости границы между кластерами к1 и к2.
Приведем пример расчета степени разделимости границы между кластерами 0 и 7. Из рис. 1, б видно, что длина границы равна 13 гексагональным ячейкам £0,7 = 15. Каждая ячейка обладает различной степенью разделимости С, 0,7. Тогда средняя степень разделимости границы между кластерами 0 и 7 сводится к вычислению формулы
—К 1, К 2
I
г =1
С
сг,к1,к 2
гч _ г=1_
Сгр,К 1,К 2 = т . (1)
^К1,К 2
Аналогично проводим расчет для остальных границ. Результаты расчетов представим в табл. 2.
Таблица 2
Матрица степеней разделимости границ между кластерами
Символы 0 1 2 3 4 5 6 7 8 9
«0» 0,97 0,88 1,15 0,70 0,78 0,43
«1» 0,97 0,69 1,02 0,88
«2» 0,69 0,61 0,71
«3» 0,61 0,84
«4» 1,01 0,51
«5» 0,88 1,02 1,01 0,91 0,71
«6» 1,15 0,51 0,91 0,60
«7» 0,70 0,88 0,71 0,84 0,81
«8» 0,78 0,71 0,60 0,93
«9» 0,43 0,81 0,93
Значения, представленные в табл. 2, характеризуют степень разделимости межкластерных границ. Чем выше степень межкластерной границы, тем меньше вероятность перепутать два соседних кластера в процессе идентификации. С целью описания процесса идентификации в контексте теории вероятностей и последующего определения коэффициента эффективности системы введем обозначения: Рг - вероятность успешной идентификации /-го символа бортового номера; ^ - вероятность ошибки идентификации /-го символа бортового номера.
Положим, что в процессе идентификации символов бортового номера возможны 10 вариантов решений (0, 1, 2, 3, 4, 5, 6, 7, 8, 9). Из табл. 2 выберем минимальное значение степени межкластерной границы Сгр,0,9 Сгр ,9,0 = 0,43 и обозначим его ^т. Данные границы являются самыми слабыми по степени разделимости кластеров, следовательно, вероятность ошибки идентификации в данном случае максимальна. Тогда вероятности ошибок идентификации остальных межкластерных границ будем рассчитывать по следующей формуле:
Чы* 2 = 7^^ , (2)
СГР,К1,К 2
где Цк\,к2 - вероятность ошибки идентификации на границе между кластерами к1 и к2, т.е. вероятность того, что в процессе идентификации символа «1» мы выберем соседний символ «7» из межкластерного пространства (рис. 1, а). В качестве примера приведем следующий расчет:
а ■ 0,43 Ч 7 = = о!— = 0,48,
, СГР07 0,88
т.е. ^1,7 = 0,48 qmin. Аналогичным образом проводим расчет всех остальных значений. Результаты расчетов приведены в табл. 3.
Матрица (табл. 3) является симметричной относительно главной диагонали. Здесь значения всех ячеек, кроме главной диагонали, отображают вероятность возникновения ошибки идентификации. Например, значение ячейки [1; 7] говорит о том, что в процессе идентификации символа «1» существует вероятность того, что мы можем ошибочно принять его в качестве символа «7» с вероятностью ошибки, равной 0,48^Ш1„. Значения ячеек главной диагонали отражают вероятность успеха во время идентификации символа. К примеру, значение ячейки [0;0] говорит о том, что вероятность успешной идентификации символа «0» равна ро = 1 - 0,03ят1„. С целью последующего расчета эффективности резервирования системы обозначим суммарную вероятность ошибки каждого из символов (табл. 4).
В результате проведенных исследований и вычислений предложен метод оценки вероятностей идентификации объекта на основании графического изображения его бортового номера, а также получены численные значения вероятностей идентификации объекта.
Таблица 3
Вероятностная матрица идентификации символов бортового номера
Символы 0 1 2 3 4 5 6 7 8 9
«0» 1-0,039тш 0,449тт 0,48?тт 0,37^тт 0,614тт °,55^тт ^тт
«1» 0,44дтт 1-0,06дтт 0,62^тт 0,42^тт 0,489тт
«2» 0,62^тт 1-0,05^тт 0,70^тт 0,60дтт
«3» 0,70^тт 1-0,15^тт 0,51^тт
«4» 1-0,099тт 0,42дтт 0,84?тт
«5» 0,48?тт 0,42дтт 0,42дтт 1-0,04?тш 0,47дтт 0,60дтт
«6» 0,37^тт 0,84?тт 0,47^тт 1-0,02^тш 0,71?тт
«7» 0,614тт 0,489тт 0,60дтт 0,51^тт 1-0,02^тш 0,53^тт
«8» °,55^тт 0,60дтт 0,71^тт 1-0,03?тШ 0,46^тт
«9» Цтт. 0,53дтт 0,46дтт 1-0,26дтш
Таблица 4
Вероятности идентификации символов бортового номера
Символы Вероятность ошибки идентификации Вероятность успеха идентификации
«0» Я = 0,03дт1„ Р0 = 1 - 0,03ятт
«1» Я = 0,06 дтт Р1 = 1 - 0,06 Ят1„
«2» Я = 0,05 дтт Р2 = 1 - 0,05 Ят1„
«3» Я = 0,15 дтт Р3 = 1 - 0,15 Ят1„
«4» Я = 0,09 ятт Р4 = 1 - 0,09 Ят1„
«5» Я 5 = 0,04 Ят1„ Р5 = 1 - 0,04 Ят1„
«6» Я6 = 0,02 Ят1„ Р6 = 1 - 0,02 Ят1„
«7» Я7 = 0,02 Ят1„ Р7 = 1 - 0,02 Ят1„
«8» Я8 = 0,03 Ят1„ Р8 = 1 - 0,03 Ят1„
«9» Я9 = 0,26 Ят1„ Р9 = 1 - 0,26 Ят1„
Перейдем к описанию метода оценки вероятностей идентификации объекта на основании графического изображения его кузова.
Очевидно, что существует некоторая вероятность ошибки правильной идентификации формы кузова вагона. Опишем математический аппарат, учитывающий возможные ошибки идентификации. Поскольку процесс идентификации формы кузова сводится к вычислению числовых коэффициентов, определим особенности размещения числовых коэффициентов в «-мерном пространстве. С этой целью возьмем эталоны каждой из форм кузова и рассчитаем для них числовые коэффициенты.
Необходимо также учитывать габариты кузова и некоторые особенности его конструкции, например, трапеция или овал могут выглядеть немного иначе по сравнению с их правильной геометрической формой. Это связано с тем, что вагоны имеют люки для загрузки и выгрузки. Результаты расчетов приводим к табличному виду аналогично табл. 1. Полученные данные кластеризуем с помощью программного комплекса ОеёиСог. Результаты кластеризации представлены на рис. 2.
Рис. 2, а отображает расположение кластеров («Трапеция», «Прямоугольник», «Овал») по отношению друг к другу. Кластеризация выполнена на гексагональном растре. Каждая ячейка растра (рис. 2, б) отображает расстояния между соседними кластерами. Здесь цвет каждой ячейки характеризуется числовым значением.
Значения каждой ячейки варьируются в диапазоне [0,0001; 2,73] (от синего цвета к красному), если цвет точки темно-синий, следовательно, расстояние между соседними точками ~ 0,0001. Границы между кластерами обозначены сплошной линией черного цвета. На рис. 2, б видно, что межкластерные границы сильно отличаются от содержимого самих кластеров, что свидетельствует о хорошей разделимости признакового пространства. Также можно заметить, что длина и степень разделимости кластеров каждой границы различны. Обладая информацией о длинах границ и расстояниях между кластерами, мы можем определить степень разделимости самих кластеров. Здесь чем больше значение граничного коэффициента, тем меньше вероятность перепутать соседние кластеры в процессе идентификации. Расчет степени разделимости между кластерами осуществляем согласно формуле (1). Результаты расчетов представим в табл. 5.
Рис. 2. Кластеризация числовых коэффициентов для эталонов кузовов вагонов:
а - кластеры; б - матрица расстояний
Таблица 5
Матрица степеней разделимости границ кластеров
Форма кузова «Трапеция» «Прямоугольник» «Овал»
«Трапеция» 2,06 1,82
«Прямоугольник» 2,06 1,86
«Овал» 1,82 1,86
Значения в табл. 2 характеризуют степень разделимости межкластерных границ. Чем выше степень межкластерной границы, тем меньше вероятность перепутать два соседних кластера в процессе идентификации. С целью описания процесса идентификации в контексте теории вероятностей и определения коэффициента эффективности системы введем обозначения: Р7 - вероятность успешной идентификации 7-го типа кузова вагона; д7 - вероятность ошибки идентификации 7-го типа кузова вагона. Положим, что в процессе идентификации символов бортового номера возможны три варианта решений («Трапеция», «Прямоугольник», «Овал»). Из табл. 5 выберем минимальное значение степени межкластерной границы Сгр,т,ов = Сгр,ов,т = 1,82 и обозначим его дф. Данные границы являются самыми слабыми по степени разделимости кластеров, следовательно, вероятность ошибки идентификации в данном случае максимальна. Тогда вероятности ошибок идентификации остальных межкластерных границ рассчитаем по формуле (2), а результаты представим в табл. 6.
Таблица 6
Вероятностная матрица идентификации кузова вагона
Форма кузова «Трапеция» «Прямоугольник» «Овал»
«Трапеция» 1 - 0,12дф 0,88дф дф
«Прямоугольник» 0,88дф 1 - 0,003дф 0,98дф
«Овал» дф 0,98дф 1 - 0,023дф
С целью последующего расчета эффективности резервирования системы обозначим суммарную вероятность ошибки каждого из типов кузова (табл. 7).
В результате проведенных исследований и вычислений предложен метод оценки вероятностей идентификации объекта на основании графического изображения его кузова, а также получены численные значения вероятностей идентификации объекта.
Таблица 7
Вероятности идентификации кузова вагона
Форма кузова Вероятность ошибки идентификации Вероятность успеха идентификации
«Трапеция» Ят = 0,12Яф Рт = 1 - 0,12яф
«Прямоугольник» Яп = 0,003Яф Рп = 1 - 0,003яф
«Овал» Яов = 0,023Яф Ров = 10,023яф
Перейдем к описанию метода оценки вероятностей идентификации объекта на основании натурного листа поезда.
Поскольку процесс формирования натурного листа изначально осуществляется человеком-оператором, следовательно, существует некоторая вероятность ошибки заполнения. В работе [2] уже описана модель надежности человека-оператора. Модель основана на том, что процесс обучения оператора снижает возможность допущения им ошибок в будущем.
Дадим краткую характеристику модели, необходимую для дальнейшего изложения материала. Пусть: t - время профессиональной деятельности; т - время обучения оператора профессиональной деятельности; £ - условия обучения оператора профессиональной деятельности. Предполагаем, что оператор обучался своей деятельности в течение времени т в условиях £, при этом промежуток времени т предшествовал промежутку времени t. Обозначим указанную вероятность Py(t,£). Вероятность должна быть тем меньше, чем больше промежуток времени т и чем жёстче комплекс условий обучения £. Однако оператор в процессе работы может утрачивать свою работоспособность, поэтому условная вероятность успешной деятельности оператора равна
, ч P (t + х(т), е)
"(t'т)="P^Toi) • (3)
где P(x(t),e) - безусловная вероятность успешной деятельности оператора в условиях е.
Величина х(т) есть время работоспособности оператора в условиях е, эквивалентное по расходу ресурса работоспособности оператора за время т в условиях £. Если х(т) = 0, то при t = 0 оператор полностью работоспособен после окончания процесса обучения (новый оператор). При этом кривая интенсивности его отказа будет сдвинута относительно первоначальной кривой вправо по оси времени на величину т. Сама форма кривой интенсивности не изменяется. Если х(т) = т, то при t = 0 оператор остаётся работоспособным, но его интенсивность отказа в момент t = 0 равна интенсивности отказа в момент т (старый оператор). Сдвига кривой интенсивности вправо не происходит. В случае частичной утраты оператором работоспособности осуществляется сдвиг кривой интенсивности вправо на величину х(т), 0 < х(т) < т. Из (3) следует выражение для интенсивности отказа
X p (t, т) = X(t + х(т), е). (4)
Таким образом, принцип построения интенсивности (4) формально сводится к уменьшению безусловной интенсивности отказа оператора в Ру(т, х) раз и сдвигу её кривой вправо на величину х(т), что отражает процессы обучения и обновления, свойственные операторской деятельности. Далее ограничимся самым простым случаем, когда оператор после обучения становится полностью обновлённым. Кроме того, если X(t,s) = Х(е) = const, то предыстория процесса до t = 0 не оказывает влияния на его дальнейшее поведение, но интенсивность отказа по-прежнему будет уменьшаться в Ру(т,х) раз. Работоспособность (надёжность) оператора зависит от величины ресурса работоспособности. Она будет тем меньше, чем больше выработанный ресурс r, и тем больше, чем больше восполненный ресурс 0. Тогда продолжительность обучения оператора т в заданных условиях £
1 r
т> -ln——, (5)
V-r" ln P
при этом должно выполняться условие Рз > в' . Так, если r = Xt = 0,01-10 = 0,1; V = 0,2 ч , то для Рз = 0,95 т > 5-ln2 = 3,464. Интенсивность отказа оператора в некоторых условиях функционирования постоянна и равна 0,1 ч -1, т.е. в среднем он делает одну ошибку за 10 ч работы. Для обеспечения таких условий работы оператора жёсткость режима тренировки должна соответствовать данным табл. 8.
Таблица 8
Условия допустимой интенсивности работы оператора
t, ч 1 2 4 6 8 10 100
V, 1/ч 2,3 1,15 0,58 0,38 0,29 0,23 0,04
1/v, ч 0,43 0,87 1,72 2,63 3,44 4,34 23,2
Например, если среднее время между проявлениями ошибок оператора равно 4,34 ч, то необходимое время тренировки составит 10 ч. Примем, что оператор своевременно проходит обучение при достаточном режиме тренировки и работает по 8 ч в смену. Тогда вероятность ошибки оператора
^оператора ~ 0,01
В ходе работы уже была оценена вероятность ошибки получения достоверных данных каждого из трех источников информации. Далее оценим, насколько возрастает общая вероятность правильной идентификации объекта при использовании дополнительных источников данных.
Для решения поставленной задачи примем считанный бортовой номер за основной источник информации, а остальные два источника (изображение кузова, натурный лист) - в качестве резервной. Для повышения надежности идентификации объекта предлагается использовать резервирование информации, получаемой из различных источников, и контролировать ее достоверность.
Если используются три или более данных, целесообразно применять кворумное резервирование r из s, где s - число источников информации, r - уровень кворума [3]. Так как все вероятности правильной идентификации в разных источниках информации различны, надежность кворумного резервирования следует вычислять с помощью производящей функции общей теоремы о повторении опытов:
n n r—1
П (q+pi)=Zpm,zm; Prss=1—ZР,,
i=1 m=0 i=0
где Ртп - вероятность m успехов в n опытах; z - произвольный параметр. Для r = 2, s = 3 Р23 = 1- (qi q2 + qi 4з + q2 4з - 2qi q2 qs); для r = 2, s = 4 Р2,4 = 1- (qi q2 qs + qi q2 q4 + qi 4з q4 + q2 4з q4 - 3qi q2 qs qs).
В зависимости от того, сколько цифр к необходимо идентифицировать для определения типа вагона и какие цифры в бортовом номере, вероятность ошибки идентификации равна
к
q = 1—П (i—q).
i=1
Так как вероятности ошибки в натурном листе для всех цифр одинаковы, то
q2 = i- (i ^ператора^) .
Эффективность резервирования можно оценивать с помощью коэффициента повышения надежности Кэфр идентификации:
Кэфр = qi/(i - prs).
Проведем расчет эффективности кворумного резервирования.
Вероятность ошибки идентификации символов бортового номера объекта
10
q 1=1—П (1—q)=1—0,7=0,3.
¿=1
Вероятность ошибки оператора при заполнении восьми символов бортового номера q2 = i - (i - ЧоП^) = i - (i - 0,0i)8 = 0,08, где к - количество идентифицируемых цифр при к = 8.
Вероятность ошибки идентификации кузова подвижной единицы
3
q 3 = 1 — П (1 — q ) = 1 — 0,83 = 0,17.
¿=1
Вероятность успеха идентификации в резервируемой системе
Р2,3 = i - (qi q2 + qi qs + q2 qs - 2qi q2 qs) = i - 0,03 = 0,97.
Коэффициент эффективности резервирования
Кэфр = P2,3 /(i - qi) = 0,97/(i - 0,3) = i,39.
Из проведенных вычислений видно, что повышение вероятности успеха идентификации объекта при условии использования резервных источников первичной информации составляет 39 %.
Для собственных вагонов кворумное резервирование неприменимо. Надежность их идентификации можно несколько повысить, используя контроль правильности кодов по контрольным суммам, и рассчитывать надежность по формулам постоянного резервирования.
Таким образом, в данной работе проведен кластерный анализ результатов обработки реальных исходных данных, предложены методы оценки вероятностей идентификации объектов на основании графической информации о бортовом номере и кузове объекта, а также технологической информации о бортовом номере. Кроме того, предложен метод оценки эффективности кворумного резервирования источников первичной информации об объекте и выполнен расчет.
Библиографический список
1 Гибридная модель идентификации подвижных единиц железнодорожного транспорта / Д.С. Гвоздев, М.Д. Линденбаум, В.В. Храмов, С.М. Ковалев // Вестник РГУПС. - 2013. - № 2. - С. 92-98.
2 Смагин, В.А. Техническая синергетика. Вероятностные модели элементов сложных систем : монография / В.А. Смагин. - СПб., 2003. - Вып. 1. - 62 с.
3 Линденбаум, М.Д. Надежность информационных систем : учебник для вузов ж.-д. трансп. / М.Д. Линденбаум, Е.М. Ульяницкий. - М., 2007. - 318 с.
Bibliography
1 The hybrid model of identification of railway mobile units / D.S. Gvozdev, M.D. Lindenbaum, V.V. Khramov, S.M. Kovalev // Vestnik RGUPS. - 2013. - № 2. - P. 92-98.
2 Smagin, V.A. Technical synergy. Probabilistic models of the elements of complex systems : monograph / V.A. Smagin. - St.-Petersburg, 2003. - Vol. 1. - P. 62.
3 Lindenbaum, M.D. Reliability of information systems : textbook for railroad transport universities / M.D. Lindenbaum, E.M. Ulyanickiy. - Moscow, 2007. - 318 p.
УДК 004.032.26, 656.212.5
Е.В. Пучков, Н.Н. Лябах
ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАЗРАБОТКИ АВТОМАТА-СОВЕТЧИКА НА СОРТИРОВОЧНОЙ ГОРКЕ
Создание интегрированной системы информатизации сортировочных станций (СС) с интеллектуализацией процессов принятия решений является важным этапом реализации принятой ОАО «РЖД» «Программы совершенствования и развития СС железных дорог на 2006-2015 годы». Главные задачи заключительного этапа реформирования железнодорожного транспорта: повышение эффективности и безопасности перевозок, внедрение инновационных проектов, а также развитие информационных и компьютерных технологий. Самое приоритетное направление для ОАО «РЖД» -совершенствование процессов оперативного управления СС, которые являются важнейшим элементом технологического конвейера, поскольку время простоев вагонов существенно влияет на себестоимость и составляет значительную долю оборота.
В данной работе исследуется возможность применения нейроэмулятора «NeuroNADS» [1] для создания автомата-советчика по расчету скорости выхода отцепа с парковой тормозной позиции (ТП). Следует отметить, что человеку-оператору присущи такие качества, как интуиция и умение оперировать нечеткими алгоритмами управления, накапливать опыт работы. Указанные факторы математически трудно формализуются, поэтому наиболее перспективным представляется подход с использованием именно искусственных нейронных сетей (ИНС).
Создаваемая модель, которая будет лежать в основе автомата-советчика, отражает не реальные закономерности происходящих в ней процессов, а соответствие между входными и выходными данными. Модель считается удовлетворительной, если при одних и тех же входах в реальной системе значения их входов также совпадают (по некоторому критерию).
Рассмотрим систему (рис. 1), иллюстрирующую создание машинного «советчика» с использованием ИНС, обученного на основании опыта, имеющегося у оператора или группы специально отобранных экспертов [2].
На рис. 1:
БД - база данных, в которой хранится информация об объекте управления, характеризуемом вектором параметровXj = (х^, X2j, ..., xnj) вj-м наблюдении;
ЛПР - лицо, принимающее решение ynj;
БПР - блок принятия решений ymj;
БС - блок сравнения ynj и ymj, выходом которого является Sj - значение ошибки рассогласования решений, принятых человеком и машиной; БК - блок коррекции алгоритма принятия решений, заложенного в МБПР.
Разрабатываемое информационно-логическое устройство (ИЛУ) должно автоматически накапливать в блоках памяти и выдавать на рабочее место оператора скорость выхода отцепа с парковой ТП. Использование ИЛУ совместно с табло оперативной информации или дисплеем позволит освободить эксплуатационный персонал станции от запоминания большого числа разнообразных ситуаций и значительно снизит его информационную нагрузку. При этом сократятся непроизводительные простои локомотивов и расформировываемых составов, повысится качество формирования поездов, а также безопасность роспуска и маневровых работ. Хранящаяся в ИЛУ информация может использоваться на последующих этапах для выбора управляющих команд непосредственно на исполнительные устройства.