Электронное моделирование
УДК: 656.25:004.896
Р. А. Ковалев,
П. А. Василенко,
П. Е. Булавский, д-р техн. наук
Кафедра «Автоматика и телемеханика на железных дорогах», Петербургский государственный университет путей сообщения Императора Александра I
СТРУКТУРА АВТОМАТИЗИРОВАННОГО РАБОЧЕГО МЕСТА ДЛЯ РАСПОЗНАВАНИЯ ПРИНЦИПИАЛЬНЫХ ЭЛЕКТРИЧЕСКИХ СХЕМ И ОЦЕНКА ЕГО ЭФФЕКТИВНОСТИ
В статье впервые предложена структура автоматизированного рабочего места, позволяющая решать задачу распознавания сложных электрических схем с текстовыми фрагментами. Разработана как общая структура, так и структура всех модулей, входящих в него: модуль подготовки исходных данных, модуль работы с шаблонами, модуль распознавания, модуль анализа текстовых данных принципиальных электросхем, модуль описания результатов распознавания. Рабочее место протестировано при работе с принципиальными схемами разного качества.
техническая документация систем железнодорожной автоматики и телемеханики; распознавание растровой технической документации; структура программно-технических средств; тестовая выборка; шаблон графического изображения принципиальных электрических схем
Введение
По данным отчетов служб автоматики и телемеханики, в одной дистанции сигнализации, централизации и блокировки (СЦБ) хранится и обслуживается в среднем от 20 до 100 тыс. листов документов формата А4. В работах [1-9] показано, что затраты на бумажную технологию ведения велики и необходим переход на электронную технологию техдокументации. Перевод бумажной технической документации в электронный редактируемый формат процесс трудоемкий. Среди всех видов технической документации железнодорожной автоматики и телемеханики принципиальные схемы занимают более 70 % общего объема.
В мировой практике распознавания аналогичных схем известно множество попыток [10-15]. Однако реальных результатов не достигнуто. Использование автоматизированного рабочего места распознавания принципиальных
схем (АРМ РПС) при решении задач автоматизации проектирования и ведения технической документации весьма эффективно и создает предпосылки расширения области применения.
Для внедрения разработанных в [16-19] алгоритмов спроектирован программный комплекс АРМ РПС, схема которого приведена на рис. 1. Учтена возможность работы с исходными данными разных форматов, необходимость обработки пакетных данных и анализа результатов распознавания в интерактивной форме.
Рис. 1. Общая структура АРМ РПС
Структура АРМ РПС разделена на пять программных модулей, каждый из которых решает свой список задач.
1 Структура и модули программного комплекса
Модуль подготовки исходных данных реализует механизм получения данных различных форматов и подготовки документа-заготовки для дальнейшего распознавания, обеспечивает доступ к исходному изображению алгоритмов модуля распознавания текста. Структура модуля приведена на рис. 2. Пунктиром обозначены пути обмена данными. Вариант исполнения векторизатора описан в работе [20].
Модуль работы с шаблонами реализует механизм управления базой шаблонов. Интерфейс доступа к базе шаблонов и внешнее централизованное
хранилище позволяют применять различные схемы доступа к шаблонам, что необходимо для изменения и поддержания актуальной базы шаблонов различными пользователями. Структурная схема модуля приведена на рис. 3.
^-Модуль подготовки входных данных-
Данные в растровых форматах
Данные в векторном формате ■эуд
■png
■jpg
.tiff
.svg
Алгоритмы предобработки изображений
Внешний векторизатор
Встроенный векторизатор
Заготовка для распознавания в формате 8\ДЗ
Рис. 2. Структурная схема модуля подготовки исходных данных ,-Модуль работы с шаблонами элементов-
PJ
Рабочее место специалиста
Редактор шаблонов
Интерфейс доступа к базе шаблонов
Централизованное хранилище шаблонов
Р1
Р2 f
Рп
База шаблонов
элементов схемы
Рис. 3. Структурная схема модуля работы с шаблонами
Модуль распознавания содержит алгоритмы поиска шаблонов и имеет непосредственный доступ к базе шаблонов, минуя дополнительный интерфейс доступа, описанный в модуле работы с базой шаблонов. Структурная модель приведена на рис. 4.
*-Модуль распознавания-
Р1
Документ в формате ОФ-ТД
Алгоритм поиска шаблонов
Р2
База шаблонов элементов схемы
Рп
Заготовка для распознавания в формате ЭХДЗ
Рис. 4. Структурная модель модуля распознавания ,-Модуль анализа текстовых данных ПЭС-
Рис. 5. Модуль анализа текстовых данных ПЭС
Модуль анализа текстовых данных принципиальной электрической схемы содержит алгоритмы анализа графических данных с точки зрения их принадлежности к текстовой информации, дополняя найденные в модуле распознавания элементы схемы атрибутной информацией, а также общей текстовой информацией, не задействованной при распознавании элементов. В данном модуле реализован словарь масок атрибутов элементов принципиальной электрической схемы. Структура модуля приведена на рис. 5.
Модуль описания результатов распознавания содержит интерфейсы доступа к различным форматам представления данных, в том числе отраслевому формату технической документации (ОФ-ТД), а также реализует алгоритмы конвертации различных документов в формат ОФ-ТД и обратно. Структурная схема данного модуля приведена на рис. 6.
,-Модуль описания результатов распознавания--ч
Описание форматов документов
Документ в формате ОФ-ТД
Документы
других форматов
Рис. 6. Структурная схема модуля описания результатов распознавания
Такая структура позволяет использовать модули по отдельности в различных системах анализа и обработки техдокументации, к примеру в системе, описанной в [21, 22].
2 Примеры тестирования и оценка эффективности программного комплекса
В качестве исходных данных для оценки эффективности алгоритмов было отобрано в общей сложности около 100 схем, которые разделены по критериям качества на две группы. В первую группу вошли схемы хорошего ка-
чества с цельной структурой, без наложений текстовой информации на структурную часть схемы и с малым уровнем шума. Пример такой схемы показан на рис. 7.
Рис. 7. Схема первой тестовой группы
Тестирование производилось на компьютере Inter(R) Core(TM)2 Duo E4500(2.20 GHz, 2.20 GHz), 4 ГБ ОЗУ под управлением 64-разрядной операционной системы Windows 7. Распознавание схемы, фрагмент которой представлен на рис. 7, занимает 8 минут, результат распознавания приведен на рис. 8. Зеленым цветом обозначены распознанные элементы схемы, синим -распознанные провода, черным - нераспознанные графические элементы.
Качество распознавания текстовой информации зависит от выбранной системы распознавания текстовых выражений и не является целью данного исследования. Из анализа были исключены элементы типа «вывод», присутствующие на схемах, так как алгоритмы для поиска выводов находятся в стадии разработки. Результат работы АРМ РПС с первой тестовой группой в виде диаграммы показан на рис. 9.
Первая группа состоит из 43 схем, содержащих 3182 элементов, из них распознано верно 2928, распознано ошибочно 62, не распознано 192.
Вторая тестовая группа содержит схемы допустимого и плохого качества со средним уровнем шума. Пример такой схемы представлен на рис. 10.
Рис. 8. Результат распознавания схемы
Распознано Не распознано
Рис. 9. Результат распознавания первой тестовой группы
Во вторую группу также входят схемы, нарисованные вручную. Всего вторая тестовая группа содержит 60 примеров схем. Результат работы системы на схемах второй группы приведен в виде диаграммы на рис. 11.
Всего элементов схем на тестовых схемах второй группы 3139, из них распознано верно 2700, распознано ошибочно 153, не распознано 286.
Рис. 10. Схема второй группы тестовой выборки
Распознано Не распознано ошибочно 5%
Рис. 11. Результат распознавания второй тестовой группы
Заключение
Алгоритм построения связной структуры принципиальной электрической схемы показал хорошие результаты по первой и второй тестовой группе. В ходе эксперимента выяснилось, что результат работы данного алгоритма может быть использован для идентификации участков распознаваемой схемы, где по той или иной причине структура схемы не может быть построена (в основном это случаи нераспознанного элемента не некотором наборе примитивов). Пример такого анализа приведен на рис. 12, где красным цветом помечены примитивы схемы, не задействованные в распознавании элементов и не являющиеся структурной составляющей распознанной схемы. Пометка реализуется программным путем, что упрощает последующее ручное редактирование результатов распознавания.
Система распознавания принципиальных схем, опирающаяся на описанные в [16-19] алгоритмы, показала свою пригодность для распознавания существующих в отделах технической документации схем. Предлагаемое АРМ не позволяет полностью автоматически безошибочно распознавать элементы схем, но способно значительно ускорить и упростить данный процесс, что показали результаты его эксплуатации в группах технической документации ОАО «РЖД».
Рис. 12. Участок нераспознанных примитивов
Библиографический список
1. Василенко М. Н. Интеллектуальная система электронного документооборота в хозяйстве железнодорожной автоматики и телемеханики / М. Н. Василенко, Д. В. Зуев, Д. В. Седых, П. А. Василенко // Сб. тр. конференции «TIS-2017», СПб., ФГБОУ ВО ПГУПС. - С. 247-254.
2. Василенко М. Н. Принципы организации электронного документооборота технической документации / М. Н. Василенко, Б. П. Денисов, П. Е. Булавский, Д. В. Седых // Транспорт Российской Федерации. - 2006. - № 7. - С. 31-35.
3. Василенко М. Н. Система информационного обеспечения на основе баз данных / М. Н. Василенко, Б. Л. Денисов, П. Е. Булавский, Д. В. Седых // Автоматика, связь, информатика. - 2006. - № 11. - С. 47-48.
4. Василенко М. Н. Математическое моделирование систем и процессов : учеб. пособие / М. Н. Василенко, А. М. Горбачев, Д. В. Новиков. - СПб. : ФГБОУ ВО ПГУПС, 2015. - 61 с.
5. Седых Д. В. Отраслевой формат технической документации на устройства железнодорожной автоматики и телемеханики. Ч. 1. Концепция создания / Д. В. Седых, Д. В. Зуев, М. А. Гордон // Автоматика на транспорте. - 2017. - Т. 3. - № 1. -С.112-128.
6. Василенко М. Н. Электронный документооборот в хозяйстве СЦБ / М. Н. Василенко, В. Г. Трохов, Д. В. Зуев // Автоматика, связь, информатика. - 2014. - № 8. -
C. 2-3.
7. Василенко М. Н. Безбумажная технология ведения технической документации ЖАТ / М. Н. Василенко, Д. В. Зуев // Автоматика, связь, информатика. - 2014. -№ 4. - С. 34-35.
8. Василенко М. Н. Современные информационные технологии работы с технической документацией / М. Н. Василенко, Д. В. Зуев // Автоматика, связь, информатика. - 2014. - № 5. - С. 24-25.
9. Василенко М. Н. Экономическое обоснование принятия решений в логистических центрах ОАО «РЖД» в реальном масштабе времени / М. Н. Василенко, Д. В. Зуев // Железнодорожное дело. - 2015. - № 1. - С. 20-21.
10. Muda Nadira. Optical Character Recognition By Using Template Matching (Alphabet) Zain Fakulti Sistem Komputer & Kejuruteraan Perisian / Nadira Muda, Nik Kamariah Nik Ismail, Siti Azami Abu Bakar, Jasni Mohamad. - Universiti Malaysia Pahang Karung Berkunci 12, 25000 Kuantan, Pahang, 2007.
11. Lee S. Recognizing hand-written electrical circuit symbols with attributed graph matching / S. Lee, H. S. Barid, H. Bunke, K. Yamamoto // Structured Document Analysis, Springer Verlag. - Berlin, 1992. - Pp. 340-358.
12. Ripley Brian D. Pattern Recognition and Neural Networks / Brian D. Ripley. - Cambridge University Press, 1996.
13. Ahmed Maher. An expert system for general symbol recognition / Maher Ahmed, Rabab Kreidieh Ward // Pattern Recognition journal. - 1999. - Vol. 33. - Pp. 19751988.
14. Cheng T. A symbol recognition system. In Proceedings of the Second International Conference on Document Analysis and Recognition / T. Cheng, J. Khan, H. Liu,
D. Yun // IEEE Comput. Soc. Press ICDAR'93, 1993. - Pp. 918-921.
15. Okazaki A. An automatic circuit diagram reader with loop-structure-based synibol recognition / A. Okazaki, T. Kondo, K. Mori, S. Tsunekawa, E. Kawamoto // IEEE Transactions on PAMI, 1988. - Pp. 331-341.
16. Василенко М. Н. Метод выделения структуры принципиальной электрической схемы железнодорожной автоматики и телемеханики при распознавании печатной документации / М. Н. Василенко, Р. А. Ковалев // Автоматика на транспорте. - 2017. - Т. 3. - № 1. - С. 88-97.
17. Василенко М. Н. Методы выделения текстовых выражений принципиальных электрических схем железнодорожной автоматики и телемеханики / М. Н. Василенко, Р. А. Ковалев // Автоматика на транспорте. - 2016. - Т. 2. - № 4. -С. 540-551.
18. Седых Д. В. Методы распознавания структуры монтажных схем железнодорожной автоматики и телемеханики / Д. В. Седых, А. А. Матушев // Автоматика на транспорте. - 2016. - Т. 2. - № 4. - С. 552-563.
19. Матушев А. А. Распознавание структуры монтажных схем ЖАТ / А. А. Матушев, Д. В. Седых // Автоматика, связь, информатика. - 2015. - № 10. - С. 4-7.
20. Зуев Д. В. Векторизатор растровых чертежей (РАСТЕРГРАФ) / Д. В. Зуев, Д. В. Седых, С. В. Салихов, Р. А. Ковалев // Программы для ЭВМ. Базы данных. Топологии интегральных микросхем. - 2016. - № 11. - С. 1.
21. Горбачев А. М. Автоматизированная система экспертизы схемных решений железнодорожной автоматики и телемеханики / А. М. Горбачев, Р. А. Ковалев, Р. Т. Мустафаев, Д. В. Седых // Программы для ЭВМ. Базы данных. Топологии интегральных микросхем. - 2013. - № 6. - С. 1.
22. Седых Д. В. Методы сверки чертежей напольного технологического оборудования железнодорожной автоматики и телемеханики / Д. В. Седых // Региональная информатика «РИ-2016» : материалы конференции. - СПб. : СПИРАН, 2016. -С. 316-317.
Roman A. Kovalyov, Peter A. Vasilenko, Peter E. Bulavsky, «Automation and remote control on railways» department Emperor Alexander I St. Petersburg state transport university
Development structures of workstation for electrical circuit recognition
and it's efficiency mark
Structure of workstation for electrical circuit recognition, which can solve the problem of recognizing complex electrical circuits with high percentage of recognition, is presented for the first time in this article. In addition to the general structure, all secondary software module have been developed: source data preparation module, working with templates module, recognition module, text data
analysis module, description of recognition results module. Performance testing of workstation for electrical circuit recognition on electrical circuit of different quality and test results were performed.
technical documentation of railway automation and telemechanics; recognition of raster technical documentation; structure of software and hardware; test sample; electrical circuit graphic template
References
1. Vasilenko M. N., Sedykh D. V., Vasilenko P. A. (2017). Intelligent system of electronic document management in railway automation and remote control [Intellektu-alnaya sistema ehlektronnogo dokumentooborota v hozyajstve zheleznodorozhnoj avtomatiki i telemekhaniki]. Proceedings of the conference «TIS-2017» [Sbornik trudov konferencii TIS-2017]. St. Petersburg, Peterburg state transport university. -Pp. 247-254.
2. Vasilenko M. N., Sedykh D. V, Bulavsky P. E., Denisov B. P. (2006). Principles of organization of electronic document circulation of technical documentation [Prin-cipy organizacii ehlektronnogo dokumentooborota tekhnicheskoj dokumentacii], Transport of the Russian Federation [Transport Rossijskoj Federacii], issue 7. -Pp. 31-35.
3. Vasilenko M. N., Sedykh D. V, Bulavsky P. E., Denisov B. P. (2006). Database-based information support system [Sistema informacionnogo obespecheniya na os-nove baz dannyh], Automation, communication, informatics [Avtomatika, svyaz, in-formatika], vol. 11. - Pp. 47-48.
4. Vasilenko M. N., Gorbachev A. M. (2015). Mathematical modeling of systems and processes [Matematicheskoe modelirovanie sistem i processov], Tutorial [Uchebnoe posobie]. St. Petersburg, Petersburg state transport university. - 61 p.
5. Sedykh D. V., Zuev D. V., Gordon M.A. (2017). Industrial format of technical documentation for devices of railway automation and telemechanics. Part 1. Concept of creation [Otraslevoj format tekhnicheskoj dokumentacii na ustrojstva zheleznodorozhnoj avtomatiki i telemekhaniki chast 1 koncepciya sozdaniya], Automation in transport [Avtomatika na transporte], issue 3, vol. 1. - Pp. 112-128.
6. Vasilenko M. N., Trohov V. G., Zuev D. V. (2014). Electronic document management in the household of automatics and telemechanics [Ehlektronnyj dokumen-tooborot v hozyajstve scb], Automation, communication, informatics [Avtomatika svyaz informatika], vol. 8. - Pp. 2-3.
7. Vasilenko M. N., Zuev D. V. (2014). Paperless technology for the maintenance of technical documentation [Bezbumazhnaya tekhnologiya vedeniya tekhnicheskoj dokumentacii zhat], Automation, communication, informatics [Avtomatika svyaz informatika], vol. 4. - Pp. 34-35.
8. Vasilenko M. N., Zuev D. V. (2014). Modern information technology work with technical documentation [Sovremennye informacionnye tekhnologii raboty s tekhnicheskoj dokumentaciej], Automation, communication, informatics [Avtoma-tika svyaz informatika],vol. 5. - Pp. 24-25.
9. Vasilenko M. N., Zuev D. V. (2015). Economic justification of decision-making in the logistics centers of Russian Railways in real time [Ekonomicheskoe obosnovanie prinyatiya reshenij v logisticheskih centrah OAO RZHD v realnom masshtabe vre-meni], All-Russian Information and Analytical Journal, Railway business [Vseros-sijskij informacionno- analiticheskij zhurnal zheleznodorozhnoe delo], vol. 1. -Pp. 20-21.
10. Nadira Muda, Nik Kamariah Nik Ismail, Siti Azami Abu Bakar, Jasni Mohamad. Optical Character Recognition By Using Template Matching (Alphabet) Zain Fakul-ti Sistem Komputer & Kejuruteraan Perisian, Universiti Malaysia Pahang Karung Berkunci 12, 25000 Kuantan, Pahang, 2007.
11. Lee S., Barid H. S., Bunke H., Yamamoto K. (1992). Recognizing hand-written electrical circuit symbols with attributed graph matching. Structured Document Analysis, Springer Verlag, Berlin. - Pp. 340-358.
12. Ripley Brian D. Pattern Recognition and Neural Networks. Cambridge University Press, 1996.
13. Maher Ahmed, Rabab Kreidieh Ward (1999). An expert system for general symbol recognition. Pattern Recognition journal. - 1999. - Vol. 33. - Pp. 1975-1988.
14. Cheng T., Khan J., Liu H., Yun D. (1993). A symbol recognition system. In Proceedings of the Second International Conference on Document Analysis and Recognition. IEEE Comput. Soc. Press ICDAR'93. - Pp. 918-921.
15. Okazaki A., Kondo T., Mori K., Tsunekawa S., Kawamoto E. (1988). An automatic circuit diagram reader with loop-structure-based synibol recognition. IEEE Transactions on PAMI. - Pp. 331-341.
16. Vasilenko M. N., Koval'ov R. A. (2017). Method of selection the structure of fundamental electric circuit of railway automation and remote control during the recognition of printed documentation [Metod vydeleniya struktury principialnoj ehle-ktricheskoj skhemy zheleznodorozhnoj avtomatiki i telemekhaniki pri raspoznavanii pechatnoj dokumentacii], Automation on transport [Avtomatika na transporte], issue 3, vol. 1. - Pp. 88-97.
17. Vasilenko M. N., Koval'ov R. A. (2016). Methods of textual expression selection of elementary electric diagrams of railway automation and remote control [meto-dy vydeleniya tekstovyh vyrazhenij principialnyh ehlektricheskih skhem zhelezno-dorozhnoj avtomatiki i telemekhaniki], Automation on transport [Avtomatika na transporte], issue 2, vol. 4. - Pp. 540-551.
18. Sedykh D. V., Matushev A. A. (2016). Methods of assembly diagrams structure recognition of railway automation and remote control [Metody raspoznavaniya struktury montazhnyh skhem zheleznodorozhnoj avtomatiki i telemekhaniki], Automation on transport [Avtomatika na transporte], issue 2, vol. 4. - Pp. 552-563.
19. Sedykh D. V., Matushev A. A. (2015). Recognition of patterns of wiring diagrams RATM [Raspoznavanie struktury montazhnyh skhem zhat], Automation, communication, informatics [Avtomatika svyaz informatika], vol. 10. - Pp. 4-7.
20. Vector of raster drawings (RASTERGRAPH) (2016) [Vektorizator rastrovyh chertezhej rastergraf], Programs for computers. Database topology of integrated microcircuits [Programmy dlya ehvm bazy dannyh topologii integralnyh mikroskhem], vol. 11. - P. 1.
21. Vasilenko M. N., Gorbachev A. M., Zuyev D. V., Grigoryev Ye. V. (2013). Automated system for expert evaluation of circuit designs of railway automatics and telemechanics [Avtomatizirovannaya sistema ehkspertizy skhemnyh reshenij zheleznodorozhnoj avtomatiki i telemekhaniki], Programs for computers. Database. topology of integrated microcircuits [Programmy dlya ehvm bazy dannyh topologii integralnyh mikroskhem], vol. 6. - P. 1.
22. Sedykh D. V. (2016). Methods of reconciling drawings of outdoor technological equipment of railway automation and telemechanics [Metody sverki chertezhej napolnogo tekhnologicheskogo oborudovaniya zheleznodorozhnoj avtomatiki i telemekhaniki], Regional Informatics «RI-2016». Conference proceedings [Regionalnaya informatika ri-2016, materialy konferencii]. St. Petersburg, SPIRAN. - Pp. 316-317.
Статья представлена к публикации членом редколлегии М. Н. Василенко Поступила в редакцию 31.05.2018, принята к публикации 29.06.2018
КОВАЛЕВ Роман Александрович - аспирант кафедры «Автоматика и телемеханика на железных дорогах» Петербургского государственного университета путей сообщения Императора Александра I. e-mail: [email protected]
ВАСИЛЕНКО Петр Алексеевич - студент кафедры «Автоматика и телемеханика на железных дорогах» Петербургского государственного университета путей сообщения Императора Александра I. e-mail: vasilenko. [email protected]
БУЛАВСКИЙПетр Евгеньевич - доктор технических наук, профессор кафедры «Автоматика и телемеханика на железных дорогах» Петербургского государственного университета путей сообщения Императора Александра I. e-mail: [email protected]
© Ковалев Р. А., Василенко П. А., Булавский П. Е., 2018