УДК 004.352.243
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИИ НА ПРИМЕРЕ РАСПОЗНАВАНИЯ СКАНИРОВАННОГО РУКОПИСНОГО ТЕКСТА
А.А. Мозговой
В статье показаны результаты внедрения элементов системы поддержки принятия решений в графический интерфейс программы распознавания сканированного рукописного текста. Внедрение элементов поддержки принятия решений в виде экспертных оценок позволяет значительно увеличить качество распознавания сканированного рукописного текста
Ключевые слова: оптическое распознавание, рукописный, СММ, СППР
ВВЕДЕНИЕ
Значительная вариативность в написании рукописных слов делает задачу автоматизации процесса распознавания сканированного рукописного текста весьма нетривиальной. Суммирование ошибок на каждом этапе процесса в конечном итоге приводит к увеличению процента нераспознанных слов до значительной величины,
что ограничивает возможность практического применения разработанной подсистемы.
В данной статье рассматривается возможность внедрения элементов системы поддержки принятия решений на основе экспертных оценок [1] в графический интерфейс программы распознавания сканированного рукописного текста [2] в целях увеличения качества распознавания. Структурная схема предлагаемого решения показана на рис.1.
Рис. 1. Структурная схема роли ЛПР в распознавании рукописных слов
Взаимодействие осуществляется посредством графического интерфейса в интерактивной форме [3]. Применение пунктирных линий обозначает, что взаимодействие с ЛПР на этапе распознавания,
строго говоря, не является обязательным. Если применяемые оптимальные характеристики по умолчанию позволяют получить на выходе приемлемый результат, то вмешательства ЛПР не требуется.
Мозговой Алексей Александрович - ВИВТ, аспирант, e-mail: [email protected]
Наибольший негативный вклад в уменьшение процента распознанных рукописных слов происходит на следующих этапах:
- извлечение слов из изображения (вероятность отказа - 5%);
- нормирование изображений слов (вероятность отказа - 5%);
- распознавание слов (вероятность отказа -4%).
Итоговый процент распознавания в 86,64% показан на рис. 2.
Рис. 2. Итоговый процент распознавания
ИЗВЛЕЧЕНИЕ СЛОВ ИЗ ИЗОБРАЖЕНИЯ
Эффективность этапа извлечения слов из изображения определяется двумя эмпирическими коэффициентами а и д, которые используются при расчёте расстояния между словами по горизонтали (1) и вертикали (2).
а = Ртха = ^— ха,а^ = {0,а1>а7П, (1)
^ - ширина промежутка I для _/ -ой строки в пикселях,
- количество суммируемых
промежутков,
1Ш - ширина изображения в пикселях, а - эмпирический коэффициент (а=1,2).
° = ((У1шах - У1ш1п) + (У2тах - У2тт))/ ^ (2) где У1тах, У2тах, У1т1п, У2т1п -вертикальные координаты верхних и нижних точек прямоугольных областей совокупностей точек, д - коэффициент, найденный эмпирическим путём (д = 4).
Значения коэффициентов а и д были подобраны после анализа базы изображений, полученной при сборе образцов почерков [4]. Однако в ряде случаев лучшие результаты получаются при использовании других пар значений.
Для выявления наиболее подходящих пар эмпирических коэффициентов предлагается привлечение экспертных оценок лица принимающего решение (ЛИР), организованное в виде графического интерфейса с возможностью выбора наиболее оптимального варианта из предложенных итоговых изображений (см. рис.3).
Рис. 3. Выбор лучшей пары коэффициентов на основе экспертной оценки
Ирименение экспертных оценок позволяет увеличить эффективность этапа извлечения слов из изображения с 95% до 98%.
НОРМИРОВАНИЕ ИЗВЛЕЧЁННЫХ СЛОВ
Задача нормирования извлечённых
изображений рукописных слов по высоте осложняется особенностью в написании русских слов, заключающейся в наличие верхних (буквы «б», «в», иногда - «д») и нижних (буквы «д», «з», «р», «у», «ф») графических элементов. В целом разработанная автором подпрограмма нормирования справляется с поставленной задачей, однако в ряде случаев, связанных с небрежностью написания, происходят сбои (см. рис.4).
Рис. 4. Выбор лучшего коэффициента нормирования на основе экспертной оценки
Качество нормирование удаётся улучшить путём экспертной оценки коэффициента г, используемого для вычисления границ средней зоны слова (3).
Н Нтах Ншах/2, (3)
где Нтах - максимальное количество значащих пикселей анализируемого изображения слова, г -коэффициент, найденный эмпирическим путём (2 = 2).
Эффективность этапа увеличилась более чем на 4,5 процента с 90,25% до 95,06%.
РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ СЛОВ
На завершающем этапе распознавания также предлагается использование экспертных оценок, которое заключается в предложении к оценке ЛПР нескольких вариантов слов из выпадающего списка [5], имеющих близкие коэффициенты соответствия р (4) моделям слов, ранжированные по убыванию коэффициента (рис. 5).
идцать
тридцать
тринадцать триста
Рис. 5. Выбор вариантов распознавания из выпадающего списка
Итоговый процент распознавания с применением СППР в 93,15% показан на рис. 6.
Рис. 6. Итоговый процент распознавания с применением СППР
р(ОЦ) = £Г=1аг(0,
(4)
l(/) =
it
I
at(i)aii
bj(0(t+1)).
ЗАКЛЮЧЕНИЕ
Таким образом, внедрение в графический интерфейс программы распознавания рукописного текста элементов поддержки принятия решений в виде экспертных оценок ЛПР позволяет значительно (на 6,5%) увеличить качество распознавания сканированного рукописного текста. Особенностью предлагаемого решения является реализация интерактивного взаимодействия с ЛПР на ключевых этапах распознавания рукописного текста с визуализацией корректирующего воздействия в режиме реального времени. Применение заранее рассчитанных оптимальных коэффициентов позволяет увеличить производительность системы за счёт возможности ограничения привлечения ЛПР в ряде случаев.
Литература
1. Семенов, С.С. Оценка качества и технического уровня сложных систем. Практика применения метода экспертных оценок / С.С. Семенов // Ленанд, 2015 г., 352 стр., 978-5-9710-1972-5
2. Мозговой, А.А. Проблемы применения скрытых марковских моделей при распознавании рукописного текста / А.А. Мозговой // В мире научных открытий. 2013. №6. С.186-198.
3. Судаков, В.А. Унификация разработки программного обеспечения прикладных СППР / В.А. Судаков, В.П. Осипов // XII всероссийское совещание по проблемам управления / ВСПУ-2014 Институт проблем управления им. В.А. Трапезникова РАН. 2014. С. 8855-8863.
4. Мозговой, А.А. Проблемы извлечения рукописных слов из сканированного изображения [Электронный ресурс] / А.А. Мозговой // Моделирование, оптимизация и информационные технологии.2013. №1. http://moit.vivt.ru/wp-content/ uploads/ 2013/04/ mozgovoy_1_13_1.pdf (дата обращения 14.05.2013).
5. Рогов, А.А. Автоматизированная система распознавания рукописных исторических документов / А.А. Рогов, А.Н. Талбонен, А.Г. Варфоломеев // Труды 12-ой Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" - RCDL'2010, Казань, Россия, 2010, С. 469-475.
где р - вероятность генерирования исследуемой последовательности наблюдений анализируемой моделью.
a1(i) = nibi(01),
Воронежский институт высоких технологий
DECISION SUPPORT SYSTEM BY THE EXAMPLE OF THE OFF-LINE HANDWRITTEN
TEXT RECOGNITION
A.A. Mozgovoy
The paper reviews results of the implementation of elements of a decision support system in the graphical user interface of the off-line handwriting text recognition system. The elements of decision support in the form of expert assessments can significantly enhance the quality of handwriting text recognition Key words: optical recognition, handwriting, HMM, DSS