СЕНСОР ОТБРАКОВКИ «ЛОЖНЫХ» СТРАНИЦ В.Н. Дроздов, С.И. Федоренко
Печатание оттисков - основная полиграфическая операция и один из этапов создания полиграфической продукции. Для получения из оттисков готовой продукции необходимо выполнить целый ряд так называемых брошюровочно-переплетных и отделочных процессов (БПП). Это технологические операции по предварительной обработке оттисков, по изготовлению и обработке книжных блоков, изготовлению изданий в мягкой обложке, а также все операции по изготовлению книг. Изготовление книжных блоков включает в себя комплектовку блока издания, скрепление листов или тетрадей (шитье нитками или проволокой, а также клеевое скрепление), обработку блока - его подготовку для вставки в крышку или для крытия обложкой. Вышеперечисленные операции выполняются на так называемом послепечатном оборудовании (ППО). Отделка продукции в ППО признается узким местом процесса полиграфического производства. Это обусловлено большим разнообразием объектов обработки, а также сложностью самих операций обработки послепечатной стадии. Также разнообразен и контроль выполнения этих операций. Для повышения качества продукции необходимо повышать степень автоматизации послепечатного оборудования и всех его систем контроля.
Одним из примеров операций контроля на послепечатной стадии служит проверка комплектности блоков. Существует два способа комплектовки: вкладкой для малообъемных (с толщиной блока до 6.5 мм) брошюр и журналов и подборкой для блоков и брошюр любого объема и всех блоков книг в переплете. Комплектовка вкладкой обычно производится на вкладочно-швейных машинах и вкладочно-швейно-резальных агрегатах, т.е. эта операция выполняется в комплексе с последующими операциями, например, со скреплением, обрезкой.
Для всех способов комплектовки требуется проверка правильности подбора тетрадей, так как нарушение правильной последовательности блоков приводит к браку и, соответственно, снижению качества выпускаемой продукции.
В настоящее время проверка комплектности осуществляется в основном оператором вручную путем проверки правильности расположения подборочных меток на торцах сфальцованных тетрадей. Такой способ имеет ряд недостатков, главными из которых являются: его применимость только для комплектовки подборкой в листо-подборочных машинах, невозможность применения в случае жесткого соединения подборочной машины с переплетной машиной, а также участие человека, снижающее надежность и скорость работы всего производства.
Все это обусловливает актуальность и значимость исследований, направленных на решение одной из важных проблем послепечатной стадии - повышение уровня автоматизации системы контроля комплектовки блоков.
В настоящее время существуют разработки, направленные на автоматизацию этой контрольной операции. Все они используют специальные приборы - сенсоры для определения правильности тетради. По методу работы сенсоры можно разделить на две группы: первая группа сенсоров осуществляет чтение сигнатур, печатаемых на листе перед его фальцовкой; вторая группа сенсоров не требует дополнительных технологических объектов на листе и работает с содержимым верхней страницы тетради. Причем в настоящее время существуют сенсоры, поддерживающие оба указанных метода работы, так как это позволяет добиться большей надежности. В качестве сигнатур для первой группы сенсоров выступают стандартные подборочные метки или наносимые на тетрадь штрихкоды. В первом случае для чтения подборочных меток используются оптические сканирующие головки. Наиболее надежные результаты можно получить при сканировании корешков тетрадей блока после его подборки, проверяя наличие лестничного эффекта из меток [1].
стничного эффекта из меток [1]. Распространенным примером использования штрих-кодов является система ASIR-3 («Automatic Signature Image Récognition system») фирмы «Мюллер Мартини» для проверки комплектности тетрадных блоков [5], вышедшая в 2004 г., при этом компания начала разработки в этой области еще в 1994 г.
Однако использование штрихкодов требует от производства полной ориентации на использование системы ASIR во время всего процесса изготовления заказа, в том числе и на печатные процессы, что не всегда является возможным. Кроме того, печать штрихкодов увеличивает объем макулатуры, хотя ее разработчик прилагает все усилия для уменьшения площади штрихкодов. Таким образом, затраты на процесс контроля правильности комплектовки оказываются значительно выше, чем при использовании систем контроля, не выходящих за рамки процесса комплектовки. Кроме того, система ASIR-3 поставляется опционально и не входит в базовый состав оборудования.
Другим известным примером использования одновременно обоих методов контроля является система Opticontrol, разработанная компанией Optigraf. Она была представлена в 2002 г. Эта система состоит из двух сенсоров, один из которых читает штрихкод, печатаемый в технологической зоне листа, а другой сенсор имеет возможность читать содержимое текстовых страниц - отдельные слова. Одним из главных недостатков этой системы является малая рабочая зона, что приводит к меньшей надежности определения ошибочных страниц, как указывалось ранее. Это ограничение вытекает из-за заявленного ограничения на максимальное количество обрабатываемых сегментов текста одной страницы в рабочей зоне - всего 20.
Таким образом, существующие автоматические системы контроля процесса комплектовки имеют недостаточную надежность. Во всех системах появляются значительные трудности контроля комплектовки при работе со специфическими типами изданий, такими кактелефонные справочники, каталоги, ежедневники и т.п. Эти издания являются наиболее трудными для контроля, где страницы имеют практически идентичное содержимое. Рассмотренные режимы работы не позволяют с большой надежностью определить, одинаковы ли изображения двух разных тетрадей одного справочника или нет. Для определения их равенства необходимо иметь возможность различать детали изображения, такие как буквы текста, формат их записи и т.д. Также невозможно контролировать такие страницы по их малой части содержимого с площадью в несколько сантиметров. Для этого требуется работать с большей частью изображения страницы.
Идея исследований направлена на решение задачи автоматизированного контроля комплектности тетрадей в блоке, а также тетрадных блоков в книжном блоке при изготовлении книг. Предлагается проводить проверку правильности комплектовки любого типа объектов путем анализа содержимого верхней страницы сфальцованного тетрадного листа или тетрадного блока. Анализ производится специально разработанным с этой целью сенсорной системой, далее называемой сенсором. Сенсор решает задачу распознавания образов, заключающуюся в анализе содержимого текущей страницы для сравнения ее с правильной страницей, задаваемой в режиме обучения. Результат сравнения есть ответ - совпадают ли страницы или нет. В случае несовпадения страниц, данная страница считается бракованной и должна быть изъята из процесса комплектовки. При этом в каждую станцию подборочной машины устанавливается по одному сенсору. Все сенсоры соединяются в центре управления машиной и составляют вместе с ним единую систему контроля правильности комплектовки.
Системы контроля комплектовки блоков должны иметь возможность задания эталонной тетради в режиме обучения, предшествующем режиму нормальной работы, в котором осуществляется сравнение текущей тетради с эталонной. Поэтому задача отбраковки неправильных тетрадей заменяется задачей распознавания образов, при которой необходимо принятие решения об отнесении данной тетради к классу бракованных
или правильных тетрадей. Решающие правила должны обеспечивать минимум ошибок распознавания.
Перед созданием системы распознавания необходимо определить условия ее функционирования. Для этого требуется провести исследование возможных отклонений анализируемой страницы от эталонной страницы в процессе работы сенсора, осуществляющего сканирование страницы для получения ее образа в памяти процессора и распознавание страницы. В результате исследований поведения страниц на конвейере БПМ выяснилось, что имеются две проблемы, решение которых необходимо обеспечить при создании системы отбраковки страниц.
Основная сложность автоматизации послепечатных процессов состоит в высокой скорости транспортных устройств (конвейеров), осуществляющих передачу объектов обработки от одного узла машины к другому. Подборочные машины обычно агрегати-руются с оборудованием для скрепления блоков: машинами для клеевого бесшвейного скрепления (МБС) или шитья проволокой втачку. При этом скорость работы подборочной машины задается скоростью МБС, которая в настоящий момент достигает 18000 блоков в час (5 блоков/сек) [5]. Поэтому скорость движения конвейера в подборочных машинах достигает 2,5 метров в секунду и выше. Например, фирма Колбус (Германия) в подборочной машине модели 2И-840 использует скорость 2,5 м/с, а модель 3681/18 фирмы «Мюллер Мартини» (Швейцария) работает со скоростью 3,5 м/с. Такие скорости требуют очень быстрого времени срабатывания приборов для автоматизации послепечатных процессов - порядка нескольких десятков миллисекунд на каждый объект.
Другая проблема заключается в непостоянном положении анализируемых объектов со стороны приборов. Анализируемые объекты могут смещаться или поворачиваться на относительно малый угол по отношению друг к другу, а также могут иметь место деформации страниц при таких больших значениях скорости их перемещения. Поэтому простейшие способы прямого сравнения изображений страниц являются малонадежными.
Процесс исследований вышеуказанных требований показал существование ограничений в отклонении страниц при их прохождении под сенсором в трех направлениях, а также ограничение в максимально возможном повороте страницы. Эти ограничения были вынесены как предельные значения для отклонений в положении страниц для процесса распознавания страниц по их изображениям.
Пусть мы имеем два изображения: эталонное /э (х,у) и анализируемое /(х',у'), смещенное на величины Дх, Ду по соответствующим осям, повернутое на угол ф и отличающееся масштабом 1 по оси х . Такое преобразование эталонной страницы является аффинным преобразованием. Обозначим его ¥ : (х, у) ® (х', у') . Запишем связь между координатами этих изображений:
Гх' = [ (хс + (1 + 1 )(х-хс) + Дх)совф + (у + Ду^тф] у; ^ Ду,ф, 1): \ , . ,
[у =[- (хс + (1 + 1 )(х - хс) + Дх)Б1Пф+ (у + Ду)СОБф] (1) где [•] - операция взятия целой части вещественного числа; хс - координата центральных пикселей всех строк изображения, т.е. хс = хтах / 2. Положительное значение
1 соответствует приближению страницы к сенсору, отрицательное - отдалению от сенсора.
Заметим, что аффинное преобразование ¥ можно легко расширить и на множество точек {(хг,уг)}, а именно ¥ :{(хг,уг)} ® {(х'г,у,')} ° {(хг,уг)} ® {¥(хг,уг)}. При
этом каждая точка из исходного множества имеет свое отображение в выходном множестве. Тогда, учитывая (1), между яркостью пикселей двух изображений можно записать следующую зависимость:
¥(х, у; Ах, Ау, ф, 1) ® (х', у') / (х ', у ') = В( х ', у ', / ( х, у))
где В(х' , у', /э (х, у)) есть функция зависимости нового значения яркости каждого пикселя в новой точке, зависящая от яркости исходного пикселя до преобразования. Сама эта зависимость имеет достаточно сложный характер, определяемый оптическими и конструктивными параметрами самого прибора, а также схемой установки прибора в конвейер БПМ. В данной работе эта зависимость исследуется с точки зрения максимального воздействия такого перемещения на яркость изображения. В результате анализа изображений выяснилось, что относительное изменение яркости пикселей можно считать равномерной и что оно находится в пределах АВтах = 15 %, т.е.
,, \/( х' , у' ) - /э ( х у)|
"х у : ]-—---1 <АВ £ АВтах
/э(x, у) . (3)
В приведенной формуле (3) разность в числителе берется по абсолютному значению, так как возможны и отрицательные значения в случае перемещения страницы в сторону удаления от сенсора.
Выше приведена выбранная модель преобразования двух изображений страниц. На следующем шаге необходимо решить задачу совмещения изображений страниц, зная модель трансформации изображений. Сама задача совмещения изображений страниц является фундаментальной проблемой компьютерного видения и встречается очень часто, например, при выявлении изменений в серии изображений, анализе движения, объединении информации от различных сенсоров, стереозрении и текстурном анализе. Подобные проблемы, в свою очередь, возникают в биомедицинских приложениях, при решении задач фотограмметрии и в зрении роботов, при дистанционном сборе данных. Различные методы совмещения включают в качестве составных элементов выполнение таких операций, как выделение контуров, сегментация и построение структурного описания изображения. Все эти вопросы являются ключевыми в науке об интерпретации и понимании изображений - иконике, поэтому несомненна ценность изучения проблемы совмещения изображений и для теории.
В случае распознавания страниц задача совмещения является серьезной проблемой, так как обычно решение этой задачи на мощных компьютерных системах занимает много процессорного времени. Поэтому требуется найти такое решение проблемы совмещения при заданных условиях, которое бы укладывалось в отведенное на это время, равное 90 мс.
Исходя из вышесказанного, было выбрано аппаратно-программное решение для создания сенсора отбраковки страниц. Часть задач, связанная с получением признаков текстового содержимого страниц, была реализована на аппаратной базе, что позволило получить выбранные признаки за несколько миллисекунд, в то время как на обычном ПК требуется от несколько сотен миллисекунд до нескольких секунд. А обработку полученного набора признаков можно производить на цифровом процессоре обработки сигналов, обладающем малой ценой и большой производительностью.
Создание систем распознавания - достаточно сложный итеративный процесс, реализация которого связана с постепенно уточняющейся математической моделью проектируемой системы. На первой итерации составляется априорный алфавит классов и разрабатывается априорный словарь признаков. После выбора алгоритма распознавания на следующей итерации приступают к решению основной задачи, составляющей основу проблемы распознавания - определению алфавита классов и словаря признаков, которые в условиях ресурсных или других типов ограничений обеспечивают наибольшую эффективностърешений.
Рассматривая систему распознавания страниц, необходимо выделить два класса объектов: страницы, совпадающие с эталоном и не совпадающие с ним. При дальнейшем анализе была выявлена необходимость выделения на страницах текстового и полутонового содержимого. Такое разделение показало достаточность предложенного подхода для надежной работы с различными типами изданий.
Для страниц текстовых изданий признаками будут являться параметры всего текстового содержимого страницы: местоположение текста на странице, его оформление и его семантическое содержание. Очевидно, что две страницы с одинаковым расположением, оформлением и содержанием можно считать одинаковыми. Под оформлением текста мы будем понимать такие его параметры, как размер используемого шрифта, параметры всех присутствующих знаков на странице и их взаимного расположения. Параметрами знака страницы могут быть его местоположение на странице, размер, площадь, форма, структура. Эти параметры хорошо известны в задачах оптического распознавания символов (OCR).
Для страниц нетекстовых изданий признаком будет само изображение содержимого страницы. Размер изображения страницы занимает объем в 1 Мбайт. Даже по сегодняшним меркам работа с таким объемом данных представляет проблему, особенно для передачи и хранения. Поэтому очевидно, что разрабатываемый алгоритм должен работать с некоторыми участками (областями) этого изображения, а результат распознавания считать положительным в случае положительных результатов распознаваний со всех выбранных областей.
Принципы работы всей сенсорной системы рассмотрен в работе [2], а сам алгоритм принятия решения о бракованной странице - в работе [3]. Один из основных алгоритмов решения задачи совмещения изображений страниц - определение положения текущей страницы - рассмотрен в работе [4].
С помощью предложенного подхода был разработан алгоритм быстрого решения задачи совмещения изображений страниц, который имеет большое теоретическое и практическое значение, а также был разработан алгоритм сенсора отбраковки страниц, показавший отличные результаты работы на реальном оборудовании.
Литература
1. Киппхан Г. Энциклопедия по печатным средствам информации. М.: МГУП, 2003. 1280 с.
2. Федоренко С.И. Принципы работы сенсорной системы по отбраковке «ложных» страниц. / IX С.-Петербургская международная конференция «Региональная информатика - 2004 (РИ - 2004)». Санкт-Петербург 22-24 июня 2004 года. Труды конференции. СПб, 2005. С.357-360.
3. Федоренко С.И. Алгоритм работы сенсорной системы по отбраковке «ложных» страниц. // Известия вузов. Проблемы полиграфии и издательского дела. М.: МГУП, 2005..№2. С. 80-84.
4. Федоренко С.И. Задача нечеткого сравнения графов и ее решение для сенсорной системы отбраковки «ложных» страниц. // Проблемы экономики и прогрессивные технологии в текстильной, легкой и полиграфических отраслях промышленности. СПб, 2005..№9. С. 224-228.
5. Хведчин Ю.И. Послепечатное оборудование. 4.1. Брошюровочное оборудование. МГУП, 2003. 466 с.