Научная статья на тему 'Построение модели знаний о технологиях с помощью дискриминантных алгоритмов'

Построение модели знаний о технологиях с помощью дискриминантных алгоритмов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
62
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Построение модели знаний о технологиях с помощью дискриминантных алгоритмов»

связей органических молекул по кинетическим данным в радикальных реакциях в жидкой и газовой фазах, а преподавателям, студентам и аспирантам соответствующих специальностей использовать настоящую систему в качестве активного справочного пособия.

Созданный прототип ЭС и ее основные компоненты могут по соответствующей адаптации составить основу при создании активных компонент распределенных сетей для сбора, хранения, извлечения, интеллектуального анализа, распространения и производства знаний в узкоспециализированных областях исследований и технологий.

Литература

1. Wooldridge M., Jennings N.R., editors. Intelligent AgentsTheories, Architectures, and Languages. Lecture Notes in Artificial Intelligence. V. 890. Springer-Verlag, January 1995. 407 p.

2. Туманов В.Е. Производство знаний в предметно-ориентированной системе научной осведомленности // Программные продукты и системы. 2008. № 4. С. 93-95.

3. Wooldridge M., Jennings N. Intelligent Agents: Theory and Practice // Knowledge Engineering Review. 1995. № 10 (2).

4. Туманов В.Е., Кромкин Е.А., Денисов Е.Т. Оценка энергий диссоциации С-Н-связей в кислородсодержащих соединениях по кинетическим данным радикальных реакций отрыва // Изв. АН. Сер. Химическая. 2002. № 9. С. 1508-1516.

ПОСТРОЕНИЕ МОДЕЛИ ЗНАНИЙ О ТЕХНОЛОГИЯХ С ПОМОЩЬЮ ДИСКРИМИНАНТНЫХ АЛГОРИТМОВ

В.И. Пименов, к.т.н. (Санкт-Петербургский университет технологии и дизайна, [email protected])

Рассматриваются особенности представления в компьютерных обучающих системах технологических знаний, которые описывают процессы, направленные на производство материального или информационного продукта. Предложен подход, основанный на выделении классов.

Ключевые слова: технологический процесс, обучение распознаванию образов, решающее правило, база знаний.

Специальная литература представляет технологический процесс (ТП) как текстовое описание (вербальную модель), снабженное иллюстрациями, формулами, таблицами. До конца не исследованные технологии, процессы, описывающие создание новых материалов, сопровождаются также наличием большого количества экспериментальных данных.

Этапность выполнения технологических операций, выделение классов готовой продукции, наличие диапазонов значений технологических параметров, обеспечивающих получение готового продукта требуемого качества, приводят к построению дискретных моделей знаний о технологических процессах. Многие исходные ингредиенты являются результатом выполнения других технологических процессов (переделов). Поэтому с точки зрения описания понятий и их свойств вопросы описания и формализации исходных ингредиентов и готового продукта должны решаться одинаково.

При реализации обучающей системы в гипер-медиатехнологиях в основе ее логической схемы прежде всего лежит модель предметной области, которая чаще строится в виде многосвязного графа логических связей учебных элементов. Основная проблема при преобразовании первичного материала в систему гипермедиакомпонент - выделение информационных блоков и установление логических связей-гиперссылок между сотнями, а иногда и тысячами учебных элементов.

Модель знаний о ТП представляется как совокупность статической и динамической составляющих. Статическая модель отражает множество классов О: возможные наименования продукции, сортность, уровни потребительских и эксплуатационных показателей качества. Описание технологического процесса массивом «объект-атрибуты-значения» позволяет представить задачу проектирования динамической модели знаний как обучение распознаванию образов (ОРО), когда из БД извлекается система решающих правил, описывающих порядок изготовления продукции заданных классов. Ее графическое представление дает модель поля знаний, на котором распределяются информационные блоки и устанавливаются связи-гиперссылки. Значения атрибутов ХА, характеризующих сырье, материалы, детали, изделия, и достаточное число прецедентов позволяют выделить информативное подмножество признаков ХР для разделения ТП по выпуску продукции различных классов. Признаки-свойства, не вошедшие в рабочий словарь ХР, определяют в исходных текстах базовые понятия, общие места или дополнительную мультимедийную информацию.

Алгоритмическое обеспечение процесса проектирования модели знаний обучающих систем технологической направленности следующее. Исходными данными являются описания ХА производимых объектов с указанием их принадлежности соответствующему классу. Список призна-

ков, входящих в априорныи словарь, специалист формирует исходя из заданного алфавита классов объектов, в частном случае - при составлении онтологии знаний об описываемых ТП.

Получение априорной информации для обучения выполняется одним из способов:

1) выборкой из БД результатов наблюдения за выпуском готовой продукции;

2) заданием значений признаков (или диапазонов значений признаков) объектов обучающей выборки (ОВ);

3) заданием функций принадлежности нечетких классов.

Если отношение размерности исходного пространства признаков к объему ОВ невелико ^А/п(2)<0,03, ..., 0,1, где п(2) - число объектов ОВ для пары классов) и априорный словарь недостаточен для разделения объектов различных классов, то возникает необходимость применения последовательного критерия отношения вероятностей, позволяющего накапливать информацию о значениях признаков объекта на этапе логического вывода. В режиме выделения класса с новыми потребительскими свойствами распознающая БЗ решает задачу двухальтернативного распознавания объектов интересующего класса йи и остальных объектов, относящихся к фоновому классу йф [1].

При ограниченном обучающем материале используются алгоритмы ОРО, обеспечивающие высокую экстраполирующую силу найденных правил. Критерием выбора класса решающего правила (РП), осуществляемого совместно с поиском рабочего словаря Хр, является гарантированная оценка риска [2] Рош^„„(К, Хр ) + е(п, п, М, Ь), где V - эмпирический риск (частота ошибок распознавания на обучающей выборке); е - гарантированное уклонение среднего риска от эмпирического; емкость Ь=Ь(К, Хр) является мерой разнообразия класса РП К для фиксированной размерности признакового пространства. К простейшим классам РП, имеющим минимальную емкость, относятся логические, линейно-логические, линейные и кусочно-линейные. РП, образующие в пространстве признаков нелинейные разделяющие гиперповерхности, при оценке их емкости могут использовать кусочно-линейную аппроксимацию.

Характер зависимости величин Рош от объема выборки п, доверительной вероятности п, количества классов продукции М и емкости Ь позволяет в условиях ограниченных ОВ осуществить выбор класса РП К* и рабочего словаря Хр. Выбранный по критерию минимума Рош класс К предпочтительнее с точки зрения обеспечения экстраполирующей силы системы РП.

Нарушение гипотезы компактности, когда объекты различных классов перемешаны в признаковом пространстве, приводит к тому, что дис-

криминантные правила отказываются от распознавания или в лучшем случае «цепляют» только кусочки настоящих логических закономерностей в данных [3]. Чтобы избежать подобной ситуации, следует перед обучением соответствующие трудные классы разбить на подклассы или, если выполняется поиск неочевидных, скрытых ре-гулярностей, предварительно выделить подгрупп-пы объектов ОВ методами таксономического анализа.

Поиск рабочего словаря и интервальное кодирование признаков (для логических РП) выполняются на основе вычисления критерия информативности. Его выбор связан с классом используемых РП. Для логических РП и для РП, построенных в пространстве непрерывных признаков, используются свои группы критериев.

Для уменьшения избыточности кода и вели-

N.

чины объема пространства признаков У= П- ,

j=l -

, можно устранить дублирующие пороги

после дискретизации отдельных признаков на определенное число градаций что позволяет добиться более глубокого минимума Рош.

Таким образом, при формировании распознающей БЗ при ограниченности исходных данных прежде всего решается комбинаторная задача выбора класса РП и системы описания объектов, а затем с учетом типа входящих в описание признаков непосредственно строится РП. Тем самым осуществляются разбиение единого процесса обучения и учет структуры взаимосвязи его основных этапов.

Для кодирования признаков можно использовать алгоритм позиционного порогового кодирования [4] или алгоритм минимального числа порогов (МЧП) [5]. В первом случае весь диапазон значений признака предварительно разбивается на интервалы равной длины, на каждом интервале для вычисления разделяющей силы определяется характеристическое множество классов, для которых частота появления объектов ОВ не равна нулю. Во втором случае процедура обеспечивает разделение всех полностью разделимых между собой классов, используя МЧП.

Программы формирования рабочего словаря выбирают минимальное или квазиминимальное число признаков N. из исходного априорного словаря ХА при информативности 1р, не ниже исходной 1А. После МЧП-дискретизации задачу выбора рабочего словаря можно свести к схеме аддитивного алгоритма ветвей и границ [5]. Обобщение информации, содержащейся в классах объектов, способствует выявлению отличительных, характерных для каждого класса настроек параметров технологического процесса.

Алгоритмы обучения и распознавания используют, например, следующие методы:

— метод ближайшего соседа; кусочно-линейное РП формируется для небольшого числа классов (М<10);

— метод дискретных линейных решающих функций (ЛРФ) [4]; при обучении настраиваются коэффициенты дискретных функций и пороги позиционного кодирования признаков;

— метод бинарной решающей матрицы (БРМ), осуществляющей покрытие каждого класса объектов ОВ гиперпараллелепипедами с гранями, ортогональными координатным осям [5]. Матрица формируется по описаниям интервалов кодирования признаков через множества индексов классов, значения признаков которых принадлежат данному интервалу кодирования. Распознавание осуществляется посредством поэлементной конъюнкции ячеек матрицы, на которые указывают значения признаков распознаваемого объекта, и выделения единичной ячейки, соответствующей коду класса.

Параметрическая идентификация РП заключается в настройке коэффициентов алгоритма распознавания на конкретную обучающую выборку: по окончании обучения формируются массивы значений порогов для логических РП или коэффициенты линейных функций для линейных и кусочно-линейных РП.

Выбор среди множества альтернативных логических РП в условиях недостаточной ОВ осуществляется на основе рассмотрения сформированных систем описания. Лучшее качество имеет алгоритм, для которого минимальной является величина объема пространств признаков V, и, соответственно, Рош при Vmin«0 и П=СОП81.

Поэтому при оценке надежности РП следует учитывать влияние используемого способа кодирования признаков и вида их критерия информативности, которые должны быть согласованы со сложностью РП. Дискретные ЛРФ аппроксимируют линейные непрерывные решающие функции с мелким шагом дискретизации и по своей сложности занимают промежуточное положение между известными логическими и линейно-логическими РП.

Учет взаимосвязи основных этапов обучения на основе комплексного применения дискрими-нантных алгоритмов в условиях ограниченной априорной информации позволяет проектировать динамическую модель знаний с обеспечением высокой точности при принятии решения по новым данным.

РП, построенные как простой набор дискри-минантных функций линейного и более сложного вида, даже в случае полного разделения классов не содержат знаний о диапазонах изменения значений параметров ТП и их взаимодействий для получения готового изделия заданного класса. Их анализ позволяет указать лишь состав наиболее важных технологических параметров и их весовые коэффициенты для попарной различимости тех-

нологических процессов. Логические правила в форме БРМ и нечеткой решающей матрицы легко поддаются семантической интерпретации и соответствующей реализации в БЗ.

Методы ОРО могут использоваться при создании обучающих систем, основой которых являются информационно-логическая и продукционно-фреймовая модели.

Методику проектирования логической схемы гипертекстовых обучающих систем позволяют сформировать результаты, полученные в процессе построения дискриминантного РП. Например, признаки, оставшиеся после выполнения процедур интервального кодирования и отбора рабочего словаря, характеризуют отличительные для каждого класса настройки параметров, и на фрагмент учебного материала, описывающий характерный прием для получения продукта требуемого класса, дается одна гиперссылка.

Интервалы признаков, представляющие 30-70 % классов, свидетельствуют о возможности выделения соответствующих классов продукции в отдельное подмножество. Информационный блок с гиперссылками-наименованиями выделенных подмножеств следует после титульной страницы.

Интервал признака, представляющий 100 % классов, является характеристикой всей предметной области и чаще всего определяет фрагмент вводной части учебно-методического материала.

Несколько процентов определяют повторяющиеся для некоторых классов процедуры, на которые дается несколько гиперссылок. Оставшееся дополнение множества признаков определяет общие (базовые) декларативные сведения, которые используются для выполнения обычных действий по созданию продукции различного типа.

Информационный блок каждого класса включает указатель на декларативный фрагмент и перечень указателей на процедуры создания и обработки продукции. Содержание перечня определяется теми интервалами признаков, которые представляют заданный класс.

В интеллектуальной обучающей системе БЗ обеспечивает функционирование в режимах обучения, тестирования или тренажера. Фреймовая модель содержит сведения о характеристиках исходных компонентов, параметрах оборудования и технологических потоков, показателях качества произведенной продукции и показателях работоспособности изделия после его эксплуатации. Продукционная модель позволяет выбирать рациональную технологическую цепочку и значения параметров в режиме консультанта или тренажера за счет применения набора правил.

Литература

1. Пименов В.И. Применение методов обучения распознаванию образов для проектирования динамической модели

знаний о технологических процессах // Системы управления и информационные технологии. 2006. № 2 (24). С. 98-103.

2. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов (статистические проблемы обучения). М.: Наука, 1974.

3. Дюк В.А. Осколки знаний // Экспресс-Электроника. 2002. № 6. С. 60-65.

4. Носов А.Л. Описание объектов распознавания в системах технического зрения роботов. Киров: КПИ, 1986. Деп. в ЦНИИТЭИ приборостроения 01.04.86, № 3202-пр.

5. Пименов В.И. Построение обучающей системы на базе модели онтологии // Качество. Инновации. Образование. 2006. № 4. С. 42-48.

ДИНАМИЧЕСКОЕ ИЗМЕНЕНИЕ ПРОЦЕССОВ НА БАЗЕ ПЛАТФОРМЫ WINDOWS WORKFLOW FOUNDATION

М.А. Маслаков; В.Н. Якимов, д.т.н.

(Самарский государственный технический университет, [email protected])

Предложен подход к созданию адаптируемых процессов на базе коммерческой платформы управления потоками работ Windows Workflow Foundation. В основу подхода положена одна из существующих методик моделирования потоков работ, адаптированная в соответствии с особенностями архитектуры и ограничениями рассматриваемой платформы. Представлено описание разработанной программной библиотеки компонентов для создания адаптируемых процессов.

Ключевые слова: потоки работ, динамическое изменение, адаптируемые процессы, структурная корректность, Windows Workflow Foundation.

Современный этап развития корпоративных информационных систем (КИС) характеризуется активным использованием компонентов промежуточного уровня для управления бизнес-процессами. Подобные компоненты относятся к классу систем управления потоками работ, и их основной задачей является обеспечение функционирования сквозных бизнес-процессов предприятия, состоящих из набора отдельных действий, операций и подпроцессов, связанных с применением различных программных средств [1]. Системы, основанные на потоках работ, должны иметь достаточную степень гибкости и адаптивности к изменяющимся условиям и текущим требованиям пользователя, участвующего в процессе. В реальных условиях иногда необходимо периодическое, а во многих случаях единичное отклонение от схемы процесса. Поэтому актуальна задача исследования методов обеспечения адаптивности при выполнении процессов в системах, основанных на управлении потоками работ.

Существует большое количество промышленных платформ, ориентированных на поддержку управления процессами (IBM, BEA/Oracle, Microsoft, Fujitsu, jBoss). Эти платформы функционируют на базе своих собственных методов представления потоков работ и процессов. Методы могут опираться на стандарты и языки описания процессов и процессных взаимодействий, зачастую расширяя и изменяя их, а могут основываться на уникальных для платформы подходах. Поэтому одной из задач является определение возможностей применения результатов теоретических модельных исследований к реальным промышленным платформам и стандартам. В данной работе делается попытка предложить методы построения автоматизированных информационных систем, основанных на управлении потоками работ и под-

держивающих механизмы адаптации исполняемых процессов на базе промышленной платформы Windows Workflow Foundation (WF).

Структурный аспект проблемы обеспечения гибкого исполнения процессов

Проблема обеспечения возможностей гибкого исполнения процессов в системах, ориентированных на управление процессами, включает структурный, семантический, организационно-методический аспекты. Одним из важнейших является синтаксический, или структурный аспект. Информационная система, ориентированная на управление процессами, должна поддерживать полный жизненный цикл процесса для всех типов его изменений. Выделяют изменения на уровне типа и экземпляра процесса. В свою очередь, экземпляры процесса разделяют на несмещенные (оригинальные, работающие на основе первоначальной схемы) и смещенные (модифицированные посредством индивидуального вмешательства в схему исполняемого процесса) [2]. Изменения на уровне типа процесса должны распространяться как на оригинальные, так и на модифицированные во время исполнения экземпляры процессов. Это особенно важно для длительных по времени процессов, наиболее часто встречающихся в реальных системах масштаба предприятия.

Основным вопросом при рассмотрении структурного аспекта поддержки адаптивных процессов является обеспечение структурной корректности изменений экземпляра процесса. При этом необходима выработка соответствующих критериев корректности.

Разные методы моделирования опираются на разные критерии корректности схемы процесса, зависящие от структурных и динамических свойств процесса. Соответственно, для каждого

i Надоели баннеры? Вы всегда можете отключить рекламу.