МЕТОД ДООБУЧЕНИЯ АЛГОРИТМОВ РАСПОЗНАВАНИЯ КЛАССОВ ОБЪЕКТОВ
А.Г. Бачев; В.В. Малозёмов
(Военная академия воздушно-космической обороны им.. Г.К. Жукова, г. Тверь); А.В. Машкин, к.т.н. (2 ЦНИИ Минобороны России, г. Тверь, [email protected])
В статье представлен метод решения задачи корректировки статистического описания объектов распознавания в пространстве признаков. Использование данного метода позволяет повысить достоверность решений, принимаемых алгоритмами распознавания за счет учета дополнительной признаковой информации. Ключевые слова: дообучение алгоритмов, пространство признаков.
Формирование образов распознаваемых объектов осуществляется путем статистической обработки многократных наблюдений (измерений) значений признаков распознавания и формализации их в виде генеральной совокупности для каждого объекта [1]. При синтезе алгоритма распознавания генеральная совокупность значений фиксируется и, как правило, в дальнейшем не корректируется. Однако в процессе дальнейшего наблюдения за объектами любого класса появляется дополнительная признаковая информация, в том числе и принципиально отличающаяся от информации, полученной ранее. В связи с этим алгоритм распознавания должен обладать свойством адаптации к изменяющимся признаковым образам, то есть должен дообучаться. Под дообучением будем понимать процесс корректировки образного описания распознаваемых объектов на основе поступающей текущей признаковой информации и принятия решений о ее принадлежности.
Цель работы заключается в разработке метода дообучения алгоритмов распознавания на основе анализа дополнительной признаковой информации.
Если предположить, что априорные образы не являются абсолютно стабильными, то в процессе получения текущей измерительной признаковой информации, аппроксимируемой функцией плотности распределения для признака х - ^(х), и отнесения ее с соответствующими вероятностями ко всем возможным М образам объектов из анализируемой совокупности необходимо корректировать априорные функции плотности каждого 1-го образа - ^(х).
Пусть априорный образ ^(х) был сформирован в результате N2 испытаний. Площадь к-го столбца априорной гистограммы определяется из выражения:
N.
х„±
sk=-
Ах 2
N
N. Ах 2
> fj (х)Ах,
= NEfj (х)Ах, при Ах -> О,
(1)
где N - количество испытаний, попавших в к-й столбец априорной гистограммы; - координата
центра к-го столбца априорной гистограммы; Ах -элемент вероятности, соответствующий ширине столбца гистограммы.
Получение текущего образа ^(х) в процессе наблюдения за объектом физически означает наличие в признаковой области дополнительного испытания.
При получении единичного текущего распределения ¡текСх) площадь соответствующего столбца А8к выражается как
ASk«fleK(x)Ax=ANk
х„- 2
(2)
где Л1\к - числовая доля текущего испытания, попавшего в к-й столбец априорной гистограммы.
Общее количество испытаний составляет N2+1. Следовательно, площадь столбца аддитивного распределения (совокупности априорного и текущего) представляется как
к N¿.+1 ' где ^*(х) - трансформированное априорное распределение, характеризующее образ 1-го объекта.
Проведя преобразования с учетом (1-3), получаем выражение вида
^(х)Ах + Ц-тек(х)Ах
f; Ах =
NE+1
(4)
трансформированный образ математически выражается как
С(х>=
NT
NE+1
Цх) +
1
Ns+1
freK(x)
(5)
Если было получено п текущих образов, то трансформация априорного образа примет вид
Nv
1
N2+n
fiW+Z^—fieK,(x). (6)
^N,+11
Однако такое представление справедливо при условии, что наблюдаемые текущие образы однозначно относятся к 1-му объекту. В случае несоблюдения этого условия необходимо трансформировать априорные образы с учетом апостериорных вероятностей р , означающих вероятности отнесения ]-го текущего образа к 1-му априорному распределению. Расчет величин может произво-
п
диться с использованием известной формулы Байеса [2]:
Р1Р1(Г(х)/ + |с,.(х))
-!-• (7)
Р =■
ч м
£РРД(х)ЯтеК)(х))
Учитывая весовые коэффициенты в виде значений Р^ (7), выражение (5) запишется как
N Р
(х) = „ ^ (х) + -—Гтек: (х), а формула
N.. + Р.
£ ч
N. + Р.
2 ч
N " РХек (Х) -г (X) + £ 4 1
(6) в виде ^"(х) = ■
Расчеты показателей качества распознавания с использованием процедуры дообучения проводились для условий, когда объектами выступают радиоэлектронные средства - источники радиоизлучений. В качестве априорных образов рассматривались одномодальные функции плотности распределения вероятностей случайных значений
частоты излучений радиоэлектронных средств. После реализации процедуры дообучения априорные образы трансформировались в полимодальные функции плотности, характеризующие законы распределения частот излучения в различных режимах работы радиоэлектронных средств. Для фиксированных условий проведения расчетов значения показателей качества изменялись в пределах единиц процентов.
Таким образом, откорректированное статистическое описание объектов распознавания в пространстве признаков на основе поступающей дополнительной информации позволяет адаптировать алгоритмы. Это дает возможность более адекватно представлять объекты их статистическими образами, что, в свою очередь, приводит к повышению достоверности вырабатываемых решений.
Литература
1. Левин Б.Р. Теоретические основы статистической радиотехники. В 3 кн. М.: Сов. радио, 1975.
2. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1968.
АВТОМАТИЗИРОВАННАЯ СИСТЕМА РЕНТГЕНОСТРУКТУРНОГО АНАЛИЗА ПОЛИКРИСТАЛЛОВ
(Работа выполнена при поддержке ФЦП «Научные и научно-педагогические кадры инновационной России»,
НИР НК-136П/3)
Я.И. Якимов; Е.С. Семенкин, д.т.н.
(Сибирский федеральный университет, г. Красноярск, [email protected])
Статья посвящена разработке программной системы автоматизированного рентгеноструктурного анализа данных порошковой дифракции. В основе ее лежит новый гибридный двухуровневый генетический алгоритм глобальной оптимизации. Апробация системы показала, что существенно упрощается и автоматизируется процесс определения кристаллической структуры, обеспечивая высокую точность результатов.
Ключевые слова: гибридный генетический алгоритм, рентгеновский структурный анализ, кристаллическая структура, порошковая дифракция, количественный фазовый анализ.
Определение атомной структурной модели неизвестного кристаллического вещества - наиболее трудная задача в исследованиях новых веществ и материалов, особенно, когда нет возможности получить достаточно большой кристалл вещества для исследования монокристальными методами. В этом весьма распространенном случае используют методы порошковой дифракции. Вследствие информационной бедности порошковой дифрактограммы - схлопывания трех пространственных измерений в одну размерность дифракционного профиля с перекрытием дифракционных пиков от большого числа разноориентиро-ванных кристаллитов - возникает проблема. Это накладывает фундаментальные ограничения на информацию, получаемую из профиля, и ее анализ. Дополнительные трудности создает частое наличие трудноотделимых примесей побочных фаз.
Сравнительно новым и перспективным направлением решения проблемы поиска кристаллической структуры по данным порошковой дифракции является применение стохастических методов глобальной оптимизации в прямом пространстве, таких как Монте-Карло, имитация отжига, эволюционные алгоритмы [1]. Суть методов заключается в статистической генерации и критериальной эволюции тестовых структур с накоплением лучших из них для использования в последующих генерациях. Глобальный критерий качества при этом - соответствие профилей экспериментальной и тестовой модельной ди-фрактограмм, где вторая является сложной функцией большого числа параметров, описывающих форму профиля и непосредственно структурную модель.
Формализуя задачу определения кристаллической структуры из данных порошковой дифрак-