Секция «Математические методы моделирования, управления и анализа данных»
нитного к антиферромагнитному состоянию. В случае вакансии азота значение магнитного момента существенно не изменяется в зависимости от расстояния между вакансиями. Данное явление объясняется электрон-дефицитным состоянием атомов бора, окружающих вакансию азота.
Локализация магнитного момента для монослоя И-БМ с вакансиями обоих типов происходит на атомах, окружающих вакансию.
В ходе численного моделирования магнитных свойств вакансий в монослое И-БМ было установлено, что присутствие вакансий приводит к появлению магнитного момента. Показано, что исследуемая система является магнитно упорядоченной. При увеличении расстояния между вакансиями возможен переход от антиферромагнитного к ферромагнитному состоянию и наоборот, в зависимости от типа вакансий. Откры-
тие подобного явления дает новые возможности использования вакансий в монослое h-BN для внедрения и контроля магнитного упорядочения.
Библиографические ссылки
1. Kohn W. and Sham L. J. Phys. Rev. 140. 1133 (1965).
2. Kresse G, Hafner J. et al, Phys. Rev. B 47. 558 (1993).
3. Kresse G., Hafner J. et al., Phys. Rev. B 48. 13115
(1993).
4. Kresse G., Hafner J. et al., Phys. Rev. B 49. 14251
(1994).
5. Vanderbilt D. Phys. Rev. B 41. 7892 (1990).
6. Monkhorst H. J., Pack J. D., Phys. Rev. B 13. 5188 (1976).
© Сержантова М. В., Кузубов А. А., 2012
УДК 681.3
Ю. В. Смешко Научный руководитель - Е. Д. Агафонов Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
КРИТЕРИЙ ДЛЯ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ КОЛИЧЕСТВА КЛАССОВ В ЗАДАЧЕ НЕЧЕТКОЙ КЛАССИФИКАЦИИ С САМООБУЧЕНИЕМ
Рассматривается задача построения нечеткого классификатора для множества объектов, представленных признаковым описанием без указаний учителя. Предложен критерий для автоматического определения количества нечетких классов.
Нередко процесс интеллектуального анализа данных включает в себя решение задачи классификации, то есть группировки объектов исходного множества по однородным классам. При анализе сложных систем границы классов, выделяемых в процессе классификации, могут быть размытыми. В этом случае классы пересекаются и обладают сложной формой и структурой [1]. Требование об однозначности классификации подобной совокупности объектов оказывается чрезмерно жестким. В нечетком подходе к задаче классификации вместо понятия строгой принадлежности к классу вводится понятие функции принадлежности ц, принимающей вещественные значения
из интервала [0,1] и отражающей степень сходства
объекта с типичным элементом группы (центром класса). При таком подходе класс представляет собой нечеткое множество объектов, а проблема классификации сводится к определению степени принадлежности объекта тому или иному классу.
В задаче классификации с самообучением информация о конечном множестве из т объектов представлена признаковым описанием, которое называют матрицей «объект-свойство» Хт/п, где каждый объект х е X будет интерпретироваться как точка в п -мерном признаковом пространстве 1п (X). Указания о принадлежности объектов классам отсутствуют. Количество классов также заранее неизвестно и должно определяться в процессе группировки. При решении
задачи классификации с самообучением проблема определения количества классов выходит на первый план.
Иногда встречается случай, когда заказчик (владелец данных) точно знает, сколько классов он хотел бы получить [1]. Чаще заказчик высказывает пожелание: хотелось бы получить количество классов в диапазоне от сп до ск. Алгоритм классификации с самообучением должен автоматически выбрать наиболее «есте-
*
ственное» число классов с в этом диапазоне. Для этого исследователь формирует критерий Q(X, с), с
помощью которого можно предпочесть одно разбиение другому и определиться с выбором количества классов. Тогда проблема сводится к последовательному разбиению исходной совокупности объектов на различное число классов из интервала [сп, ск] с последующим выбором разбиения, соответствующего экстремальному значению введенного функционала:
Q(X, с) ^ ехгг . (1)
сп<с<ск
В работе предлагается критерий для определения количества классов в процессе решения задачи нечеткой классификации с самообучением. Критерий сформирован на основе гипотезы компактности, предполагающей, что объекты одного класса должны образовывать компактные «сгустки» в многомерном признаковом пространстве [2]. Исходная информация для расчета критерия задана матрицей Гт/с = (цг1},
Актуальные проблемы авиации и космонавтики. Информационные технологии
которая определяется в результате группировки m объектов в c нечетких классов алгоритмом нечеткой классификации с самообучением. Предлагается следующий алгоритм для определения количества классов:
1. Задаем границы интервала [си, ck], сп < ck .
2. а) С помощью алгоритма нечеткой классификации с самообучением производим группировку множества объектов в с нечетких классов (с = си,сп +1,...,ck ).
б) Рассчитываем показатель нечеткого внутриклассового разброса:
1 c 1 m
S=-Х—Хм(xi, tI
c l=1m i=1
(2)
d=±1 1
c l=1 c -
1
]-1 Х d(xi,Tl').
1 c 11 Ul
(3)
г) Предлагается следующий критерий для количественной оценки разбиения [1, 2]:
Da
Q( x, c) = ь -т—
S +ф
(4)
где а, Ь, ф - параметры, определяющие значимость соответствующих показателей. Шаги а), б), в), г) повторяются до тех пор, пока с = ck. После того, как значения критерия (4) определены для всего интервала [си, ck], проблема отыскания количества классов *
с сводится к решению оптимизационной задачи:
c = c: Q(X, c) ^ max .
cn<c<ck
(5)
где - функция принадлежности / -объекта 1 -классу; ё(х, х1) - функция, определяющая расстояние от I -объекта до центра 1 -класса. В качестве меры ё использовалось Евклидово расстояние в многомерном признаковом пространстве.
в) Рассчитываем показатель межклассового разброса:
В качестве исходных данных для алгоритма использовалась выборка Glass Identification, взятая с UCI Machine Learning Repository. Шесть типов стекла представлены 214 образцами. Для каждого образца измерено 9 различных показателей-признаков. Признаки выражены количественными величинами. Указания учителя отсутствуют. В качестве алгоритма нечеткой классификации с самообучением использовался алгоритм нечетких С-средних [3].
Критерий для определен ил количества классов
2 4 6 В 10 12 14 16 1В 20 22 24 26 2В 30
Число классов
Результаты применения алгоритма (cn = 1, ck = 30, c = 6, Q(X,c ) = 2.737)
Максимум критериальной функции, изображенной на рисунке, соответствует разбиению на 6 нечетких классов.
Библиографические ссылки
1. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск : Изд-во Ин-та математики, 1999. 270 с.
2. Загоруйко Н. Г. Методы распознавания и их применение. М. : Сов. радио, 1972. 208 с.
3. Bezdek J. C. Pattern Recognition With Fuzzy Objective Function Algorithm. NY: Plenum Press, 1981.
© Смешко Ю. В., 2012