Решетнеескцие чтения. 2015
3. Hall P., Park B. U., Samworth R. J. Choice of neighbor order in nearest-neighbor classification // Annals of Statistics. 2008. No. 36(5), pp. 2135-2152.
4. Vapnik V. Vosstanovlenie zavisimostey po empiricheskim dannym [Restoring dependencies from empirical data]. Moscow : Nauka Publ.,1979. 448 p.
5. Koromyslova A., Semenkina M. About the effectiveness of evolutionary algorithms for multicriterial design of artificial neural networks // Vestnik SibGAU. 2015. T. 16, no. 1, pp. 79-85.
© KopoMbicnoBa A. A., Cepraemo P. E., 2015
УДК 519.854.33
ВЫЧИСЛЕНИЕ ПОРОГОВЫХ ЗНАЧЕНИЙ ВЕЩЕСТВЕННЫХ ПРИЗНАКОВ ПРИ ПОСТРОЕНИИ ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ
Е. М. Краева, И. С. Масич1
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
Е-mail: [email protected]
Рассматриваются вопросы дискретизации и бинаризации вещественных признаков для возможности их использования при построении логических классификаторов.
Ключевые слова: логические алгоритмы, распознавание, закономерности.
CALCULATING REAL ATTRIBUTES TO CUTPOINTS FOR CONSTRUCTING LOGICAL RULES
E. M. Kraeva, I. S. Masich1
Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation Е-mail: [email protected]
In this paper we consider issues of discretization and binarization of real attributes to be used in constructing logical classificators.
Keywords: logic algorithms, recognition, pattern.
Среди различных методов распознавания существуют методы, которые изначально разработаны для работы с объектами, описываемыми бинарными признаками [1]. В то же время эти методы могут быть эффективны и при работе с разнотипными признаками. Это требует применения процедуры бинаризации, т. е. преобразования признаков различных типов в бинарные признаки.
Как обсуждалось ранее [2], наиболее сложным является кодирование вещественных признаков. Число различных значений вещественного признака может быть велико, поэтому назначение бинарной переменной на каждое значение признака неприемлемо. Наилучшим является назначение бинарной переменной на некий интервал значений исходного признака.
Таким образом, весь диапазон значений каждого вещественного признака следует разбить на интервалы. Границы таких интервалов называются порогами.
Бинарные переменные указывают, превысило ли значение признака объекта соответствующий порог:
[1,ь, >Р/,
Здесь i - номер исходного вещественного признака; / - номер порога; р/ - значения порогов.
В качестве потенциальных порогов можно взять середины интервалов между двумя последовательными значениями признака, соответствующими объектам различных классов:
ь( з) + ь(3) р/ = Ь +
0, bj <ßj.
2
Для двух произвольных объектов разных классов г е К + и V е К- определим величину
ау = \ХУ - ху |.
Если а/ = 1, то объекты г и V различны по бинарной переменной х,, т. е. значения численного признака ьз у этих объектов лежат по разные стороны порога р/.
Для описания решения, будет ли порог р/ использоваться при дискретизации, введем бинарную переменную:
[1, если порог р, используется,
УУ = I л
[0, в противном случае.
Математические методы моделирования, управления и анализа данных
Один из возможных способов отбора порогов - это решение задачи оптимизации [3]:
d kj
SSУу ^ min'
j=1 i=1
d kj
SSaZiyv * 1'г e K +'w e K-•
j=1 i=1
Цель данной задачи - снижение числа порогов, достаточных для разделения объектов различных классов.
Введем меру робастности порога [4]:
г/ = г (ßj) = min x, -ßj •
xeD I j I
Изменим модель оптимизации следующим образом:
d kj
SSg (г) Уу ^ min'
j=1 i=1
d kj
SSa7yn * 1'z e K +' w e K-•
j=1 i=1
Здесь g (z) - положительная убывающая функция, например, g (z) = 1/ z .
Определение порогов в соответствии с данной моделью оптимизации позволяет находить такое расположение порогов, которое способствует лучшему качеству классификатора. Данный подход полезен при решении многих практических задач, например [5].
Библиографические ссылки
1. Краева Е. М., Масич И. С. Методы отбора закономерностей в логических алгоритмах распознавания // Решетневские чтения : материалы XVII Между -нар. науч. конф. / СибГАУ. Красноярск, 2013.
2. Краева Е. М., Масич И. С. Бинаризация вещественных признаков для построения логических закономерностей // Решетневские чтения : материалы XVIII Междунар. науч. конф. ; СибГАУ. Красноярск, 2014.
3. Boros E., Hammer P. L., Ibaraki T., Kogan A. Logical analysis of numerical data // Mathematical Programming. 1997. № 79. Р. 163-190.
4. Antony M., Ratsaby J. Robust cutpoints in the logical analysis of numerical data // Discrete Applied Mathematics. 2012. № 160. Р. 355-356.
5. Казаковцев Л. А., Орлов В. И., Ступина А. А., Масич И. С. Задача классификации электронной компонентной базы // Вестник СибГАУ. 2014. № 4(56). С. 55-61.
References
1. Kraeva E. M., Masich I. S. Methods for pattern selection in logical algorithms of recognition // Materialy XVII Mezhdunarodnoy nauchnoy konferentsii "Reshetnevskie chteniya", Krasnoyarsk, 2013.
2. Kraeva E. M., Masich I. S. Binarization of real attributes for constructing logical rules. Materialy XVIII Mezhdunarodnoy nauchnoy konferentsii "Reshetnevskie chteniya", Krasnoyarsk, 2014.
2. Boros E., Hammer P.L., Ibaraki T., Kogan A. Logical analysis of numerical data // Mathematical Programming. 1997. No.79, рр. 163-190.
4. Antony M., Ratsaby J. Robust cutpoints in the logical analysis of numerical data // Discrete Applied Mathematics. 2012. No. 160, рр. 355-356.
5. Kazakovtsev L. A., Orlov V. I., Stupina A. A., Masich I. S. The problem of classifying electronic components // Vestnik SibGAU. 2014. No. 4(56), рр. 55-61.
© Краева Е. М., Масич И. С., 2015
УДК 004.414.23
ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧЕ ОПРЕДЕЛЕНИЯ КАЧЕСТВА МЕЖДИАЛОГОВОГО ВЗАИМОДЕЙСТВИЯ ПО ТИПУ «ЧЕЛОВЕК-ЧЕЛОВЕК»*
У. Н. Круглова1, А. В. Спирина2
1 Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected] 2Ульмский университет Германия, 89081, г. Ульм, аллея Альберта Эйнштейна, 43 E-mail: [email protected]
Рассматривается применение методов снижения признакового пространства, статистической обработки нечисловых данных и моделирования для решения задачи определения качества диалога.
Ключевые слова: нейронные сети, метод главных компонент, нечисловые данные, автоматическая настройка нейронной сети.
*
Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации в рамках проекта М'МЕЕ157414Х0037.