Секция «Математические методы моделирования, управления и анализа данных»
УДК 519.6
Е. С. Мангалова, М. С. Мангалова Научный руководитель - О. В. Шестернева Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
ИССЛЕДОВАНИЕ ВЛИЯНИЯ РАЗНООБРАЗИЯ АНСАМБЛЯ МОДЕЛЕЙ НА ТОЧНОСТЬ В ЗАДАЧАХ ВОССТАНОВЛЕНИЯ РЕГРЕССИИ
Показано влияние разнообразия индивидуальных моделей на точность ансамбля, исследована эффективность методов генерации разнообразия, основанных на манипуляциях с обучающими подмножествами и параметрами обучения индивидуальных моделей.
В последние годы коллектив моделей (ансамбль) -это один из распространенных инструментов решения задач интеллектуального анализа данных.
Фундаментальной задачей при построении ансамблей является генерация разнообразия ансамбля [1]. Очевидно, что агрегация схожих моделей в ансамбле не может привести к существенному повышению качества идентификации.
Проблема генерации разнообразия заключается в том, что индивидуальные модели обучаются для решения одной задачи, по одной обучающей выборке и вследствие этого обычно сильно коррелированны [2].
Влияние точности индивидуальных моделей и их разнообразия на ошибку коллективной модели показывает декомпозиция ошибки коллективной модели, предложенная Крогом и Веделсби в работе [3]: Е( Н) = Ет (Н) - А( Н),
1 п N 2
^ ^ I (() - Нх)) =
тм -=1 1=1
1 N п 2
= ^ (Х-)- щ)) -
"-¿V 1=1 -=1 1 п N 2
- ^ (Х-)- Н(Х)),
-=1 г=1
где Н(х) - ансамбль; Н1 (х),...,hN (х) - индивидуальные модели, входящие в ансамбль; ((,/(х,)),...,(хп,/(хп)) - тестовая выборка объема п;
E ( H ) - ошибка ансамбля; Em ( H ) - средняя ошибка индивидуальных моделей; A(H) - мера неопределенности (разнообразия) ансамбля.
Заметим, что компонента A(H) неотрицательна,
ошибка ансамбля E(H) не может быть больше, чем средняя ошибка индивидуальных моделей Em (H).
В работе исследованы различные методы генерации разнообразия ансамблей параллельного и последовательного обучения. Показана высокая эффективность формирования различных обучающих подмножеств для построения индивидуальных моделей, а также эффективность выбора различных параметров индивидуальных моделей при обучении.
Библиографические ссылки
1. Kuncheva L. I. Combining Pattern Classifiers: Methods and algorithms. John Wiley & Sons, Hoboken, NJ, 2004.
2. Zhou Z.-H. Ensemble Methods: Foundations and algorithms. Chapman & Hall/Crc Machine Learning & Pattern Recognition. 2012. 236 p.
3. Krogh A., Vedelsby J. Neural network ensembles, cross validation and active learning // Advanced in Neural Information Processing System 7. Cambridge: MIT press, 1995. P. 231-238.
© Мангалова Е. С., Мангалова М. С., 2014
УДК 330.12
А. Р. Мулюкова Научный руководитель - Б. Г. Ильясов Уфимский государственный авиационный технический университет, Уфа
РАЗРАБОТКА СИСТЕМЫ НЕЧЕТКОГО ЛОГИЧЕСКОГО ВЫВОДА ДЛЯ АНАЛИЗА КАЧЕСТВА ЖИЗНИ
Рассматриваются проблемы оценки качества жизни. Предлагается система нечеткого логического вывода, позволяющая оценить влияние на качество жизни уровня налогообложения, занятости населения и продолжительности жизни.
Одной из главных целей развития общества является повышения качества жизни граждан. Эта цель достигается посредством удовлетворения различных потребностей человека: в образовании, в медицине, в трудоустройстве и других потребностей, при этом
единых общепризнанных критериев и норм качества жизни не существует. На его оценку оказывают влияние возраст, пол, социально-экономическое положение человека, религиозные убеждения, культурный уровень и многие другие факторы.