Секция «Математические методы моделирования, управления и анализа данных»
УДК 519.6
Е. С. Мангалова, М. С. Мангалова Научный руководитель - О. В. Шестернева Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
ИССЛЕДОВАНИЕ ВЛИЯНИЯ РАЗНООБРАЗИЯ АНСАМБЛЯ МОДЕЛЕЙ НА ТОЧНОСТЬ В ЗАДАЧАХ ВОССТАНОВЛЕНИЯ РЕГРЕССИИ
Показано влияние разнообразия индивидуальных моделей на точность ансамбля, исследована эффективность методов генерации разнообразия, основанных на манипуляциях с обучающими подмножествами и параметрами обучения индивидуальных моделей.
В последние годы коллектив моделей (ансамбль) -это один из распространенных инструментов решения задач интеллектуального анализа данных.
Фундаментальной задачей при построении ансамблей является генерация разнообразия ансамбля [1]. Очевидно, что агрегация схожих моделей в ансамбле не может привести к существенному повышению качества идентификации.
Проблема генерации разнообразия заключается в том, что индивидуальные модели обучаются для решения одной задачи, по одной обучающей выборке и вследствие этого обычно сильно коррелированны [2].
Влияние точности индивидуальных моделей и их разнообразия на ошибку коллективной модели показывает декомпозиция ошибки коллективной модели, предложенная Крогом и Веделсби в работе [3]: Е( Н) = Ет (Н) - А( Н),
1 п N 2
^ ^ I () - Нх)) =
тм -=1 1=1
1 N п 2
= ^ (Х-)- щ)) -
"-¿V 1=1 -=1 1 п N 2
- ^ (Х-)- Н(Х)),
-=1 г=1
где Н(х) - ансамбль; Н1 (х),...,hN (х) - индивидуальные модели, входящие в ансамбль; ((,/(х,)),...,(хп,/(хп)) - тестовая выборка объема п;
E ( H ) - ошибка ансамбля; Em ( H ) - средняя ошибка индивидуальных моделей; A(H) - мера неопределенности (разнообразия) ансамбля.
Заметим, что компонента A(H) неотрицательна,
ошибка ансамбля E(H) не может быть больше, чем средняя ошибка индивидуальных моделей Em (H).
В работе исследованы различные методы генерации разнообразия ансамблей параллельного и последовательного обучения. Показана высокая эффективность формирования различных обучающих подмножеств для построения индивидуальных моделей, а также эффективность выбора различных параметров индивидуальных моделей при обучении.
Библиографические ссылки
1. Kuncheva L. I. Combining Pattern Classifiers: Methods and algorithms. John Wiley & Sons, Hoboken, NJ, 2004.
2. Zhou Z.-H. Ensemble Methods: Foundations and algorithms. Chapman & Hall/Crc Machine Learning & Pattern Recognition. 2012. 236 p.
3. Krogh A., Vedelsby J. Neural network ensembles, cross validation and active learning // Advanced in Neural Information Processing System 7. Cambridge: MIT press, 1995. P. 231-238.
© Мангалова Е. С., Мангалова М. С., 2014
УДК 330.12
А. Р. Мулюкова Научный руководитель - Б. Г. Ильясов Уфимский государственный авиационный технический университет, Уфа
РАЗРАБОТКА СИСТЕМЫ НЕЧЕТКОГО ЛОГИЧЕСКОГО ВЫВОДА ДЛЯ АНАЛИЗА КАЧЕСТВА ЖИЗНИ
Рассматриваются проблемы оценки качества жизни. Предлагается система нечеткого логического вывода, позволяющая оценить влияние на качество жизни уровня налогообложения, занятости населения и продолжительности жизни.
Одной из главных целей развития общества является повышения качества жизни граждан. Эта цель достигается посредством удовлетворения различных потребностей человека: в образовании, в медицине, в трудоустройстве и других потребностей, при этом
единых общепризнанных критериев и норм качества жизни не существует. На его оценку оказывают влияние возраст, пол, социально-экономическое положение человека, религиозные убеждения, культурный уровень и многие другие факторы.
Актуальные проблемы авиации и космонавтики - 2014. Информационные технологии
По своей сути качество жизни - это разносторонняя характеристика условий существования человека, его развития, а также субъективных представлений и оценок удовлетворения своей жизнью. Качество жизни представляет собой сложную структуру взаимосвязей его составляющих, основными из которых являются занятость населения, продолжительность жизни, состояние природной среды, здоровье населения, качество образования, уровень налогообложения, и многие другие [1].
Качество жизни не может быть однозначно математически описано функцией определяющих его факторов, так как качество жизни, как и многие влияющие на него факторы, не имеет универсальных числовых мер оценки. В работе предлагается система нечеткого логического вывода, позволяющая оценить влияние на качество жизни уровня налогообложения, занятости населения и продолжительности жизни. Реализовать данную систему можно воспользовавшись специальным приложением Fuzzy Logic Toolbox математического пакета программ Matlab.
Построены графики зависимостей качества жизни от продолжительности жизни, подушевого налогового сбора и занятости. Анализ полученных зависимостей позволяет сделать следующие выводы. Во-первых, повышение налогового сбора незначительно влияет на качество жизни, так как с одной стороны это приводит к снижению доходов людей, а с другой стороны - к увеличению государственного бюджета, выделению денег на развитие общества, и, следовательно, к повышению качества жизни населения в целом. Во-вторых, повышение занятости населения и продолжительности жизни значительно влияет на качество жизни, так как они являются основными показателями исследуемого параметра.
Результаты, полученные с помощью разработанной системы нечеткого логического вывода, могут
Matlab представляет собой интерактивную компьютерную систему для выполнения инженерных и научных расчетов, ориентированную на работу с массивами данных, одним из элементов которой является приложение Fuzzy Logic Toolbox. Fuzzy Logic Toolbox обладает простым и хорошо продуманным интерфейсом, позволяющим легко проектировать и диагностировать нечеткие модели. Графические средства Fuzzy Logic Toolbox позволяют интерактивно отслеживать особенности поведения системы.
В качестве основных переменных, оказывающих наибольшее влияние на качество жизни в исследовании, были выбраны величина налога, приходящаяся в среднем на душу населения, занятость населения и продолжительность жизни [2]. Эти переменные используются для построения системы нечеткого логического вывода и анализа качества жизни.
На основе имеющихся статистических данных определен диапазон изменения выбранных переменных [3], и выделены интервалы, которые соответствуют низким, средним и высоким значениям этих переменных (см. таблицу).
использоваться как научно-исследовательскими институтами, занимающимися изучением проблем качества жизни, так и органами государственной власти для принятия решений по улучшению качества жизни.
Библиографические ссылки
1. Беляева Л. А. Уровень и качество жизни. Проблемы измерения и интерпретации // Социологические исследования. 2009. № 1. С. 33-42.
2. Мурасанова А. А. Принципы оценки уровня жизни населения // Изв. Иркут. гос. экон. акад. 2008. № 15(61). С. 102-105.
3. URL: http://www.gks.ru.
© Мулюкова А. Р., 2014
Описание входных переменных
Наименование Диапазон изменения Термы Тип функции принадлежности
Продолжительность жизни, лет 77,8 (Республика Ингушетия) -60,79 (Чукотский автономный округ) 1(^(низкая), average(средняя), high(высокая) Гауссова
Занятость, тысяч человек 0,69 (Ямало-Ненецкий автономный округ) - 0,16 (Республика Ингушетия) 1(^(низкая), average(средняя), high(высокая) Гауссова
Величина налога, приходящаяся в среднем на душу населения, тыс. руб./чел. 124,53 (Ненецкий автономный округ) - 3,85 (Республика Адыгея) 1(^(низкая), average(средняя), high(высокая) Гауссова