Вестник Евразийской науки / The Eurasian Scientific Journal https://esj.today 2018, №1, Том 10 / 2018, No 1, Vol 10 https://esj.today/issue-1 -2018.html URL статьи: https://esj.today/PDF/56ITVN118.pdf Статья поступила в редакцию 19.02.2018; опубликована 12.04.2018 Ссылка для цитирования этой статьи:
Горбатков С. А., Фархиева С. А., Горбаткова Е.Ю. Метод агрегирования переменных нейросетевой модели в обратных задачах восстановления зависимости в условиях высокой размерности пространства признаков и зашумленности данных // Вестник Евразийской науки, 2018 №1, https://esj.today/PDF/56ITVN118.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ.
For citation:
Gorbatkov S.A., Farkhieva S.A., Gorbatkova E.Yu. (2018) The method of aggregating the variables of a neural network model in inverse problems of recovering the dependence in conditions of high dimensionality of the space of attributes and data noisiness. The Eurasian Scientific Journal, Vol. 10, No. 1. https://esj.today/PDF/56ITVN118.pdf (In Russ.)
УДК 378.675 ГРНТИ 28.23.24
Горбатков Станислав Анатольевич
ФГОБУ ВО «Финансовый университет при Правительстве Российской Федерации»
Филиал в г. Уфа, Россия Профессор кафедры «Математика и информатика»
Доктор технических наук E-mail: [email protected] РИНЦ: http://elibrary.ru/author_profile .asp?id=158740 SCOPUS: http://www.scopus.com/authid/detail.url?authorId=8646868800
Фархиева Светлана Анатольевна
ФГОБУ ВО «Финансовый университет при Правительстве Российской Федерации»
Филиал в г. Уфа, Россия Заведующий кафедрой «Математика и информатика»
Кандидат технических наук E-mail: [email protected] РИНЦ: http://elibrary.ru/author_profile.asp?id=567037
Горбаткова Елена Юрьевна
ФГОБУ ВО «Башкирский государственный педагогический университет им. М. Акмуллы», Уфа, Россия
Доцент кафедры «Охрана здоровья и безопасности жизнедеятельности»
Кандидат педагогических наук E-mail: [email protected] РИНЦ: http://elibrary.ru/author_profile.asp?id=300637
Метод агрегирования переменных нейросетевой модели в обратных задачах восстановления зависимости в условиях высокой размерности пространства признаков и зашумленности данных
Аннотация. Статья посвящена совершенствованию интеллектуальных информационных технологий (нейросетей) и носит методологический характер. В предшествующих статьях авторов были сделаны первые шаги в исследовании эмерджентных эффектов, порождаемых комплексированием нейросетевых технологий и агрегированием экзогенных переменных на базе обобщенных функций желательности Харрингтона. Первые
шаги исследований оказались успешными и были подтверждены вычислительными экспериментами и сравнением с классической (базовой) эконометрической моделью. Однако не был получен ответ на основной вопрос комплексирования указанных выше методов, предложенный авторами: сработает ли эта идея при ужесточении условий моделирования, характерных для некоторых классов прикладных задач? Речь идет о сильном зашумлении в данных (вплоть до их сознательного искажения), отягощённых отсутствием априорных сведений о виде закона распределения шумов, неполнотой данных, неопределенностью, большой размерностью пространства признаков (до нескольких сот экзогенных переменных и нескольких десятков эндогенных переменных). В данной статье получены четкие ответы на указанные выше вопросы и дополнительно исследованы вопросы об адекватности получаемой нейросетевой модели. Специфической особенностью рассмотренного класса нейросетевых моделей является то, что и эндогенные, и экзогенные переменные являются случайными величинами. Подробно исследованы вопросы регуляризации предложенного метода и его апробации на реальных данных обработки опросных анкет для экзогенных переменных и изменений с помощью сертифицированных измерительных средств для эндогенных переменных. Предложена концепция и оригинальный реализующий ее метод иерархического трехуровневого каскадного агрегирования эндогенных и экзогенных переменных нейросетевой модели, которые повышают прогностическую силу модели в очень сложных условиях моделирования. Концепция и реализующий ее метод апробированы на реальных данных из области профилактической медицины.
Ключевые слова: нейросетевая модель; агрегирование; экзогенные переменные; эндогенные переменные; обобщенная функция желательности Харрингтона; регуляризация; обратные задачи; восстановление зависимостей
Введение. Постановка задачи нейросетевого моделирования. Актуальность темы исследования
В статье рассматривается обратная задача восстановления зависимостей, скрытых в данных
у = (р{х); у = ( у1, ...,уи, —,Ут); X = ( Xi,...,Xj,...,Xn). (1)
Здесь у - вектор восстановленных (расчетных) значений экзогенных переменных; х -вектор экзогенных (объясняющих) переменных; <pQ) - оператор восстанавливаемой нелинейной зависимости (нейросетевая модель системы); XjeRn, yueRm - пространства вещественных чисел.
Таким образом, с позиций системного подхода целью моделирования в статье является получение новых знаний о моделируемой системе здоровьесохраняющей технологии для социального кластера обучающейся молодежи (студентов). Для достижения этой цели разрабатываются оригинальные нейросетевые модели.
В статье авторов [1] было показано, что объединение двух расчетных систем - нейросети и агрегирующей обобщенной функции желательности Харрингтона [2] для экзогенных переменных - порождает эмерджентный эффект. Он заключался в сокращении размерности факторного пространства: Rn^Rk,k«n и, соответственно, уменьшении энтропии в расчетной системе. Эндогенная переменная Y в [1] рассматривалась как скалярная величина -вероятность P банкротства корпорации.
В данной статье идея комплексирования расчетных методов из [1] развивается и углубляется, что обусловлено спецификой специально выбранной моделируемой системы с особо сложными условиями моделирования - объекта профилактической медицины для
социального кластера студентов вузов. Исследуемый социально-биологический кластер требует учета системного нелинейного воздействия различных факторов на индивидуум (студента), причем с оценкой результатов воздействия в разных аспектах. Соответственно, исходная эндогенная переменная Y должна быть не скаляром, а вектором в (1). При этом для содержательного описания моделируемого кластера набирается более 170 экзогенных переменных (факторов) и несколько десятков эндогенных переменных. Результаты наблюдений сильно зашумлены в силу того, что экзогенные переменные получаются путем обработки опросных анкет. Вид закона распределения шумов априорно неизвестен, что исключает возможность разработки аналитических методов регуляризации моделей.
Такая постановка задачи порождает, помимо практического интереса для профилактической медицины, два положительных момента для теории нейросетевого моделирования сложных систем:
1) Создается благодатная почва для проверки идей усовершенствования нейросетевых технологий в сложных условиях моделирования.
2) Векторный характер эндогенной переменной Y в (1) создает предпосылки разработки концепции ступенчатого (каскадного) агрегирования переменных модели ({уи} U (ху)}; и = 1, m; j = 1, п (см. ниже в разделе 2 статьи). Здесь «U» -символ дизъюнкции, т. е. объединения множеств.
Концепция ступенчатого (каскадного) агрегирования эндогенных и экзогенных переменных нейросетевых моделей на основе обобщенной функции желательности Харрингтона [1] предложена и исследована в данной статье впервые. Это обосновывает актуальность и научную новизну материала статьи.
1. Идея предлагаемой концепции и метода каскадной компрессии эндогенных и экзогенных переменных
Предлагаемая концепция, представляющая собой методологическую основу метода и разработанной нейросетевой модели (НСМ), формулируется так: «Концепция уменьшения размерности исходного пространства переменных НСМ [Rn X Rm] » представляет собой алгоритм, организованный по иерархической трехуровневой схеме так, что предыдущий уровень (каскад) агрегирования переменных создает предпосылки для усиления полезного эффекта в последующем каскаде. В итоге на выходе НСМ степень компрессии переменных примерно равна произведению степеней компрессии каждого каскада (рис. 1). Порождаемый эмерджентный эффект - повышение качества НСМ в сложных условиях моделирования за счет сильной компрессии пространства переменных и сглаживания ошибок измерения переменных операторами частных функций желательности (dj(xj}) и {du(yu}} и затем операторами обобщенных функций желательности Dy и Dx (см. ниже (2) и (3))».
Как отмечалось в [1], суммарная длина описания НСМ по информационному критерию Куллбака-Лейблера [3] определяет прогностическую силу модели, ограничивая сверху ожидаемый риск неверной оценки. Другими словами, следует уменьшать размерность пространства переменных с финишным контролем ее качества на тестовом множестве [9].
Заметим, что сформулированная выше концепция отражает общесистемный закон каскадного принципа усиления положительного эффекта [4]. Наглядный пример из техники: коэффициент усиления полезного сигнала в каскадном электронном усилителе примерно равен произведению коэффициентов усиления последовательных каскадов.
Сформулированная выше концепция послужила методологической основой оригинального гибридного метода, названного авторами «Метод каскадного агрегирования эндогенных и экзогенных переменных построения нейросетевой модели (МКА)». Алгоритм МКА, организованный по иерархической схеме рис. 1, детально описан ниже.
Рисунок 1. Метод каскадного агрегирования построения нейросетевой модели (составлено авторами)
На иерархическом уровне I, назовем его «базовым», производится отбор показателей (признаков), включаемых в НСМ, т. е. П = [{уи} и (ху)] . На эвристическом уровне производится разделение пространства признаков П на две группы: уи Е П эндогенных переменных и х^ Е П2 экзогенных переменных. Дискриминантным правилом разбиения П на две группы П и П2 служит способ получения информации, который аккумулирует профессиональный опыт аналитика, разрабатывающего модель. Здесь необходим глубокий анализ и учет специфики моделируемого объекта: пространство эндогенных переменных {уи} Е П формируется с помощью приборных измерений отдельных показателей уи и образованием из них сверток и удельных безразмерных критериев (см. ниже в иллюстрационном примере раздела 3 статьи (жизненный индекс, адаптационный показатель, гармоничность телосложения и др.)) всего более 30 показателей. При образовании таких «мини-агрегатов» используются общепринятые формулы профилактической и спортивной медицины [5, 6].
Отметим два важных свойства изложенного способа формирования пространства эндогенных переменных П , которые предопределяют качество создаваемой НСМ: 1) получаемая информация, содержащаяся в П, носит объективный характер; 2) образуемые
«мини-агрегаты» {уи} уже подвергают компрессии исходные, измеренные приборами, показатели.
Пространство экзогенных переменных ху Е П2, которое отражают нелинейное влияние внешней среды на объект (биосистему) - студента, формируется совсем другим способом -путем обработки данных опросных анкет. Здесь возможно сильное зашумление (вплоть до сознательного искажения). Это и служит посылом к совершенствованию нейросетевых информационных технологий в этой прикладной области.
Агрегирование переменных на уровне II. Здесь в блоке П.2 на базе частных функций желательности йуи и обобщенной функции желательности Харрингтона Бу множество эндогенных переменных {уи} Е П трансформируется в один обобщенный скалярный показатель Бу по формуле (2).
Dy = w/d1 ■ d2 ■ ... • du ■ ... • dm E [0; 1].
(2)
Функции частных желательностей du(y■^) осуществляют преобразование натуральных нормированных (кодированных) значений эндогенных переменных у^ в безразмерную шкалу желательности, имеющий интервал от 0 до 1. Значение du = 0 соответствует абсолютно неприемлемому уровню и-го признака, а значение du = 1 идеальному (самому лучшему) значению данного признака. Функции du вычисляются либо по формуле (3), либо по графику (рис. 2).
= ехр[-ехр(-у')]. (3)
Рисунок 2. Функция желательности (рисунок заимствован из [2])
Принято считать лингвистическую оценку «очень хорошо» соответствующей по шкале желательности диапазону du Е [0,8; 1] , «хорошо» du Е [0,63; 0,8] ; «удовлетворительно» du Е [0,37;0,63], «плохо» du Е [0,2;0,37], «очень плохо» (неприемлемо) du Е [0;0,2]. Число интервалов на кодированной шкале у' принято выбирать от 3 до 6. Выбор числа интервалов на кодированной шкале определяет крутизну кривой желательности в средней зоне.
Функция частных желательностей du(y■[l) имеет три положительных свойства:
• Она хорошо интерпретируется в терминах качественных (лингвистических) оценок меры влияния и-ой эндогенной переменной на обобщенyю функцию желательности Харингтона Б по (2).
• Функция du Е [0; 1], поэтому она удобна в расчетах; функция по (3) непрерывно дифференцируема любое число раз.
56ITVN118
• Функция du(yü) реализует сжимающий оператор по отношению к своему аргументу у'и: например, на рис. 2 видно, что интервал [-6; 6] отображается в интервал [0; 1], т. е. коэффициент сжатия получается примерно равным 12. Данное свойство особенно важно для исследуемого класса задач с сильным зашумлением данных.
Отметим, что лингвистическая интерпретация значений обобщенной функции желательности Харрингтона D также производится в соответствии с рис. 2. Указанные выше положительные свойства частных функции желательностей характерны и для функции Харрингтона D.
В блоке II.1 алгоритма происходит преобразование экзогенных переменных Xj ЕП2 в частные функции желательности {dj}, аналогично операциям в блоке II.1. Разница состоит лишь в том, что в пространстве П2 на эвристическом уровне выделяются множества подгрупп экзогенных переменных {*yfc)}, j = 1,п; (Ю = 1,2, ■■■, I. Каждая к-я подгруппа отражает свой аспект влияния экзогенных показателей на обобщенный показатель D по (2).
Так в иллюстрационном примере из раздела 3 статьи обобщенной оценки здоровья студентов подгруппа П21 характеризует качество питания студентов, подгруппа П222 -упорядоченность образа жизни (режим), подгруппа П23 - приверженность к вредным привычкам и т. д.
Соответственно числу подгрупп l для каждой из них образуются свои обобщенные функции желательности Харрингтоны D(k^(dj), (к = 1,I; j = 1, п) по (1).
Отметим два важных свойства образуемых на уровне II агрегатов DY и DXj в виде
обобщенных функций желательности Харрингтона: 1) агрегируемые частные функции желательности du и dj, играющие роль аргументов в (2), должны быть однонаправленными; 2) в общей нелинейной НСМ должно учитываться влияние эндогенных частных желательностей du, dp (и Фр; и,р = 1,2, ■ .,т) друг на друга. Первое свойство учитывается при кодировании (нормировании) натуральных величин аргумента формулы (2):
У [Утт,Утах] ^ У' ^ [-6,+6] . Второе свойство выполняется автоматически в силу структуры формулы (2).
На уровне III алгоритма МКА строится байесовский ансамбль НСМ, связывающая вход модели {D(k\dj)} с выходом DY(du):
F
0{хк)^)ЕК1^0уШЕК\ (4)
где: Р(^) - оператор нейросетевого отображения [7].
Сделаем некоторые замечания по поводу построения НСМ на уровне III алгоритма:
1) Согласно классификации [4] агрегатов нейросеть вида (3) следует отнести к «агрегатам-сетям», которая на заключительном каскаде III тоже вносит свой вклад в компрессию переменных: И1 ^ И1 , т. е. степень компрессии здесь оценивается числом подгрупп I экзогенных переменных. В итоге в МКА степень компрессии достигается порядка сотен. В примере из раздела 3 статьи она составляет 566. Компрессия переменных в НСМ сопровождается регуляризацией расчетной модели на байесовским ансамбле.
2) Итоговый выходной показатель описанного алгоритма Оу{Аи) Е [0; 1] и поэтому допускает трактовку в терминах субъективной вероятности желаемого события.
2. Количественные оценки метода каскадного агрегирования переменных и построения НСМ
Всего обследовалось из ведущих вузов Республики Башкортостан 800 студентов. Фрагмент выборки объемом 90 студентов, по которой для иллюстрации предлагаемого МКА строилась нейросетевая модель, показан в таблице 1 (эндогенные, т. е. выходные переменные в виде агрегатов - частных функций желательности {йуи}). Всего выделено 11 групп основных эндогенных переменных, в которых агрегированы от двух до нескольких первичных, измеряемых с помощью сертифицированных приборов, показателей:
VI - индекс массы тела, вычисляемый по формуле У1 = М/К ,кг/м2, где М- масса тела, кг; к - поверхность тела, м2;
У2 - гармоничность телосложения (индекс Леви) [5, 6], У2 = [Т/2] • 100, где Т - обхват грудной клетки в спокойном состоянии, см; Ъ - рост, см;
У3 - индекс относительной силы (в %), вычисляемый по формуле У3 = [Р/М] • 100 %, где Г - сила кисти (кг);
У4 - жизненный индекс (в мл/кг), вычисляемый по формуле: ЖЕЛ/М; где ЖЕЛ -жизненная емкость легких;
У5 - частота пульса, ударов/мин.;
У6 - циркулярно-респираторный индекс Скибинской [5, 6]: [ЖЕЛ/100А]/У5, где А -задержка дыхания после вдоха, с;
У7 - артериальное давление, мм ртутного столба;
У8 - адаптационный показатель, вычисляемый по формуле: У8 = 0,011 • + 0,014 • • (САД) + 0,008 • (ДАД) + 0,009 • М - 0,009 • Г5 + 0,014 • В - 0,27; (где САД, ДАД -систологическое и диастологическое артериальное давление; В - возраст. Эта формула представляет собой уравнение регрессии, где числовые значения коэффициентов оценены по методу наименьших квадратов и являются размерными величинами [5, 6]. В то же время каждый член в правой части уравнения является безразмерной величиной; факторы в правой части имеют размерность: [У5] = ударов пульса/мин.; [САД, ДАД] = мм ртутного столба; [М] = кг; [В] = возраст, полных лет).
У9 - проба Руфье [5, 6], соответствующая формуле: У9 = (4 • (Р1 + Р2 + Р3) - 200) / 10; где Р1 - число пульсаций сердца за 15 с до физической нагрузки, Р2 - число пульсаций после нагрузки за первые 15 с, Р3 - число пульсаций за последние 15 с первой минуты периода восстановления;
У10 - показатель гибкости позвоночника (расстояние от ладоней до пола в наклоне со скамейки без сгибания коленей, см);
VII - оценка личностной тревожности в баллах (психологический тест «Шкала самооценки уровня тревожности» Ч.Д. Спилберга и Ю.Л. Ханина) [5, 6].
Таблица 1
Фрагмент агрегирования эндогенных переменных на основе обобщенной функции желательности Харрингтона Бу
Номер наблюдения Частные функции желательности эндогенных переменных dy.u.i (и = 1 •1 г';1 = 1 •10) Произведения частных желательностей Обобщенные функции желательности Харрингтона
i du ¿21 d3i d5i d6i d7i d8i d<)i dioi diu n U = 1 DY.i
1 0,9 0,7 0,75 0,95 0,45 0,75 0,5 0,65 0,35 0,985 0,72 0,01212 0,6695
2 0,95 0,65 0,86 0,81 0,75 0,74 0,5 0,7 0,55 0,63 0,1 0,00289 0,5878
3 0,85 0,5 0,85 0,3 0,5 0,5 0,6 0,14 0,68 0,8 0,39 0,00048 0,4995
4 0,35 0,9 0,68 0,36 0,21 0,67 0,5 0,25 0,75 0,7 0,6 0,00043 0,494
5 0,68 0,7 0,7 0,58 0,27 0,9 0,5 0,7 0,9 0,7 0,15 0,001553 0,555
6 0,45 0,37 0,68 0,19 0,15 0,45 0,19 0,3 0,5 0,53 0,51 0,000012 0,3547
7 0,65 0,5 0,37 0,36 0,29 0,5 0,37 0,17 0,4 0,5 0,18 0,000042 0,3625
8 0,83 0,6 0,68 0,7 0,46 0,68 0,5 0,81 0,81 0,285 0,25 0,00289 0,588
9 0,68 0,65 0,69 0,7 0,31 0,72 0,4 0,5 0,81 0,7 0,58 0,00313 0,592
10 0,83 0,68 0,72 0,3 0,71 0,68 0,75 0,7 0,9 0,98 0,81 0,0221 0,707
Составлено авторами
Как отмечалось выше, экзогенные первичные показатели {хполучены из обработки анкетных карт студентов-респондентов. Каждая карта содержала 170 вопросов, сформированных с использованием общепринятых методик в профилактической и спортивной медицине [5, 6]. Ответы содержали как количественные, так и качественные показатели. Эти показатели пересчитывались в соответствующие тесты, пробы и величины (в размерных и безразмерных величинах) по формулам из [5, 6].
Образовано 9 подгрупп экзогенных переменных, для которых в каждом /-ом опыте
получены соответствующие агрегированные показатели - обобщенные функции
(к)
желательности Харингтона Бх. , показанные в таблице 2. Эти показатели интерпретируются следующим образом: Б^1 - качество питания (агрегировано 18 факторов); Б^2 - режим
(3)
использования телевизора и компьютеров (агрегировано 10 факторов); Бх. -занятие спортом и закаливание (агрегировано 3 фактора); - режим труда и отдыха (агрегировано 5 факторов); Б^5 - вредные привычки (агрегировано 11 факторов); Б^ - самооценка состояния здоровья
(7)
(агрегировано 10 факторов); Б^ - оценка психического здоровья (агрегировано 7 факторов); Б^1 - условие проживания и финансовое обеспечение (агрегировано 7 факторов); Б-
нравственные установки респондента (агрегировано 19 факторов).
Таблица 2
(к)
Фрагмент агрегирования экзогенных переменных в виде функций Харрингтона Dx.
i d(1) d(2) d(3) d(4) d(5) d(6) d(7) d(8) d(9)
1 0,4816 0,4346 0,5521 0,5996 0,6260 0,6878 0,8133 0,6101 0,6388
2 0,5673 0,4577 0,5493 0,5915 0,3757 0,5856 0,8133 0,6424 0,4724
3 0,6085 0,3694 0,6383 0,7524 0,6594 0,5006 0,4177 0,6401 0,6760
4 0,5653 0,7336 0,5196 0,3985 0,7259 0,6296 0,8133 0,7165 0,7127
5 0,5678 0,4529 0,6663 0,6144 0,5262 0,6542 0,8133 0,7745 0,6307
6 0,6316 0,5490 0,5783 0,6811 0,6925 0,5986 0,8133 0,6052 0,7251
7 0,6398 0,5337 0,7773 0,4876 0,6957 0,5492 0,8133 0,5801 0,6437
8 0,5231 0,5897 0,4751 0,7225 0,6727 0,6418 0,5061 0,5648 0,6437
Вестник Евразийской науки 2018, №1, Том 10 ISSN 2588-0101
The Eurasian Scientific Journal 2018, No 1, Vol 10 https://esi.today
i d(1) Uxi d(2) d(3) d(4) d(5) Uxi d(6) Uxi d(7) Uxi d(8) Uxi d(9) Uxi
9 0,6587 0,4417 0,8500 0,6746 0,5055 0,5432 0,8133 0,7691 0,6004
10 0,5261 0,4671 0,3902 0,7822 0,5030 0,5924 0,7635 0,6720 0,5724
Составлено авторами
Теперь изложим алгоритм построения «нейросети-агрегата» в каскаде III рис. 1. Использовалась демоверсия программного продукта «Neurisolutions-4.0». Для регуляризации НСМ был построен байесовский ансамбль сетей, аналогичных [1, 10]. Все НСМ ансамбля принадлежали к одному классу - «многослойные персептроны (MLP) с обратным распространением ошибки (BP)». В скрытых слоях варьировалось их число и типы активационных функций - логистическая функция и гиперболический тангенс. Поскольку условия моделирования сложны, то заведомо нарушаются все предпосылки классического регрессионного анализа. Поэтому, для оценки качества НСМ мы использовали прямой критерий, не стесненный требованиями к статистическим свойствам остатков - процент правильной идентификации моделируемого показателя DY на тестовом множестве примеров Qtest, которого сеть не знала при обучении. Использовался критерий оценки:
100%; N[: [(DYi - < г; N* = (Ц^*)^. (5)
Здесь звездочкой «*» отмечены точки тестового множества, в которых НСМ верно идентифицирует обобщенный показатель здоровья, т. е. с достаточно малой погрешностью 8, назначаемой аналитиком (мы задавали 8 = 0,05); DYo DYl - опытные и расчетные значения моделируемой величины DY; N - общее количество точек тестового множества (N = 20). В вычислениях получено п = 80 %.
Данная оценка качества дополнялась индексом множественной корреляции rD,g , выдаваемая НСМ при обучении. Получено достаточно высокое значение этого показателя: rDlß = 0,94.
На рис. 3-4 и таблице 3 показаны результаты обучения и тестирования НСМ, а в таблице 3 - данные по регуляризации модели согласно байесовскому подходу из [1, 8]. Модельное значение DY усреднялось на отфильтрованном байесовском ансамбле нейросетей. При фильтрации отсеяны НСМ № 1, 4, 6, 8 из таблицы 3.
Таблица 3
Характеристика моделей байесовского ансамбля на тестовом множестве из 20 точек
№ п/п Количество скрытых слоев / типы активационных функций в слоях n* n n*/n
1 2 / Гиперболический тангенс - 1 слой, Линейная - 2 слой 12 20 0,60
2 2 / Гиперболический тангенс - 1 и 2 слои 19 0,95
3 2 / Сигмоид - 1 и 2 слои 17 0,85
4 2 / Гиперболический тангенс - 1 слой, Сигмоид - 2 слой 12 0,60
5 2 / Сигмоид- 1 слой, Гиперболический тангенс - 2 слой 15 0,75
6 2 /Линейная - 1 слой, Гиперболический тангенс - 2 слой 12 0,60
7 2 / Линейная - 1 и 2 слои 18 0,90
8 2 / Сигмоид- 1 слой, Линейная - 2 слой 13 0,65
9 2 / Линейная - 1 слой, Сигмоид - 2 слой 18 0,90
10 1 / Гиперболический тангенс - 1 слой 17 0,85
Составлено авторами
Рисунок 3. Зависимость средней квадратической ошибки (М8Е) обучения от числа эпох (составлено авторами)
Рисунок 4. Сравнение опытных данных и расчетных значений моделируемого показателя на тестовом множестве НСМ (составлено авторами)
Из рис. 3 видно, что сеть обучается успешно: МББ снижается до 0,002 за 595 эпох без эффекта «переобучения».
Из рис. 4 видно, что из 20 тестовых точек 16 точек идентифицируется верно при 8 < 0,05 в формуле критерия (4).
Выводы
1. Основная идея метода каскадного агрегирования (МКА) эндогенных и экзогенных переменных на основе обобщенных функций желательности Харингтона и НСМ подтверждена на реальных данных комплексного исследования студентов вузов. Получила степень компрессии переменных на трех каскадах агрегирования по рис. 1 примерно 566. Соответственно в сложных условиях моделирования, характерных для этой прикладной задачи, НСМ хорошо обучается и хорошо тестируется (процент правильно идентифицируемых точек достигает 80 % по рис. 4).
2. На основе построенной обученной, протестированной и регуляризированной НСМ могут решаться прикладные задачи:
• Выявление групп риска потери (или ухудшения) здоровья студентов при групповом и индивидуальном обследовании по опросным анкетам, т. е. без
применения дорогостоящих лабораторных измерений с использованием только информации из опросных анкет.
Разработки методик комплексного обследования.
Оценка и сравнение степени влияния агрегированных экзогенных показателей
= 1,1 на результативный обобщенный показатель здоровья
кластера респондентов (студентов). Для этого в НСМ численно определяются средние значения коэффициентов эластичности
ую _
1 TM ADYq DXq Эк~~---
Xq
Ч
где: A'Dy, J - конечные приращения функции результативной переменной DY.q и ее аргумента Dx.q в текущей точке q; М - число дискретных точек для расчета коэффициентов эластичности для каждой к-ой группы экзогенных переменных.
ЛИТЕРАТУРА
1. Горбатков С.А., Фархиева С.А. Системный подход к агрегированию экзогенных и эндогенных переменных в нейросетевых моделях банкротств на основе функций Харрингтона // журнал «Вестник Евразийской Науки», 2017 № 3 (9) [Электронный ресурс] - М.: Науковедение, 2017. Режим доступа: http://naukovedenie.ru/PDF/100TVN317.pdf, свободный. - Загл. с экрана. - Яз. рус., англ.
2. Адлер Ю.П. Планирование эксперимента при поиске оптимальных условий: Монография / Ю.П. Адлер, Е.В. Маркова, Ю.В. Грановский; изд. 2-е, перераб. и доп. - М.: Наука, 1976. - 279 с.
3. Деза Е., Деза М.М. Энциклопедический словарь расстояний / Елена Деза, М.М. Деза; пер. с англ. В.И. Сычева. - М.: Наука, 2008. - 448 с.
4. Перегудов Ф.И., Тарасенко Ф.П. Основы системного анализа: Учебник. - Томск: Изд-во НТЛ, 1997. - 367 с.
5. Баевский Р.М., Берсенева А.П. Оценка Адаптационных возможностей организма и риска развития заболеваний: Монография, 1997. - 234 с.
6. Дубровский В.Н. Спортивная медицина. М.: Владос, 2007. - 512 с.
7. Горбатков С.А. Методологические основы разработки нейросетевых моделей экономических объектов в условиях неопределенности / С.А. Горбатков, Д.В. Полупанов, Е.Ю. Макеева, А.Н. Бирюков; под ред. С.А. Горбаткова. - М.: Издательский дом «Эконмическая газета», 2012. - 494 с.
8. Горбатков С.А., Горбаткова Е.Ю. Использование байесовской регуляризации модели анализа условий и образа жизни обучающейся молодежи // Современные проблемы науки и образования. - 2015. - №3(59). Режим доступа: https://science-education.ru/ru/article/view?id=18842, свободный.
9. Тарков М.С. Понижение размерности пространства данных в задаче диагностирования заболевания щитовидной железы / М.С. Тарков, М.А. Чиглинцев // XIV Всероссийская науч.-техн. конференция «Нейроинформатика2012»; Сборник научных трудов. - М.: НИЯУ МИФИ. -2012. - Часть 3. - С. 142-150.
10. Шумский С.А. Байесова регуляризация обучения // Лекции школы-семинара «Современные проблемы нейроинформатики» (23-25 января 2002 г., Москва). -М.: МИФИ, 2002. - С. 61-94.
Gorbatkov Stanislav Anatol'evich
Financial university under the government of the Russian Federation
Ufa branch, Russia E-mail: [email protected]
Farkhieva Svetlana Anatol'evna
Financial university under the government of the Russian Federation
Ufa branch, Russia E-mail: [email protected]
Gorbatkova Elena Yurevna
Bashkir state pedagogical university named after M. Akmullah, Ufa, Russia
E-mail: [email protected]
The method of aggregating the variables of a neural network model in inverse problems of recovering the dependence in conditions of high dimensionality of the space of attributes and data noisiness
Abstract. The article is devoted to the improvement of intellectual information technologies (neural networks) and is methodological in nature. In the previous articles of the authors, the first steps were taken to investigate emergent effects caused by the integration of neural network technologies and the aggregation of exogenous variables on the basis of generalized Harrington desirability functions. The first steps of the research were successful and were confirmed by computational experiments and comparison with the classical (basic) econometrics model. However, no answer was received to the main question of the combination of the above methods proposed by the authors: will this idea work if the modeling conditions that are characteristic of certain classes of applied problems are tightened? We are talking about a strong noise in the data (down to their conscious distortion), burdened by the lack of a priori information about the form of the noise distribution law, the incomplete data, the uncertainty, the large dimensionality of the feature space (up to several hundred exogenous variables and several dozen endogenous variables). In this article, clear answers have been received to the above questions and further questions have been investigated about the adequacy of the resulting neural network model. A specific feature of the considered class of neural network models is that both endogenous and exogenous variables are random variables. The questions of regularization of the proposed method and its approbation on real data of processing questionnaires for exogenous variables and changes with the help of certified measuring means for endogenous variables are studied in detail. The concept and the original method of hierarchical three-level cascade aggregation of endogenous and exogenous variables of neural network model realizing it which increase the predictive force of model in very difficult conditions of modeling is offered. The concept and the method that implements it are tested on real data from the field of preventive medicine.
Keywords: neural network model; aggregation; exogenous variables; endogenous variables; the generalized function of desirability of Harrington; regularization; the return tasks; restoration of dependences
56ITVN118