УДК 004.931, 681.518.3
В. В. Мокшин, И. Р. Сайфудинов, А. П. Кирпичников
РЕКУРСИВНЫЙ АЛГОРИТМ ПОСТРОЕНИЯ РЕГРЕССИОННЫХ МОДЕЛЕЙ СЛОЖНЫХ ВЕРОЯТНОСТНЫХ ОБЪЕКТОВ
Ключевые слова: регрессионный анализ, отбор факторов, рекурсивный алгоритм.
В работе предложен подход формирования регрессионной модели с использованием рекурсивного подхода. Этот метод позволяет адаптировать модель к изменяющимся входным воздействиям. Эффективность предлагаемого подхода демонстрируется на основе анализа данных функционирования сложных систем: социологического объекта и производственного предприятия.
Keywords: Regression analysis, selection of factors, recursive algorithm.
In this paper, an approach is proposed for the formation of a regression model using the recursive approach. This method allows you to adapt the model to changing input effects. The effectiveness of the proposed approach is demonstrated on the basis of an analysis of the data of the functioning of complex systems: a sociological object and a production enterprise.
«исследуемом» объекте как динамической системе создает основу операций для выработки новых управленческих решений [3, 4, 5]. В качестве примера построения статистической модели рассмотрим машиностроительное предприятие по производству комплектующих изделий для автомобильной промышленности. Для статистического анализа предприятия отобраны результативные показатели эффективности функционирования предприятия - y, j = \k . В качестве влияющих на них факторов отобраны производственно-экономические факторы -x¡, i = 1, m и факторы внешней среды - zl; l= 1, r. Перечень переменных приведен в таблице 1.
Таблица 1 - Перечень переменных, отобранных для исследования
№ Код Наименование
1 2 3
1 Х1 Нематериальные активы (тыс. руб.)
2 Х2 Основные средства (тыс. руб.)
3 Х3 Запасы (тыс. руб.)
4 х4 Затраты в незавершенном производстве (издержки обращения) (тыс. руб.)
5 Х5 Готовая продукция и товары для перепродажи (тыс. руб.)
6 x6 Дебиторская задолженность (платежи по которой ожидаются в течение 12 месяцев после отчетной даты) (тыс. руб.)
7 X? Кредиторская задолженность (тыс. руб.)
8 X8 Коммерческие расходы (тыс. руб.)
9 X9 Управленческие расходы (тыс. руб.)
10 x10 Расчетный счет (тыс. руб.)
11 x11 Валютный счет (тыс. руб.)
12 X12 Прочие операционные расходы (тыс. руб.)
13 X13 Внереализационные расходы (тыс. руб.)
14 x14 Нераспределенная прибыль отчетного года (периода) (тыс. руб.)
15 x15 Количество работников, имеющих постоянные трудовые договоры (чел.)
16 x16 Фонд заработной платы (тыс. руб.)
17 X1? Средняя заработная плата на одного сотрудника (руб.)
18 x18 Заёмные средства (тыс. руб.)
19 y1 Выручка (нетто) от продажи товаров, продукции, работ, услуг (тыс. руб.)
20 y2 Себестоимость проданных товаров, продукции, работ, услуг (тыс. руб.)
21 y3 Валовая прибыль (тыс. руб.)
22 y4 Прибыль от продаж (тыс. руб.)
23 y5 Прибыль до налогообложения (тыс. руб.)
24 y6 Текущий налог на прибыль (тыс. руб.)
25 y? Прочие операционные доходы (тыс. руб.)
26 y8 Внереализационные доходы (тыс. руб.)
Существуют различные подходы, направленные на формирование моделей анализа и контроля сложных систем, поведения которых обуславливается различными внешними факторами. В качестве сложных систем могут рассматриваться как биологические и экономические системы, так и целые производственные предприятия, а также социологические объекты (город, район, регион и т.д.) [1-11] или автоматизированные системы [12-21]. Управление такими объектами предполагает анализ процессов их функционирования и выбор наиболее оптимальных решений, нацеленных на достижение определенного конечного результата. Детальный анализ непрерывно поступающей информации об
Окончание табл.1
1 2 3
27 Уя Доход на 1 работника (тыс. руб./чел.)
28 Уы Прибыль на 1 работника (тыс. руб./чел.)
29 ¿1 Объём ВВП в текущих ценах по России (млрд. руб.)
30 Кредиторская задолженность предприятий России (в среднем за период) (млрд. руб.)
31 Задолженность предприятий России поставщикам (млрд. руб.)
32 24 Задолженность предприятий в бюджет России (млрд. руб.)
33 ¿5 Дебиторская задолженность предприятий России (в среднем за период) (млрд. руб.)
34 ¿6 Задолженность покупателей в России (млрд. руб.)
35 ¿7 Объём промышленного производства России в текущих ценах (млрд. руб.)
3б ч Инвестиции в основной капитал (млрд. руб.)
37 29 Производство грузовых автомобилей (тыс. шт.)
38 х10 Производство тракторов (тыс. шт.)
39 х11 Индекс цен производителей промышленных товаров (к пред. периоду)
По предварительно отобранным переменным собраны поквартальные значения исходных статистических данных (ИСД) за семь лет работы, начиная с 1-го квартала 2001 года и заканчивая 4-м кварталом 2007 года, из балансовых отчетов, отчетов о прибылях и убытках, подаваемых в налоговые органы, и сведений о количестве сотрудников и заработной плате, подаваемых в Государственный комитет статистики.
Одним из часто используемых методов статистического анализа сложных систем является многофакторный нелинейный регрессионный анализ. Этот метод сводится к подбору уравнений регрессии, которые должны удовлетворять задаваемому качеству модели.
Качество модели обеспечивается требованиями, чтобы отношения стандартных ошибок к средним значениям откликов, уровни значимости уравнений регрессии по критерию Фишера и коэффициентам множественной детерминации, а также уровни значимости коэффициентов уравнений регрессии по критерию Стьюдента не превышали 0,05.
Мощным средством подбора уравнений регрессии является пошаговая регрессия в пакете прикладных программ Statistica 6.0. Она позволяет включать такие факторы в уравнение регрессии, которые дают наибольшую прибавку к критерию Фишера. Пошаговая регрессия сводится к перебору всех возможных комбинаций в заданном диапазоне входных факторов х,.
Такой подход упрощает подбор, но имеет недостатки. Не учитывается возможность использования функций от производственно-экономических факторов - хи i = 1, т и факторов внешней среды -1= 1, г, в частности, произведение факторов между собой. Приведем полученные уравнения регрессии для выручки от продажи товаров, продукции, работ, услуг у1 и себестоимости проданных товаров, продукции, работ, услуг у2 некоторого производственного предприятия, сотрудничающего с предприятиями автомобильной и нефтяной промышленности:
у2 = 8,93-105 -49,7х17 + 0,5х3 + 9СЦ5г9 -44$9х15 - 2,39г10 -50Ц4г7 + +17,8х1б + 0,6х14 - 3,12г4 + 2967г5 - 0,8х5 + 1,6к3 + 0,7г8 - 1,4х,8 + + 33,3^ - 6,7х13 - 128,8г2 + 0,3хб,
(2)
у = 9,15-10 + 53$72г9+1,0б-10! г, + 0,34х, -17988^, -1,39% -- 0,9% + 1Д% - 421,32х7 - 3,18-10' г4 + 21,98х1 + 0,04% + + 20б,3бх5 -4,01% + 2,83я8 + 45.6Ц + 0,7х6-0,89х2,
(1)
Полученные уравнения (1) и (2) достаточно простые, но не учитывают нелинейные связи между результативными у, входными факторами х, и факторами внешней среды х. Поэтому данный метод формирования регрессионных уравнений неточный.
Предлагаемый в данной работе рекурсивно-регрессионный подход представляет собой сочетание стандартного регрессионного анализа с методом группового учета аргументов, адаптированного к динамическим быстроизменяющимся процессам. Настоящий подход является итерационной процедурой, в которой на основе некоторой «базовой» модели по мере обновления информации и накопления статистики автоматически происходит ее коррекция: добавляются и/или удаляются независимые переменные (рис.1).
Рис. 1 - Схематическое представление формирования структуры многомерного аддитивного ряда с учетом изменения системы во времени
Область, обозначенная пунктирной линией, определяет формирование модели функционирования объекта исследования в определенный момент времени. Вся схема отражает возможность изменения уже созданной модели во времени, т.е. появляется возможность добавления новых входных факторов и переформирования модели (1). Фактически, это есть формулировка основных идей рекурсивных подходов [7, 8]. Именно такие соображения будут использоваться нами при динамическом формировании модели функционирования объекта.
В результате этого регрессионная модель динамически обновляется [9] и при этом происходит ее
рекурсивная самоорганизация. Сочетание вышеупомянутых методов позволяет адаптировать широко известный регрессионный анализ к исследованию сложных динамических систем и заметно улучшить качество прогнозирования. При этом значительно сокращается время, затрачиваемое на построение регрессионной модели [10].
Для апробации метода проведены исследования применительно к задаче о повышении эффективности управления производственным предприятием. Приведем уравнения регрессии:
у = 4,92 -105 + 2,85 -1СТ4х3х17 + 3,79 -103х80,5 - 2,54 ■Ю-3х8х12 + + 3,68-10-2х,2 - 25,56х1_К, + 2,79-10-4х4х8 -1,19■Ю-3х10х13 + + 4,54-107 х14-1 - 2,06-108х9-1 + 7,69■Ю-4х132 - 8,04■1010 х3-1 -
- 4,19 ■10-5х3х16 + 0,41х3^ -1,98 ■Ю-5х6х16 + 1,39 -105х„-1 - (3)
- 3,77■Ю-3х1х14 + 7,9■10-6х6х9 - 0,5х4^2 -1,86-104х12х14 +
+ 2,84 ■ 107 х13-1 - 3,7 ■ 10-6 х3х4 + 2,5 -103 х13х15 - 3,54 ■ 108 х18-1 + + 6,72-102х5^ -10-7х6г8 - 60,991п х8, у2 = -2,48 ■ 105 + 2,32 ■ 10-4х3х17 + 5,55 ■ 104 1п х8 - 34Д4х^ -
- 2,21 ■Ю-4х12х18 + 2,67 ■Ю-3х8х„ + 5,1 ■ 107х14-1 - 1,04 ■Ю8х9-1 +
+ 2,21 ■Ю-4х122 - 4,62■Ю-3х1г8 - 3,46 ■Ю-3х15х16 + 6,42х4^ -
- 7,69 ■Ю-5х7х12 -1,05 ■Ю-5х3х4 + 3,68 ■Ю-3х1х4 +1,74■Ю3х160,5 -
- 5,87 ■Ю-4х4х12 - 2,23 ■Ю-4х13г8 - 7,98 ■ хпК, - 7,37 ■ 105х6х17 -
- 1,43 ■Ю-3х1х9 + 2,69 ■Ю-4х10х14 + 4,62 ■Ю5х13-1 + 7,5 ■Ю-6х4х18 -
- 7,19х15гп + 4,1 ■Ю-4х1х8,
где - общие факторы, полученные в результате факторного анализа факторов внешней среды г; 1=1, г. Результат факторного анализа показал, что для рассматриваемого объекта исследования все факторы внешней среды нам удалось представить двумя общими факторами (^1, Г2) и двумя исходными факторами (г8, г11), которые объясняют изменения, вносимые 11-ю факторами с достаточно высокой достоверностью около 95%.
Результаты регрессионного анализа при использовании пошаговой регрессии и рекурсивно-регрессионного подхода приведены в таблице 2, 3 соответственно.
Из таблиц 2 и 3 видно, что использование рекурсивно-регрессионного подхода при построении регрессионных уравнений более точно. При использовании этого метода значения стандартных ошибок гораздо меньше, значения коэффициентов множественной детерминации и критериев Фишера более выше, чем при использовании пошаговой регрессии [6].
Таблица 2 - Таблица результатов регрессионного анализа при пошаговой регрессии
Код переменной Стандартная ошибка, Sj Среднее, Стандартная ошибка/Среднее, Sj/yj Коэф. множ. детерминацииД? Критерий Фишера, F
У1 17858,68 293896 0,060765 0,99 211,414
У2 17966,56 256503,61 0,070044 0,99 150,228
Таблица 3 -Таблица результатов регрессионного анализа при рекурсивно-регрессионном подходе
Код пере-мен-ной Стандартная ошибка, Sj Среднее, Уj Стандартная ошибка/ Среднее, Sj/yj Коэф. множ. детерминации, R? Критерий Фишера, F
У1 0,3468 290324,6 0,000001 1 358037107264,198
У2 39,3271 256503,6 0,000153 1 22650208,9846163
Используя рекурсивно-регрессионный подход формирования регрессионных уравнений, получили диаграммы относительного влияния производственно-экономических факторов - х1, /= 1,т, факторов
внешней среды - 1= 1, г на выручку от продажи товаров, продукции, работ,
х17 12,17%
х18 0,16%"
Удельные веса для у1
z8
F1 1=2 0,02% 7,79% 2,44% х1
х4 1,16%
х10 5,4 0,00% 1,87%
Рис. 2 - Диаграмма влияния факторов на у1 по удельным весам
Коэффициенты эластичности для у1
тг П П
г, П П
х1 х3 х4 х5 х8 х9 х1о х11 2 х13 и х 15 х 1 х17 х 18 = У 78
Рис. 3 - Диаграмма влияния факторов на у1 по коэффициентам эластичности
Рис. 4 - Диаграмма влияния факторов на у2 по удельным весам
Коэффициенты эластичности для y2
1,5 1
0,5
п п
x1 x3 x4 7 x8 x9 x10 x11 x13x14x15x16 x17x18 F1 F2 z8 z11
Рис. 5 - Диаграмма влияния факторов на y2 по коэффициентам эластичности
услуг y1 и себестоимость проданных товаров, продукции, работ, услуг y2. Также получили диаграммы
влияния выше приведенных факторов xi, i = 1, m ,
zi, l=1, г на y1 и y2 по коэффициентам эластичности [11,12] (рис.2-5).
Из рисунков 2-5 можно сделать вывод, что существенное влияние на повышение выручки от продажи товаров, продукции, работ и услуг yl оказывают хl - нематериальные активы; х3 - запасы; х5 - готовая продукция и товары для перепродажи; х9 -управленческие расходы; х17 - средняя заработная плата; Fl - основные экономические показатели России. Существенное отрицательное влияние на у1 оказывают х6 - дебиторская задолженность; х12 -прочие операционные расходы; х14 - нераспределенная прибыль отчетного периода; х16 - фонд заработной платы. Значительное влияние на повышение себестоимости проданных товаров, продукции, работ, услуг у2 оказывают х4 - затраты в незавершенном производстве; х8 - коммерческие расходы; xll -валютный счет; х17 - средняя заработная плата; Fl -основные экономические показатели России. существенное отрицательное влияние на у2 оказывают х1 - нематериальные активы; х6 - дебиторская задолженность; х7 - кредиторская задолженность; х12 -прочие операционные расходы.
Таким образом, предложенная процедура наряду с удовлетворением всех поставленных требований получения уравнений регрессии обеспечивает сравнительно несложное их получение. Это в значительной степени облегчает метод исследования, анализа и контроля сложных систем. Процедура формирования регрессионных уравнений реализована с помощью Visual Studio.Net Enterprise Architect 2003 for Windows 2000/XP.
Важным достоинством предлагаемого подхода является то, что модели для результативных факторов формируются автоматически на каждом временном шаге. Происходит рекурсивная самоорганизация моделей, и исчезает необходимость в их постоянной корректировке «вручную». Таким образом, предложенный подход позволяет автоматизировать процесс формирования структуры аддитивного функционального ряда вида (3) и (4), гибко настраивая при этом необходимый уровень сложности ряда по отдельным параметрам. Более того, здесь также остается возможным выход за пределы базиса классических типов степенного и гармонического рядов путем повышения их гибкости с помо-
щью введения членов полинома (3) и (4) с дробной кратностью. Представленный в работе комплексный подход, в принципе, предоставляет мощный и гибкий инструмент анализа и контроля объекта исследования, на поведение которого влияет множество различных внешних факторов. Следует заметить, что также существует возможность использования представленного подхода совместно с методами и алгоритмами нейронных сетей.
Литература
1. Мокшин В.В., Кирпичников А.П., Шарнин Л.М. Отслеживание объектов в видеопотоке по значимым признакам на основе фильтрации частиц / Вестник Казанского технологического университета. 2013. Т. 1б. № 18. С. 297-303.
2. Сайфудинов И.Р., Мокшин В.В., Кирпичников А.П. Многоклассовое обнаружение и отслеживание транспортных средств в видеопоследовательности / Вестник Казанского технологического университета. 2014. Т. 17. № 19. С. 348-355.
3. Якимов И.М., Кирпичников А.П., Мокшин В.В., Му-хутдинов Т.А. Обучение имитационному моделированию в пакете БтиПпк системы Ма1ЬАЬ / Вестник Казанского технологического университета. 2015. Т. 18. № 5. С. 184-188.
4. Степанова М.А., Сытник С.А., Кирпичников А.П., Мокшин В.В. Оптимизация процесса ремонта грузоподъемных машин по математической модели / Вестник Казанского технологического университета. 2013. Т. 1б. № 20. С. 309-314.
5. Якимов И.М., Кирпичников А.П., Мокшин В.В. Моделирование сложных систем в имитационной среде AnyLogic / Вестник Казанского технологического университета. 2014. Т. 17. № 13. С. 352-357.
6. Якимов И.М., Кирпичников А.П., Мокшин В.В., Ко-стюхина Г.В., Шигаева Т.А. Комплексный подход к моделированию сложных систем в среде BPWN-Arena / Вестник Казанского технологического университета. 2014. Т. 17. № б. С. 287-292.
7. Мокшин В.В., Якимов И.М. Метод формирования модели анализа сложной системы / Информационные технологии. 2011. № 5. С. 4б-51.
8. Мокшин В.В. Параллельный генетический алгоритм отбора значимых факторов, влияющих на эволюцию сложной системы / Вестник Казанского государственного технического университета им. А.Н. Туполева. 2009. № 3. С. 89-93.
9. Якимов И.М., Кирпичников А.П., Мокшин В.В. Моделирование сложных систем в среде имитационного моделирования GPSS W с расширенным редактором / Вестник Казанского технологического университета. 2014. Т. 17. № 4. С. 298-303.
10. Мокшин В.В., Якимов И.М., Юльметьев Р.М., Мокшин А.В. Рекурсивно-регрессионная самоорганизация моделей анализа и контроля сложных систем / Нелинейный мир. 2009. Т. 7. № 1. С. бб-7б.
11. Якимов И.М., Кирпичников А.П., Мокшин В.В. Моделирование сложных систем в имитационной среде AnyLogic / Вестник Казанского технологического университета. 2014. Т. 17. № 13. С. 352-357.
12. Моисеев, В.С. Вероятностная динамическая модель функционирования программных средств активной защиты мобильных распределенных АСУ / В.С. Моисеев, П.И. Тутубалин // Информационные технологии. - 2013. - № б. - С. 37-42.
13. Тутубалин, П.И. Применение компьютерных технологий в профессиональном обучении / П.И. Тутубалин,
2
0
-0,5
-1
А.И. Шевченко // Образовательные технологии и общество. - 2012. - Т. 15. - № 2. - С. 433-448.
14. Медведева, С.Н. Информационные технологии контроля и оценки знаний в системе дистанционного обучения Mood1e / С.Н. Медведева, П.И. Тутубалин // Образовательные технологии и общество. - 2012. - Т. 15. - № 1. - С. 555-566.
15. Тутубалин, П.И. Оптимизация выборочного контроля целостности информационных систем / П.И. Тутубалин // Информация и безопасность. - 2012. - Т. 15. - № 2. - С. 257-260.
16. Моисеев, В.С. Общая модель крупномасштабной мобильной распределенной АСУ / В.С. Моисеев, П.И. Тутубалин // Нелинейный мир. - 2011. - Т. 9. - № 8.
- С. 497-499.
17. Тутубалин, П.И. Применение моделей и методов стохастических матричных игр для обеспечения информационной безопасности в мобильных распределенных автоматизированных системах управления / П.И. Тутубалин // Нелинейный мир. - 2011. - Т. 9. - № 8.
- С. 535-538.
18. Моисеев, В.С. Основные принципы построения и задачи разработки защищенных прикладных информационных технологий / В.С. Моисеев, П.И. Тутубалин,
A.Н. Козар, Г.Е. Борзов // Вестник Казанского государственного технического университета им. А.Н. Туполева. - 2008. - № 4. - С. 112-116.
19. Моисеев, В.С. К задаче определения вероятностных характеристик информационной безопасности разрабатываемых автоматизированных систем управления /
B.С. Моисеев, П.И. Тутубалин // Депонированная рукопись ВИНИТИ № 26-В2007 11.01.2007.
20. Тутубалин, П.И. Основные задачи прикладной теории информационной безопасности АСУ / П.И. Тутубалин // Научно-технический вестник информационных технологий, механики и оптики. - 2007. - № 39. - С. 63-72.
21. Моисеев, В.С. Оптимизация состава вычислительного кластера мобильной распределенной интегрированной информационной системы / В.С. Моисеев, П.И. Тутубалин, Р.Р. Шафигуллин // Вестник Казанского государственного технического университета им. А.Н. Туполева. - 2012. - № 1. - С. 120-128.
© В. В. Мокшин - канд. тех. наук, доцент каф.автоматизированных систем обработки информации и управления КНИТУ-КАИ, e-mail: [email protected]; И. Р.Сайфудинов - аспирант кафедры автоматизированных систем обработки информации и управления КНИТУ-КАИ им А.Н.Туполева, e-mail: [email protected]; А. П. Кирпичников - док. физ.-мат. наук, зав. каф. интеллектуальных систем и управления информационными ресурсами КНИТУ, e-mail: [email protected].
© V. V. Mokshin- PhD, Associate Professor of the Department of Automated Information Processing Systems & Control, KNRTU named after A.N. Tupolev, e-mail: [email protected]; 1 R. Saifudinov - Graduate Student of the Department of Automated Information Processing Systems & Control, KNRTU named after A.N. Tupolev, e-mail: ildai09@mailm; А. P. Kirpichnikov - Dr. Sci, Head of the Department of Intelligent Systems & Information Systems Control, KNRTU, e-mail: [email protected];.