DOI 10.47576/2949-1878_2023_12_91 УДК 338:004
ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ В ПРОГНОЗИРОВАНИИ ЭКОНОМИЧЕСКОГО РОСТА
Саввин Андрей Андреевич,
студент, Кубанский государственный аграрный университет имени И. Т. Трубилина, Краснодар, Россия, [email protected]
Немцев Дмитрий Сергеевич,
студент, Кубанский государственный аграрный университет имени И. Т. Трубил ина, Краснодар, Россия, [email protected]
Драгуленко Владислав Владимирович,
доцент кафедры тракторов, автомобилей и технической механики, Кубанский государственный аграрный университет имени И. Т. Трубилина, Краснодар, Россия, [email protected]
В статье анализируются методы машинного обучения для выявления интенсивности влияния изучаемого предмета на экономический рост. Использовались данные о показателях экономического развития из разных регионов, такие как ВВП, инфляция, безработица. Также исследуются перспективные направления развития машинного обучения на примере модели линейной регрессии, искусственного интеллекта, приводится пример создания и обучения нейросети для классификации субъектов Краснодарского края, где использовались показатели края и языки программирования.
Ключевые слова: машинное обучение; прогнозирование; экономический рост; моделирование; регрессия; данные; алгоритмы; нейросети.
UDC 338:004
APPLICATION OF MACHINE LEARNING IN FORECASTING
ECONOMIC GROWTH
Savvin Andrey A.,
student, Kuban State Agrarian University named after I. T. Trubilin, Krasnodar, Russia, [email protected]
Nemtsev Dmitry S.,
student, Kuban State Agrarian University named after I. T. Trubilin, Krasnodar, Russia, 13nema 13@gmail. com
Dragulenko Vladislav V.,
Associate Professor of the Department of Tractors, Automobiles and Technical Mechanics, Kuban State Agrarian University named after I. T. Trubilin, Krasnodar, Russia, [email protected]
The article analyzes the methods of machine learning to identify the intensity of the influence of the studied subject on economic growth. We used data on economic development indicators from different regions, such as GDP, inflation, unemployment. Promising areas of machine learning development are also explored using the example of a linear regression model, artificial intelligence, and an example of creating and training a neural network for classifying subjects of the Krasnodar Territory, where edge indicators and programming languages were used.
Keywords: machine learning; forecasting; economic growth; modeling; regression; data; algorithms; neural networks.
Современная экономика представляет собой сложную и динамичную систему, в которой принятие решений и прогнозирование экономического роста являются ключевыми. Однако из-за большого объема данных и высокой неопределенности надежное прогнозирование экономических показателей остается затруднительным. Традиционные методы прогнозирования, основанные на статистических моделях, не всегда способны учесть все факторы, влияющие на экономический рост, и часто дают неверные результаты.
В последние десятилетия машинное обучение (ML) стало одним из наиболее перспективных направлений исследований в экономике. Использование методов машинного обучения для прогнозирования экономического роста позволяет повысить точность прогнозов и учитывать сложные взаимосвязи и зависимости между экономическими показателями.
Целью данной научной статьи является изучение и оценка применимости методов машинного обучения для прогнозирования экономического роста. Основываясь на анализе современных подходов и экономических моделей, проанализирована эффективность различных методов машинного обучения в прогнозировании экономического роста и определены наиболее подходящие модели для решения этой задачи.
Важность исследования заключается в том, что качество прогнозирования экономического роста может быть улучшено, что важно для принятия обоснованных экономических решений. А. Г Аганбегян указывал, что «...Россия - страна, где 2/3 отраслей имеют устаревшие основные фонды, работающие по старым, отжившим свой век технологиям» [1, с. 78]. Точные и надежные прогнозы позволяют прогнозировать экономическое развитие, определять оптимальные стратегии развития и минимизировать риски [1].
Наше исследование не только содержит сравнительный анализ различных методов машинного обучения, но и расширяет знания о взаимосвязи между экономическими показателями и факторами, влияющими на экономический рост. Результаты исследования могут представлять интерес для экономистов, инвесторов, аналитиков и экспертов в области экономического прогнозирования, а
также могут быть использованы для разработки более точных экономических моделей и стратегий. Дается обзор существующих методов машинного обучения и их применимости для прогнозирования экономического роста. Затем на основе экономических данных проводится оценка эффективности различных моделей. Наконец, даются рекомендации по использованию наиболее эффективных методов машинного обучения для прогнозирования экономического роста и возможные рекомендации для дальнейших исследований.
Прогнозирование экономического роста является важной задачей для многих стран и организаций, поскольку оно позволяет предсказать будущее направление и темпы экономического развития. В последние годы машинное обучение становится все более популярным инструментом для прогнозирования экономического роста.
В этом исследовании машинное обучение используется для прогнозирования экономического роста. Одним из наиболее часто используемых методов машинного обучения является регрессия. Пример модели линейной регрессии представлен на рис. 1.
Перед применением модели линейной регрессии данные были предварительно обработаны. Это включало в себя удаление отклонений от данных, заполнение пропущенных значений и масштабирование переменных. Затем образец был разделен на тренировочную и тестовую части в соотношении 80:20.
После того как данные были собраны и выборка была разделена на обучающий и тестовый компоненты, была обучена линейная регрессионная модель выборки упражнений. Затем полученная модель была протестирована на тестовом образце, чтобы оценить ее точность и способность прогнозировать экономический рост. Для оценки качества модели использовались стандартные показатели, такие как средняя абсолютная ошибка (MAE) и средняя квадратичная ошибка (MSE).
Результаты анализа данных показали, что модель линейной регрессии дает достаточно хорошие результаты в прогнозировании экономического роста. Однако выбранный методологический подход сопряжен с потенциальными проблемами и ограничениями, которые необходимо принимать во внима-
ние. Например, модель линейной регрессии предполагает линейные зависимости между переменными и не учитывает нелинейные взаимодействия. Более того, выбранная выборка может не учитывать некоторые важные факторы, влияющие на экономический рост, такие как политическая ситуация, международные отношения и т. д.
В исследовании использовались данные по различным экономическим показателям, таким как валовой внутренний продукт, инфляция, безработица и торговый баланс за определенный период. А. Кудрин указывал, что «...по динамике изменения ВВП можно оценивать ожидания производителей относительно будущего спроса на их продукцию» [2, с. 15]. Эта информация использовалась в качестве входных параметров для моделей машинного обучения, таких как линейная регрессия, случайные леса и нейронные сети. Затем была проведена оценка качества прогнозных моделей экономического роста.
Методы машинного обучения для прогнозирования экономического роста обладают хорошим потенциалом для повышения качества и точности прогнозов, они позволяют учитывать сложные взаимосвязи и нелинейность в экономических данных, что делает их более эффективными при прогнозировании. Эти результаты могут быть применены на
практике при разработке экономической политики и стратегий развития.
В результате анализа было установлено, что использование методов машинного обучения для прогнозирования экономического роста позволяет получать более точные и надежные результаты по сравнению с традиционными методами. Модели машинного обучения, такие как нейронные сети, добились наибольшего успеха в прогнозировании экономического роста. Кроме того, использование ансамблевых методов, таких как случайные леса, может повысить точность прогнозов и уменьшить количество ошибок [2].
Благодаря совершенствованию хранения и сбора данных, разработке новых алгоритмов и повышению мощности компьютеров, прогнозы стали качественнее в области машинного обучения. Современные компьютеры с мощными процессорами позволяют использовать новые модели машинного обучения, которые обеспечивают более точные прогнозы. В результате этого, данная сфера информационных технологий получила название «искусственный интеллект». В. В. Шумов указывал, что «.рост информационных технологий в некоторой стране служит образцом для подражания среди других народов» [5, с. 29]. Хотя машинное обучение и тесно связано с искусственным интеллектом, это все же различные понятия.
Искусственный интеллект представляет собой способность компьютерных систем эмулировать когнитивные функции человека, такие как решение проблем и обучение, а также использовать логику и математические вычисления для логических выводов. Машинное обучение, в свою очередь, это процесс обучения компьютеров с использованием математических моделей данных без явных инструкций. Таким образом, машинное обучение является применением искусственного интеллекта, которое позволяет компьютерной системе самостоятельно учиться и совершенствоваться.
Мы разрабатываем нейронную сеть, которая позволит нам прогнозировать рейтинг социально-экономического развития региона и его инвестиционной привлекательности. По мнению В. И. Морозовой, «.благодаря связи машинного обучения и искусственного интеллекта, многие компании в основном во всех отраслях открывают для себя новые возможности» [3, с. 203]. С использованием машинного обучения мы можем провести качественный и количественный анализ пока-
зателей, которые определяют это развитие, и автоматизировать систему.
Для обучения нейронной сети использовались данные по Краснодарскому краю, которые были получили с официального сайта Краснодарстата. Были выбраны 22 показателя, по которым проводится исследование. Эти показатели представлены на рис. 2 [3].
Мы собрали данные в файлы Excel и отсортировали их таким образом, чтобы можно было использовать их в качестве набора данных для обучения нейронной сети. Использовались 22 показателя в качестве входных данных, а значения «у» - очень низкий, низкий, средний, высокий и очень высокий - в качестве выходных переменных. Мы распределили эти значения с помощью предварительной оценки, основанной на верхних и нижних границах диапазона значений, и получили средние интервалы для каждого диапазона значений. Затем скорректировали предварительную оценку с помощью дискри-минантного анализа. В результате получили готовый набор данных для обучения.
чИнъгн.4-.чнн:ч
12 т.\ шЛ ki .4 ïT M* x-î
Tjd • H
из
Ni
EM ф
х_1П d? • La
TJ4
•Л
.02
CÎL/-HK1 ннШнкУ-н нЛГЛ-Л^наг! н j S АчЫ2' ¡«пущ^Гй 1Щ1
Ер*ДЧеМН I Of Am ГЛ»Т4 pdEKT'IH ■ со эргдчн Мц--^ prfnb « мсо ^
Текущие {iчел|1^«г#цитчь1С| н-рчм^нч озрлнуовд'к'сщей среди. Ш^дойчтМ: р.'С-гч.'н ргзл.
м гм liipfijci ф-тавы.. м чОй-й Тин;, и? * г-цд,
СН5 z-*-M прс ^mjd и прщц «ц^.р со.г rf-crc- ношйгги ты г. pvlWH « гад
Обкмпртр]Н«С1НРрШГЧ11*Р|МПе>1ИМа1К-1и г у г л ГГ-.5
Qir(iyjiiH5T-i*af4Krt<T4i>iHWi ПрйяТММГЫ-. ftur-OftHùHfi H ytftr * ¡M
йыручл» D-T р-Н.Г'НЫи.Чн! TOC ïfCT I DùtCT. УСЛуТ| ОТ ИКСЛ^пОлОЦЦАПКМаЙ Д4тТЫГ.ру4лай ■ год Стгр-^н-енг rre-ipi4îrÎ<TH-Hno:orK;iiHOi:r,:?i.lb.TCi.-HUHf-rjfor нуглусзс* lK.pY&nfil * №4
«i ttpSHl WHK Kf HK.y.rti^.^4 CAfiA-|(*HHHH Ml iflw-f-н лдс^Д-
ОЛщМн^ийНЫ ПрОДПМ].гоГГ*<'>ШЬ.^ гсирсв. PCJ.lbHHllРЦ1 ч k Гf jMn _,J ч V TnK.pYEbTU'H kM^, гТнш.'гп HjyJ ■ «НО440Л » ruçT греигт» б-чдм e т-i. iwc.pv&neP * r-PJ,
пдочцнт (+j, [-] 1 [*нст*мв< ïw.pYt^a » ng
0К&ОДЬ| 1Ы &*![ ПГИС-К Ча.-О'Ок к pli жиГС.1".1
.'|рнСь. гь [|т5ит™.1 до- илот вобл ежен н» отуст нзга inn« Twt.p-yt.neH ■ гол,
Ûrtmp^iKjrt ^.pyflv^atf-fti
^р^л'СрОМ ТЬИ.руЕМН'Л к мд
CHkuj" птошыь »>н.п f :н чвдшгн^ д. орлими*» ■ средней hi и own жни«-*: обшеЯ
Дбмнм РЫМ н ферм»Прсддемнмигыкпа 1 н.ч uJii* ЫЖлцД на LÙ ТО.
Cpf-^Hf-^-Ti^HJl 'lLV,lHd,-L"j4 4j4H':.':r H4j:q »ptbCTHH П.ТЛЛ frtbdTnrfrni ИЦифф ■
СреАнедос^чы »HHWIIMWM нн^Мм!■ up^ficm»' luttrt работник« мц рубль »
Рисунок 2 - Перечень показателей
Далее с помощью языка программирования Python и библиотеки Seaborn определим и проанализируем внутренние связи между
коэффициентами. На рис. 3 представлена тепловая карта городских округов, на которой видно, что некоторые коэффициенты
оказывают большее влияние, нежели другие. дящийся на пересечении двух коэффициен-Соответственно, чем темнее квадрат, нахо- тов, тем слабее зависимость между ними [4].
х1 х2 хЭ х5 хб х7 х11x12x16x17x18x19
Рисунок 3 - Тепловая карта зависимостей коэффициентов для городских округов
Отсюда видно, что сильно связаны между собой х5,х6,х7 и х11; среднее влияние оказывают друг на друга х18, х3, х1. Также можно заметить, что х17 и х19 почти никак не влияет на другие параметры. Поэтому при разработке модели нейронной сети можно их убрать, поскольку это позволит улучшить её
качество, а следовательно, сделает классификацию более точной.
Теперь разделим данные на данные для обучения и тестовые данные. Разделим нашу выборку в соотношении 30 % - тестовые данные и 70 % - данные для обучения.
precision recall fl-score support
Высокий Низкий Средний
1.00 69 0.84
1*00 е.4£
е.бз
1.00 е. 64 0,61
з
зз
43
accuracy macro avg weighted avg
0,03 Й.51
е.Зб е.53
0.87 0.35 0.52
79 79 79
0.875260326032
Рисунок 4 - Метрики качества нейронной сети
Затем переходим непосредственно к созданию и обучению нейронной сети. Будем использовать самый известный алгоритм обучения классификации: стохастический градиентный спуск. Стоит отметить, что для быстроты работы используется не вся выборка, а случайные данные. Применим его для метода классификации SVM.
Запустим и протестируем нейронную сеть. Чтобы улучшить ее показатели, подберем параметры константы, которая умножает член регуляризации и количество итераций без улучшений. В итоге получим модель с
оценками метрик, представленными на рис. 4.
Таким образом, после обучения нейронная сеть будет использоваться для классификации субъектов Краснодарского края по шкале, которая включает очень низкий, низкий, средний, высокий и очень высокий уровни. Кроме того, добавленные функции, такие как тепловая карта и графики линейной регрессии, отображают параметры, которые помогут принимать решения о распределении бюджета или инвестиций в различные населенные пункты, районы или округа [3].
Список источников _
1. Аганбегян А. Г Сокращение инвестиций - гибель для экономики, подъем инвестиций - ее спасение // Экономические стратегии. 2016. № 18(4). С. 74-83.
2. Кудрин А., Гурвич Е. Новая модель роста для российской экономики // Вопросы экономики. 2014. № 12. С. 4-36.
3. Морозова В. И., Логунова Д. И. Прогнозирование методом машинного обучения // Молодой ученый. 2022. № 21 (416). С. 202-204.
4. Организация агропромышленного производства на этапе цифровой трансформации экономики / А. Л. Золкин, Е. В. Матвиенко, М. С. Чистяков, С. Н. Косников // Управленческий учет. 2021. № 4-2. С. 232-238.
5. Шумов В. В. Государственная и общественная безопасность: Моделирование и прогнозирование. М.: Ле-нанд, 2016. 27-34 с.
References _
1. Aganbegyan A. G. Reduction of investments - death for the economy, the rise of investments - its salvation. Economic strategies. 2016. No. 18(4). Pp. 74-83.
2. Kudrin A., Gurvich E. A new growth model for the Russian economy. Economic issues. 2014. No. 12. Pp. 4-36.
3. Morozova V. I., Logunova D. I. Forecasting by machine learning method. Young scientist. 2022. No. 21 (416). Pp. 202-204.
4. Organization of agro-industrial production at the stage of digital transformation of the economy / A. L. Zolkin, E. V. Matvienko, M. S. Chistyakov, S. N. Kosnikov. Managerial accounting. 2021. No. 4-2. Pp. 232-238.
5. Shumov V. V. State and public safety: Modeling and forecasting. Moscow: Lenand, 2016. 27-34 p.