ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2018 Управление, вычислительная техника и информатика № 42
УДК 658.512
DOI: 10.17223/19988605/42/3
Ю.И. Параев, Т.И. Грекова, К.О. Полуэктова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ОДНОСЕКТОРНОЙ ЭКОНОМИКОЙ ПРИ СЛУЧАЙНОМ ИЗМЕНЕНИИ ФОНДОВООРУЖЕННОСТИ ТРУДА
Рассматривается задача оптимального управления односекторной экономикой при случайном изменении фондовооруженности труда. В качестве критерия оптимальности выбирается максимум среднего значения непроизводственного потребления на заданном периоде производства. Решение проводится с помощью метода динамического программирования.
Ключевые слова: односекторная экономика; фондовооруженность труда; непроизводственное потребление; оптимальное управление; динамическое программирование.
Проблема управления односекторной экономикой восходит к [1, 2]. Ей посвящено большое количество работ, в которых рассматриваются и решаются разные варианты задач, в том числе и задачи оптимального управления такой экономикой (например, [3-6]). Естественным продолжением этих исследований является решение задач с учетом каких-либо случайных возмущений, действующих в процессе производства. Состояние односекторной экономики определяется двумя величинами: K(t) — основной капитал и L(t) — трудовые ресурсы. Вообще говоря, изменение основного капитала во времени происходит случайным образом из-за таких факторов, как случайный износ основных производственных фондов, приобретение новых фондов, цена на которые зависит от курса валют, производственная неопределенность, экономическая конъюнктура и т.п. Если основной капитал изменяется случайным образом, то фондовооруженность труда k = K/L и непроизводственное потребление c = C/L, приходящиеся на одного работника, также будут изменяться случайным образом. В [7] на основании изучения статистических данных приводится определенное обоснование того, что влияние экзогенных случайных факторов на экономическую динамику можно моделировать процессом броуновского движения.
В настоящей работе рассматривается задача оптимального управления односекторной экономикой при случайном изменении фондовооруженности труда. В качестве критерия оптимальности выбирается максимум среднего значения непроизводственного потребления на заданном периоде производства. Решение задачи проводится с помощью метода динамического программирования.
1. Постановка задачи
Состояние экономики характеризуется двумя величинами: фондовооруженностью труда k(t) и непроизводственным потреблением c(t), приходящимися на одного работника, а также производственной функцией F(k) — валовым продуктом, произведенным в единицу времени. В детерминированном случае эти переменные удовлетворяют уравнениям
k = uF-\xk, к(0) = к0, (1)
с = 5с + (1 - u)F, с(0) = 0, (2)
где ц - коэффициент амортизации, 5 — норма дисконтирования (ц > 0, 5 > 0), uF — часть продукта, которая идет на увеличение основного капитала, (1 — u)F — часть продукта, которая идет на увеличение непроизводственного потребления. Таким образом, в задаче управляющим параметром является коэффициент u, который должен удовлетворять условию
0 < u < 1. (3)
Далее используется производственная функция Кобба-Дугласа, т.е. ^(к) = Лка, где А - масштаб темпа производства (А > 0), а - коэффициент эластичности по основным фондам. Предполагается, что планируемый период производства [0, Т] задан и достаточно велик. Согласно (2) общее непроизводственное потребление на интервале [0, Т] при заданном управлении и равно
т
с(Т) = | вКт -} (1 - и)Е (к )сИ. (4)
о
Детерминированная задача: в течение интервала времени [0, Т] найти такое управление и(0 с учетом (3), при котором функционал (4) достигает максимума. Эта задача с помощью принципа максимума Понтрягина подробно решена в [8].
В [7] предложено учет случайных воздействий на фондовооруженность труда представить в виде уравнения
к = иР-\хк + к(0) = к0, (5)
где - стандартный белый гауссовский шум (или = где ю(0 - винеровский процесс),
с - коэффициент волатильности. Таким образом, процесс Щ) становится случайным. Однако этот процесс измеряется, т.е. в каждый момент времени ^ значение Щ) известно.
Стохастическая задача: в течение интервала времени [0, Т] найти такое управление и(0 для (2) и (5) с учетом (3), при котором среднее значение функционала (4) максимально. В статье задача решается с помощью метода динамического программирования [9].
2. Решение стохастической задачи
Согласно методу динамического программирования, введем функцию Беллмана
s(k;t, T ) = max M j j eKT -t) (1 - u)F (k )dt\k,t j
- среднее значение величины с(Т) при условии, что процесс продолжается на интервале времени [t, Т] с начальным условием k(t) = к и на этом интервале применяется оптимальное управление. Для этой функции можно записать уравнение Беллмана:
ds(k;tJ) = max j^fel) (uF(k) - yk) + е^)(1 -u)F(k)+1 c2k2 ^(k;t'T) 1 -
2
6t o<u(i)<i [5k 2 dk
= max iuF(k)(^^kUl - e«T-o) - yk+ e«?-of(k)+1a2k2 6^^T)
(6)
o<u(t)<i [6k 6k 2 6k2 J
s(k ;T , T) = 0.
Из решения этого уравнения получается решение стохастической задачи. Здесь к - аргумент функции s(k;t,T), а не случайный процесс, определяемый уравнением (5).
Если взять детерминированную задачу и решать ее с помощью динамического программирования, то приходим к уравнению (6) при с = 0. Но поскольку решения с помощью принципа максимума и динамического программирования эквивалентны, то решение уравнения (6) при с = 0 должно совпадать с решением, полученным в [8]. Это решение состоит в том, что интервал [0, T] точками ti и t2 (0 < ti < t2 < T) разбивается на три интервала: [0, ti], [ti, t2] и [t2, Т]. Интервал [0, ti] соответствует выходу на магистраль, интервал [ti, t2] - магистрали (если она существует), интервал [t2,T] - заключительному этапу (сходу с магистрали). На магистрали к = koc = const, причем
ke , u , (7)
5 + У F (koc)
где P = i - а. Далее рассматривается основной вариант, когда k(0) < koc и на интервале [0, ti] u = i.
На заключительном интервале [¿2, Т и = 0. Таким образом, структура оптимального управления для детерминированной задачи имеет вид:
1 при 0 < t < tx, ) = \иж при ^ < t < ^, (8)
0 при ^ < t < Т. Получается, что решение задачи сводится к нахождению моментов ¿1 и ¿2.
Можно предположить, что в стохастическом случае при достаточно малом коэффициенте с структура оптимального управления имеет такой же вид. Поэтому решение стохастической задачи фактически сводится к нахождению оптимальных моментов ¿1 и ¿2. Эти моменты находятся в процессе решения уравнения (6). Максимум правой части этого уравнения по и с учетом (3) достигается при
и^) =
1, если > е),
дк
ипг, если ^ = ей(Т -t), (9)
дк
дз(к^,Т) Ъ(т-,)
0, если -< е ).
дк
3. Сход с магистрали
В этом случае решение уравнения (6) начинается с правого конца. Обозначим через ^ (к'^,-), (к; t,^), ^ (к-) функции Беллмана, если момент t относится к интервалам [0, tl], [tl, t2], [t2, Т соответственно.
На интервале [¿2, Т и = 0. Поэтому уравнение (6) принимает вид:
+ е^т-^к) +1д%(к;у), кТ,Т) = 0. (10)
дt дк 2 дк2Ъ Его решение можно записать в виде:
8ъ(к;иТ) = Е(к^ъ(иТ), (11)
где wз(t,T) _ искомая функция. Подставляя (11) в (10), получаем
-Е(к)ч> з (Г, Т) = -\xkl-' \к)ч> з (?, Т) + ^а2к2Р "(к)ч> 3 (Г,
или
-Р(к)м>з (?, Т) = (?, Т) + - о2 а(а - \)Р(к)ч>ъ (?, Т7) + Р(к)е5(т-').
Сократив на F(k), получаем
-м>ъ(?,Т) = -&м>3(Г,Т) + е3(т-'\ м>3(Т,Т) = 0, где 0 = ац + ^арс2. Решение этого уравнения:
е«(Т_() _ е-ЫТ_)
w3(t,Т)=-. (12)
3 5 + &
Согласно (9) на интервале [¿1, ¿2] должно выполняться условие
= е5(Т _') (13)
дк
и, следовательно, условие
д_ЩТ) . 0. (14)
дк2
Кроме того, из принципа оптимальности Беллмана следует, что S2(k;t,Т) = S2(k;t,t2) + sз(k(t2);t2,Т). Поэтому из (6) получаем
= -Мкд^к) + -ор(к), 52(к;г2,г2) = 0. (15)
дг дк
Согласно методу разделения переменных его решение ищем в виде:
^ (к;1, ^ ) = Н (к )е8(т+ Б, (16)
где Н(к) - искомая функция, В - некоторая константа. Подставляя (16) в (15) и сокращая на ехр{5(Г -¿)}, получаем дифференциальное уравнение первого порядка с независимым аргументом к:
цкН '(к) + 5Н (к) = Р (к).
Его решение состоит из общего решения однородного уравнения и частного решения неоднородного уравнения, что приводит к выражению [10]
- Ак а
Н(к) = Ск ц + , (17)
ац + 8
где С - константа интегрирования. Эта константа находится из условия (13) или, как следует из (16), из условия Н' = 1. В результате имеем
Н(к) = -—Ск ц + ^^ = 1. цк ац + 8
Находя отсюда константу С и подставляя в (17), получаем
H (k) = F-yk. (i8)
о
К выражению (18) еще раз применим условие Н' = i. Получаем
h (k) = aAk а -1 - ^ = 1. 5
Отсюда следует (7). Выражение для Uoc получается из (1), так как koc = const. Таким образом, свойства магистрали в детерминированном и стохастическом случаях совпадают. Константа В находится из условия S2(k;t2,t2) = 0. Из (16) следует, что
B = - H (k (t2 )eS(T-t2).
Этот же результат можно получить непосредственно. Так как на интервале [ti, t2] k = koc = const и (1 - u)F = F -yk = const, то получаем
u e S(T) - eS(T-<2)
s2(k;t, t2) = je8(T-t) (1 - u)F(k)dt = (F - yk)
8
что совпадает с (16).
4. Выбор оптимального параметра ¿2
Из полученного выше следует, что при ^ < ¿2
^(к;?,Т) = Н(к)(е5(Т-° -е*(Т-°) + 0(е5(Т-2) -е^-^)), (19)
где
о=Р(к2)
0 8 + 3 .
Поскольку эта функция зависит от параметра ¿2, то естественно выбрать его так, чтобы функция достигала максимума. Вычислим производную
dsn
Отсюда
ds2 = H(k)5e8(T-t2) -Q(5es<T-t2) +&e-Э(Т-í2)) = 0. dt2
^(5+ЭХТ-t2) = 5(H Q) (20)
&Q '
Т - и = к =-1п
2 3 5 + Э
5 (Н - е;
Таким образом, длина интервала [¿2, Т] равна значению гз.
5. Выход на магистраль
На интервале [0, ¿1] и = 1. Поэтому непроизводственное потребление равно нулю и поэтому при t < ¿1 Sl(k;t, ¿1) = 0 и Sl(k;¿,Т = S2(k(¿\);¿l,Т). Поскольку Sl(k;t,tl) = 0, то вторая производная этой функции по к равна нулю. Поэтому уравнение (6) принимает вид:
-^л) -цк), ^Л) = 0.
о1 дк
Это уравнение можно решать методом характеристик. В результате получается, что переменная к удовлетворяет уравнению (1), решение которого на интервале [¿о, ¿) с начальным условием к(^) = ко имеет вид [2]:
кр (£) = А (1 - ет )) + к1ет). (22)
ц
Момент времени ¿1 определяется из условия к(^) = кос, что приводит к выражению
С , г в Л
. (23)
1 ,
£ =— 1п
1 цв
А - цкв
А - Цк0вс ,
Таким образом, выражения (21) и (23) определяют структуру управления и дают решение задачи. Для существования данного решения необходимо, чтобы сумма длин интервалов [0, ¿1] и [¿2, Т] была меньше Т, т.е. ¿1 + гз < Т.
6. Общее непроизводственное потребление
Из полученных результатов следует, что максимальное среднее значение непроизводственного потребления на интервале [0, Т] равно
5(к0;0, Т) = S2(k (0;^, + ^(к (^^Т) = = Н(Щ))(е8(Т) -еыТ-'2) + б(к(^))(е8(Т-г*) -е-^-^)). ( )
Сюда нужно подставить (21) и (23). При этом в формулах (21) и (24) к = к(Ь) = к^) = кос, т.е. нужно учитывать (7). В частности, получается
е=^т^, (25)
5 + Э
Т - ^ = к =—1—1п 2 3 5 + -&
( Э(5+ц) ^
(5 + Рц)$-ац5 _ (26)
Можно рассмотреть, как ведет себя функционал (24) с ростом с или, что то же самое, параметра 0. Из (26) видно, что при увеличении 0 длина интервала [¿2, Т] стремится к нулю. Также стремится к нулю и величина Q. В результате получаем, что с ростом параметра 0 функционал (24) стремится к величине
s(k0;0,T) = Н(кос)(е5(Т4) -1).
На рисунках приведены результаты численного моделирования при следующих значениях параметров: А = 1, а = 0,5, ц = 0,1, 5 = 0,1, Т = 12, ко = 5, кос = 6,25, ¿1 = 0,7. На рис. 1 приведено изменение во времени фондовооруженности труда при разных значениях коэффициента волатильности с. На рис. 2 приведено изменение во времени непроизводственного потребления при разных значениях коэффициента волатильности с. Видно, что эта величина убывает с ростом с.
к
с
2
3
4
О
О h h
t
T
h h
t
T
Рис.1. Изменение фондовооруженности труда (кривая 1 соответствует ст = 0; кривая 2 - ст = 0,1; кривая 3 - ст = 0,2)
Рис. 2. Изменение непроизводственного потребления (кривая 1 соответствует ст = 0; кривая 2 - ст = 0,1; кривая 3 - ст = 0,2, кривая 4 - ст = 0,3)
Заключение
В результате исследования установлено, что структура управления решения детерминированной и стохастической задач совпадают и определяются значениями моментов t\ и t2. При этом стохастическая составляющая влияет только на момент t2. Увеличение коэффициента волатильности ст приводит к уменьшению среднего значения непроизводственного потребления.
1. Эрроу К. Применение теории управления к экономическому росту // Математическая экономика. М. : Мир, 1974. 745 с.
2. Ашманов С.А. Введение в математическую экономику. М. : Наука, 1984. 286 с.
3. Демин Н.С., Кулешова Е.В. Максимизация потребления работодателей в случае производственной функции общего вида //
Обозрение прикладной и промышленной математики. 2004. Т. 11, вып. 2. С. 326-327.
4. Демин Н.С., Кулешова Е.В. Управление односекторной экономикой на конечном интервале времени с учетом потребле-
ния работодателей // Автоматика и телемеханика. 2008. № 9. С. 140-155.
5. Демин Н.С., Кулешова Е.В. Принцип магистрали в задаче управления односекторной экономикой при наличии ограниче-
ний на накопление и потребление // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2009. № 2 (7). С. 5-23.
6. Анисимов А.В., Григоренко Н.Л., Лукьянова Л.Н. Задача оптимального управления для односекторной модели экономиче-
ского роста со смешанными ограничениями // Прикладная математика и информатика : труды факультета ВМК МГУ им. М.В. Ломоносова. Москва : МАКС Пресс, 2013. Т. 44. C. 5-21.
7. Соловьев В.И. Стохастические методы в экономике и финансах. М. : Гос. ун-т управления, 2000. 154 с.
8. Параев Ю.И., Грекова Т.И., Данилюк Е.Ю. Аналитическое решение задачи оптимального управления односекторной эко-
номикой на конечном интервале времени // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 4 (17). С. 5-15.
9. Параев Ю.И. Введение в статистическую динамику процессов управления и фильтрации. М. : Сов. радио, 1976. 184 с.
10. Камке Э. Справочник по обыкновенным дифференциальным уравнениям. М. : ГИФМЛ, 1961. 702 с.
Параев Юрий Иванович, д-р техн. наук, профессор. E-mail: [email protected] Грекова Татьяна Ивановна, канд. техн. наук, доцент. E-mail: [email protected] Полуэктова Ксения Олеговна. E-mail: [email protected] Национальный исследовательский Томский государственный университет
Paraev Jury. I., Grekova Tatiana. I., Poluektova Ksenia O. (National Research Tomsk State University, Russian Federation). Optimal control of one-sector economy under random variation labor funds.
Keywords: the one-sector economy; capital-labor ratio; non-productive consumption; optimal control; dynamic programming. DOI: 10.17223/19988605/42/3
ЛИТЕРАТУРА
Поступила в редакцию 28 сентября 2017 г.
The problem of optimal control of one-sector economy under random variation labor funds is considered. The state of the economy is characterized by two variables: capital-labor ratio k(t) and non-productive consumption per an employee c(t) along with the production function F(k) being the gross product made per one unit of time. In this study the Kobb-Douglas production function is considered, that is F(k) = Aka, where A denotes the scale of rate of production (A > 0), a is the elasticity coefficient on fixed assets. Variables k(t) and c(t) satisfy the following equations:
k = iiF-\ik + al£,(t), k(O)=k0, c = 8c + (1 - u)F, c(0) = 0,
where | is the depreciation rate, 8 is the discount rate (| > 0, 8 > 0), ^(t) denotes the standard white Gaussian noise (or ^(t) = d<»(t)/dt, where ro(t) is the Wiener process), a is the coefficient of volatility, uF is the product fraction which is used to increase a fixed capital, (1 - u)F is the product fraction which is used to increase a non-productive consumption. Thus, the coefficient u is the controlling parameter in considered problem. This coefficient should satisfy the following condition: 0 < u < 1. It is assumed that the planned production period [0, T] is specified and sufficiently long. The general non-productive consumption on the interval [0, T] for a given control u is defined as follows:
T
c(T) = | es(T-t> (1 - u)F(k)dt .
0
The objective of this study is to find such control u(t) on the interval [0, T] for which the average value of c(7) reaches its maximum. This problem is solved using a dynamic programming method. Bellman's function s(k;t,7) is introduced; s(k;t,T) is an average value of value c(7) provided that process continues on time interval [t, T] with an initial condition k(t) = k and on this interval is applied optimal control. For this function Bellman's equation is specified. The formulated objective is a solution of the Bellman's equation. This solution consists that an interval [0, T] by points ti and t2 (0 < ti < t2 < T) breaks into three intervals: [0, ti], [ti, fe], and [t2, 7]. The interval [0, ti] corresponds to the output to the highway, the interval [ti, t2] - to the highway (if it exists), the interval [t2, 7] - to the final stage (to a descent from the highway). On the highway, there is k = koc = const, and
ki-» = Ji£. , u = „ =- ^
oc
S + ^ " F ( koc )
If k(0) < koc, then u is equal to i on the interval [0, ti]; u is equal to i on the interval [t2, 7]. As a result, it turns out that the control structure is determined by values of ti and t2. The moment ti depends only on initial condition k(0) and doesn't depend on a stochastic component, the moment t2 doesn't depend on initial condition, but it depends on a. Thus, the greater a, the less length of the interval [t2, 7] and average value of non-productive consumption.
REFERENCES
1. Arrow, K. (1974) Primenenie teorii upravleniya k ekonomicheskomu rostu [Application of Control Theory to Economic Growth].
Translated from English. Moscow: Mir.
2. Ashmanov, S.A. (1984) Vvedenie v matematicheskuyu ekonomiku [Introduction to mathematical economy]. Moscow: Nauka.
3. Demin, N.S. & Kuleshova, E.V. (2004) Maximizing consumption of employers in case of production function of a general view.
Review of Applied and Industrial Mathematics. 11(2). pp. 326-327. (In Russian).
4. Demin, N.S. & Kuleshova, E.V. (2008) Control of single-sector economy over a finite time interval with allowance for employer
consumption. Automation and Remote Control. 69(9). pp. 140-155. (In Russian).
5. Demin, N.S. & Kuleshova, E.V. (2009) Turnpike principle in a problem of management onesectoreconomy in the presence of re-
strictions on saving and consumption. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science. 2(7). pp. 5-23. (In Russian).
6. Anisimov, A.V., Grigorenko, N.L. & Lukyanova, L.N. (2013) Problem of optimum control for one-sector model of economic growth
with the mixed restrictions Prikladnaya matematika i informatika. 44. pp. 5-21. (In Russian).
7. Solovyev, V.I. (2000) Stokhasticheskie metody v ekonomike i finansakh [Stochastic methods in economy and finance]. Moscow:
GUU.
8. Paraev, Yu.I., Grekova, T.I. & Daniliuk, E.Yu. (2011) The analytical decision of a problem of optimumcontrol one-sector economy
on a final interval of time. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika -Tomsk State University Journal of Control and Computer Science. 4(17). pp. 5-15 (In Russian).
9. Paraev, Yu.I. (1976) Vvedenie v statisticheskuyu dinamikuprotsessov upravleniya i fil'tratsii [Introduction to statistical dynamics of
control processes and filtrations]. Moscow: Sovetskoe Radio.
10. Kamke, E. (1961) Spravochnikpo obyknovennym differentsial'nym uravneniyam [A reference-book on the ordinary differential equations]. Moscow: GIFML.