10. Abramova M.A., Kostyuk V.G., Goncharova G.S. Zhiznennye plany i adaptatsiya razlichnykh sotsiokulturnykh tipov molodezhi. Zhurnal sotsiologii i sotsialnoj antropologii. T. 16, № 1, 2013. S. 78-99.
Савельев Лев Яковлевич - кандидат физико-математических наук, профессор Новосибирского государственного университета, профессор Тувинского государственного университета, НИЛ «Теории вероятностей и ее приложений», E-mail: [email protected]
Гончарова Галина Савитовна - научный сотрудник Института философии и права СО РАН, E-mail: [email protected]
Savelyev Lev - PhD Candidate of Physics and Mathimatics, professor of Novosibirsk State University, Professor of Tuvan State University, Laboratory "Theory of Probability and its Applications", E-mail: [email protected]
Goncharova Galina - Researcher, Institute of Philosophy and Law, Russian Academy of Sciences, E-mail: [email protected].
УДК 519.217.2 +314.3
МАРКОВСКАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДИНАМИКИ КОЛИЧЕСТВА ДЕТЕЙ В СЕМЬЯХ ТУВЫ
Хурума А.К.
Тувинский государственный университет, НИЛ «Теории вероятностей и ее приложений», Кызыл
THE MARKOV MATHEMATICAL MODEL THE DYNAMICS OF THE NUMBER OF CHILDREN IN FAMILIES
OF TUVA
Khuruma A.K.
Tuvan State University, Laboratory "Theory of Probability and its Applications", Kyzyl
В работе строится и исследуется Марковская математическая модель динамики количества детей в семьях Республики Тыва. Дается полное количественное описание параметров и характеристик построенной цепи Маркова, основанное на данных Тывастата РТ. Доказывается, что построенная цепь Маркова является неразложимой и эргодической, найдено ее стационарное распределение и дана оценка скорости сходимости к нему ежегодных абсолютных распределений вероятностей. Произведено прогнозирование динамики изменения количества детей в семьях на ряд лет и сделано сравнение с уже имеющимися статистическими данными.
Ключевые слова: Конечные цепи Маркова, Марковская модель, эргодичность, стационарное распределение, структура семьи, прогнозирование
This article presents the constructed mathematical model of Markov dynamics of the number of children in Tuvan families. Completed quantitative description of the parameters and characteristics of the constructed Markov chain was given, which based on databases of Tuvan Statistics Center of Republic of Tuva. It is proved that the constructed Markov chain is indecomposable and ergodic. The stationary distribution was found and evaluated the rate of convergence to it annual absolute probability distributions. The forecasting dynamics of
changing in the number of children in families for several years were produced and made a comparison with existing statistical data.
Key words: Finite Markov chains, Markov model, Ergodicity, Stationary distribution, Structure of family, Prognosis.
Конечные цепи Маркова имеют многочисленные приложения в различных областях знаний, в том числе в социологии и демографии. Построение математических марковских моделей позволяет решать реальные проблемы прогнозирования в социальных процессах, наблюдаемых в имеющихся статистических данных. Одна из подобных марковских моделей для анализа и прогнозирования динамики числа детей в семьях была предложена и кратко представлена в работе [1] (часть 4), которая затем в более развернутом виде была изложена в монографии [2] (глава 4). В настоящей работе мы строим и изучаем свою аналогичную версию марковской модели структуры семей, основанной на статистических данных по Республике Тыва, и делаем соответствующие стохастические прогнозы. Предварительные результаты были кратко анонсированы нами в [3].
Рассмотрим систему, которая может находиться в одном из несовместных состояний А = i, i g S, конечного пространства возможных состояний S = {0,1,2,...,Ж}. Система в дискретные моменты времени t = 0,1,2,..., называемые шагами, переходит из одного состояния Аы в другое А,. Смена состояний происходит по закону: в нулевой момент времени (t=0), вероятности начальных состояний равны P(А0 = i0 ) = (0) ; затем на любом шаге t>1 условная вероятность перехода системы, находящейся в состоянии = i, в состояние А = j равна p~. Причем она не зависит ни от состояний системы в
предыдущие моменты времени (марковское свойство), ни от текущего времени (свойство однородности).
Определение 1 : Случайный процесс А0, А1,..., А(,... смены состояний называется простой однородной цепью Маркова с конечным числом состояний и дискретным временем, если для V t > 1 и i, j,i0,\... G S выполняется марковское свойство:
р{А = j / Ао = ^ А1 = il,..., Л-1 = i}=р{А = j / Л-1 = i}=Pj,
если только Р{А0 = i0, А1 = ^,..., А-i = i}> 0.
Изменение состояний описывается матрицей переходов P с элементами Pj, i g S, j g S . Элемент p. равен вероятности, с которой система перейдет из
состояния i в состояние j за единицу времени. Матрица P называется стохастической, если она обладает свойствами:
0 < р < 1, Vi, j g S и £ p = 1, Vi g S.
jGS
Подробное описание дискретных (конечных) цепей Маркова дано, например, в [4].
Рассмотрим конкретную марковскую математическую модель [2] для прогнозирования числа детей в семье. Вероятности переходов из одного состояния в другое состояние будем вычислять на основании статистических данных. Будем использовать статистические данные для Республики Тыва, взятые нами из источника [5]. Выборочное обследование 460 домохозяйств по наличию детей в возрасте до 16 лет, проведенное в 2003 году, показало следующие результаты: количество семей (домохозяйств), не имеющих ни одного ребенка - 145, имеющих 1 ребенка - 151 семья, 2 ребенка имеют 118 семей, 3 ребенка имеют 39 семей, 4 и более ребенка имеют 7 семей.
Обозначим п^) - количество семей (домохозяйств), имеющие i детей, где i=0, 1, 2, 3, 4. Соответственно, получим:
п(0) = 145 домохозяйств, в которых нет детей; п(1) = 151 домохозяйство, в которых 1 ребенок; п(2) = 118 домохозяйств, в которых 2 ребенка; п(3) = 39 домохозяйств, в которых 3 ребенка; п(4) = 7 домохозяйств, в которых 4 и более ребенка.
За момент времени t примем год. Каждая семья в каждый момент t=0, 1, 2, ... может иметь i= 0, 1, 2, 3, 4 детей, либо больше 4 детей. Множество состояний модели £ = {0,1,2,3,4}. Будем предполагать, что при переходе от момента t к моменту t +1 для семьи, имеющей >0 детей в момент t есть три возможности: сохранить число детей с вероятностью pii>0, увеличить число детей с вероятностью pi(i+l)>0, уменьшить число детей на 1 с вероятностью pi(i-1)>0, остальные вероятности примем равными нулю, тогда pi(i-1) +pii + pi(i+l) = 1Начальное распределение вероятностей, соответствующее частотам разных типов семей 2003 года, в соответствии со статистическими данными по Туве, примем равными
= (0,3152 ; 0,3283 ; 0,2565 ; 0,0848 ; 0,0152). При определении переходных вероятностей данной цепи Маркова возникают некоторые технические трудности. Оптимальным было бы использовать статистические данные (свои в каждом регионе) по крайней мере за два года о всех случаях изменения состава семей по количеству детей с указанием, из какого состояния семья перешла в другое состояние за 1 год. Однако существующая технология микропереписей населения, либо других опросных способов фиксации количественного состояния семей не позволяет выделить нужные для нас количественные данные в их динамике. По этой причине при определении переходных вероятностей в Марковской модели приходится использовать косвенные данные и теоретические предположения. Заметим, что и в подавляющем числе случаев построения математических моделей не только в социологических явлениях, но и многих других, математикам приходится работать в условиях не полной количественной информации и использовать специальные приемы и допущения.
В уже упомянутой работе [1] (Глава 9, пункт 9.2) и затем, в более подробном изложении в работе [2] (Глава 4, пункт 4.1), где изучается
применение Марковской модели для изучения динамики количества детей в семье, основанное на статистических данных по Новосибирской области, предлагается для построения вероятностей переходов использовать урновую модель. В этой же работе подтверждается адекватность такого приема путем сравнения расчетных теоретических выводов с реальными статистическими данными. В настоящей работе мы также будем использовать такой прием для оценки переходных вероятностей.
Всюду далее численные расчеты мы будем проводить с точностью в четыре знака после запятой.
Вычислим значения переходных вероятностей, определяя их долями семей с данным числом детей, по следующим формулам для = 1, 2, 3:
"(О
Pi(i-1) pi(i+1)
n(i -1) + n(i) + n(i + 1) = n(i -1)
n(i -1) + n(i) + n(i + 1) = n(i + 1)
n(i -1) + n(i) + n(i + 1) И для i= 0, 4 определим по формулам:
Poo = n(0) ; p01 = n(1)
n(0) + n(1) n(0) + n(1)
n(4) ; p„= n(3) .
P44 = -^-; P43
«(3) + «(4) «(3) + «(4)
Вычислим ненулевые значения переходных вероятностей для i=P.
г, — «(1) 151
Pli = -—-=-= 0,3647;
«(0) + «(1) + «(2) 414
P0 =_«(0)_= 145 = 0,3503 ;
n(0) + «(1) + «(2) 414
P2 =_«(2)_= и8 = 0,2850.
«(0) + «(1) + «(2) 414
Аналогично вычислим переходные вероятности для i = 2, 3:
P22 =_«-(2)_= 118 = 0,3831 ; Pi =_«®_= 151 = 0,4903 ;
«(1) + «(2) + «(3) 308 «(1)+«(2) + «(3) 308
P23 =_«(3)_= Л = 01266, P33 = -«(3)-= — = 0,2378 ;
«(1) +«(2) + «(3) 308 «(2) +«(3) + «(4) 164
118 7
P32 =-= 0,7195 ; P34 = — = 0,0427 .
164 164
Вычисления для i = 0, 4 дают переходные вероятности:
Poo = 145 = 0,4899 ; Pol = — = 0,5101 ; P44 = 7 = 0,1522 ; P43 = 39 = 08478. 296 296 46 46
Запишем матрицу переходов цепи Маркова, подставляя в нее значения найденных переходных вероятностей:
(0,4899 0,5101 0 0 0 N 0,3503 0,3647 0,2850 0 0 Р = 0 0,4903 0,3831 0,1266 0
0 0 0,7195 0,2378 0,0427 0 0 0 0,8478 0,1522
Исследуем данную цепь Маркова в рамках общепризнанной классификации А.Н.Колмогорова, представленной, например, в [4].
Цепь Маркова является конечной с числом состояний равным пяти: S = {0,1,2,3,4}. Цепь однородна по времени.
Очевидно, что из каждого состояния можно перейти за конечное число шагов в любое другое, и вернуться назад, т.е. для любых i,jе{0,1,2,3,4} существуют t1 и t2eN, такие, чтоpij(t1)>0, pji(t2)>0. При этомpii(1)>0, для всех i е {0,1,2,3,4}. Таким образом, все состояния цепи {0,1,2,3,4} являются существенными (несущественных состояний нет), сообщающимися и образуют ровно один класс существенных состояний. Такие цепи называют неразложимыми или неприводимыми.
Теперь найдем стационарное распределение ж*= (ж0, ль ж2, ж3, ж4) изучаемой цепи Маркова, т.е. удовлетворяющее условию ж* ■Р=%", которое существует для любой конечной цепи Маркова. Из установленной выше неразложимости нашей цепи следует, что ее стационарное распределение единственно [4]. Решаем систему линейных алгебраических уравнений размерности 5x5:
>и ■ ж1 + р21 ■ ж2 + Р31 ■ + Р41 ■ ж4 + Р51 ■ ж5 = Ж1 ,
Р12 ■ Ж1 + Р22 ■ Ж2 + Р32 ■ Ж3 + Р42 ■ Ж4 + Р52 ■ Ж5 =Ж2, Р13 ■ Ж1 + Р23 ■ Ж2 + Р33 ■ Ж3 + Р43 ■ Ж4 + Р53 ■ Ж5 = Ж3 , Р14 ■ Ж1 + Р24 ■ Ж2 + Р34 ■ Ж3 + Р44 ■ Ж4 + Р54 ■ Ж5 = Ж4 , Р15 ■ Ж1 + Р25 ■ Ж2 + Р35 ■ Ж3 + Р45 ■ Ж4 + Р55 ■ Ж5 = Ж5 ,
с присоединенным уравнением условия нормировки Ж + ж + + Ж3 + = 1.
Получаем следующее единственное строго положительное нормированное решение системы л0=0,2888, ж1=0,4210, ж2=0,2448, ж3=0,0432, ж4=0,0022. Стационарное распределение имеет вид ж*= (0.2888, 0.4210, 0.2448, 0.0432, 0.0022).
Теперь исследуем предельные свойства используемой цепи Маркова. Согласно классификации [4] , в зависимости от предельных свойств выделяют правильные, регулярные и эргодические цепи Маркова. При этом из эргодичности цепи Маркова следует ее регулярность, а из регулярности -правильность. Покажем, что данная цепь Маркова является эргодической, и, тем самым, регулярной и правильной. В термин «эргодичность» в различных
источниках иногда вкладывается различие, поэтому напомним используемое нами определение из [4].
Определение 2: Конечная цепь Маркова называется эргодической, если
для всех ее переходных вероятностей существуют пределы lim рШ = р* , i , j
*
=1,2, ..., n , независящие от i, и положительные р* > 0 при j = 1, 2, ..., n . При этом финальное распределение р = (р, р2рп) = я является единственным
стационарным распределением цепи: ж*-Р=ж*. Отметим, что из того, что цепь Маркова имеет единственное строго положительное стационарное распределение, что мы уже установили, еще не следует, что она эргодическая (см. [4]).
Согласно теореме Маркова [4], для того, чтобы конечная цепь Маркова была эргодической, необходимо и достаточно, чтобы существовало m0 е N, такое, что все элементы матрицы РШо являются строго положительными. По некоторым оценкам (см., например, [6], Глава 8), для неотрицательных неразложимых матриц с ненулевыми диагональными элементами, а мы имеем именно такую матрицу, достаточно возвести ее лишь в степень m0 < n-1= 4. Выполним эти операции и найдем
Р 2 , Р 3
и Р :
Р 2 =
(0.4187 0.435 9 0.145 4 0.0000 0.0000^ 0.2994 0.4514 0.2131 0.0361 0.0000 0.1718 0.3666 0.3776 0.0786 0.0054 0.0000 0.3528 0.4467 0.1838 0.0167 0.0000 0.0000 0.6100 0.3306 0.0594.
Р 3 =
(0.3578 0.4438 0.1799 0.0184 0.0000^ 0.3048 0.4218 0.2363 0.0356 0.0015 0.2126 0.4065 0.3057 0.0711 0.0042 0.1236 0.3477 0.4040 0.1144 0.0104 0.0000 0.2991 0.4716 0.2062 0.0232,
Р 4 =
(0 .3 30 8 0 .4326 0 .2087 0.0272 0.0008 0.2971 0.4252 0.2363 0.0397 0.0018 0.2465 0.4066 0.2841 0.0591 0.0037 0.1823 0.3879 0.3362 0.0871 0.0065 v0.104 8 0.3403 0.4142 0.1284 0.0123
Как видим, матрицы Р, Р2, Р3 содержат нулевые элементы , а матрица Р4 уже нет. Следовательно, наша цепь Маркова является эргодической, а значит регулярной и правильной.
Приведем теперь матричные свойства любой эргодической цепи Маркова [4]. Если цепь эргодическая, то последовательность степеней ее переходной
матрицы Рт сходится при ш^да к предельной матрице Р* , в которой все строки
*
одинаковые и совпадают с вектором стационарного распределения л , т.е.
{
Pm ^ P* =
ж, , ж
ж, , ж,,
,ж„
Отметим, что предельная матрица P сама является переходной матрицей
некоторой новой цепи Маркова, имеющей то же самое стационарное
*
распределение ж .
Под сходимостью последовательности матриц P n к предельной матрице P следует понимать поэлементную числовую сходимость, т.е. ptj ^ ж. при
т^-да и при всех i, j = 1, 2, ..., n.
Вместе с тем, сходимость последовательности матриц с тем же смыслом удобно описать и на языке нескольких метрик в пространстве матриц. Чаще всего для этого используется «равномерная» метрика (расстояние) р, задаваемая в нашем случае по следующей формуле
р( Рт, Р *) = max (max | p™ - ж* |) .
i=1,2,...ji j=1,2,...ji ,J J
Очевидно, Pm ^ P тогда и только тогда, когда
р( Рт, Р ) ^0 при т^-да. Введение метрики р позволяет говорить о скорости сходимости и о степени близости матрицы Pm при данном m к предельной матрице P . Если некоторое число в > 0 мало, и р( Рт, Р ) < в , то можно сказать, что Pm « P с точностью в . Данный подход мы используем для нашей цепи Маркова.
Будем последовательно находить степени переходной матрицы Рт при т=1, 2, ..., n (первые четыре степени мы уже построили) и оценивать их расстояние в равномерной метрике до предельной матрицы P. Получим следующие значения:
р( Р , Р *) = 0, 8046,
р( Р3, Р *) =0,2888, р( Р8, Р *) =0,0262, р( Р16 , Р *) =0,0006,
р( Р2, Р *) =0,3652, р( Р4, Р *) =0,1840, р( Р12, Р *) =0,0032,. р( Р21 , Р *) =0,0003.
Из-за накопления неизбежных ошибок округления дальнейшего увеличения точности приближения матрицы Рш к матрице Р с ростом ш>20 уже не происходит. Приведем две матрицы из этой последовательности (одну из них используем ниже):
*
*
*
ж! , ж2 ,..., жп j
P 8 =
P20 =
(0.2944 0.4227 0.2400 0.0409 0.0020 0.2903 0.4213 0.2437 0.0426 0.0021 0.2835 0.4192 0.2496 0.0453 0.0024 0 .275 0 0.4165 0.2572 0.0486 0.0027 0.2626 0.4124 0.2682 0.0536 0.0032 (0.2891 0.4210 0.2447 0.0431 0.0022^ 0.2891 0.4210 0.2447 0.0431 0.0022 0.2891 0.4210 0.2447 0.0431 0.0022 0.2891 0.4210 0.2447 0.0431 0.0022 0 .2 890 0.4210 0.2448 0.0431 0.0022,
Можно считать, что матрица P20 уже практически не отличается от
D*
предельной матрицы P , расхождения в значениях их элементов не превышают 0,0003 (напомним, что все вычисления мы проводим с точностью до 4-х знаков после запятой).
Теперь перейдем к содержательной трактовке результатов наших вычислений.
Для изучения дальнейшей динамики числа детей будем исследовать то, как будет развиваться наша цепь Маркова во времени с заданным выше начальным распределением.
Имея на нулевом шаге распределение вероятностей состояний , цепь Маркова на 1-ом шаге, n=l, будет иметь на множестве S распределение
вероятностей (л°, ж\ ,ж\ ,п\ ,ж\), найдем эти вероятности:
В состояние А0 на первом шаге цепь может попасть из любого из состояний А0, А1, А2, А3, А4, которые образуют полную группу попарно несовместных событий. По формуле полной вероятности получим:
4 4
=Z р& = 0/а, = /}• PíA,) = z p,0 =Z
i=0 ¿=0 ¿=0
Аналогично получаем остальные формулы:
Pi0 ■
=
Z Pj =z
< Pj
j = 0,1,2,3,4.
Запишем полученные формулы в матричном виде: л0 • Р, т.е. вектор л0 умножается на матрицу Р слева.
На следующем 2-ом шаге, п=2, цепь Маркова будет иметь на множестве распределение вероятностей
Л = ( л0 , л2 ,ж2,ж3, лА),
для которого будет ж2= ж1 • Р= ж0 • Р2.
Повторяя предыдущие рассуждения, для любого п=1,2,... имеем жп= ж0 • Рп.
Возведя нашу матрицу переходов в степень m = 2, 3,...,8 и округляя (см. выше), получаем матрицы переходов Р2 для 2004 года, Р3 для 2005 года, ... , Р8 для 2010 года (матрица Р8 приведена выше).
¿=0
¿=0
Найдем вектор распределения вероятностей состояний цепи Маркова,
соответствующий 2010 году
л8= л0-Р8= (0,3152 0,3283 0,2565 0,0848
0,0152)•
(0.2944 0.4227 0.2400 0.0409 0.0020^ 0.2903 0.4213 0.2437 0.0426 0.0021 0.2835 0.4192 0.2496 0.0453 0.0024 0.2750 0.4165 0.2572 0.0486 0.0027 0.2626 0.4124 0.2682 0.0536 0.0032,
= ( 0,2881 0,4207 0,2456 0,0434 0,0022).
Основываясь на статистических данных 2003 года по Республике Тыва, мы получили прогноз на 2010 год распределения семей по количеству детей с помощью использованной математической модели:
не имеющих детей - 28,81 % семей;
1-2 ребенка - 42,07+24,56 = 66,63 % семей;
3-4 и более ребенка - 4,34+0,22= 4,56 % семей.
Для сравнения приведем результаты выборочного обследования, проведенного Тывастатом в 2010 году [7] о распределении домохозяйств по наличию детей до 16 лет:
не имеющих детей - 33,4% ;
имеющих 1-2 ребенка - 50,2% ; имеющих 3 и более ребенка - 16,4 %.
Как мы видим, рассчитанный нами прогноз на 7 лет вперед, близок к фактическому распределению, что свидетельствует об адекватности использованной математической модели.
Следует отметить, что в нашей модели не учитываются (и не могут заранее учитываться) такие непрогнозируемые обстоятельства, влияющие на количество детей в семье, как спады и подъемы экономического положения в стране (в т.ч. инфляция), введение на государственном уровне мер по стимулированию рождаемости (в т.ч. «материнский капитал»), и многое другое. И это совершенно нормальная ситуация для исследователя, которая ставит новые задачи для будущих изысканий по данной проблематике.
Текст нашей статьи носит математический характер, но написан он с некоторыми подробностями и пояснениями, известными математикам, так, чтобы он был доступен и социологам, поскольку содержательно мы решаем социологические задачи.
Библиографический список
1. Гончарова Г.С., Савельев Л.Я. Семейно-брачные отношения у народов Сибири. Новосибирск: Издательство «Нонпарель», 2004. 286 с.
2. Савельев Л., Балакин С. Конечные марковские цепи и серии. Теория и приложения. -Saarbrucken, Deutschland / Германия: LAP LAMBERT Academic Publishing, 2012. 150 с.
3. Хурума А.К. Дискретные Марковские модели в социальных процессах. Научные труды ТувГУ, выпуск 10, Том II, Кызыл, РИО ТувГУ, 2012, стр. 120-122 .
4. Жданок А.И. Основы теории конечных цепей Маркова. Теория и практика. Кызыл: ГУП «Тываполиграф», 2008. 165 с.
5. Социальное положение и уровень жизни населения Республики Тыва за 2003 год. Статистический сборник, Тывастат, Кызыл, 2005. 128 с.
6. Хорн Р., Джонсон Ч. Матричный анализ. М., Мир, 1989. 656 с.
7. Социальное положение и уровень жизни населения Республики Тыва за 2010 год. Статистический сборник, Тывастат, Кызыл, 2011. 216 с.
bibliograficheskij spisok
1. Goncharova G.S., Savelev L.Ya. Semejno-brachnye otnosheniya u narodov Sibiri. Novosibirsk: Izdatelstvo "Nonparel", 2004. 286 s.
2. Savelev L., Balakin S. Konechnye markovskie tsepi i serii. Teoriya i prilozheniya. -Saarbrucken, Deutschland / Germaniya: LAP LAMBERT Academic Publishing, 2012. 150 s.
3. Khuruma A.K. Diskretnye Markovskie modeli v sotsialnykh protsessakh. Nauchnye trudy TuvGU, Vypusk 10, Tom II, Kyzyl, RIO TuvGU, 2012, str. 120-122 .
4. Zhdanok A.I. Osnovy teorii konechnykh tsepej Markova. Teoriya i praktika. Kyzyl: GUP "Tyvapoligraf1, 2008. 165 s.
5. Sotsialnoe polozhenie i uroven zhizni naseleniya Respubliki Tyva za 2003 god. Statisticheskij sbornik, Tyvastat. Kyzyl, 2005. 128 s.
6. Khorn r., Dzhonson Ch. Matrichnyj analiz. M., Mir, 1989. 656 s.
7. Sotsialnoe polozhenie i uroven zhizni naseleniya Respubliki Tyva za 2010 god. Statisticheskij sbornik, Tyvastat, Kyzyl, 2011. 216 s.
Хурума Анна Кыс-ооловна - старший преподаватель кафедры математического
анализа и методики преподавания математики Тувинского государственного университета,
Кызыл, E-mail: [email protected]
Khuruma Anna- Senior Teacher of the Department of Mathematical Analysis and
methods of teaching mathematics, Tuvan State University, Kyzyl, E-mail: [email protected]