Элементы численного вероятностного анализа

Добронец Борис Станиславович; Попова Ольга Аркадьевна

УДК 519.24

Б. С. Добронец, О. А. Попова

ЭЛЕМЕНТЫ ЧИСЛЕННОГО ВЕРОЯТНОСТНОГО АНАЛИЗА

Определяется понятие численного вероятностного анализа. Рассматриваются его элементы с точки зрения теории и возможности их применения на практике. Изучается понятие вероятностного расширения. Описываются подходы к вычислению функций от случайных аргументов и операций над ними. Приводятся примеры использования элементов анализа в практике решения экономических задач. Показывается, что в ряде случаев данный подход можно рассматривать как реальную альтернативу методу Монте-Карло, которая позволяет существенно повысить точность вычислений и сократить их объем.

Ключевые слова: численный вероятностный анализ, вероятностное расширение, численные операции над случайными величинами, гистограммная арифметика, функции случайных аргументов, стохастические линей-

ные и нелинейные уравнения.

В последнее время возрос интерес и увеличилась исследовательская активность в области теории и практики анализа данных больших объемов. Такие объемы информации, с одной стороны, позволяют получить более точное описание объекта исследования, а с другой - превращают поиск решений в сложную задачу, требующую применения современных математических методов обработки и анализа информации, в том числе разработки численных методов, позволяющих определять функции от случайных аргументов и осуществлять операции над ними.

В настоящее время в практике принятия управленческих решений, например при оценке инвестиционных проектов в условиях высокой неопределенности и риска с успехом, используют метод Монте-Карло [1; 2]. Однако при всех положительных качествах этот метод обладает рядом недостатков, самыми существенными из которых являются низкая скорость сходимости и высокие вычислительные затраты, что вносит дополнительные сложности в работу с данными большого объема.

В рамках обозначенного направления анализа данных рассмотрим понятие численного вероятностного анализа как раздела вычислительной математики, предметом которого является решение задач со стохастическими неопределенностями в данных с использованием численных операций над плотностями вероятностей случайных величин и их функций. Одним из основных элементов численного вероятностного анализа является гистограммная арифметика, применение которой позволяет снизить уровень неопределенности в данных и получить дополнительную информацию о распределении случайных величин [3]. Идея гистограммного подхода изложена в работах [4; 5] и заключается в следующем: наряду с общим представлением плотностей вероятностей случайных величин в виде непрерывных функций можно рассматривать случайные величины, плотность распределения которых представляет гистограмму. Например, для одномерной случайной величины гистограмма Р -кусочно-постоянная функция, которая определяет-

ся сеткой {х. | г = 0,...,п} и на каждом отрезке [ хг, хг+1 ] принимает постоянное значение Рг,

к = тах 'ТоЧх-+1 - хг}.

Важным понятием численного вероятностного анализа является понятие вероятностного расширения. Определим это понятие в рамках гистограммного подхода. Для этого рассмотрим задачу определения закона распределения функции нескольких случайных аргументов.

Пусть имеется система непрерывных случайных величин (х1,..., хп) с плотностью распределения р(х1,..., хп). Случайная величина г связана с системой (х1,..., хп) функциональной зависимостью

7 = /(х1,..., хп ).

Тогда плотность вероятности случайной величины г будем называть вероятностным расширением функции /.

На основе понятия вероятностного расширения определим гистограммное вероятностное расширение. Пусть гистограмма ¥ определяется сеткой {7. |г = 0,...,п}. Зададим область

Ц = {(х,...,хп) | 7. < /(х,...,хп) < 2г+1}. Тогда значение

гистограммы ¥ на отрезке [+1] имеет вид [3]:

¥г = | Р(^1,..., 4п №.^ п / (7г+1 - 7 ). (1)

Ц-

Гистограмму ¥, построенную по (1), будем называть вероятностным гистограммным расширением/.

Далее построим гистограммные вероятностные расширения для арифметических операций над случайными величинами. Пусть Р - гистограмма плотности вероятности 7 = х * у, где * е {+, -, •, /, Т}. Тогда на интервале [ , гм]

Р = | р(х, х2)йх-1йх-2 / (г+1 - 7-),

Ц

где Ц = {(х , х2) | 7- < х * х2 < 7- +1} [4].

Операция max(x, y) определяется через функцию распределения F:

z Z

F(z) = J Px ß)d; J Py (4)d^.

—ад —ад

Пусть f (xj,..., xn) - рациональная функция. Тогда для вычисления гистограммы F заменим арифметические операции гистограммными, а переменные xj, x2, ..., xn - их гистограммными значениями. Полученную гистограмму F будем называть естественным гистограммным расширением.

Теорема 1. Пусть f (xj,xn) - рациональная функция, каждая переменная которой встречается только один раз и xj,...,xn - независимые случайные

величины. Тогда естественное гистограммное расширение аппроксимирует вероятностное расширение с

точностью O(ha).

Доказательство проведем по индукции. Для n = 2 утверждение справедливо [4]. Пусть это утверждение справедливо и для n = k и гистограмма Fk аппроксимирует плотность вероятности функции f(xj,...,xk) с некоторой точностью O(ha). Покажем, что это справедливо и для n = к +1. Действительно, Fk+1 = Fk * xk+^ но Fk+i — f (xi >•••> xk, xk+i) =

= (Fk — f (xi > •••> xk)) * xk+i ^ Cha * suPP {xk+i} ■

Теорема доказана.

Рассмотрим пример, который иллюстрирует теорему 1. Пусть функция представлена в виде

f (x, у) = xy + x + у +1 = (x +1)(у + 1) .

Заметим, что только второе представление функции в виде произведения двух сомножителей подпадает под условие теоремы 1 и, следовательно, естественное гистограммное расширение будет аппроксимировать

вероятностное с точностью O(ha).

Теорема 2. Пусть для функции f(x1,...,xn) возможна замена переменных, такая что f (z1,.,zk) -рациональная функция от переменных z1,.,zk, удовлетворяющая условиям теоремы 1, и Zj - функции от множества переменных x;, i e Ind;, причем множества Ind; попарно не пересекаются. Пусть для каждой функции zi можно построить вероятностное расширение. Тогда естественное расширение f(z1,.,zk) будет аппроксимировать вероятностное расширение

f (x1,..v xn ).

Пример 1. Пусть f (x1, x2) = (—x2 + x1)sin(x2). Тогда z1 = (—x12 + x1) и z2 = sin( x2). Заметим, что можно построить вероятностные расширения функций z1, z2, где f = z1 z2 - рациональная функция, подпа-

дающая под условия теоремы 1. Следовательно, естественное расширение этой функции будет аппроксимировать вероятностное расширение / (х1, х2).

Рассмотрим случай, когда для / (х1,..., хп) необходимо найти вероятностное расширение /, но не удается построить замену переменных согласно теореме 2. Пусть для определенности только х1 встречается несколько раз. Заметим, что если подставить вместо случайной величины х1 детерминированную (, то для функции /(/, х2,..., хп) можно построить естественное вероятностное расширение. Пусть t - дискретная случайная величина, аппроксимирующая х1 следующим образом: t принимает значения ti с вероятностью Рг - и пусть для каждой /(^,х2,...,хп) можно построить естественное вероятностное расширение фг. Тогда вероятностное расширение / функции /(х1,...,хп) можно аппроксимировать плотностью вероятности ф следующим образом:

ф© =£р ф. ©.

г=1

Пример 2. Пусть /(х, у) = х2у + х, где х, у - равномерные случайные величины, заданные на [0,1]. Заменим х дискретной случайной величиной t, {^ |^ = (г-0.5)/п,г = 1,2,...,п}, Рг = 1 /п. Далее вычислим естественные вероятностные расширения фг (табл. 1). Сравнение ф и /, вероятностного расширения / (х, у) показывает хорошее приближение: ф аппроксимирует /с порядком а = 1,499 8.

Таблица 1

Погрешность аппроксимации вероятностных расширений

n II f — Ф 112

10 1,2887825282E - 03

20 4,5592973952E - 04

40 1,6120775967E - 04

80 5,6996092139E - 05

160 2,0151185588E - 05

Важно отметить, что число арифметических операций для вычисления х * у имеет порядок O(n2), где п - размерность сетки гистограмм. Гистограмма как кусочно-постоянная функция приближает плотность вероятности с точностью O(1 / п). Однако уже средние точки гистограмм приближают плотность вероятности с точностью O(1 / п2). Как показано в [4], нижняя оценка скорости сходимости гистограммных расширений к вероятностным имеет значение а = 1 (реально это значение несколько выше). Численные же эксперименты подтвердили, что в условиях теоремы 1 при правильном согласовании сеток гистограмм и использовании более тонких способов интегрирования гистограммные расширения имеют скорость сходимости а » 2.

Сравним полученные результаты с методом Монте-Карло. Известно, что метод Монте-Карло имеет

сходимость 0(1 / ), где N - число повторов [1].

Гистограммные же расширения имеют скорость сходимости 0(1 / па).

Пусть необходимо достигнуть точности є. Число операций метода Монте-Карло при этом составит 0(є—2), число операций с гистограммной арифметики - 0(є—2/а), следовательно гистограммная арифметика при а > 1 эффективнее метода Монте-Карло примерно в 0(є—2(1—1а)) раз.

Проиллюстрируем эффективность гистограммной арифметики на численном примере.

Пример 3. Пусть требуется найти сумму трех равномерно распределенных на [0, 1] случайных величин. Вычисления при п = 30 показывают, что ошибка при использовании численных операций гистограмм-ной арифметики в норме 12 составляет 1,1680Е - 03; ошибка метода Монте-Карло при числе бросаний N = 105 равна 5,4601Е - 03, а при числе бросаний N = 106 - 2,0284Е - 03, что сравнимо с погрешностью гистограммной арифметики. При этом число арифметических операций гистограммной арифметики определяется величиной порядка 302 или 103 , а метода

Монте-Карло - величиной порядка 106. Таким образом, в данном примере гистограммная арифметика эффективнее метода Монте-Карло примерно в тысячу раз.

Для решения ряда практических задач необходимо решать системы линейных и нелинейных уравнений. Методы их решений рассмотрены в работе [3].

В случае нахождения корня одномерного уравнения / (х, к) = 0, где к - случайный вектор параметров, предположим, что корень локализован на отрезке [а, Ь ], фг - вероятностное расширение

/(г,к), г є [а, Ь]. Тогда Р(г) есть вероятность, что корень лежит левее (правее) точки г:

0

Р(г) =| фг ©^. (2)

—ад

Применение численного вероятностного анализа рассмотрим на примере.

Пример 4. Пусть завод производит некоторую продукцию и осуществляет ее реализацию. По наблюдениям известна гистограмма Уі покупок г-го товара, например, за неделю. Это означает, что известна плотность вероятности продажи товара

Рі, ¥г є [ Уг > Уі ].

Пусть доход Д линейно зависит от продажи

товара Д = аУі. Будем считать, что производство

і-го товара не зависит от производства других товаров. Тогда общий доход будет просто суммой всех доходов по продажам всех товаров. Поэтому мы

можем рассмотреть производство только одного вида продукции и для простоты индекс опустим.

Применим гипотезу: завод несет убытки, если товар произведен в объеме R, но продано Y < R. Величина убытков U линейно зависит от разницы P(Y - R) < 0.

Пусть завод произвел товар объемом R. Оценим возможный доход:

R

D = aj p( y) ydy, и возможный убыток

R

U = pj p( y)( y - R)dy. y

Заметим, что в этой постановке нам нужно максимизировать сумму D + U ^ max:

R R

f (R) = (D + U)(R) = aj p( y) y dy + p j p( y)( y - R)dy =

y y

R R

= (a + P) j p( y) y dy - PR j p(y)dy ^ max.

y I

Приведем графики зависимости «производство-прибыль» при различных значениях параметров а и р (рис. 1). В расчетах величина a = 1, кривые 1-5 соответствуют значениям р = 0,3 (кривая 1), р = 0,4 (кривая 2), р = 0,5 (кривая 3), р = 0,7 (кривая 4), р = 1 (кривая 5).

Рис. 1. Графики зависимости «производство-прибыль»

Таким образом, при небольших значениях р увеличение производства покрывает возможные убытки перепроизводства, но при сравнительно больших значениях р величину производства К следует ограничивать исходя из максимального значения О + и.

В качестве примера использования численных операций над гистограммными переменными рассмотрим задачу принятия решения об инвестировании проекта выпуска лекарственного препарата [2].

Пример 5. Компания рассматривает вопрос о приобретении для последующего производства патента нового лекарственного препарата. Стоимость патента составляет 3,4 млн долл. Решение принимается на основе анализа дисконтированных денежных потоков

по значениям рассчитанных показателей NPV и IRR. Горизонт расчетов - три года. Согласно прогнозам, компания в первый, второй и третий годы реализации проекта продаст соответственно 802 тыс., 967 тыс. и 1 132 тыс. упаковок лекарства по цене 6, 6,05 и 6,10 долл. за упаковку. Ставка налога на прибыль равна 32 %, ставка дисконтирования - 10 %, себестоимость - 55%, операционные издержки -15% от цены препарата.

По результатам расчетов IRR проекта составляет 15 %, а NPV - 344,8 тыс. долл. Стандартная финансовая модель приведена в табл. 2.

В данном случае мы имеем дело с высоким уровнем рыночной неопределенности, поэтому стандартная финансовая модель не дает достаточных оснований для принятия решения. Для одновременного учета неопределенности в цене, продажах, себестоимости и издержках применяется численный вероятностный анализ. Основные параметры финансовой модели: цена и объем продаж - моделируются как случайные переменные, имеющие вероятностное распределение. Численный вероятностный анализ позволит понять, какие факторы повлияют на финансовые результаты проекта в наибольшей степени.

Для моделирования цены продажи (отдельно за первый, второй и третий год реализации проекта) используется треугольное распределение.

Данное распределение имеет три параметра: минимальное значение, максимальное значение и наиболее вероятное значение. Цена продажи в первый год имеет минимальное значение 5,90 долл., максимальное значение - 6,10 долл., наиболее вероятное значение - 6,00 долл. Аналогично цена продажи во второй год имеет треугольное распределение с параметрами 5,95, 6,05, 6,15 долл. Цена продажи на третий год имеет треугольное распределение с параметрами 6,00, 6,10, 6,20 долл.

Объем продаж моделируется как случайная переменная с нормальным распределением. При этом в первый год нормальное распределение имеет среднее значение (математическое ожидание) 802 тыс. долл. и стандартное отклонение 25 тыс. долл., во второй год - 967 тыс. долл. и 30 тыс. долл. и в третий год -1 132 тыс. долл. и 25 тыс. долл. соответственно. Предполагается, что себестоимость (процент от продаж)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

имеет треугольное распределение с минимальным значением 50 %, максимальным значением 65 % и наиболее вероятным значением 55 %.

Следует отметить, что в данном случае треугольное распределение имеет не симметричную форму, а немного скошено вправо. Поэтому велика вероятность того, что себестоимость будет завышена, а не занижена по сравнению с наиболее вероятным значением. Операционные издержки (процент от продаж) моделируются с нормальным распределением с ожиданием 15 % и стандартным отклонением 2 %.

Для данного проекта NPV вычислялся по формуле

NPV(r) = 0,8181818 • 0,68zjäj х

3

ху ----3 400 000,

+ г)г

где с - цена в i-й год; xi - продажи в i-й год; s1 -себестоимость; z1 - издержки. Заметим, что в этой формуле каждая случайная величина встречается только один раз.

Расчеты велись при размерности гистограмм n = 50. Сравнение вычисления NPV методом Монте-Карло показало, что при числе экспериментов N = 1000 000 результаты совпадают с гистограмм-

ным расчетом с точностью до трех-четырех знаков после запятой. Численные эксперименты продемонстрировали, что при этом гистограммная арифметика более чем в триста раз быстрее.

Внутренняя норма доходности IRR определяет максимально приемлемую ставку дисконта, при которой можно инвестировать средства без каких-либо потерь для собственника: IRR = r, и при которой NPV(r) = 0.

Для вычисления IRR необходимо решать нелинейные уравнения. В случае гистограммного анализа использовалась формула (2). Таким образом, вычисление гистограммы корня нелинейного уравнения свелось к вычислению соответствующих интегралов от гистограммных расширений.

Анализ гистограмм NPV и IRR (рис. 2) показывает, что вероятны как крайне негативные исходы, так и значительная прибыль по сравнению со стандартным анализом.

Таблица 2

Стандартная финансовая модель

Показатель Год 0 Год 1 Год 2 Год 3

Цена упаковки, долл. - 6,00 6,05 6,10

Количество проданных штук - 802 000 967 000 1 132 000

Выручка, долл. - 4 812 000 5 850 350 6 905 200

Себестоимость, долл. - 2 646 600 3 217 693 3 797 860

Валовая прибыль, долл. - 2 165 400 2 632 658 3 107 340

Операционные издержки, долл. - 324 810 394 899 466 101

Чистый доход до налогов, долл. - 840 590 2 237 759 2 641 239

Налоги, долл. - 588 989 716 083 845 196

Стартовые инвестиции, долл. 3 400 000 - - -

Чистый доход, долл. 3 400 000 251 601 1 521 676 1 796 043

Рис. 2. Гистограммы NPV и IRR

На основании последнего примера можно сделать вывод о том, что применение гистограммной арифметики в рамках технологии визуально-интерактивного моделирования (ВИМ) [6] позволяет лицу, принимающему решение, увидеть возможные варианты негативных исходов реализации проекта в отличие от стандартного анализа, который дает только положительный ответ.

Таким образом, проведенные авторами теоретические и практические исследования приводяи к двум основным выводам:

- гистограммная арифметика может рассматриваться как элемент численного вероятностного анализа, который позволяет работать с неопределенными данными в рамках различных практических приложений;

- гистограммная арифметика может использоваться как инструмент технологии визуально-интерактивного моделирования, что значительно повышает качество анализа возможных вариантов решений и дает удобное средство для их принятия.

Библиографические ссылки

1. Соболь И. М. Численные методы Монте-Карло. М. : Наука, 1973.

2. Лукашов А. В. Метод Монте-Карло для финансовых аналитиков: краткий путеводитель // Упр. кор-поратив. финансами. 2007. № 1. С. 22-39.

3. Добронец Б. С., Попова О. А. Численные операции над случайными величинами и их приложения // J. of Siberian Federal Univ. Mathematics & Physics. 2011. Т. 4, № 2. С. 229-239.

4. Герасимов В. А., Добронец Б. С., Шустров М. Ю. Численные операции гистограммной арифметики и их применения // Автоматика и телемеханика. 1991. № 2. С. 83-88.

5. Добронец Б. С. Интервальная математика / Краснояр. гос. ун-т. Красноярск, 2004.

6. Добронец Б. С., Попова О. А. Применение гистограммной математики в экономических задачах исследования операций // Тр. VI Моск. междунар. конф. по исслед. операций / отв. ред. П. С. Красноще-ков, А. А. Васин. М. : МАКС-Пресс, 2010. С. 90-92.

B. S. Dobronets, O. A. Popova

ELEMENTS OF A NUMERICAL PROBABILISTIC ANALYSIS

In this paper the authors define the notion of a numerical probabilistic analysis. Its elements are considered in terms of theories and their applicability in practice. The authors explore the notion of probabilistic extensions, present overview of the approaches to the calculation of functions of random arguments and operations on them, and provide with examples of elements of the analysis in the practice of solving economic problems. It is shown that this approach can be considered in some cases, as a real alternative to the Monte Carlo method that can significantly improve the calculation accuracy and to reduce their volume.

Keywords: numerical probabilistic analysis, probabilistic extension, numerical operations on random variables, histogram arithmetic, functions of random arguments, stochastic linear and nonlinear equations.

Элементы численного вероятностного анализа Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Добронец Борис Станиславович, Попова Ольга Аркадьевна

Похожие темы научных работ по математике , автор научной работы — Добронец Борис Станиславович, Попова Ольга Аркадьевна

ELEMENTS OF A NUMERICAL PROBABILISTIC ANALYSIS

Текст научной работы на тему «Элементы численного вероятностного анализа»