Научная статья на тему 'Агрегированное среднее как процедура обработки системной информации'

Агрегированное среднее как процедура обработки системной информации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
316
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГУЛЯРНОЕ СРЕДНЕЕ / ВЗВЕШЕННОЕ СРЕДНЕЕ / АГРЕГИРОВАННОЕ СРЕДНЕЕ / АБСТРАГИРОВАНИЕ / ФИНАНСОВЫЕ СИСТЕМЫ / МОДЕЛИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тубольцев М. Ф., Маторин С. И., Тубольцева О. М.

Рассматриваются различные процедуры усреднения как средство абстрагирования при моделировании совокупностей объектов предметной области. Вводится понятие агрегированного среднего, расширяющее классическое понятие регулярного среднего с множества скалярных значений на совокупности объектов. Необходимость рассмотрения не классических процедур усреднения связана с потребностями разработки прикладных системных методов в конкретных предметных областях, где требуется моделировать совокупности объектов, не обладающих статистической репрезентативностью. Поскольку в таких ситуациях статистические методы не применимы, используются системы объектов и методы общей теории систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Агрегированное среднее как процедура обработки системной информации»

УДК 303.732.4

АГРЕГИРОВАННОЕ СРЕДНЕЕ КАК ПРОЦЕДУРА ОБРАБОТКИ СИСТЕМНОЙ ИНФОРМАЦИИ

М.Ф. ТУБОЛЬЦЕВ С.И. МАТОРИН ОМ. ТУБОЛЬЦЕВА

e-mail:

[email protected] [email protected]

Рассматриваются различные процедуры усреднения как средство абстрагирования при моделировании совокупностей объектов предметной области. Вводится понятие агрегированного среднего, расширяющее классическое понятие регулярного среднего с множества скалярных значений на совокупности объектов.

Необходимость рассмотрения не классических процедур усреднения связана с потребностями разработки прикладных системных методов в конкретных предметных областях, где требуется моделировать совокупности объектов, не обладающих статистической репрезентативностью. Поскольку в таких ситуациях статистические методы не применимы, используются системы объектов и методы общей теории систем.

Ключевые слова: регулярное среднее, взвешенное среднее, агрегированное среднее, абстрагирование, финансовые системы, моделирование.

При моделировании различных объектов или процессов, после постановки цели моделирования, необходимым этапом является абстрагирование от несущественных для сути дела деталей. Сама процедура абстрагирования осуществляется в каждом конкретном случае по-разному и плохо формализуется.

Важным моментом при создании математической модели является определение фазового пространства модели, т.е. множества возможных значений всех существенных для целей моделирования атрибутов (параметров). Количество атрибутов модели в процессе абстрагирования стараются оптимизировать: если оставить слишком мало атрибутов, то модель получится сильно упрощенной и не адекватной; если оставить слишком много атрибутов, то размерность фазового пространства будет большой, а модель - трудной для изучения и практических расчетов.

На практике часто встречается ситуация (например, в системах массового обслуживания), когда необходимо смоделировать поведение совокупности однородных (однотипных) объектов, каждый из которых обладает небольшим набором атрибутов. Размерность фазового пространства модели кардинально сократиться, если считать все моделируемые объекты клонами некоторого объекта — «типичного» представителя объектов совокупности. Очевидно, что значения атрибутов этого «типичного» представителя должны быть такими, чтобы при замене объектов совокупности на клоны модель не сильно потеряла бы в качестве и оставалась адекватной.

В простейшем случае процедура вычисления значений атрибутов «типичного» представителя объектов совокупности может производиться для каждого атрибута независимо от других, и, в силу традиции, называется усреднением. Происхождение термина трудно проследить ввиду повсеместного и давнего его использования, но гораздо важнее то, что под этим термином скрывается целое семейство вычислительных процедур: среднее арифметическое, среднее геометрическое и т.п.

Исчерпывающее описание процедур вычисления так называемого регулярного среднего дано А.Н.Колмогоровым [1]. Последовательность функций Mn определяет регулярный тип среднего, если выполняются следующие условия (Колмогоров):

I. M(xi,x2/...,xn) непрерывна и монотонна по каждому переменному;

II. M(xi,x2,.. .,xn) — симметричная функция;

III. среднее от одинаковых чисел равно их общему значению: M(x,x,...,x) = x;

IV. можно заменить некоторую группу значений их собственным средним, не меняя общего среднего: M(xi,x2,...,xm,yi,...,yn) = Mn+m(x,x,...,x,yi,...,yn), где x = M(xi,x2,...,xn).

Теорема 1 (Колмогоров). При выполнении условий I-IV среднее M(x1,x2,.,xn) имеет вид

)=¥ { ф( X) + ф (X ) + • • • + Ф (X ) 2 I П

где ф — непрерывная строго монотонная функция, а ^ - обратная к ней

M (xi, x2 ,..., xn ) = V ii^^i^z-zw^ (i)

Условия 1-1У (условия Колмогорова) выражают наиболее общие и важные требования к процедуре усреднения. При выборе различных функций ф получаются различные частные процедуры усреднения:

1) если ф (х) = ах + Ь — линейная функция, то получаем

л

среднее арифметическое;

М (х!, Х2 х„ )

(х + х +—+ х

_п_

п

2) если ф (х) = 1п х - логарифмическая функция, то получаем М(х, х2,..., х) = ^хх ' ' ' х„, среднее геометрическое;

и т. д.

( ехр| -+ ехр - - + • • • + ехр(-:

к I

(2)

Алгоритм той или иной процедуры усреднения определяется видом функции ф , отражающей специфику прикладной задачи. На математическом уровне абстрагирования, когда требуется только выполнение условий 1-1У, подходит любая непрерывная строго монотонная функция. Специфика предметной области может потребовать выполнения некоторых дополнительных условий, и, даже, отказа от некоторых из условий 1-1У.

Так В.П.Маслов [2], дополнив условия Колмогорова условием:

V. М(х + а,х + а,..., х + а) = М(х, х,..., х) + а, получил, что ф (х) = ах + Ь или ф(х) = С ехр(Бх) + В . Нелинейная операция усреднения (осреднения по терминологии Маслова) в случае функции ф(х) = ехр(-х / И) нашла применение, как в экономике, так и квантовой статистике [3-5]. Процедура осреднения Маслова имеет вид:

(х _ ^ ( х

М (х, х,..., х) = -И 1П 1—1-1

1 2 п | п

где И — некоторое число. Если в формуле (2) перейти к пределу при И —> ~ , то среднее Маслова переходит в среднее арифметическое. Таким образом, при больших положительных значениях И среднее Маслова мало отличается от среднего арифметического.

Однако потребности приложений требуют применения не только регулярного среднего. Регулярные методики усреднения применимы в тех случаях, когда вся необходимая для вычисления среднего значения информация содержится в значениях усредняемого параметра (атрибута), а так бывает далеко не всегда. Следующий элементарный пример показывает, что информации о значениях усредняемого параметра может оказаться недостаточно для вычисления среднего значения.

Пусть сельхозпредприятие выращивает на двух полях пшеницу, и урожайность после уборки полей составила на первом поле 20 центнеров с гектара, а на втором — 40. Очевидно, что среднюю урожайность на этих двух полях нельзя вычислить, зная только значения урожайности на каждом из полей. Необходимо использовать дополнительно другую существенную для процедуры усреднения информацию об объектах: в данном случае это информация о значениях таких атрибутов как площадь каждого из полей (или объем собранного на полях урожая). Знание этой дополнительной информации уже достаточно (вместе с информацией об урожайности) для усреднения: если поля равны по площади, то средняя урожайность составит 30 центнеров с гектара, а если площадь второго поля в три раза больше, то средняя урожайность будет 35 ц./г. и т.д.

Ситуация будет аналогичной, если усреднять любой параметр (атрибут), значение которого не измеряется непосредственно, а вычисляется на основе значений других измеримых параметров. Этот класс задач (и некоторые другие) приводит к понятию взвешенного среднего, вычисление которого осуществляется по формуле:

п_ п

М (х, х2 ,..., хп ) = X , = 1 (3)

г =1 г =1

Из условий для взвешенного среднего в общем случае условие II не выполняется, и, следовательно, его нельзя относить к регулярному среднему. Тем не менее, оно широко используется, например, в физике при вычислении центра тяжести совокупности материальных точек и т.п.

Если вернуться к рассмотренному примеру, то окажется, что основная трудность состояла не в поиске процедуры усреднения, а в концептуальном определении того, что следует пон имать под средней урожайностью для некоторой совокупности полей. Занимаясь моделированием в рамках некоторой предметной области, не всегда можно абстрагироваться на математическом уровне и применять регулярное среднее. Чаще необходимо, погрузившись в контекст практической задачи, учитывать закономерности и ограничения предметной области.

В нашем примере сначала осуществляется агрегирование объектов, т.е. представление всей совокупности объектов в виде одного объекта того же типа, а затем за среднее значение атрибута на совокупности принимается значение соответствующего атрибута агрегированного объекта. Два поля виртуально представляются в виде одного поля, площадь которого равна сумме площадей отдельных полей, а собранный урожай — сумме урожаев. Урожайность этого виртуального поля и принята в качестве среднего значения урожайностей на двух данных полях.

Таким образом, можно ввести понятие агрегированного среднего, когда сначала выполняется процедура построения виртуального агрегированного объекта из некоторой совокупности однородных объектов, а затем для агрегированного объекта определяется значение атрибута, принимаемое за среднее на всей совокупности.

Построение агрегированного объекта из некоторой совокупности объектов возможно только при выполнении определенных условий.

1. Объекты совокупности должны все обладать некоторым общим набором характеризующих их атрибутов, существенных для целей моделирования. Т. е., в данном случае рассматривается агрегирование однотипных объектов, в отличие от агрегирования путем сборки из разнотипных элементов.

2. Должна существовать возможность представления всей совокупности объектов в виде одного объекта того же типа, имеющего, следовательно, тот же набор атрибутов, что и каждый объект совокупности. Другими словами, все объекты, в том числе полученный агрегированием, можно рассматривать в одном и том же фазовом пространстве.

3. Агрегированный виртуальный объект должен быть реализуемым, т.е. факт его существования не должен противоречить основным законам и ограничениям предметной области.

4. Для агрегированного среднего должен выполняться аналог второго условия для регулярного среднего. Второе условие Колмогорова гарантирует, что значение среднего не зависит от порядка следования значений усредняемого параметра в вычислениях. В случае совокупности объектов результат агрегирования не должен зависеть от нумерации объектов и порядка их участия в процедуре агрегирования.

5. Для агрегированного среднего должен выполняться аналог четвертого условия для регулярного среднего. Четвертое условие Колмогорова гарантирует, что значение среднего сохраняет всю существенную информацию о совокупности скаляров, достаточную для вычисления среднего при расширении совокупности. В случае совокупности объектов агрегированный объект может использоваться вместо первоначальной совокупности объектов, если первоначальная совокупность объектов расширена и требуется повторное агрегирование.

Важно отметить, что эффективность и полезность агрегирования для приложений в рамках некоторой предметной области определяется не только самой процедурой агрегирования, но и в значительной степени выбором объектов, допускающих агрегирование.

Правильному отбору таких объектов в контексте предметной области помогает использование системного подхода. При этом общая теория систем выступает в роли метатеории, помогающей правильным образом структурировать предметную область, отобрать объекты изучения, выбрать уровень абстрагирования.

В качестве не тривиального примера рассмотрим применение агрегированного среднего в теории финансовых вычислений. Исходным будет понятие финансового события — базового

объекта предметной области: 5 = с1 ), где £ есть хронологический момент времени, а ё — стоимость определенного финансового актива в некоторой валюте. Финансовым накопителем будем называть любую сущность, способную аккумулировать финансовые активы и обмениваться ими с другими финансовыми накопителями или внешними сущностями. Каждое финансовое событие ассоциировано с хотя бы одним финансовым накопителем, т.е. означает поступление или отток финансового актива.

Любая совокупность финансовых событий {5.} = 1,2,..., п , ассоциированных с некоторым

финансовым накопителем, порождает финансовый поток {(£г- , С } = 1,2,..., п, где С = , I = 1,2,..., п в зависимости от того увеличивается (+) или уменьшается (-) после

наступления финансового события финансовый актив. С каждым финансовым потоком свяжем характеристическую функцию потока (операции):

n

F (V ) = ^ cV4 "io , (4)

i =1

где t0 = min(ij,t2 ,...,t„) , а V€ (0, 1) . По смыслу V является множителем дисконтирования, а F(V)

— чистым приведенным значением финансового потока. Множитель дисконтирования связан со

ставкой сравнения соотношением: V = (1 + r) l, r € (0, <») .

Совокупность финансовых событий }i = 1,2,..., n , ассоциированных с некоторым

финансовым накопителем, называется финансовой операцией, если характеристическая функция потока обращается в ноль. Таким образом, финансовую операцию A (Action) можно на уровне абстрагирования, принятом в финансовой математике, отождествлять с ее финансовым потоком, поскольку доходность финансовой операции определяется значением корня характеристической функции потока.

Следует отметить, что современная финансовая математика ориентирована на изучение как отдельных финансовых событий (динамика рыночных цен и т.д.), так и совокупностей финансовых событий, привязанных к некоторому юридическому или физическому лицу — владельцу финансового потока. Используемый нами термин финансовый накопитель близок по смыслу термину владелец финансового потока, но лучше вписывается в архитектуру системного подхода.

Несмотря на многочисленные достижения современной финансовой математики, в первую очередь связанные с применением стохастических методов [6], многие задачи не имеют удовлетворительного решения. Так, например, метод эквивалентной замены платежей [7], являющийся основным инструментом реструктуризации, применяется к любым совокупностям финансовых событий. В результате столь широкого применения метод получился незамкнутым в том смысле, что требует априорного задания ставки сравнения, для правильного выбора которой нет теоретических или эмпирических рекомендаций.

В противоположность этому, смысл системного подхода к финансовым вычислениям состоит в том, чтобы указать класс объектов — финансовые системы, для которых большинство задач финансовых вычислений становятся простыми (при этом, вычислительная сложность задач остается высокой). В частности, все задачи реструктуризации становятся замкнутыми и не требуют задания какой-либо априорной информации [8].

Ключом к построению теории финансовых систем, разрабатываемой авторами, является разработка процедуры вычисления агрегированного среднего для атрибута доходности финансовых операций — основных объектов предметной области финансовых вычислений. Пусть

{Ак}к = 1,2,..., N — некоторая совокупность финансовых операций, {tk}к = 1,2,..., N — моменты начала финансовых операций, а {F(V)}к = 1,2,..., N — характеристические функции операций. Определим финансовый поток совокупности финансовых операций {Ак}к = 1,2,..., N как теоретико-множественное объединение финансовых потоков отдельных операций. Тем самым определена процедура агрегирования совокупности финансовых операций M (A, А,..., AN) и характеристическая функция, которая может быть вычислена по формуле:

N

F (V ) = X Fk (V )Vtk —t0 , (5)

к =1

где to = minft, ¿2 ,...Л ) .

Агрегированное среднее г({Ак}) доходности совокупности финансовых операций {Ак}к = 1,2,..., N можно вычислить, если существует корень уравнения F(V)=0 - V0, тогда

r({Ak }) = V 1 — 1 . Проблема заключается в том, что не всякая совокупность финансовых операций

дает в результате агрегирования финансовую операцию. Характеристическая функция, определенная формулой (5), не обязана иметь корень, несмотря на наличие корней у всех

характеристических функций {Fk(V)}к = 1,2,..., N .

Целесообразно поэтому ограничится использованием только таких совокупностей

финансовых операций {Лк}к = 1,2,..., N, для которых М(А, А,..., Л) — агрегированный объект

также является финансовой операцией. Только в этом случае у агрегированного объекта существует атрибут доходности, который может интерпретироваться как агрегированное среднее

совокупности финансовых операций {Лк}к = 1,2,..., N . Такие совокупности финансовых операций

{А}к = 1,2,..., N будем называть системами финансовых операций или просто финансовыми системами.

Финансовые системы оказались полезными при решении задач реструктуризации финансовых операций [8], проектировании комбинированных финансовых операций [9], а также в задачах моделирования. При этом, от финансовых систем не требуется никаких свойств статистической репрезентативности — системные методы продолжают эффективно работать даже в случае тривиальных систем, состоящих из одной финансовой операции (например, реструктуризация выплат по долгосрочному кредиту).

Как ясно из предыдущего, эффективность системного подхода в решении задач конкретной предметной области определяется процедурой агрегирования объектов предметной области и выбором объектов агрегирования. Чрезмерное расширение множества агрегируемых объектов делает процедуру агрегирования некорректной (доходность произвольной совокупности финансовых операций может не существовать). Напротив, резкое сужение множества агрегируемых объектов делает процедуру агрегирования малосодержательной, поскольку многие важные объекты предметной области выпадают из рассмотрения.

Определенная для систем финансовых операций процедура агрегирования

М (Д, Л2 ,..., Л1 ) обладает свойствами регулярного среднего за исключением первого, которое для

объектов определить нельзя, поэтому можно сделать вывод, что агрегированное среднее для финансовых операций является специализированным расширением регулярного среднего на случай применения в области финансовых вычислений.

Список литературы

1. Колмогоров А.Н. // Избранные труды по математике и механике, 1985. С. 136-137.

2. Маслов В.П. Нелинейное среднее в экономике // Матем. заметки. 2005. Т. 78. №3. С. 377-395.

3. Маслов В.П. Расходы покупателей и скорость оборота при нелинейном финансовом осреднении.

Законы эконофизики // Докл. РАН. 2004. Т. 396. №2.

4. Маслов В.П. Нелинейное финансовое осреднение, эволюционный процесс и законы эконофизики

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

// Теор. вероятн. и ее применен. 2004. Т.49. №2. С.34.

5. Маслов В.П. Эконофизика и квантовая статистика // Матем. заметки. 2002. Т. 72. №6. С. 883-891.

6. Ширяев А.Н. Основы стохастической финансовой математики. Т. 1,2. -М.: Фазис, 1998.

7. Четыркин Е.М. Методы финансовых и коммерческих расчетов. — М.: Дело, 1995, с. 137.

8. Тубольцев М.Ф. Математические методы в системном анализе финансовых операций //Вестник

ВГУ, Серия: Системный анализ и информационные технологии, 2008, №1. с.124 — 133.

9. Тубольцев М.Ф., Маторин С.И., Тубольцева О.М. Системный подход к

построению

комбинированных схем ипотечного кредитования// Труды ИСА РАН, том 62, выпуск 1, 2012. — стр. 91100.

AGGREGATED AVERAGE AS A PROCEDURE OF SYSTEM INFORMATION

PROCESSING

M.F. TUBOLTSEV S.I. MATORIN O.M.TUBOLTSEVA

Belgorod National

Research University

e-mail:

Tuboltsev @bsu.edu.ru [email protected]

The different averaging procedure as a means of abstraction for modeling sets of domain objects. The notion of an aggregate average, extending the classical notion of regular medium with a set of scalar values on a set of objects.

The need of considering no classical averaging procedures related to the needs of system development methods applied in specific subject areas where you want to simulate a set of objects that do not have the statistical representativeness. Because these situations do not apply statistical methods are used the system of objects and methods of general systems theory.

Keywords: regular average, weighted average, the average aggregate, abstracting, financial systems, modeling.

i Надоели баннеры? Вы всегда можете отключить рекламу.