Научная статья на тему 'Проблема распознавания событий в поле центральных сил и прогнозирование курсов валют'

Проблема распознавания событий в поле центральных сил и прогнозирование курсов валют Текст научной статьи по специальности «Математика»

CC BY
147
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АСТРОНОМИЯ / АСТРОСОЦИОТИПОЛОГИЯ / ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ / СЕМАНТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ МОДЕЛИ / СОЛНЕЧНАЯ СИСТЕМА / КУРС ВАЛЮТЫ / ПРОГНОЗ / ASTRONOMY / ASTROSOCIOTYPOLOGY / COMPUTATIONAL EXPERIMENT / SEMANTIC INFORMATION MODELS / SOLAR SYSTEM / CURRENCY FORECAST

Аннотация научной статьи по математике, автор научной работы — Трунев Александр Петрович

Обсуждается проблема распознавания событий в поле центральных сил. Развита модель прогнозирования курсов валют на основе астрономических параметров

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE EVENTS RECOGNITION PROBLEM IN THE FIELD OF CENTRAL FORCES AND CURRENCY FORECAST

The events recognition problem in the field of central forces is discussed in the article. The currency forecast model based on the astronomical data is developed

Текст научной работы на тему «Проблема распознавания событий в поле центральных сил и прогнозирование курсов валют»

УДК 303.732.4

ПРОБЛЕМА РАСПОЗНАВАНИЯ СОБЫТИЙ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ И ПРОГНОЗИРОВАНИЕ КУРСОВ ВАЛЮТ

Трунев Александр Петрович к. ф.-м. н., Ph.D.

Директор, A&E Trounev IT Consulting, Торонто, Канада

Обсуждается проблема распознавания событий в поле центральных сил. Развита модель прогнозирования курсов валют на основе астрономических параметров

Ключевые слова: АСТРОНОМИЯ, АСТРОСОЦИОТИПОЛОГИЯ, ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ, СЕМАНТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ МОДЕЛИ, СОЛНЕЧНАЯ СИСТЕМА, КУРС ВАЛЮТЫ, ПРОГНОЗ

UDC 303.732.4

THE EVENTS RECOGNITION PROBLEM IN THE FIELD OF CENTRAL FORCES AND CURRENCY FORECAST

Alexander Trunev Ph.D.

Director, A&E Trounev IT Consulting, Toronto, Canada

The events recognition problem in the field of central forces is discussed in the article. The currency forecast model based on the astronomical data is developed

Keywords: ASTRONOMY, ASTROSOCIOTYPOLOGY, COMPUTATIONAL EXPERIMENT, SEMANTIC INFORMATION MODELS, SOLAR SYSTEM, CURRENCY FORECAST

В работах /1-2/ была сформулирована теорема астросоциотипологии, которая устанавливает зависимость функции распределения случайных событий, происходящих на земле от кинематических и динамических параметров нашей планеты при ее движении вокруг Солнца. Одним из следствий этой теоремы является то, что любые непрерывные во времени распределения событий при их представлении в зависимости от координат небесных тел содержат когерентные колебания, обусловленные движением небесных тел /3/. В работе /4/ высказана гипотеза о том, что когерентные колебания могут быть использованы для распознавания событий в астросоциотипологии. В настоящей работе обсуждается проблема распознавания событий в поле центральных сил. Дано решение проблемы на основе системной теории информации. Развита модель прогнозирования курсов валют с использованием астрономических параметров.

Теорема астросоциотипологии

При выводе этой теоремы предполагается /1-3/, что на планете происходит ряд однородных событий, число которых в единицу времени описывается функцией W(t), нормированной на единицу за один период обращения планеты вокруг центрального светила, т.е.

(1)

Период обращения связан с угловой скоростью движения по орбите интегральным соотношением

1 Т

— | (0^ і = 1

2р „

Для замкнутых траекторий эта теорема является следствием дифференциального уравнения, связывающего плотность функции распределения вдоль радиальной и угловой координаты в полярной системе координат

ттл/ ч 7 ТТЛ/ ч Ж , ттг/ ч Сг Wи) 1 .

W ^ і = W ^)—сіг = W ^)----------------------= —— Сії

Сг іії г о(:) (2)

Отметим связь кинематических параметров:

ІГ

Г = О

(3)

Как известно, в поле центральных сил тело совершает финитное движение по эллипсу, уравнение которого в полярной системе координат можно представить в виде:

1

— = а + Ь ео8$ г

1

а = — 2

ґ

11

— + —

Ь = -2

ґ

г г

^ тій тах у

(4)

г , г Здесь тт’ тах

- минимальное и максимальное удаление планеты от центра масс системы.

В поле центральных сил выполняется закон сохранения момента импульса в форме

1

1

wr2 = l = const

Отсюда и из уравнений (3-4) вытекают простые соотношения

Г = lb sin J

( 1 a Y

sin J = ± 1-----------------

V ^br b w (J) = l (a + b cos J)2

sin J = + 1 -

(5)

В случае равновероятных событий положим в уравнениях (2) Щ/)=1, и, используя (5), находим плотности распределения событий вдоль угловой и радиальной координаты

Здесь С1, с2 - постоянные множители, которые можно найти из условия нормирования. Отметим, что полученные плотности (6) зависят от полярного угла (или долготы Солнца) и радиальной координаты, хотя исходное распределение не зависит от времени. Плотность функции распределения в зависимости от расстояния имеет особенности в точках остановки, где радиальная скорость обращается в нуль.

В дискретном случае, рассмотренном в /3-9/ и других работах по астросоциотипологии, вместо уравнения (2) используются нормированные частоты и их стандартные отклонения:

w( J) = c1 / w( J) = c1 /1(a + b cos J)2

(6)

i i ,j

=

II

/ 1 V

, 1 <1< п, 1 £ у £ ^

(7)

Теорема астросоциотипологии непосредственно следует из определений (7), которые не содержат никаких внешних параметров, кроме угловой и радиальной скорости.

Отметим, что при наблюдении с земли за небесным телом, орбита которого близка к окружности, радиальная скорость в системе Земля - небесное тело связана с разностью долгот соотношением /2/:

г = ге(щ -щ^п($-$)

(8)

г, щ , $

Здесь е е е - радиус, угловая скорость Земли, и долгота Солн-

щ, $

ца соответственно, п - угловая скорость вращения небесного тела по орбите вокруг Солнца и его долгота соответственно.

Предположим, что известна функция распределения событий вдоль М = м($)

угловой координаты, , которую нормируем на единицу

1 2р

— | м($^$ = 1

2р 0 (9)

Функция плотности распределения вдоль радиальной координаты может быть получена из дифференциального соотношения:

м($)$ = м($ (г))—& = м(г )йТ

<^г (10)

Отметим, что функция плотности распределения отличается от функции с тильдой в правой части (10) на постоянный множитель, который определяется из условия нормировки. Вместо радиальной переменной удобно использовать нормированную переменную

Г — Г

__ max

Jx —

Г — Г •

max min

Тогда уравнение (10) приобретает вид

dJ w(J)dJ = w(J( x))—dx = w( x)dx

dx (11)

Отсюда следует, что отношение плотностей вдоль угловой и нормированной координаты (с учетом нормировки и положительной определенности плотности) в случае Солнца равно

w(J)/w(x) = Жsin J, 0 £ J £ ж

2 (12)

В случае произвольного небесного тела, используя уравнение (8),

находим:

w(J)/w(x) » C|sin(J—Je)| (13)

Здесь С - постоянный множитель, который определяется из условия

нормировки.

Отметим, что уравнение (12) выполняется с точностью до величины эксцентриситета земной орбиты (или орбиты небесного тела). С той же точностью можно связать между собой функцию плотности распределения

событий по времени W(t) и функцию w w( J). Действительно, используя уравнение (2), находим

W(t)dt = W(t)dJ » —W(t)dJ w(t) 2ж

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, если использовать вместо истинной угловой скорости ее среднее значение, определяемое по периоду обращения планеты, тогда плотность распределения событий по углу связана с плотностью распределения событий по времени простым соотношением:

(14)

Далее заметим, что если функция Ж(^) является регулярной, то и

видно, что эти свойства относятся к непрерывным распределениям событий, тогда как в случае дискретных событий особенности заменяются конечными величинами - пиками событий /1-2/.

Можно показать, что в случае дискретных распределений уравнение

(12) имеет дискретный аналог

Уравнение (15) выполняется тем точнее, чем больше общее число случаев и число ячеек модели, а также число случаев, приходящихся на одну ячейку.

На рис. 1 представлены данные отношения распределений

N (Ъ- )/ N (X-) реализации выбора 20007 респондентов из 37 категорий

нор-

для одной категории с общим числом случаев 13640 в зависимости от мированного угла Ф- / 2р в модели М120. Числа N- (Ъ- ), N - (X- ) определялись на основе комплекса программ «Эйдос-астра» /10-11/ путем суммирования записей банка данных, относящихся к данной категории в данной ячейке. Сплошная линия на рис. 1 представляет правую часть уравнения (15). Наблюдается линейная корреляция данных с теоретической кривой с коэффициентом Я2 = 0.6443.

нения (13) или в точках, где

, в силу уравнения (13). Оче-

(15)

Менее представительные категории имеют большее рассеяние данных относительно теоретической кривой. Поэтому по мере роста числа категорий рассеяние данных возрастает. Тем не менее, данные всех 37 исследованных категорий ложатся вокруг теоретической кривой. На рис. 2

представлены данные отношения распределений N у (Фу ) / N у (Ху ) реализации выбора 20007 респондентов из 37 категорий для десяти наиболее представительных категорий из таблицы 1 работы /9/ с общим числом слу-

Ф, / 2р

чаев 44176 в зависимости от нормированного угла у , в модели М120. Сравнивая данные на рис. 1 и 2 можно сделать вывод, что рассеяние данных относительно теоретической кривой (15) заметно растет с ростом числа категорий. Это связано с тем, что при уменьшении общего числа случаев приходящихся на категорию, уменьшается и число случаев, приходящихся на одну ячейку модели.

Уменьшая число ячеек модели, можно понизить рассеяние данных относительно теоретической кривой за счет увеличения числа случаев, приходящихся на одну ячейку. На рис. 3 представлены данные отношения

N.. (Ф.)/N.. (Х.)

распределений у у у у реализации выбора 20007 респондентов из 37 категорий для пяти наиболее представительных категорий с общим

31176 Фу / 2р

числом случаев 31176 в зависимости от нормированного угла в

модели М22. Для совокупности этих данных наблюдается линейная корреляция с теоретической кривой (представлена квадратными символами на рис. 3) с коэффициентом Я2 = 0.7928.

Рис. 2. Отношение функций плотности распределения событий вдоль угловой и радиальной координаты в модели М120 для десяти категорий

1 -І, -

0С*

•о.'

0.2

0.4 0.6

Ф/2л

0.8

0

О віИ

■ ОБО ОБ^2

X ОБ^3 Ж ОБ^4 • ОБ^5 + ОБ^1_6

- ОБ^1_7

- ОБ^1_8 ОБ^1_9

■ ОБи 10

Таким образом, данные, представленные на рис. 1-3, свидетельствуют, что дискретный аналог уравнения (12) в форме (15) действительно существует. Докажем это утверждение, используя интегральную форму выражения числа событий в данной ячейке и теорему о средней точке, имеем:

Nу (Фу) = N. |ч(Ф^Ф = Niw(Jj )АФ, Фу < ~ < Jj + АФ

ху +Ах

N у (х!) = N , | w(х)йХ = Niw(xj )Ах, ху < ху < Хj + Ах

ху

Здесь N. - общее число случаев данного типа. С учетом полученных выражений составим отношение

N (Ф) = ч(х)АФ

Nij (ху ) Ч(ху )Ах

Далее заметим, что в дискретном случае при выборе равномерной сетки по угловой и радиальной координате, как в работах /1-7/, отношение

АФ / Ах = сош1. Без ограничения общности можно выбрать эту константу так, чтобы получить выражение (15). Следовательно, уравнение (12) действительно выполняется в дискретном случае, причем невязка, необходимая для согласования правой и левой части уравнения (15), определяется выбором средней точки в соответствующих интервалах, т.е.

^(Ф,) р . „ . ч(х1) ™(Ф,)

Для дифференцируемой функции плотности распределения легко показать, что невязка в правой части уравнения (16) стремится к нулю при

АФ, Ах ® 0 О й

условии, что 5 . Однако, для дискретных распределений это

выполняется лишь в том случае, если число случаев, приходящихся на одну ячейку, достаточно велико, что заведомо не выполняется в задачах с конечным числом событий. Для таких задач можно оптимизировать невязку, путем перебора числа ячеек сетки. В частности, для данных, приведенных на рис. 1-3, оптимальное число ячеек сетки М=22.

Полученные выше результаты касаются свойств функции плотности распределения событий по угловой и радиальной координате Солнца отно-

сительно нашей планеты. К сожалению, для других небесных тел солнечной системы не удается получить простой дискретный аналог уравнения

(13), поскольку в правую часть этого уравнения входит разность углов, а не один угол, как в уравнении (12). Кроме того, даже если исходное распределение событий ’(1) является случайным, распределения событий вдоль долготы и расстояния до небесных тел содержат когерентную составляющую, обусловленную периодическим движением нашей планеты. На рис. 4 представлены данные отношения распределений по долго-

N.. (Ф.)/N.. (х.)

те и расстоянию до Венеры - . ] . 3 , реализации выбора 20007

респондентов из 37 категорий для десяти наиболее представительных категорий из таблицы 1 работы /9/ с общим числом случаев 44176 в зависимо-

х = Ф. /2р

сти от нормированного угла 3 в модели М120. В распределении данных отчетливо наблюдаются когерентные колебания, обусловленные периодическим движением Земли и Венеры.

Рис. 4. Отношение функций плотности распределения событий вдоль угловой и радиальной координаты Венеры в модели М120 для десяти категорий

Ф/2л

■ ОБО ОВ^2

X ОВ^Э Ж ОВ^4 • ОВ^5 + ОВ^б

- ОВ^7

- ОВ^в ОВ^9

■ ОВи 10

N.. (Ф.)

На рис. 5 представлены данные абсолютных распределений . .

реализации выбора 20007 респондентов из 37 категорий для пяти наиболее представительных категорий с общим числом случаев 31176 в зависимости от долготы Венеры в модели М120. Из этих данных следует, что распределение событий по долготе Венеры содержит колебания, обусловленные

изменением угловой скорости в системе Венера-Земля. Действительно, как это следует из уравнения (2), плотность распределения событий вдоль угловой координаты изменяется обратно пропорционально угловой скорости, т.е.

м>($ )ф =

^(0 (17)

В случае Солнца это изменение невелико и дается первым уравнение (6). В случае других небесных тел относительное движение велико, что приводит к большому изменению относительной угловой скорости и к появлению колебаний в распределении числа событий, как это видно из данных на рис. 5.

Заметим, что указанным свойством квазипериодичности, обусловленным изменением знака относительной угловой скорости, обладают и распределения относительно долготы других небесных тел. При этом, влияние каждого небесного тела на функцию распределения можно достаточно легко идентифицировать по внешнему виду кривой отношения функций плотности распределения вдоль угловой и радиальной координаты. На рис. 6-9 представлены данные отношения распределений по долготе

N (ф)/N (х1)

и расстоянию -

, реализации выбора 20007 респондентов

из 37 категорий для десяти наиболее представительных категорий из таблицы 1 работы /9/ с общим числом случаев 44176 в зависимости от норми-

х. = ф. /2р

рованного угла 3 3 в модели М120 для Меркурия, Марса Юпи-

тера и Луны соответственно. Можно видеть, что данные на рис. 6-9 группируются сходным образом, но иначе, чем данные для Солнца (рис. 2) и Венеры (рис.4).

Рис. 6. Отношение функций плотности распределения событий вдоль угловой и радиальной координаты Меркурия в модели М120 для десяти категорий

3.5 3

2.5

2

1.5

1

0.5

0

0.2

0.4

0.6

0.8

$ / 2р

I ОБО ОБ^2 > ОБ^3 Ж ОБ^4 ОБ^5 + ОБ^1_6 ■ ОБ^1_7 - ОБ^1_8 ОБ^1_9 ОБи 10

0

Рис. 7. Отношение функций плотности распределения событий вдоль угловой и радиальной координаты Марса в модели М120 для десяти категорий

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3.5 3

2.5 2

1.5 1

0.5 0

Ж

0.2

0.4

0.6

0.8

$/2р

ОБ^1_1 ОБ^1_2 ОБ^1_3 ОБ^1_4 ОБ^1_5 ОБ^1_6 ОБ^1_7 ОБ^1_8 ОБ^1_9 ОБи 10

0

Данные для Юпитера на рис. 8 содержат 12 пиков, обусловленных взаимным когерентным движением Земли и Юпитера на протяжении 12летнего цикла. Данные для Марса и Меркурия при внешнем сходстве рис. 6 и 7 имеют разное рассеяние относительно среднего значения. Данные для Луны группируются аналогично данным для Меркурия и Марса, но со своими специфическими особенностями. Отметим, что все данные на рис. 2, 4, 6-9 изменяются пропорционально радиальной скорости в системе Земля - соответствующее небесное тело.

Рис. 9. Отношение функций плотности распределения событий вдоль угловой и радиальной координаты Луны в модели М120 для десяти категорий

3.5

3

2.5

2

1.5

1

0.5 0

0.2

0.4

0.6

0.8

$/2р

ОБО ОБ^1_2 > ОБ^1_3 Ж ОБ^1_4 ' ОБ^1_5 + ОБ^1_6 ■ ОБ^1_7 ОБ^1_8 ОБ^1_9 ОБи 10

0

Таким образом, в силу уравнения (2), данные распределений относительно координат любого небесного тела - расстояния и долготы, содержат когерентные составляющие, обусловленные периодическим движением небесного тела относительно Земли. Зададимся вопросом, можно ли использовать когерентные возмущения функции плотности распределения данных, обусловленные движением небесных тел для распознавания самих данных по астрономическим параметрам, заданным в момент события -({)1 Ответ является положительным в задачах астросоциотипологии, связанных с распознаванием социальных категорий, причем можно утверждать, что чем больше использовано разнородных входных астрономических параметров, тем выше вероятность распознавания. Например, сочетание параметров долготы и расстояния должно приводить к повышению вероятности распознавания, что было обнаружено в работе /6/. С другой стороны, при замене независимых от долготы небесных тел углов домов на зависимые от долготы параметры склонения, вероятность распознавания должна снижаться, что было обнаружено в работе /14/.

Задача о распознавании социальных категорий в поле центральных сил

Сформулируем задачу распознавания социальных категорий, рассматривая их как совокупность событий выбора самих категорий множеством респондентов. Тогда момент рождения респондентов можно отнести к началу события. Действительно, выбор социальной категории, например, профессии, не является одномоментным событием. Обычно ему предшествуют периоды воспитания и образования, практической подготовки. Однако для упрощения задачи удобно отнести это событие ко времени рождения респондентов, поскольку в этой задаче нет никакого другого выделенного момента времени, кроме рождения индивида.

Итак, имеется множество респондентов А, которому ставится в соответствие множество категорий С1. Каждый респондент характеризуется моментом времени и местом рождения (географические координаты места рождения). По данным рождения можно построить матрицу, содержащую

координаты небесных тел, например углы долготы и расстояния, а по биографическим данным респондентов можно определить частотные распределения N1 - число респондентов, имеющих отношение к данной категории С1. В частности, для банка данных /12/ соответствующие распределения приведены в работах /5-9/ и других. Отметим, что один респондент может иметь отношение к нескольким категориям.

Определим число случаев реализации данной категории, которое приходится на заданный интервал изменения астрономических параметров, имеем в дискретном случае:

N . (х., к) = N ^(х., к)Ах, х. < х. < xj + Ах 1 </< п, 1 £ . £ т, к = 1,...,к0 (18)

Здесь к0 - число небесных тел, используемых в задаче.

В системе искусственного интеллекта /10/, используемой для решения задач астросоциотипологии, осуществляется фильтрация сигнала путем определения матрицы информативности в виде /13/

Здесь нормированная переменная определена следующим образом:

N . (ф., к) = N™(ф., к)Аф, ф. < ф. < ф^ + Аф

1 < I < п, 1 < . < 2т, 1 < к < к0

ф. (к)/2р , 1 < . < т

Гттх ( к) - Г1ПШ (к) ’

т +1 < j < 2т

max

Первая величина (19) называется информативность признака, а вторая величина является стандартным отклонением информативности или интегральная информативность (ИИ).

В случае непрерывных распределений событий определенная согласно (19) информативность явно не зависит от кинематических параметров небесных тел. Однако в дискретных задачах было обнаружено, что ИИ зависит от расстояния до небесных тел /5-9/, что обусловлено невязкой, возникающей в формулах типа (16).

На рис. 10 представлены результаты расчетов интегральной информативности в зависимости от расстояния до Солнца в модели М22 выбора из 27-37 категорий (маркеры С27-С37 соответственно) для 20007 респондентов из банка данных /12/. Отметим, что зависимость типа представленной на рис. 10 наблюдается в широком диапазоне изменения числа интервалов разбиения от 6 до 172, числа категорий от 11 до 100 и общего числа случаев от 13479 до 123671 /8-9/. Таким образом, эту закономерность можно признать фундаментальным фактом. По характеру распределения данных на рис. 6 можно сделать вывод, что ИИ изменяется пропорционально радиальной скорости, что непосредственно следует из основной теоремы астросоциотипологии /1-3/.

На рис. 11 представлены обобщенные данные нормированного параметра ИИ в зависимости от нормированного расстояния до Луны, Марса, Меркурия и Юпитера, полученные на сетках семи масштабов. Сравнивая данные, представленные на рис. 11 и на рис. 6-9, можно сделать вывод, что для этих небесных тел ИИ изменяется пропорционально радиальной скорости, как и в случае Солнца.

Следовательно, зависимость статистических параметров от кинематических параметров небесных тел сохраняется в матрице информативно-

сти, определенной согласно первому уравнению (19). Определим размерность этой матрицы для примеров, приведенных на рис. 1-9. В модели М120 матрица информативности содержит 37х120х20=88800 элементов для 37 категорий и 20 параметров десяти небесных тел, разбитых на 120 ячеек. Соответственно в модели М22 матрица информативности содержит 37х22х20=16280 элементов.

Рис. 10. Распределение стандартного отклонения логарифмов нормированных частот при изменении числа

категорий

0 0.2 0.4 0.6

x

0.8

♦ C37

■ C36 ▲ C35 X C34 Ж C33

• C32 + C31

C30 - C29 C28

■ C27

-----Poly. (C37)

1

3

2.5

2

1.5 в

1 - Sa ■ Qb ■ ГЩ

0.5 8*

0

Рис. 11. Зависимость нормированной интегральной информативности от нормированного расстояния до Луны, Марса, Меркурия и Юпитера в моделях М6, М12, М20, М21, М22, М23 и М24

1 ▲

• Moon ■ Mercury ▲ Mars □ Jupiter

0.2

0.4

0.6

0.8

0

x

Каждой категории можно сопоставить вектор информативности астрономических параметров размерности 2тМ, составленный из элементов матрицы информативности, путем последовательной записи столбцов, соответствующих нормированной координате, в один столбец, т.е.

, 1 £ ^ £ 2тк0

ук=5 (20)

С другой стороны, процесс идентификации и распознавания может рассматриваться как разложение вектора распознаваемого объекта в ряд по векторам категорий (классов распознавания) /13/. Этот вектор, состоящий из единиц и нулей, можно определить по координатам небесных тел, соответствующих дате и месту рождения респондента 1 в виде

1, (у -1)Лх £ Хік (I) £ ]Лх, ]к = я

0, 1 £ я £ 2тк(

аь =<

'° (21)

Таким образом, если нормированная координата небесного тела из данных респондента попадает в заданный интервал, элементу вектора придается значение 1, а во всех остальных случаях - значение 0. Перечисление координат осуществляется последовательно, для каждого небесного тела.

В случае, когда система векторов (20) является полной, можно любой вектор (21) представить в виде линейной комбинации векторов системы (20). Коэффициенты этого разложения будут соответствовать уровню сходства данного респондента с данной категорией. В случае неполной системы векторов (20) точная процедура заменяется распознаванием. При этом уровень сходства данных респондента с той или иной категорией можно определить по величине скалярного произведения вектора (21) на вектор (20), т.е.

-і 2 тк 0

Ки =-------------1 Е аь А)с5

г'1 5=1 (22)

Отметим, что возможны четыре исхода, при которых можно истинно или ложно отнести или не отнести данного респондента к данной катего-

рии. Для учета этих исходов распознавание социальных категорий в системе «Эйдос-астра» /10/ осуществляется по параметру сходства, который определяется следующим образом /15/:

1 N

8/ = 77 X (ВТ 1 + Т 1 - ВЕ 1 - р'«) • 100 %

N /=1 (23)

8 - достоверность идентификации «1-й» категории;

N - количество респондентов в распознаваемой выборке;

ВТц- уровень сходства «1-го» респондента с «1-й» категорией, к которой он был правильно отнесен системой;

Тц - уровень сходства «1-го» респондента с «1-й» категорией, к которой он был правильно не отнесен системой;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В¥ц - уровень сходства «1-го» респондента с «1-й» категорией, к которой он был ошибочно отнесен системой;

¥ц - уровень сходства «1-го» респондента с «1-й» категорией, к которой он был ошибочно не отнесен системой.

При таком определении параметр сходства изменяется в пределах от -100% до 100%, как обычный коэффициент корреляции в статистике. На рис. 12 представлен параметр сходства четырех категорий при изменении объема выборки, взятый из работы /14/. Можно отметить, что уже при N >150 происходит стабилизация параметра сходства различных категорий. Очевидно, что параметр сходства должен удовлетворять критерию простой проверки

(N = 1) = 100%

На рис 13 представлена зависимость параметра сходства 868 категорий от частоты встречаемости в модели М72. В этом примере минимальная частота равна 3, а критерий простой проверки выполняется, согласно уравнению степенной зависимости, при N1=1.7545, т.е. в интервале от 1 до 2. Следовательно, при малом объеме выборки сравнение данных в системе /10/ осуществляется простым перебором, а при большом объеме выборки используются статистические методы.

При заданном объеме выборки и при фиксированном числе небесных тел, параметр сходства зависит от числа ячеек модели. Как было установлено /5, 7, 15/ средний параметр сходства 37 категорий, данные для которых приведены на рис. 1-11, возрастает с числом ячеек модели по логарифмическому закону - см. рис. 14.

Рис. 13. Параметр сходства 868 категорий в зависимости от частоты встречаемости в модели М 72

Эти результаты показывают, что процедура распознавания по параметру сходства (23), реализованная в системе «Эйдос-астра» /10/, является устойчивой как относительно объема выборки, так и относительно числа ячеек модели. Математическое обоснование этой процедуры дано в моно-

графии /13/, где также указана связь использованной меры (19) со стати-

- Л,2

стикой С .

Естественно возникает вопрос, можно ли распознать произвольного респондента, не входящего в исходное множество А? Чтобы ответить на этот вопрос, разобьем исходное множество А на два подмножества - А1, А2. Сформируем матрицу информативности категорий, используя только подмножество А1. Выполним процедуру распознавания респондентов из подмножества А2. Теоретически определить процент угадывания при таком распознавании можно только при случайном выборе. Практический же ответ на поставленный вопрос был получен в работе /15/. Так, например, из 5000 респондентов тестируемой выборки А2, чьи данные представлены на сайте /12/, в системе "Эйдос-астра" /10/ социальные категории были определены правильно у 68,75% респондентов. Обучение системы осуществлялось в этой задаче на базе данных 15007 респондентов.

Причина, по которой оказывается возможным идентифицировать подмножества (категории) событий различной даже случайной природы, используя астрономические параметры и матрицу информативности, достаточно очевидна. Ведь фактически идентифицируются распределения, которые образуются при модулировании исходных распределений астроно-

мическими параметрами. В некоторых случаях этого достаточно, чтобы осуществить распознавание категорий.

Эту задачу можно сравнить с разложением солнечного света призмой. Свет представляет собой смесь случайных электромагнитных колебаний, но после прохождения призмы свет разлагается в спектр категорий цвета. При этом природа самого света не меняется.

Аналогично множество ’(^ может представлять собой смесь случайных событий, но в процессе обработки системой формируется матрица информативности астрономических параметров, которую можно использовать для распознавания категорий. При этом случайная природа множества ’(^ не меняется.

Прогнозирование курсов валют на основе системы «Эйдос-астра»

Заметим, что множество событий ’(^ может иметь любую природу, например, это могут быть ежедневные данные котировок валют разных стран /4, 11, 16/. При этом в качестве категорий выступают сами валюты, вернее, их котировки в отношении к американскому доллару. Предложенная в работе /16/ модель позволяет прогнозировать котировки валют на день вперед. В процессе моделирования был определен параметр отношения истинных прогнозов к ложным прогнозам для 20 стран - таблица 1.

Из приведенных в этой таблице данных следует, что использование астрономических параметров позволяет делать 76 % правильных прогнозов в случае Китая и 66% в случае Кореи. Таким образом, предложенный метод можно использовать для распознавания событий любой природы, включая события, связанные с техногенными катастрофами /17/.

Рассмотрим метод прогнозирования курсов валют на основе системы «Эйдос-астра» /10/. В качестве категорий можно выбрать повышение (САТ1)/снижение (САТ2) курса валюты для каждой страны. Неизменный курс валюты будем относить к случаю понижения при игре на повышение (рынок «быков»), или к случаю повышения при игре на понижение курса («медвежий» рынок).

Таблица 1. Качество прогноза котировок валют на день вперед для 20 стран /16/

Country T rue/False T rue% False%

UK 1,142,857 53.00% 47.00%

TAIWAN 1,454,545 59.00% 41.00%

SWITZERLAND 1,545,455 61.00% 9.00%

SINGAPORE 2 67.00% 33.00%

AUSTRALIA 1 50.00% 50.00%

SWEDEN 1,071,429 52.00% 48.00%

NEW ZEALAND 0,578947 37.00% 63.00%

NORWAY 0,928571 48.00% 52.00%

MEXICO 0,928571 48.00% 52.00%

MALAYSIA 2,428,571 71.00% 29.00%

KOREA 1,9 66.00% 34.00%

JAPAN 0,733333 42.00% 58.00%

INDIA 1,363,636 58.00% 42.00%

HONG KONG 0,833333 45.00% 55.00%

EURO 1,333,333 57.00% 43.00%

DENMARK 1,357,143 58.00% 42.00%

CHINA 3,2 76.00% 24.00%

CANADA 1,307,692 57.00% 43.00%

BRAZIL 1,285,714 56.00% 44.00%

SOUTH_AFRICA 1,818,182 65.00% 35.00%

В качестве астрономических параметров используем долготу и расстояние от Земли до десяти небесных тел - Солнца, Луны, Марса, Меркурия, Венеры, Юпитера, Сатурна, Урана, Нептуна и Плутона. Исходная база данных формируется на основе ежедневных котировок валют, опубликованных в статистическом отчете Федеральной Резервной Системы США /18/. В настоящей работе использована база данных /16/, сформированная по данным /18/ за период с 3 января 2000 г. по 16 марта 2006 г.

Список 12 стран вместе с международными обозначениями валют, исследованных ниже, дан в таблице 2. Частота встречаемости 24 категорий валют при игре на повышение представлена на рис. 15. В соответствии с идеологией проводимого исследования модель тестировалась на выборке из N=50 записей для каждой категории. По результатам тестирования определялся параметр сходства, который оказался достаточно велик в данной

задаче - рис. 16. Поэтому, распознавание категорий валют можно выполнить на период несколько дней.

В таблице 2 представлен прогноз курсов валют на период с 13-16 марта 2006 г. В первый день число сбывшихся прогнозов составляет 8 из 10, во второй и третий день - 8 из 12, а в 4 день - 5 из 10. Как видно из данных таблицы 2, система прогнозирует курсы валют избирательно, оставляя лишь достоверные прогнозы с положительным параметром сходства, иначе говоря система прогнозирует не только курсы валют, но и достоверность самих этих прогнозов. Поэтому на каждый день можно прогнозировать с достаточной достоверностью курсы валют не всех стран, а лишь некоторых.

С наибольшей достоверностью в этот период можно было спрогнозировать N70, хотя курс этой валюты повышался 14 марта и понижался 13, 15 и 16 марта. Отметим, что в модели /16/ новозеландский доллар, напротив, прогнозируется с самой низкой достоверностью на уровне 37%. Достаточно хорошо прогнозируется курс N0^ тогда как в модели /16/ норвежская крона прогнозируется на уровне 48%.

Таблица 2. Список валют 12 стран и прогноз на период 1-4 дня при игре на повышение (красным цветом отмечен сбывшийся прогноз)

13.03.2006 % 14.03.2006 % 15.03.2006 % 16.03.2006 % Country CAT

A10-SGD2 100 A29-CAD1 83 A5-TWD1 62 A19-NZD2 55 UK GB

A31-JPY2 57 A20-NZD1 50 A14-AUD1 59 A25-EUR2 51 TAIWAN TWD

A29-CAD1 48 A10-SGD2 49 A29-CAD1 51 A22-NOK2 50 SWITZERLAND CHF

A19-NZD2 46 A14-AUD1 46 A19-NZD2 45 A29-CAD1 40 SINGAPORE SGD

A16-SEK2 40 A16-SEK2 45 A16-SEK2 36 A8-CHF1 40 AUSTRALIA AUD

A14-AUD1 31 A35-CNY1 33 A10-SGD2 34 A15-AUD2 33 SWEDEN SEK

A22-NOK2 29 A22-NOK2 28 A22-NOK2 34 A35-CNY1 25 NEW ZEALAND NZD

A26-EUR1 21 A5-TWD1 25 A35-CNY1 33 A17-SEK1 17 NORWAY NOK

A5-TWD1 12 A2-GB1 24 A32-JPY1 32 A32-JPY1 14 JAPAN JPY

A35-CNY1 12 A31-JPY2 21 A26-EUR1 30 A16-SEK2 10 EURO EUR

A7-CHF2 15 A2-GB1 19 CHINA CHY

A26-EUR1 7 A7-CHF2 14 CANADA CAD

True 0.8 2/3 2/3 0.5

Японская йена хорошо прогнозируется на первый и второй день, тогда как в модели /16/ подтверждается только 42% прогнозов по этой валюте на первый день. С другой стороны, китайский юань прогнозируется в системе «Эйдос-астра» с низкой достоверностью, тогда как по модели /16/ для курса этой валюты сбывается 76% прогнозов. Наконец отметим, что развитая в настоящей работе модель прогнозирования курсов валют позволяет делать до 80% правильных прогнозов на день вперед и до 2/3 правильных прогнозов на два и три дня вперед.

Выводы

В настоящей работе сформулирована проблема распознавания событий в поле центральных сил. Дано решение проблемы на основе системной теории информации /13/. В качестве прикладной задачи рассмотрена проблема моделирования курсов валют 12 стран при игре на повышение. Предложено практическое решение этой проблемы на основе системы «Эйдос-астра» /10/. Показано, что развитая модель позволяет делать до 80% правильных прогнозов на следующий день и до 2/3 правильных прогнозов на два и три дня вперед.

Литература

1. Alexander Trunev. О распределении случайных событий в поле центральных сил/Chaos and Correlation, April 29 , 2009, http://trounev.com/Chaos/CR_4_2009.pdf

2. Трунев А.П. РАСПРЕДЕЛЕНИЕ СЛУЧАЙНЫХ СОБЫТИЙ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ/Научный журнал КубГАУ, №49(05), 2009. http://ej.kubagro.ru/2009/05/pdf/01.pdf

3. Alexander Trunev. Свойства непрерывных и дискретных распределений событий в поле центральных сил/Chaos and Correlation, May 24, 2009. http://trounev.com/Chaos/CR_5_2009.pdf

4. Трунев А.П. Теория и прикладные вопросы астросоциотипологии/ Научный журнал КубГАУ, №49(05), 2009. http://ej.kubagro.ru/2009/05/pdf/04.pdf

5. Луценко Е.В., Трунев А.П. Фундаментальные законы распознавания социальных категорий по астрономическим данным/ Chaos and Correlation, January 25, 2009, http://trounev. com/Chaos/CR1_1_2009.pdf

6. Луценко Е.В., Трунев А.П. Исследование зависимости интегральной информативности от расстояния до небесных тел Солнечной системы/ Chaos and Correlation, Dec. 8, 2008.

7. Eugene Lutsenko, Alexander Trounev. О фундаментальных закономерностях распознавания социальных категорий группы субъектов по астрономическим данным на момент рождения/Chaos and Correlation. International Journal, December 21st, 2008. http://trounev. com/Chaos/CR12_1.pdf

8. Луценко Е. В., Трунев А. П. Исследование вариабельности интегральной информативности моделей реагирования субъектов на положение небесных тел солнечной системы в момент рождения/ Научный журнал КубГАУ, № 45(1), 2009.

9. Луценко Е.В., Трунев А.П. Устойчивость зависимости интегральной информативности от расстояния до небесных тел Солнечной системы/ Научный журнал КубГ АУ, № 46(2), 2009, http://ej. kubagro. ru/2009/02/pdf/12.pdf

10. Patent 2008610097, Russia, System for Typification and Identification of the Social Status of Respondents Based on the Astronomical Data at the Time of Birth -"AIDOS-ASTRO" / E.V. Lutsenko, A.P. Trunev, V.N. Shashin; Application № 2007613722, January 9,2008.

11. Трунев А. П., Луценко Е. В. Астросоциотипология: Монография (научное издание). Краснодар: КубГАУ, 2008.

12. Astro-Databank Wiki Project http://www.astro.com/astro-databank/Main Page

13. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно -технических систем). Краснодар: КубГАУ, 2002, - 605 с.

14. Eugene Lutsenko, Alexander Trunev. Artificial intelligence system for identification of social categories of natives based on astronomical parameters. Научный журнал КубГАУ, № 03(37), 2008.

15. Луценко Е. В., Трунев А. П. Астросоциотипология и спектральный анализ личности по астросоциотипам с применением семантических информационных мультимоделей. Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2008.- №1(35). - Режим доступа: http://ej.kubagro.ru/2008/01/pdf/10.pdf

16. Alexander Trunev, Victor Okhonin. About a correlation between currency exchange rate and astronomical parameters of the Solar system’s celestial bodies. Chaos and Correlation, November 1st, 2006.

17. Татьяна Черноглазова, Александр Трунев. ХРОНИКИ АТОМНЫХ КАТАСТРОФ 20 ВЕКА/ Chaos and Correlation, March 11, 2008. http://trounev.com/Chaos/March2008/AS/AS.htm

18. Federal Reserve Statistical Release/ http://www.federalreserve.gov/releases/h10/Hist/default.htm

i Надоели баннеры? Вы всегда можете отключить рекламу.