Математика
УДК 519.216
УСЛОВИЕ ВЫРОЖДЕННОСТИ ОПТИМАЛЬНОГО МОМЕНТА В ЗАДАЧЕ ОПТИМАЛЬНОЙ ОСТАНОВКИ ДЛЯ НОВОГО ФУНКЦИОНАЛА ОТ СИММЕТРИЧНОГО СЛУЧАЙНОГО БЛУЖДАНИЯ И ЕГО МАКСИМУМА
А. Л. Воробьев1
В задаче оптимальной остановки для функционала от симметричного случайного блуждания и его максимума предложены новые классы функционалов, для одного из которых оптимальным моментом на конечном временном интервале является начало интервала, для другого — конец. Эти классы обобщают известные ранее. Доказательство оптимальности указанных моментов основано на комбинаторном анализе траекторий случайного блуждания.
Ключевые слова: симметричное случайное блуждание, оптимальная остановка, правило "купи-и-держи".
New classes of junctionals are proposed for an optimal stopping problem for a functional of a symmetric random walk and its maximum. For one class the optimal moment in a finite time interval is the beginning of this interval and for another one this is its end. These classes generalize those known previously. A proof of the optimality of the indicated moments is based on combinatorial analysis of random walk trajectories.
Key words: symmetric random walk, optimal stopping, "Buy-and-hold" rule.
1. Введение. Рассмотрим несимметричное случайное блуждание Sn, задаваемое следующим образом:
So = 0, Sn = (Xi + X2 + ... + Xn),
1, р;
-1,д = 1 - р.
Для данного процесса можно сформулировать задачу оптимальной остановки
где Xi,X2,... — независимые одинаково распределенные величины, Xi =
V (f )= sup Ef (Sr ,Mn ), (1)
0^T^N П.Н.
где т пробегает все моменты остановки относительно естественной фильтрации процесса (Sk)o^k^N (т.е. Fk = &(Xi,i ^ k)), те превосходящие N с вероятностью 1; Mn = sup Sk — максимум траек-
o^k^N
тории блуждания на отрезке [0,N]; f (s,m) — некоторая функция. Пусть т* — оптимальный момент остановки в данной задаче, т.е.
т* =arg( sup E(f(St,Mn))).
0^T ^N
Если записать f (St,Mn) = h(eSr,eMN), то поиск оптимального момента остановки в этой задаче можно интерпретировать как выбор оптимального момента для продажи акции на временном интервале [0, N] в рамках модели Кокса-Росса-Рубинштейна [1] инвестором, v которого есть такая акция и который должен продать ее в какой-то момент данного интервала. В такой интерпретации процесс eSt описывает изменение цены акции во времени, а процесс St соответствует ставке доходности акции на интервале [0, t] (в дальнейшем будем называть ее просто доходностью). Оптимальность т
максимальной цены на всем интервале, или величиной h(eSr ,eMN). Эта интерпретация аналогична описанной в работе [2] для модели Ь.т-жа Мер гона Шоу. на.
Основным известным результатом для сформулированной задачи является следующая теорема, в которой рассматривается случай f (s, m) = g(m — s) [3].
Теорема 1. Пусть g : {0,1,..., N} ^ К — невозрастающая выпуклая вниз па своей области определения функция. Тогда
Воробьев Александр Леонидович — асп. каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail: alvorobyev88Qgmail.com.
1) если р < то т* = 0 п.п.]
2) если р > то т* = N п.н.;
3) если р = то т* — любой момент остановки, удовлетворяющий соотношению
Р{т* = N или Бт* = Мт*} = 1.
Множество оптимальных моментов в утверждении теоремы включает вырожденные моменты — начало и конец интервала. В упомянутой финансовой интерпретации такой результат соответствует классу стратегий "купи-и-держи".
2. Формулировка и анализ основных результатов. Новый результат является обобщением теоремы 1 на более общий класс функционалов ¡(з,т) для случая р = т.е. для симметричного случайного блуждания.
Теорема 2. Пусть функция /(8, т) определена на Б(/) = {(з, т):з,т € Z, § € [—N, N], т € [0, Щ, в ^ т} и р = И пусть приращение функции / по аргументу в является невозрастаюшей по аргументу т функцией, т.е. на Б(/) выполняется неравенство
/ (з + 1,т) - / (з, т) > / (в + 1,т + 1) - / (з, т + 1). (2)
Тогда имеют место следующие утверждения:
1) если на Б(/) выполняется неравенство
/ (з, т) - / (з - 1, т) > / (з + 1,т + 1) - / (з, т + 1), (3)
то т* = 0 п.н. — оптимальный момент остановки в задаче (1); 2) если на Б(/) выполняется неравенство
/ (з, т) - / (з - 1, т) < / (з + 1,т + 1) - / (з, т + 1), (4)
то т* = N п.н. — оптимальный момент остановки в задаче (1); 3) если на Б(/) выполняется равенство
/(з, т) - /(з - 1, т) = /(з + 1,т + 1) - /(з, т + 1), (5)
(1) т* Р{т* =
N или Бт* = Мт*} = 1.
Данные утверждения формулируют условия в терминах функции, определенной на описанной целочисленной решетке. Но задача (1) поиска оптимального момента остановки может быть поставлена не только для дискретного несимметричного случайного блуждания, но и для его аналога в непрерывном времени — броуновского движения со сносом. И иногда между этими задачами возможен предельный переход с помощью принципа Донскера-Прохорова от дискретного времени к непрерывному. Поэтому представляет интерес отыскание условия в терминах гладкой функции, определенной в области точек 0(/) = {(з, т) : —N ^ з ^ т ^ N,m ^ 0}.
Для этого потребуем наличия третьих производных у функции /(з,т). Это условие позволяет разложить /(з, т) в ряд Тейлора в окрестности точки (з,т) в В(/):
(Дз)2
+ А«, т + Аш) = ¡{з, т) + т)Аз + т)Ат + т)—---Ь
+/тт(в, т)^- + /^(з, т)АзАт + о((Дв + Аш)3). (6)
Начнем с поиска аналога для неравенства (2). Потребуем, чтобы оно выполнялось не только для еди-
тз т.е. для любых Дз, Дт € (0, 5) выполняется условие
/(з + Дз, т) - /(з, т) ^ /(з + Дз, т + Дт) - /(з, т + Дт). (7)
Тогда, подставляя разложение (6) для /(з + Дз,т), /(з,т + Дт)ж /(з + Дз,т + Дт) в неравенство (7), мы получим
(/(з + Дз, т) - /(з, т)) - (/(з + Дз, т + Дт) - /(з, т + Дт)) = -/Зт(з, т)ДзДт + о((Дз + Дт)3).
Поскольку это выражение неотрицательно при достаточно малых Дз и Дт, имеем /8т(з,т) ^ 0 для любых (з,т) € В(/).
Аналогично потребуем, чтобы неравенство (3) выполнялось не только для единичных смещений т з т з
Д € (0, 5) выполняется условие
/ (з, т) - / (з - Д,т) ^ / (з + Д,т + Д) - / (з, т + А). (8)
Тогда, подставляя разложение (6) для /(з - Д, т), /(з + Д, т + Д) и /(з, т + Д) в неравенство (8), мы получим
(/(з, т) - /(з - Д, т)) - (/(з + Д,т + Д) - /(з, т + Д)) = -/88(з, т)Д2 - /8т(з, т)Д2 + о(Д3).
Поскольку это выражение неотрицательно при достаточно малых Д, имеем /88(з, т) + /8т(з, т) ^ 0 для любых (з,т) € В(/).
Аналогично неравенство (4) даст /88(з,т) + /8т(з,т) ^ 0 , а равенство (5) даст /88(з,т)+ /8т(з,т) = 0.
Теперь проделаем обратный вывод: покажем, как можно получить условия в формулировке теоремы 2 из их аналогов для гладкой функции /. Начнем с неравенства (2). Пусть /8т(з,т) ^ 0 У(з,т) € В(/). Тогда распишем разность левой и правой частей из неравенства (2) на В(/) с помощью формулы Ньютона-Лейбница:
8+д8 т+дт
(/(з + Дз,т) - /(з,т)) - (/(з + Дз,т + Дт) - /(з,т + Дт)) = - ^ J /8т(з',т') йт' йз' ^ 0,
8т
т.е. неравенство (2) выполнено.
Совершим аналогичный обратный переход для неравенства (3). Пусть /8т(з,т) + /88(з,т) ^ 0 У(з,т) € В(/). Распишем разность левой и правой частей из равенства (5) на В(/) с помощью формулы Ньютона-Лейбница:
8
(/(з, т) - /(з - Д, т)) - (/(з + Д,т + Д)- /(з, т + Д)) = ^ (/а(4, т) - /а{з' + Д,т + Д)) йз' =
8
8д
Д 8 Д
(Мз'+Д', т+Д'))д йз' йД' = - I I(/88(з'+Д', т+Д')+/8т(з'+Д', т+Д')) йз' йД' ^ 0,
8-д 0 8-д 0
т.е. неравенство (3) выполнено.
Абсолютно те же рассуждения с заменой знака неравенства дают переход от /8т(з,т)+ /88(з, т) ^ 0 к неравенству (4) и от /8т(з, т) + /88(з, т) = 0 к равенству (5).
Заметим, что теорема 2 дает полный ответ на вопрос об оптимальном моменте остановки в случае, когда на всей области В(/) функция /(з,т) ведет себя одинаково при движении в направлении з = т. Если же это поведение меняется на В(/), то оптимальный момент может быть разным (ниже будут приведены примеры) и нахождение какого-то правила в этом случае представляется очень сложной задачей.
Связь с результатом работы, [1]. Покажем, что наш результат действительно обобщает известный ранее в случае р = т.е. что в этом случае из теоремы 2 следует теорема 1. Возьмем функцию /(з,т) = д(з - т) с выпуклой вниз д(х), т.е. д''(х) ^ 0 при х € [0,^. Тогда /8т(з,т) = -д''(з - т) ^ 0. Как показано выше, отсюда следует выполнение неравенства (2) на В(/).
Далее, /88(з, т) = д''(з - т), поэтому /88(з, т) + /8т(з, т) = д''(з - т) - д''(з - т) = 0, т.е. на В(/) /
для нее будут оптимальными моменты, указанные в п. 3 как теоремы 2, так и теоремы 1.
3. Доказательство теоремы 2. Раскроем основную идею доказательства, из которой станет ясно, почему на функцию /(з, т) накладываются именно такие ограничения. Рассмотрим некоторый т
акции равна з = Бт. Рассмотрим, что трейдер выиграет или проиграет в среднем, если продаст акции в следующий момент, а не в этот. Доходность на следующем шаге может пойти на 1 вверх или на 1 вниз с одинаковой вероятностью. Изменение доходности на последующем временном интервале [т + 1,^ тоже случайно и не зависит от следующего шага, так как наш процесс St марковский. Рассмотрим некоторый фиксированный сценарий изменения доходности на [т + 1, N1 и сравним
продажу в моменты т и т + 1 для него. При продаже в момент т мы в обоих возможных случаях (рост или падение доходности на следующем шаге) продаем по цене в. В случае продажи в момент т + 1 при росте цены мы продаем акции по цене в + 1, при падении — по цене в — 1. Но мы оцениваем полезность момента продажи не только по цене продажи, но и по максимуму доходности на всем интервале. Пусть максимальная доходность на интервале [0, N в случае падения цены на шаге от т к т + 1 равна Ш\. Тогда в случае роста доходности на шаге от т к т + 1 она равна т2 = Ш\ + 2 (если после падения на шаге от т к т + 1 доходность достигала значения т\), Ш2 = т1 + 1 (если после падения на шаге от т к т + 1 доходность достигала зн ачения Ш1 — 1 и не больше, а значение Ш1 было достигнуто до момента т) или Ш2 = Ш1 (если после падения на шаге от т к т + 1
т1 — 2 т1 т
т +1 т
полезности: f (в + 1,ш2) + /(в — 1,ш1 ) — /(в,Ш2) — /(в,Ш1). В случае выполнения неравенства (3) это изменение неположительно при Ш2 = Ш1 + 2 (назовем эти сценарии сценариями типа 1) и при Ш2 = Ш1 + 1. То есть в указанных сценариях поведение функции полезности f правильное. В случае
Ш2 = Ш1
переходе от начального момента остановки к любому другому встреченные нами сценарии типа 1 как бы перевешивают сценарии типа 2, т.е. в совокупности полезность чаще падает, чем растет, и поэтому выгоднее всего остановиться в начале интервала.
При выполнении неравенства (4) изменение полезности неотрицательно в случаях Ш2 = Ш1 + 1 Ш2 = Ш1
моменту уже встреченные нами сценарии типа 2 перевешивают, т.е. в совокупности полезность чаще растет, чем падает, и поэтому выгоднее всего остановиться в конце интервала.
Если же выполнено равенство (5), изменение полезности неположительно при Ш2 = Ш1 +2, неотрицательно при Ш2 = Ш1 и равно нулю при Ш2 = Ш1 + 1, и нам нужно доказать, что при переходе от начального момента остановки к любому моменту тс Р {т * = N или Бт * = Мт *} = 1 встреченные нами сценарии типа 1 и типа 2 уравновешивают друг друга, т.е. полезность сбалансированно растет и падает, и в итоге эти моменты равнозначны. А поскольку этот случай — частный случай п. 1
(5)
будет доказано), то и равнозначные ему моменты тоже будут оптимальными.
Доказательство теоремы будет построено следующим образом. Сначала мы опишем процесс (Щ в случае п. 1 теоремы и П в случае п. 2), сводящий превосходство целевого момента остановки (начального в п. 1 и конечного в п. 2) над любым другим к неравенству (11), в котором вклады в полезность перевешивающих и перевешиваемых сценариев уже будут агрегированы. Далее докажем свойства 1-3 компонентов этого неравенства, где центральное свойство 3 означает перевес "правильных" сценариев над "неправильными". И, наконец, на основе этих свойств докажем требуемое неравенство (11).
Введем обозначение = Ef (Бт,МN)• Распишем данное математическое ожидание:
где ш пробегает все возможные случайные исходы; исходы соответствуют траекториям случайного блуждания на интервале [0, ./V], количество которых равно 2м; Р(сс>) = фг — вероятность исхода Ш] Бт(ш) — значение случайного блуждания в момент т при исходе ш; MN (ш) — значение максимума случайного блуждания на интервале [0,Ж] при исходе ш.
Начнем с доказательства п. 1 теоремы 2. Докажем, что для момента остановки то = 0 п.н. и
т1
то
Заметим, что Хт представляет собой сумму значений функции ^ ^ точках (Бт(ш),MN(ш)), где
ш
траектории но мы опускаем этот множитель, так как он одинаков для любого момента т).
Для момента то все точки (Бт(ш),MN(ш)) лежат на оси ординат, поскольку Бт = 0 на всех траекториях. Обозначим это множество точек через Ао. Для момента т1 точки (Бт(ш),MN(ш)) разбросаны по целочисленной решетке (в, т) с очевидными ограничениями 0 ^ т ^ N —Ж ^ в ^ т. Обозначим это множество через А^. Мы введем процесс Щ пошагового обновления этих множеств и на каждом его шаге к получим новые множества Ао,к и А^, удовлетворяющие неравенству
Хт = 5] Р(ш^ (Бт (ш),MN (ш)),
(9)
Х(Аок) — ) < Х(Аок-1) — Х(А1,к-1),
где Х(А) = ^ f (в, т), Ао,о = Ао, А1 , о = А^ к = 1,...,К, К — число шагов обновления. (« , т)еА
Тогда, поскольку ЕТ0 — ЕТ1 = Е(Ао,о) — Е(А^о), вместо неравенства (9) нам будет достаточно доказать неравенство
Е(Ао,к) — Е(А1>к) ^ 0. (11)
Смысл построения множеств Ао,& и А^ именно в том, чтобы свести задачу к неравенству (11), так как в нем вклад "правильных" и "неправильных" сценариев уже агрегирован (путем замены точек с самыми разными абсциссами на точки с тремя значениями абсциссы).
Описание процесса, Щ. Опишем процесс Щ обновления множеств Ао и Каждый шаг обновления будет взаимно однозначно соответствовать точке из множества А1, причем не важно, какая точка будет браться на каком шаге. Значит, всего шагов К = 2м — столько же, сколько и траекторий V случайного блуждания на итервале [0,Ж]. Опишем шаг соответствующий точке (в,ш):
(а) если в > 0 в таборе А1,к то сравнению с А1>ь-1 заменяем точку (в,ш) на точки (1,т — в + 1), (1,т — в + 2),..., (1, т), а в набор Ао,^ то сравнению с Ао,^-1 добавляем точки (0,т — в + 1), (0,т — в + 2),... , (0,т — 1); на рис. 1 зачеркнута заменяемая точка, закрашенными кружками изображены заменяющие ее точки, а незакрашенными — добавленные в Ао^ точки;
(б) если в < 0, в таборе А1,к то сравнению с А1>к-1 заменяем точку (в, т) на точки (—1, т), (—1, т+ 1),..., (—1, т—в — 1), а в набор Ао,^ то сравнению с Ао,^-1 добавляем точки (0, т+1),..., (0, т—в — 1); это преобразование проиллюстрировано на рис. 2;
(в) если в = 0, то Ао,к = Ао^-^А^ = А^^, т.е. па этом шаге множества не меняются.
Докажем, что выполняется неравенство (10). Для шагов типа (в) очевидно, что в данном неравенстве достигается равенство. Чтобы доказать неравенство для шагов типа (а), мы докажем чуть более общее утверждение: неравенство (10) выполняется, если па шаге обновления в наборе А^ по сравнению с А^^ точка (в, т) заменяется на точки (в—г, т—г), (в—г, т—г+1),... , (в—г, т), а в набор Ао,^ то сравнению с Ао,^-1 добавляем точки (в—г—1, т—г), (в—г—1, т—г+1),..., (в—г—1, т—1) (ординаты расположены по возрастанию; в частности, этот перечень пустой при г = 0), где 0 ^ г < в. Именно такое утверждение (для произвольного г, а не только для г = в — 1) потребуется нам при индукционном переходе в процессе доказательства. Это преобразование проиллюстрировано на рис. 3.
Рис. 1
Рис. 2
Рис. 3
Докажем это утверждение индукцией по г. База индукции: при г = 0 шаг является тривиальным, как и шаги типа (в); оба множества остаются неизменными, и в неравенстве (10) достигается равенство.
Переход индукции: пусть утверждение доказано для г = го. Докажем его для г = го + 1. Рассмотрим точки, добавленные в множества Ао,& и А^ по сравнению с Ао^-1 и А^д— при г = го. Объединим в пару точку (в — го,т — г) из множества А^ и точку (в — го — 1,т — г — 1) из множества Ао,& для каждого г = 0,...,го. На рис. 4 между точками в каждой паре проведена двусторонняя стрелка. Заметим, что разность Е(Ао,&) — Е(А^) не увеличится, если мы заменим пару точек (в — го,т — г), (в — го — 1,т — г — 1) на точки (в — го — 1,т — г) и (в — го — 2,т — г — 1) соответственно (сдвинем каждую точку на 1 влево), поскольку, согласно равенству (5), не увеличится вклад рассматриваемой пары точек в эту разность:
/(в — го — 1,т — г — 1) — /(в — го,т — г) ^ /(в — го — 2,т — г — 1) — /(в — го — 1,т — г).
Сдвиг каждой точки отображен на рис. 4 односторонней стрелкой. Такие пары покроют все точки множества Ао,&, а в множестве А^ останется точка (в — го,т — го) - Заменим ее в этом множестве на точку (в — го — 1,т — го), т.е. она сдвигается на 1 влево; также добавим точку (в — го — 1,т — го — 1) в множество А^ (изображена на рис. 4 большим закрашенным кружком) и точку (в — го — 2,т — го — 1) в множество Ао,& (изображена на рис. 4 большим незакрашенным кружком). При этом разность Е(Ао,&) — Е(А^) не увеличится, поскольку, согласно неравенству (5), не увеличится вклад рассматриваемых точек в эту разность:
—/(в — го, т — го) ^ —/(в — го — 1, т — го) — / (в — го — 1,т — го — 1) + / (в — го — 2,т — го — 1).
После всех вышеперечисленных замен множества Ао ,к и А1 ,к для г = Го перейдут соответственно в множества Ао ,к и А1 ,к для г = Го + 1 и, как мы показали, величина Х(Ао ,к) — Х(А1 ,к) не увеличится. А поскольку по предположению индукции неравенство (10) выполнялось до этого перехода, то оно будет выполняться и после него, что и требовалось доказать.
Итак, неравенство (10) доказано для шагов типа (а) для всех г = 1,...,в — 1. Нам же нужно
г=в—1
Опустим подробное доказательство для шагов типа (б), поскольку оно совершенно аналогично: применяется равенство (5), и точки сдвигаются вправо, а не влево.
Свойства множеств Ао,к и А1;к- По построению в множестве А1кк содержатся точки (в,т) с в € { —1, 0,1}. Отметим следующие свойства этого множества.
Свойство 1. В множестве А1 ,к поровну точек (в, т), у которых в = 1 и в = —1.
Доказательство. Это свойство будет следовать из того, что сумма абсцисс всех точек множе-А1 к Ао
А1 о = А1 А1 к
кова, так как каждая точка (в, т), для штор ой в > 0, на соответствующем ей шаге обновления множеств А1 ,к заменяется на в точек с абсциссой 1, а каждая точка, для которой в < 0, — на (—в)
(—1) А1 Ао
это, опишем пошаговый процесс П2 обновления множества точек, начинающийся с множества Ао,
А1
Множество точек на каждом шаге г процесса обновления П2 будет соответствовать некоторому моменту остановки т(г\ Мы знаем, что Ао соответствует моменту остановки то, А1 — моменту ть Множество, соответствующее моменту т^, назовем Ат(¿). На каждом шаге г мы продвигаемся с момента т(г) на один шаг вперед по такой-то одной траектории ш^ определенной на интервале [0,т(г)], т.е. следующий момент остановки т(г+1) на единицу больше предыдущего т(г) ровно на одной траектории. На остальных траекториях, определенных на интервале [0,т(г)], моменты т(г) и т(г+1) равны. Траектория ш^ даст 2N-т 1 траекторий на интервале [0, N, причем на шаге от момента т(г) к моменту т(г+1) одна половина этих траекторий идет вверх, другая половина — вниз. И в множестве точек Ат(¿+1) то сравнению с множеством Ат(¿) исчезает 2N-тМ точек с абсциссой Бт(¿) (ш^, появляется
2N-т М-1 точек с абсци ссой Бт (¿) (ш^ + 1 и столько же точек с аб сциссой Бт (¿) (ш^ — 1. Таким образом, сумма абсцисс точек множества не изменяется. На определенном шаге мы дойдем до момента т1 Ао А1
Ао к А1 к
т.
Доказательство. Докажем это свойство в два шага. Во-первых, точек с любой фиксированной
Ао А1
интервале [0, N в каждом из множеств Ао и А1 взаимно однозначно соответствует одна точка, имеющая одну и ту же ординату, равную максимуму блуждания на этой траектории.
Во-вторых, равенство количества точек с ординатой т у множеств Ао ,к и А1, к сохраняется при их обновлении. Действительно, вместо точки (в, т) из множества А1 ,к-1 в множестве А1, к появля-
Ао,к А1,к
с каждой из ординат т — в + 1,... ,т — 1 в случае в > 0 и по одной точке с каждой из ординат т + 1,... ,т — в + 1 в случае в < 0. Таким образом, свойство 2 доказано.
Следующее свойство является основным шагом в доказательстве теоремы.
Свойство 3. Для множества А1,к определим, следующие его подмножества: А+,к = {(в, т) € А1 ,к|в = 1,т ^ к} — точки с положительной абсциссой и не превосходящей к ординатой, А-,к = {(в, т) € А1 ,к|в = —1,т ^ к} — точки с отрицательной абсциссой и не превосходящей к ординатой. Тогда
1А-,к1 ^ |А+,к+1| для любого к ^ 0. (12)
Доказательство. Вновь обратимся к процессу П2 пошагового перехода от множества Ао к множеству А1. На каждом шаге г этого процесса мы имеем множество точек Ат(¿), соответствущее моменту остановки т(г\ Произведем р,ля пары множеств (Ао,Ат(¿)) последовательность шагов обновления, описанную ранее для пары множеств Ао,А1. Результатом этой последовательности будет множество Ап к обновлением Ат(¿) (результат обновления Ао нам здесь неинтере-
сен). В множестве АПкк выделим подмножества Ап,+,к ш Ап—;к так же, как для А^к- Проследим изменение этих подмножеств в процессе П^. В начаде процесса они пусты, поскольку все точки Ап, а значит, и все точки Ап, к на оси ординат. Выясним, что с ними происходит на шаге г про-
цесса П2, когда мы по определенной траектории ш^ ^а ^етервале [0,т(г)] сдвигаемся на один шаг вперед. Рассмотрим все траектории на интервале [0,Ж], начинающиеся с траектории Шi. Разобьем
их иа пары: пару образуют траектории, отличающиеся на одном шаге, следующем за моментом т и одинаково ведущие себя на последующих шагах (одновременно идущие вниз или вверх).
В каждой паре траекторий (ш',ш") на шаге г:
одна траектория ш' идет вверх, и Бт(¿+1) (ш') = Бт(¿) (ш') + 1;
другая траектория ш'' идет вниз, и Бт(¿+1) (ш'') = Бт(¿) (ш'') — 1.
Заметим также, что Бт(¿) (ш') = Бт(¿) (ш''), MN(ш') — MN(ш'') € {0,1, 2}. Действительно, максимумы двух траекторий, отличающихся только на одном шаге, отличаются на 0, 1 или 2:
0, если обе они достигали своего максимума MN(ш') = MN(ш'') до шага разветвления (шаг, на котором они отличаются);
1, если до шага разветвления они достигали лишь значения MN (ш') — 1;
2, если до шага разветвления они не достигали значения MN (ш') — 1.
Рассмотрим, как переход от остановки в момент тк остановке в момент тна некоторой паре траекторий (ш',ш'') влияет на изменение множеств Ат(¿+1) _ ^ и Ат(¿+1) + к+1 п0 сравнению с Ат(¿) _ к и Ат(¿) + к+1 (напомним, что в итоге нам нужно будет сравнить Ат(¿) _ ^ и Ат(¿) + к+1 ПРИ
т= т1). Для этого рассмотрим отдельно три вышеупомянутых случая соотношения максимумов двух траекторий MN(ш') и MN(ш''). Обозначим для удобства множество точек из Ат(¿) к, соответствующих траекториям ш' и ш'' и лежащих в Ат(¿) _ к {Ат(¿) + к+1)) через В- (В+). Аналогично определим В-^ и В++1 — подмножества Ат(¿+1) к-
1) MN(ш') = MN(ш'') = т. В множестве Ат(¿) к этим траекториям соответствовали две точки (в, т), в множестве Ат(¿+1) к им соответствуют точки (в + 1, т), (в — 1, т).
(а) Пусть в = 0. Тогда после шага обновления точки (в, т) не получим ни одной точки в В- и В+. Точка (в — 1, т) после шага обновления даст точку в В~+^ если т ^ к. Точка (в + 1, т) после
шага обновления даст точку в В+_1, если т ^ к + 1. Значит, разность
В
в++1)
отличается
от
В
(i)
В+) (i)
т=к+1
(б) Пусть в > 0. Тогда точка (в, т) после шага обновления дважды даст набор точек (1, т—в+1), (1, т — в + 2),... , (1,т) в множество Ат(¿) ю а точки (в — 1, т) и (в + 1, т) дадут в множество Ат(¿+1) к наборы (1,т — в + 2) (1,т — в + 3),... , (1,т) и (1,т — в), (1,т — в + 1),..., (1, т) соответственно. Тогда В- и В-+1 пусты, а количество точек в В+1 изменится по сравнению с В+, если и только если
к + 1 = т — в. В этом случае это количество вырастет на 1 и разность В
в++1)
уменьшится
на 1 по сравнению с (в) Пусть в < 0.
В
(0
В+) (i)
Ъгда точка (в, т) после шага обновления дважды внесет набор точек (—1, т), (—1, т + 1),... , (—1, т — в + 1) в множество Ат(¿) ю а точки (в — 1,т) и (в + 1, т) дадут в множество Ат(¿) к наборы (—1, т), (—1, т + 1) ..., (—1, т — в + 2) и (—1, т), (—1, т + 1),..., (—1, т — в) соответственно. Тогда множества В+ и В++1 пусты, а количество точек в В-+1 изменится по сравнению с В-, если и толеко если к = т — в + 1, т.е. к + 1 = т — в. В этом случае это количество уменьшится
на 1 и разность
В
В^+1)
уменьшится на 1 по сравнению с
В
(0
В+
м
В
(i)
Итак, при MN(ш') = MN(ш'') = т разность
В++) м
В
(i+1)
в+++1)
В
(i)
уменьшится на 1 по сравнению с в других случаях.
В+
(i)
, если и только если к + 1 = т — в, и совпадет с 2) MN(ш') = MN(ш'') + 1 = т + 1 В множестве Ат(¿) к этим траекториям соответствовали точки (в, т + 1) и (в, т), в множестве Ат(¿+1) к им ^^^^^^^ствуют точки (в + 1,т + 1), (в — 1, т).
(а) Пусть в = 0. Тогда точки (в, т+1) и (в, т) после шагов обновления не внесут никакого вклада В-
В+ . Точки же (в — 1, т) и (в + 1,т + 1) либо обе ^адут по точке В
либо обе не дадут ничего. Значит, разности
В
в+++1)
В
(i)
в+
(i+1) (i+1) '
В+
(i)
совпадают.
(б) Пусть в > 0. Тогда точки (в,т + 1) и (в,т) после шагов обновления дадут в множество Ата) к наборы точек (1,т — в + 2), (1,т — в + 3),..., (1,т + 1) и (1,т — в + 1), (1,т —
в + 2),..., (1,т), а точки (в — 1,т) и (в + 1, т + 1) дадут в множество Ат(¿+1) к наборы (1,т — в + 1), (1 ,т — в + 2), ...,(1,т + 1) и (1,т — в + 2), (1 ,т — в + 3),... ,(1, т) соо тветстаенто. Объединение этих двух наборов осталось прежним. Значит, и разности
в-+1)
В++1)
в-
м
(i)
совпадают.
В(г+1) в++1)
В++1)
В
В+) ( )
В-( )
В+ ( )
(¿)
совпадают.
(в) В случае в < 0 аналогичным образом можно показать, что
Итак, при МN(ш') = МN(ш'') + 1 = т + 1 разности
3) MN(ш') = MN(ш'') + 2 = т + 2. В множестве АТ(¿) к этим траекториям соответствовали точки (в,т + 2) и (в, т), в множестве АТ(¿+1) к им соответствуют точки (в + 1,т + 2), (в — 1, т).
(а) Пусть в = 0. Тогда точки (в,т + 2) и (в,т) после шагов обновления не внесут никакого вклада в В—) и В+). Точка (в — 1, т) даст точку в В—+1), если т ^ к, а точка (в + 1, т + 2) — точку
в В ++!)) если и только если т ^ к — 1. Значит, разность
в-+1)
в++1)
изменится по сравнению
В -)
В+)
, если и только если т + 1 = к + 1 или т = к. В этом случае она увеличится на 1.
(б) Пусть в > 0. Тогда точки (в,т + 2) и (в,т) после шагов обновления дадут в множество АТ(¿) К соответственно наборы точек (1,т — в + 3), (1,т — в + 4),..., (1,т + 2) и (1,т — в + 1), (1,т —
в + 2),..., (1,т), а точки (в + 1,т + 2) и (в — 1, т) дадут в множество АТ(¿+1) к наборы (1, т — в + 2), (1,т — в + 3),..., (1,т + 2) и (1,т — в + 2), (1,т — в + 3),..., (1,т) соответственно. Тогда В- и В-^ пусты, а количество точек в В++1 изменится то сравнению с В+, если и только если к + 1 = т — в + 1 ми к = т — в. В этом случае это количество уменьшится на 1 и разность
В
(¿+1)
в++1)
увеличится на 1 по сравнению с
В
( )
В+)
( )
(в) В случае в < 0 аналогичным образом можно показать, что разность
В
(¿+1)
в++1)
уве-
личится на 1 по сравнению с
В
( )
В+)
( )
к=т—в
Итак, при MN(ш') = MN(ш'') + 2 = т + 2 разность
В
(¿+1)
в++1)
увеличится на 1 по срав-
нению с
В~
( )
В+)
( )
к=т—в
В итоге неравенство
А
Т ({),-,к
А
т №,+,к+1
й2:
^ 0 на момент завершения процесса П2 (для т(г) =
Т1, т.е. доказываемое неравенство (12)) эквивалентно тому, что за время выполнения этого процесса пары траекторий (ш',ш'') с MN (ш') = MN (ш'') + 2 = т + 2 и т — в = к (назовем их парами типа 1) встречались не реже, чем пары траекторий с MN (ш') = MN (ш'') = ^ит — в = к + 1 (назовем эти пары парами типа 2). Докажем это.
Для этого сначала установим взаимно однозначное соответствие между траекториями типа 1 и типа 2 па пути процесса П2 при Т1 = N п.н. Оно будет проиллюстрировано на рис. 5. Возьмем
а1
две точки (в1,т1). Из описания тар траекторий с MN(ш') = MN(ш'') = т1 мы знаем, что своего максимума они достш'ают до развилки (шага, отличающих) их). Отразим верхнюю траекторию относительно вертикальной прямой в = N/2 (т.е. повернем время в обратном направлении) и сдвинем
так, чтобы начало полученной траектории сУ совпало с точкой (0, 0), т.е. на (ш') единиц вниз. На рис. 5 мы отображаем и сдвигаем не пару траекторий, а координатные оси: оси Ь и St соответствуют исходной траектории, а оси ¿'и S,t — преобразованной траектории. Тогда (в новых координатах) получившаяся траектория на интервале [0, N1, выходящая из нуля, будет иметь максимум т2 = т1 — SN(ш''), а точка развилки двух траекторий исходной пары — ординату в2 =
в1 — SN(ш''). Тогда т2 — в'2 = т1 — в1 = к + 1.
Теперь возьмем точку преобразованной траектории, предшествующую (в новых координатах) точке развилки исходной пары. Выпустим из нее траекторию в направлении новой оси абсцисс ¿', отличающуюся от продолжения преобразованной траектории только на следующем шаге (выпускаемая траектория идет на этом шаге вверх). Назовем эту точку новой точкой развилки для новой пары траекторий. Поскольку выходящая из нее нижняя траектория до-
т2
верхняя траектория имеет максимум т2 + 2. Значит, остановка в но-
а1
точки (в2 + 1,т2 + 2) и (в2 + 1, т2),г,п.е т2 — (в2 + 1) = (к + 1) — 1 = к.
Следовательно, новая пара траекторий принадлежит к типу 1.
Таким образом, каждой паре траекторий типа 2 мы поставили в ри(. д соответствие пару траекторий типа 1. Заметим, что это соответствие
т т
т-гп
Рис. 4
взаимно однозначно: для любой пары траекторий типа 1 можно было бы проделать преобразование
П2
то = 0 п.н. до момента ТN = N п.н. встречается поровну пар траекторий типа 1 и типа 2. Тогда нам достаточно доказать, что на пути процесса П2 от любого момента остановки Т1 до момента ТN = N п.н. пары траекторий типа 2 встречаются не реже, чем пары типа 1. Докажем это.
Сначала рассмотрим такую траекторию до момента остановки Т1, что SТ1 = MТ1. Каждая пара траекторий типа 1 или 2, которая будет появляться на пути начиная с этого момента до ТN на продолжении этой траектории, будет также парой этого типа, если мы перенесем начало координат в точку остановки момента Т1 и как бы отбросим начальную траекторию до этого момента. Действительно, эта начальная траектория не содержит точек выше точки остановки. А двигаясь от начала координат, мы встретим поровну точек типа 1 и типа 2 на пути до конечного момента, как мы только что доказали.
Далее, если Sтl < MТ1, то на пути от момента Т1 до ТN мы встретим не больше траекторий типа 1, чем в случае SТl = MТl при тех же Т1 и N. Действительно, зафиксируем Т1 и на отрезке [0, Т1] рассмотрим две траектории ш^ и ш^, удовлетворяющие уеловиям SТl < MТl и SТl = MТl соответственно, и объединим в пару каждые две траектории на интервале [0,^, которые обе начинаются либо с ш1, либо с ш2 и одинаково ведут себя па интервале [т1,^ (одновременно шагают вниз и
ш1
тоже имеет тип 1, а вот наоборот неверно. И поскольку мы уже знаем, что среди начинающихся с ш2 ш1
1 будет не больше, чем типа 2.
Т1
момента ТN мы встретим не меньше траекторий типа 2, чем типа 1. А значит, то же самое можно
Т1
Итак, свойство 3 доказано.
Доказательство неравенства (11) на основе свойств 1-3. Введем еще один процесс П3 обновления множеств Ао,к и А1,к (обновленные множества будем называть так же, не добавляя никаких новых индексов), такой, что после каждого шага обновления для множеств Ао,к и А1,к сохранятся свойства 1-3 и что достаточно доказать неравенство (11) для них, чтобы доказать его для исходных множеств.
Мы уже доказали, что свойства 1-3 выполнены до начала процесса П3. Опишем этот процесс. На каждом его шаге выбираем в множестве А1,к самую нижнюю точку с отрицательной абсциссой. Если в А1,к нет точек с отрицательной абсциссой, то из свойства 1 следует, что в нем все точки имеют нулевую абсциссу, а значит, множества Ао,к и А1,к совпадают и неравенство (11) выполняется.
П3
Если же нижняя точка с отрицательной абсциссой нашлась, то обозначим ее (—1,т1). Точек с такой или меньшей ординатой и при этом положительной абсциссой в множестве А\кк нет: при т1 = 0 это следует из того, что точек с пулевой ординатой и положительной абсциссой в множестве А1,к быть не может ввиду ограничения т ^ в; при т1 > 0 это следует го свойства 3 для к = т1 — 1; в противном случае вышло бы, что в А+,т1 есть точки, а в А_,т1_1 их пет (поскольку точка (в1, т\) является самой нижней из точек с отрицательной абсциссой в А1,к), что противоречит свойству 3 при к = т1 — 1. Возьмем самую нижнюю точку из точек с положительной абсциссой в А\кк (из свойства 1 следует, что в А1,к есть точки с положительной абсциссой). Обозначим ее (1,т2)• Нам известно, что т2 > ть Согласно свойству 2, в множестве Ао,к есть точка (0,т1), соответствующая точке (—1,т1), и точка (0,т2), соответствующая точке (1,т2)• Выбросим из множества Ао,к точки (0,т1) и (0,т2), из множества А\кк точки (—1,т1) и (1,т2)• Это и есть шаг обновления. Очевидно, свойства 1-3 по-прежнему будут иметь место. Неравенство (11) достаточно доказать для обновленных множеств, поскольку выполняется неравенство, получаемое комбинацией неравенств (2) и (3):
/(0,т1) — /(—1,т1) ^ /(1,т2) — /(0,т2).
Таким образом, неравенство (11) доказано, и мы доказали п. 1 теоремы 2.
Докажем теперь п. 2 теоремы 2. Возьмем произвольный момент остановки т1 и момент ТN = N п.н., оптимальность которого мы устанавливаем, и докажем, что
> Хт1. (13)
Для этого достаточно доказать оптимальность момента ТN = N отдельно на продолжении каждой траектории ш па иптервале [0,Т1]: если мы дошли по этой траектории до момента Т1, то другие траектории на интервале [0, Т1 ] нам уже не встретятся. Фиксируем определенную траекторию ш. Пусть SТ1 (ш) = в1 и MТ1 (ш) = т1.
Как и в доказательстве п. 1, сопоставим каждому из двух рассматриваемых моментов Tl,TN
(в, т) (в, т)
вш сейчас не интересуют) и имеющей максимум т на всем интервале [0,Ж]. Обозначим множества, соответствующие моментам т1 и т^, через А1 и А^. Тогда множество А1 состоит из точек с абсциссой в1
Описание процесса, П1. Выполним для множеств А1 и А^ ^^^^^^^ ^новления П1, аналогичный П1
осью этого процесса будет ось в = вь Это значит, что вмест о точки (в,т) € А^с в>в1В множестве А^ ^^^^^тся точки (в1 + 1,т — (в — в1) + 1),..., (в1 + 1, т), а в множество А1 добавятся точки (в1, т — (в — в1) + 1),..., (в1 ,т — 1); вместо точки (в, т) € А^ с в < в1 в множестве AN появятся точки (в1 — 1, т),... , (в1 — 1,т + (в — в1) — 1), а в множество А1 добавятся точки (в1 ,т + 1),..., (в1,Ш + (в — в1) — 1).
Поскольку по сравнению с п. 1 мы имеем противоположный знак в неравенстве (4), то доказать нам теперь нужно противоположное неравенство (сумма значений функционала на точках множества с постоянной "центрированной" абсциссой в = в1 должна быть меньше, а не больше, как
в=0
достаточно доказать следующее неравенство:
— £¿1,* ^ 0. (14)
Свойства множеств А1;к и А^к- Покажем, что множества А1, к и AN,к обладают свойствами, соответствующими свойствам 1-3 из доказательства п. 1.
Свойство 1'. В множестве AN,к поровну точек, у которых в = в1 — 1 и в = в1 + 1. Доказательство. Во-первых, из доказательства свойства 1 мы знаем, что сумма абсцисс точек Ао А1
А^. Во-вторых, там же замечено, что процесс обновления множества П1 (а по аналогии и П1) не
меняет сумму абсцисс, поэтому сумма абсцисс одинакова у А1 и А1 ,к, У А^ и AN,к- Таким образом, '
Свойство 2'. В множествах А1,к и AN,к поровну точек с любой фиксированной ординатой,
т
Доказательство. Как и при доказательстве свойства 2, замечаем, что, во-первых, точек с ординатой т поровну в множествах А1 и AN, а во-вторых, равенство количества точек сохраняется П'1 '
Свойство 3'. Определим, для множества AN ,к следующие его подмножества: А+,к = {(в, т) € AN,к1в = в1 + 1,т ^ к}, А_, к = {(в, т) € AN,к|в = в1 — 1,т ^ к}. Для любы,х к ^ 0 имеет место неравенство
,^ < |А+,к+1|.
Ао,к А1,к
П2, переводящем момент остановки т1 в момент остановки TN, мы встретим пар траекторий типа
т1 = в1
означает, что теперь в противоположность п. 1 точек в множестве А+,к+1 будет не меньше, чем в множестве AN,-,k: для любого к. Таким образом, свойство 3' доказано.
Доказательство неравенства (14) на основе свойств 1'-3'. Введем еще один процесс П'3 обновления множеств А1, к и AN,к (обновленные множества будем называть так же, не добавляя никаких
новых индексов), такой, что после каждого шага обновления для множеств А1, к и AN,к сохранятся ''
множеств.
' ' П'3
На каждом его шаге выбираем в множестве AN,к самую нижюю точку с абсциссой в = в1 + 1 Если в AN,к нет точек с такой абсциссой, то из свойства 1' следует, что в нем все точки имеют абсциссу в1, а значит, множества А1, к и AN,к совпадают и неравенство (14) выполняется. Именно к этому П'3
Если же верхняя точка с абсциссой в = в1 + 1 нашлась, обозначим ее (в1 + 1,Ш1). Точек с ординатой, не превосходящей Ш1 — 2, и при этом с абсциссой в = в1 — 1 в множестве AN,к нет: это следует из свойства 3' для к = Ш1 — 1; ^^^^е вышло бы, что в А+,т1 _1 ^ет ^отек, а в А_,т1_2 точки есть, а это противоречит свойству 3' при к = Ш1 — 2.
Возьмем самую нижнюю точку из точек с абсциссой в = в1 — 1 в А^к (из свойства 1' следует, что в А1,к есть точки с такой абсциссой). Обозначим ее (в1 — 1,Ш2)■ Нам ^^тестно, что Ш2 > Ш1 — 2. Согласно свойству 2', в множестве А^к ^^^ь точка (в1,Ш1) ^^^^^^^^^етющая точке (в1 +
1,mi), и точка (si,m2), соответствующая точке (si — 1,m2)• Выбросим из множества Ai,k точки (si, mi) и (si, из множества An,к точки (si + 1, mi) и (si — 1, Ш2). Это и есть шаг обновления. Очевидно, свойства 1'-3' по-прежнему будут иметь место. Неравенство (14) достаточно доказать для обновленных множеств, поскольку выполняется неравенство, получаемое комбинацией неравенств (2) и (4):
f (si, m2) — f (si — 1, m2) < f (si + 1, mi) — f (si, mi).
Таким образом, неравенство (14) установлено и мы доказали п. 2 теоремы 2.
Докажем теперь п. 3 теоремы 2. Проследим доказательство в п. 1 теоремы для момента остановки Ti, такого, что P{ri = N или STl = MTl} = 1. Заметим, что благодаря равенству (5) достижение равенства в (9) равносильно равенству в (11). Далее, равенство достигается в свойстве 3, поскольку в процессе П^, переводящем момент остановки то в момент остановки ri, мы встретим поровну пар траекторий типа 2 и пар траекторий типа 1. И, наконец, заметим, что равенство в (11) равносильно для любых множеств, получаемых в процессе Пз, поскольку замена точек одинаково изменяет суммарную полезность точек множества Ао,к и точек множества Ai,k- В конце процесса Пз мы
Ti
как и момент то.
Автор приносит благодарность А. Н. Ширяеву за постановку задачи и внимание к работе.
СПИСОК ЛИТЕРАТУРЫ
1. Ширяев А.Н. Основы стохастической финансовой математики. Т. 2: Теория. М.: Фазис, 1998.
2. Shiryaev A.N., Xu Z., Zhou X.Y. Thou shalt buy and hold // Quantitative Finance. 2008. 57, N 8. 765-776.
3. Allaart P. C. A general "bang-bang" principle for predicting the maximum of a random walk //J. Appl. Probab. 2010. 47, N 4. 1072-1083.
Поступила в редакцию 28.02.2014
УДК 521.131, 517.925.42
МУЛЬТИПЛИКАТОРЫ ПЕРИОДИЧЕСКИХ РЕШЕНИЙ ХИЛЛА В ТЕОРИИ ДВИЖЕНИЯ ЛУНЫ И МЕТОД УСРЕДНЕНИЯ
Е. А. Кудрявцева1
Изучается 2-параметрическое семейство гамильтоновых систем Нш,е с двумя степенями свободы, где система НШ}0 описывает задачу Кеплера во вращающихся осях с угловой частотой w, система Hi,i описывает задачу Хилла, т.е. "предельное" движение Луны в плоской задаче трех тел "Солнце-Земля-Луна" с массами m1 ^ m2 > m3 = 0. Методом усреднения па подмногообразии доказано существование числа w0 > 0 и гладкого семейства 2п-перподнческих решений Yu,e(t) = (q.u,e(t), Pw,e(t)) системы Нш,е, |е| ^ 1, |w| ^ w0, такого, что решения являются круговыми, Yu,e = 1ш,0 + O(w2e) и "масштабированные" движения 7ш,е(?) := (w2/3qu,e(t/w),w-i/3pu,e(t/w)) щи 0 < |w| < w0 и е = 1 образуют два семейства решений Хилла, т.е. начальные участки известных семейств f и g+ (с обратным и прямым направлением движения) 2пш-иериодических решений задачи Хилла Hi,i. С помощью усреднения доказано, что сумма мультипликаторов решения Хилла Yu,i имеет вид Tr (7шд) =4 — (2nw)2 + (2nw)3/(4n) + O(w4). Описаны уточнения и обобщения результата на класс систем, включающий ограниченную задачу трех тел, а также его приложения к планетным системам со спутниками.
Ключевые слова: задача трех тел, задача Хилла, периодические решения, усреднение на подмногообразии.
A 2-parameter family of Hamiltonian systems Hu,e with two degrees of freedom is studied, where the system Hu,0 describes the Kepler problem in rotating axes with angular frequence w, the system Hi}i describes the Hill problem, i.e. a "limiting" motion of the Moon in the planar three body problem "Sun-Earth-Moon" with the masses mi ^ m2 > m3 = 0. Using
1 Кудрявцева Елена Александровна — канд. физ.-мат. наук, доцент каф. дифференциальной геометрии и приложе-
ний мех.-мат. ф-та МГУ, e-mail: eakudrQmech.math.msu.su.