Математика
УДК 519.21
О МОДЕЛИ ТОЧЕЧНЫХ КОНФИГУРАЦИЙ, ЗАДАННОЙ ПОЛУПАРАМЕТРИЧЕСКИМ ВЗАИМОДЕЙСТВИЕМ
П. Я. Грабарник1, В. В. Щербаков2
Предлагается модель пространственного точечного процесса, заданного плотностью относительно пуассоновской меры. Функция плотности задается в полупараметрической форме, тем самым достигается значительная гибкость модели, позволяющая генерировать конфигурации точек с разнообразными структурными свойствами. Обсуждаются стандартные аналитические свойства процесса и его связи с известными классами точечных процессов.
Ключевые слова: пространственный точечный процесс, пуассоновский точечный процесс, функция взаимодействия, функция условной интенсивности, локальная стабильность, кластерные и регулярные точечные конфигурации, экспоненциальное семейство распределений.
A model of a point process specified by a density with respect to the Poisson measure is developed. The proposed model is very flexible due to the choice of the interaction function in a semiparametric form. This allows us to simulate point patterns with structure properties of high diversity. Standard analytical properties of the process and its connections with known classes of point processes are discussed.
Key words: spatial point process, Poisson point process, interaction function, conditional intensity function, local stability, cluster and regular point patterns, exponential family of distributions.
Моделирование систем пространственно распределенных взаимодействующих объектов представляет большой интерес для многих областей знания [1]. Часто такие системы объектов удобно описывать с помощью моделей случайных точечных процессов, распределение которых задано плотностью по отношению к распределению пуассоновского точечного процесса. В данной работе мы предлагаем модель случайного точечного процесса, плотность которого принадлежит к экспоненциальному семейству распределений и может быть выражена через функцию взаимодействия между соседними точками в полупараметрической форме. Новая модель может быть использована для описания разнообразных точечных конфигураций как регулярного, так и кластерного типа. Кроме того, специальным выбором параметров можно моделировать конфигурации со смешанными регулярно-кластерными свойствами.
Введем необходимые понятия и определения. Пусть D — компактное подмножество Rd, содержащее некоторую окрестность начала координат. Обозначим через \D\ лебегову меру множества D и предположим, что \D\ > 0. Для n ^ 1 определим n-точечную конфигурацию в D как неупорядоченное множество точек x = [x\,...,xn}, где Xi Е D, i = 1,...,n, такое, что в нем нет совпадающих точек, т.е. Xi = Xj для i = j. Пусть F — множество всех конечных точечных конфигураций множества D, включая пустую конфигурацию 0 (пустая конфигурация соответствует n = 0). Обозначим через \x П B\ число точек конфигурации x Е F в борелевском множестве B С D. Определим ст-алгебру F как минимальную ст-алгебру подмножеств F, относительно которой измеримы все отображения вида x ^ \x П B\, где B — произвольное борелевское подмножество D. Далее, назовем различные точки x,y Е D соседями, если евклидово расстояние между y и x не больше, чем некоторое фиксированное положительное число (радиус взаимодействия) R, т.е. \\x — y\\ ^ R. Для x Е D и x = {xi,... ,xn} Е F обозначим через vx(x) множество соседей точки x в множестве x; \vx(x)\ — мощность множества vx(x), т.е. число соседей точки x. По определению щ (x) = 0.
1 Грабарник Павел Яковлевич — канд. физ.-мат. наук, ст. науч. сотр. лаборатории моделирования экосистем ИФХБПП РАН, e-mail: [email protected].
2Щербаков Вадим Валерьевич — канд. физ.-мат. наук, науч. сотр. лаборатории больших случайных систем мех.-мат. ф-та МГУ, e-mail: [email protected].
Пусть Рп — распределение пуассоновского точечного процесса П(1) с единичной интенсивностью в О, т.е. вероятностная мера на (Е, Г), заданная следующей формулой:
Рп(А) = е |D| + J l{{xl,...,Xn}eA}dxi... dx^j
n=1 т~т
Aef, (1)
n! ' '
Dn
где через 1е мы обозначили индикатор события Е. Распределение предлагаемого точечного процесса есть вероятностная мера на измеримом пространстве (Е, Г), определяемая следующей плотностью по отношению к мере (1):
/(х) = Е-1 0ы*к)\, (2)
хк ех
где {вт, т ^ 0} — некоторая последовательность неотрицательных чисел, а 2 — нормирующий множитель (статсумма в терминологии статистической физики), т.е.
г = е~™ 1 + Е^? / II V ....... <1-п ... <!■>■,А. (3)
4 п=1 • ¿п к=1 '
Установим ограничения на параметры в, обеспечивающие конечность статсуммы (3) и, таким образом, существование точечного процесса, заданного плотностью (2).
Лемма 1. 1) Если существует константа С > 0, такая, что для всех т выполняется вт ^ Ста, где а < 1, то статсумма (3) конечна.
2) Если существует константа С > 0, такая, что для всех т выполняется вт ^ Ста, где а > 1, то статсумма (3) бесконечна.
Доказательство. Докажем первое утверждение леммы. Заметим, что в\их(Хк)\ ^ С|х|а для любых х £ Е и Хк £ х. Следовательно,
Z < е~1д1 V (c\D\Tnan
n=0 n=0
где Ci — это некоторая положительная константа. Для получения второго неравенства мы воспользовались известной асимптотической формулой для факториала. Ряд в правой части последнего неравенства сходится, и, следовательно, статсумма конечна.
Докажем вторую часть леммы. Из предположений относительно множества D следует, что оно содержит в себе некоторый шар B, радиус которого не превосходит R/2. Для каждого n интеграл по Dn в правой части (3) оценим снизу интегралом по Bn. Нетрудно видеть, что если x £ Bn, то любая точка Xk £ x имеет n — 1 соседа. Поэтому статсумму можно оценить снизу следующим образом:
- > Со Y^ e-ralog(ra)(l-a)+ra(log(|B|)+log(C)+a)-l/21og(ra) ^ п\ ^
n=1 n=1
с некоторой константой C2, где мы снова воспользовались известной асимптотикой факториала. Очевидно, что ряд в правой части последнего неравенства расходится, если а > 1. Таким образом, при сделанных предположениях статсумма бесконечна. Лемма доказана.
Заметим, что существование процесса во всех практически интересных частных случаях (см. примеры ниже) гарантируется доказанной леммой.
Предлагаемая модель точечного процесса — это частный случай модели точечных процессов, введенных в работе [2] и названных там процессами взаимодействующих соседей (INP-процессы). Распределение INP-процесса задается плотностью следующего вида относительно меры (1):
f (x) = Z-1 g(xk,Vx(xk)),
xkex
где g : D x F ^ R+ — некоторая измеримая функция. Плотность вида (2) получается при следующем выборе функции g:
g(x, z) = Е вт 1{\z\=m}.
т>0
Таким образом, модель (2) может рассматриваться как полупараметрическая версия класса INP-процессов с плотностью, принадлежащей экспоненциальному семейству распределений. Данный выбор формы модели удобен, когда отсутствует априорная информация о виде функции взаимодействия с соседями g. Последующий анализ оценок параметров в может позволить выбрать представление функции g в виде кривой, зависящей от небольшого числа параметров.
Интересно отметить, что конструкция предлагаемого случайного точечного процесса основана на таком же предположении о характере взаимодействия между точками, что и модель случайного последовательного размещения частиц в пространстве (модель CSA), изучаемая в работах [3-5]. В модели CSA точки (частицы) размещаются случайно и последовательно в ограниченном подмножестве конечномерного евклидова пространства так, что если x = (x\,...,xk) — это последовательность точек, размещенных после к шагов, то следующая размещаемая точка Xk+i имеет условное распределение с плотностью, пропорциональной функции (ж)|, где vx(x) — это множество соседей точки x в X. Аналогичным образом единственная информация о точечной конфигурации, необходимая для вычисления вклада отдельных точек в произведение в формуле (2), — это числа соседей.
Естественно интерпретировать параметры модели (2) как параметры, управляющие интенсивностью точек, имеющих заданное число соседей. Таким образом, увеличение значения параметра @i для некоторого i увеличивает вероятность состояний процесса, в котором точки с i соседями имеют более высокую концентрацию. Также легко заметить, что в случае набора возрастающих параметров во < ... < Pi < ... (условия на рост последовательности сфомулированы в лемме 1) типичными реализациями являются точечные конфигурации, образованные сгущениями точек. На языке статфизики этот случай соответствует притягивающему типу взаимодействия между точками. Если набор параметров образует убывающую последовательность, то естественно ожидать, что наиболее вероятными состояниями процесса будут так называемые регулярные точечные конфигурации, соответствующие отталкивающему взаимодействию.
Особый интерес для приложений представляют модели процессов, специфицированные конечным числом параметров, так как только в этом случае параметры могут быть оценены на основе наблюдаемой конфигурации. Варьированием значениями параметров в и радиуса взаимодействия R можно получать широкий спектр точечных конфигураций — от регулярных, образованных плотной упаковкой шаров, до разнообразных кластерных конфигураций, образованных группами точек различного размера и различной плотности (насыщенности). Это обстоятельство делает предлагаемый точечный процесс крайне удобным для многих приложений.
Перечислим частные случаи точечного процесса с плотностью (2), некоторые из которых уже встречались в литературе.
1) Пуассоновский точечный процесс в области D с интенсивностью в > 0 получается, если Pi = в, i ^ 0.
2) Если положить во = в > 0 и вi = 0, i ^ 1, то мы получаем так называемый процесс с жесткой сердцевиной, интенсивность которого управляется параметром в. Распределение процесса сосредоточено на точечных конфигурациях, в которых расстояние между любыми двумя точками не меньше чем R.
3) Непосредственным обобщением процесса с твердой сердцевиной являются точечные процессы с плотностью (2), определяемые конечным числом ненулевых параметров, т.е. вi > 0, если 0 ^ i ^ N, и вi = 0, если i > N, для некоторого N ^ 0 (при N = 0 получаем процесс с жесткой сердцевиной). Реализации такого процесса будут состоять из точек, у которых не может быть более N соседей.
4) Точечный процесс Штраусса с параметрами а > 0 и 0 < Y < 1 соответствует следующему выбору последовательности параметров: вi = aYi/2, i ^ 0 (при y > 1, как замечено в [6], процесс не определен, так как статсумма расходится). Процесс Штраусса является одним из наиболее часто применяемых точечных процессов в пространственной статистике [7]. Традиционно его распределение задается плотностью (по отношению к мере (1)), которая пропорциональна функции a|x|7s(x), где s(x) — это число пар соседних точек в x. Нетрудно видеть, что s(x) = 1/2^ ex\vx(xk)|, откуда и получаем, что при указанном выборе параметров процесс (2) имеет плотность процесса Штраусса. В традиционной параметризации а управляет интенсивностью точек, в то время как параметр y отвечает за взаимодействие между точками. Заметим, что процесс с твердой сердцевиной из п. 2 может рассматриваться как предельный случай процесса Штраусса, если положить y = 0.
5) В [8] Гайером предложена модификация процесса Штраусса, которая позволяет моделировать кластерные конфигурации. Процесс Гайера входит как частный случай в класс процессов, определенных плотностью (2), с вi = aY™m{ci, i ^ 0, для некоторых а > 0,c > 0,y > 0.
6) Точечные процессы с плотностью (2), определяемые конечным числом произвольных параметров, т.е. вi > 0, если 0 ^ i ^ N, и вi = Y ^ 0, если i > N, для некоторого N ^ 0, могут рассматриваться как
дальнейшее обобщение процесса Гайера. Преимущество данной модели состоит в том, что соответствующим выбором параметров вг, г > 0, можно контролировать размер кластеров.
Заметим, что плотности всех точечных процессов из примеров 1-6 обладают так называемым свойством наследственности, а именно если / (х) > 0, х £ Е, то и /(у) > 0 для любого у С х. В дальнейшем мы рассматриваем только те плотности вида (2), которые обладают этим свойством.
Для и £ В и х £ Е определим функцию
. , . . / (х и и) А и х = М
/(х)
где мы полагаем по определению 0/0 = 0. В теории точечных процессов эта функция называется условной интенсивностью процесса и интерпретируется как вероятность появления точки и в бесконечно малой области А С В при условии, что в оставшейся области В \ А точки процесса образуют конфигурацию х. Нетрудно вычислить, что для точечного процесса с плотностью (2)
А(«|х)=/*Мм), П (4)
Очевидно, что первый множитель в правой части уравнения (4) зависит от добавляемой точки и и ее соседей, в то время как последующее произведение зависит в общем случае как от добавляемой точки и ее соседей, так и от соседей ее соседей. Интересным является вопрос, какие условия следует наложить на последовательность параметров вг, чтобы условная интенсивность зависела только от соседей добавляемой точки и (в теории марковских точечных процессов это свойство называется марковостью в смысле Рипли-Келли [6]). Для определенности рассмотрим подкласс точечных процессов, имеющих строго положительную плотность вида (2), что эквивалентно положительности параметров в, т.е. вг > 0, г ^ 0. Покажем, что процесс Штраусса (см. п. 5 выше) является единственным точечным процессом со строго положительной плотностью вида (2), у которого условная интенсивность зависит только от добавляемой точки и ее соседей. Действительно, то, что условная интенсивность процесса Штраусса обладает этим свойством, — это факт, легко проверяемый и хорошо известный. Докажем, что других плотностей с этим свойством в указанном классе нет. Предположим, что / — это плотность вида (2), где вг > 0, г ^ 0, такая, что соответствующая условная интенсивность /^ и и)//зависит только от точки и и ее соседей в множестве z. Для любой плотности, обладающей таким свойством, выполняется, как нетрудно проверить, следующее соотношение:
/^ и и1 и и2)/ф = /^ и их)/^ и и2), (5)
в предположении, что точки их и щ не являются соседями, т.е. что ||и1 — и21| > Я. Предположим дополнительно, что множества z, z и их и z и и2 являются группами взаимных соседей, т.е. любые две точки в каждом из этих множеств являются соседями. Если мощность множества z равна г ^ 1, то в случае плотности вида (2) уравнение (5) имеет следующий вид: вг^в^вг-1 = в2%+11, поскольку, как нетрудно заметить, /^ и и1 и и2) ~ вг+1в~ в\-1 и /^ и и1) = /^ и и2) ~ в\+1. Таким образом, получаем, что вг+1вг-1 = вг для любого г ^ 1, откуда и следует, что вг = а^г, г ^ 0, для некоторых констант а и 7, что и требовалось доказать.
Можно показать, что процесс с твердой сердцевиной — это единственный представитель класса процессов, определенных в п. 3, у которого условная интенсивность зависит только от добавляемой точки и ее соседей. Это естественно ожидать, поскольку процесс с жесткой сердцевиной является предельным случаем процесса Штраусса.
Как хорошо известно, если условная интенсивность зависит только от добавляемой точки и ее соседей, то соответствующий точечный процесс обладает так называемым пространственным марковским свойством в смысле Рипли-Келли [6]. Это значит, что условное распределение сужения конфигурации процесса на некоторое подмножество С множества В зависит только от тех точек конфигурации в множестве В \ С, которые отстоят от границы множества С на расстояние не большее чем Я.
Аналогичным пространственным марковским свойством, которое обобщает пространственное марковское свойство в смысле Рипли-Келли, обладают ШР-процессы [2] и соответственно точечные процессы с плотностью вида (2). Кроме того, для ШР-процессов имеет место теорема факторизации для плотности процесса, аналогичная известной теореме Хаммерсли-Клиффорда о факторизации плотности точечного процесса, являющегося марковским в смысле Рипли-Келли (см. [2]).
В оставшейся части статьи мы докажем свойство локальной стабильности для достаточно широкого класса предлагаемых точечных процессов. Точечный процесс с условной интенсивностью А(и|х) называется локально стабильным, если существует такая константа С > 0, что неравенство А(и|х) ^ С
выполняется равномерно по всем и £ О и х £ Е. Полезность данного условия объясняется тем, что его выполнение обеспечивает геометрическую сходимость алгоритмов моделирования точечных процессов, заданных плотностью относительно пуассоновской меры. Кроме этого локальная стабильность процесса влечет выполнение центральной предельной теоремы для некоторых функционалов от точечных процессов [8].
Так как в приложениях наиболее важен двумерный случай, то в следующей лемме мы предполагаем, что О С И2 (доказательство может быть перенесено и на случай пространства произвольной размерности).
Лемма 2. Если вг > 0, г = 0,...,М, и вг = 7 ^ 0, г > М, для некоторого фиксированного N, то точечный процесс с плотностью (2) локально стабилен.
Доказательство. Обозначим
С вг+1
В = тах -.
г=0,..,И вг
Если В ^ 1, то произведение в формуле (4) не превосходит 1 и, следовательно, условие локальной стабильности выполнено.
Рассмотрим случай, когда В > 1. Предположим, что ^ > 0. Рассмотрим произвольные х £ Е и и £ О. Если Хк £ их(и) и 1^х(хк)| ^ N, то множитель в\их(Хк)\+1/в\их(Хк)\ (вклад точки Хк в формуле для условной интенсивности) оцениваем сверху числом В. Если же Хк £ Vх(и) и 1^х(хк)| > N, то в\их(Хк)\+1/в\^х(Хк)\ = 1 (т.е. вклад такой точки тривиальный). Оценим число точек из их(и) с нетривиальным вкладом (т.е. не равным 1). Разобьем круг радиуса Я с центром в точке и на 6 непересекающихся конгруэнтных секторов. Так как расстояние между любыми двумя точками, принадлежащими одному и тому же сектору, не больше чем Я, то все точки, попавшие в один и тот же сектор, являются соседями. Следовательно, вклад точки Хк £ vx(u) может быть нетривиален, если только число точек множества их(и) в секторе, содержащем Хк, не превосходит N +1. С учетом оценки вклада отдельной точки получаем
..г„ Ш P\Vx(xk )\ V г /
Хкеих(п) в\"х(Хк)\
Рассмотрим случай 7 = 0. Пусть х £ Е и и £ О такие, что А(и|х) > 0. Тогда если Хк £ vx(u), то обязательно имеем, что х(Хк)| < N, и вклад точки Хк в локальную интенсивность, т.е. множитель в\^х(Хк)\+1 /в\их(Хк)\, может быть оценен сверху числом В. Так как их(и) ^ N (в силу ограничений на число соседей), то получаем следующую оценку для функции (4) в случае 7 = 0:
Хкеих(п) в\"х(Хк)\ ^
Лемма доказана.
Ввиду потенциальной применимости процесса в приложениях большой интерес представляют получение оценок параметров процесса и их статистические свойства. Мы предполагаем продолжить исследование в этом направлении, изучая асимптотические свойства оценок максимального псевдоправдоподобия. Авторы признательны рецензенту за замеченные неточности в ранней версии статьи.
СПИСОК ЛИТЕРАТУРЫ
1. Case Studies in Spatial Point Process Modeling / Ed. by A. Baddeley, P. Gregori, J. Mateu, R. Stoica, D. Stoyan // Lect. Notes Statist. Vol. 185. N.Y.: Springer, 2006.
2. Grabarnik P., Sarkka A. Interacting neighbour point processes: some models for clustering //J. Statist. Comput. Simul. 2001. 68. 103-125.
3. Penrose M.D., Shcherbakov V. Maximum likelihood estimation for cooperative sequential adsorption // Adv. Appl. Probab. 2009. 41, N 4. 978-1001.
4. Penrose M.D., Shcherbakov V. Asymptotic normality of maximum likelihood estimator for cooperative sequential adsorption // Adv. Appl. Probab. 2011. 43, N 3. 636-648.
5. Shcherbakov V. Limit theorems for random point measures generated by cooperative sequential adsorption //J. Stat. Phys. 2006. 124, N 6. 1425-1441.
6. Kelly F.P., Ripley B.D. On Strauss's model for clustering // Biometrika. 1976. 63. 357-360.
7. M0ller J., Waagepetersen R.P. Statistical Inference and Simulation for Spatial Point Processes. N.Y.: Chapman and Hall, 2004.
8. Geyer C. Likelihood inference for spatial point processes // Stochastic geometry, likelihood and computation / Ed. by O. Barndorff-Nielsen, W.S. Kendall, M.N.M. van Lieshout. Boca Raton: Chapman and Hall, 1999. 79-140.
Поступила в редакцию 01.09.2010
УДК 514.774.8+515.124.4+519.17
КРИТЕРИЙ АДДИТИВНОСТИ КОНЕЧНОГО МЕТРИЧЕСКОГО ПРОСТРАНСТВА И МИНИМАЛЬНЫЕ ЗАПОЛНЕНИЯ
О. В. Рублева1
В работе получен новый критерий аддитивности конечных метрических пространств, основанный на свойствах минимальных заполнений в смысле М. Громова.
Ключевые слова: метрические пространства, аддитивные пространства, минимальные заполнения в смысле Громова, минимальные деревья Штейнера.
A new additivity criterion of a finite metric space is obtained in the paper. The criterion is based on properties of minimal trees in Gromov's case.
Key words: metric spaces, additivity spaces, minimal fillings in Gromov's case, Steiner minimal trees.
Введение. Исследование минимальных заполнений конечных метрических пространств было предложено А. О. Ивановым и А. А. Тужилиным в [1]. Являясь частным случаем обобщения проблемы Громова [2] о минимальных заполнениях на стратифицированные многообразия, рассматриваемая проблема представляет и самостоятельный интерес как обобщение другой классической задачи, а именно проблемы Штейнера о поиске кратчайшей сети, соединяющей заданные терминалы [3]. Напомним основные определения. Пусть С = (V, Е) — некоторый конечный связный граф, где V — множество вершин, а Е — множество ребер графа С. Если задана неотрицательная функция и: Е ^ М+, обычно называемая весовой, то пара 0 = (С, и) называется взвешенным графом. Для каждого маршрута 7 и каждого подграфа Н во взвешенном графе 0 определены их веса и(7) и и(Н) соответственно, равные сумме весов всех входящих в них ребер. Это позволяет превратить множество вершин связного взвешенного графа 0 в метрическое пространство, положив расстояние между вершинами графа 0 равным наименьшему возможному весу соединяющего их в 0 маршрута. Таким образом определенную функцию расстояния обозначим через с!ш.
Связный взвешенный граф 0 = (С, и), где С = (V, Е), называется заполнением псевдометрического пространства М = (М, р) (в отличие от метрического пространства расстояния между разными точками псевдометрического пространства могут быть равны нулю), если М С V и для любой пары точек х и у из М выполнено неравенство р(х,у) ^ (1Ш(х,у). Величина и(С) называется весом заполнения 0. Инфимум весов всевозможных заполнений псевдометрического пространства М обозначается через ш1(М) и называется весом минимального заполнения пространства М. Заполнение 0, для которого и(С) = ш1(М), называется минимальным заполнением пространства М. В работе [1] показано, что минимальное заполнение всегда существует, причем при поиске минимального заполнения для М = (М, р) можно ограничиться рассмотрением деревьев С = (V, Е), М С V, у которых все вершины степени 1 и 2 принадлежат М. В дальнейшем, если не оговорено противное, мы всегда будем предполагать, что эти условия выполнены. Границей дС дерева С будем называть некоторое фиксированное подмножество множества вершин дерева С, содержащее все его вершины степени 1 и 2.
Оказалось, что в теории минимальных заполнений псевдометрических пространств важную роль играют так называемые аддитивные пространства (см. [1]). Эти пространства также часто встречаются в приложениях, таких, как биоинформатика, теория эволюции (см., например, [4]). Напомним, что конечное метрическое пространство М = (М, р) называется аддитивным, если существует взвешенное дерево
1 Рублева Ольга Владимировна — студ. каф. дифференциальной геометрии и приложений мех.-мат. ф-та МГУ, e-mail: [email protected].