УДК 51-76, 515.124
МНОГОМЕРНАЯ p-АДИЧЕСКАЯ МЕТРИКА И ГЕНЕТИЧЕСКИЙ КОД
С. В. Козырев1, А. Ю. Хренников2
1 Математический институт им. В. А. Стеклова РАН,
119991, Москва, ул. Губкина, 8.
2 Университет им. Карла Линнея, Векшо, Швеция.
E-mails: [email protected], [email protected]
Обсуждается класс метрик на многомерных p-адических пространствах. Для рассматриваемых метрик набор шаров отличается от набора шаров для стандартной метрики, более того, можно 'рассматривать разные наборы шаров, зависящие от положения и масштаба. В качестве примера приложения вводимых метрических пространств 'рассматривается параметризация генетического кода. Показывается, что вырождение генетического кода описывается метрическим пространством из рассмотренного класса, то есть отображение генетического кода постоянно на шарах относительно метрики из введённого класса.
Ключевые слова: генетический код, ультраметрика.
1. Конструкция метрики. Стандартная многомерная ультраметрика на Qp имеет вид
d(x,y) = max (|x—y»|p), x,y e Qi x = (xb ..., xd), y = (yb ..., yd). (1)
i=l,...,d
В работе [1] изучалась деформированная многомерная метрика на Qd вида
dqi,..,qd(x,y) = max (qi|xi — yi|p), p-1 < qi < 1 i=l,...,d
и строились системы всплесков, отвечающие такой метрике (а также некоторым обобщениям такой метрики, получаемым изометрическими линейными преобразованиями в Qd). Стандартная метрика имеет вид d = dl,...,l, qi — веса деформации.
В настоящей работе обобщается класс метрик введением зависимости весов qi от положения и масштаба. А именно, рассматривается дерево шаров T(Qd, d). Вершины этого дерева являются шарами в Qp относительно стандартной метрики d, вершины соединяются рёбрами, если для соответствующих шаров один из шаров является максимальным подшаром во втором шаре. На дереве T(Qd, d) есть естественный частичный порядок, отвечающий вложению шаров.
Рассмотрим теперь набор весов {qi}, i = 1, 2,..., d, qi = qi(I), p-1 < qi ^ 1, являющийся вектор-функцией на дереве T(Qd, d) (дереве шаров относительно стандартной метрики).
Введём метрику s на Qd, имеющую вид
s(x,y) = max (qi(sup(x,y))|xi — yi|p), p-1 < qi(J) ^ 1, J eT(Qp,d). (2) i=l,...,d
Сергей Владимирович Козырев (д.ф.-м.н.), ведущий научный сотрудник, отдел математической физики. Андрей Юрьевич Хренников (д.ф.-м.н.), директор центра, центр математического моделирования, отделение математики.
Здесь sup(x,y) есть наименьший шар (относительно стандартной метрики d), содержащий точки x и у.
Рассмотрим также более сложный пример метрики, получаемый из (2) применением зависящей от шара изометрии. А именно, рассмотрим для шаров Qp относительно стандартной метрики (1) набор mod p-аффинных изометрий {U} (см. [2]), то есть взаимно однозначных отображений шара в этот же шар, являющихся изометриями относительно (1) и удовлетворяющих условию mod p-аффинности (индуцированная рассматриваемой изометрией перестановка на множестве максимальных подшаров является аффинным отображением).
Введём метрику вида
q(x, у) = s(Ux,Uy), U = U(sup(x,y)).
Таким образом,
q(x, у) = max (qi(sup(x,y))|U(sup(x,y))(x* - у*)|р).
г= 1,...,d
Здесь qi удовлетворяют неравенствам, приведённым в (2), U есть описанный выше набор mod p-аффинных изометрий. Для определения метрики q фактически достаточно знать об изометриях U только соответствующие перестановки на множестве максимальных подшаров в sup(x,y).
Введённые выше метрики можно рассматривать как ультраметрический аналог римановой метрики в Rd. Для введения римановой метрики необходимо ввести метрику (квадратичную форму) в касательном пространстве к каждой точке в Rd. В ультраметрическом случае строится метрика введением метрики в наборах максимальных подшаров для каждого шара относительно стандартной метрики.
2. 2-Адическая параметризация генетического кода. Генетический код (способ кодирования белков на нуклеиновых кислотах), см. для обзора подходов к описанию генетического кода [3], имеет триплетную структуру: каждая аминокислота кодируется тройкой расположенных рядом нуклеотидов С1С2С3 (кодоном).
Обсудим подход работы [4] по 2-адической параметризации генетического кода. 2-Мерная 2-адическая параметризация множества кодонов вводится нижеследующим образом. Такой подход также использовался в работах [5, 6]. Другая p-адическая параметризация генетического кода была введена в [7]. Применение p-адических динамических систем к описанию генетического кода обсуждалось в [8].
1. Множество нуклеотидов параметризуется парами 0,1 следующим образом (такая параметризация отражает химическую природу нуклеотидов):
A G
U С
00 01
10 11
2. Рассмотрим следующий порядок нуклеотидов в кодоне:
2 > 1 > 3. (B)
3. Построим 2-адическую плоскость — квадрат 8 х 8 с координатами (ж, у): ж = (жожіжг) = жо + 2жі + 4х2, Жі = 0,1;
У = (У0У1У2) = Уо + 2уі +4у2, Уі = 0,1.
Такая 2-адическая плоскость может рассматриваться как группа Z/8Zх х Z/8Z (со сложением по модулю 8) с 2-мерной 2-адической метрикой
, С1С2С3) = тах(|х - х'Ь, |у - у'Ы, (3)
(х,у) = р(СіС2Сз), (х',у') = р(С1 С2 С3).
Расстояние принимает значения 1, 1/2, 1/4.
Рассмотрим отображение р, переводящее кодон в точку 2-адической плоскости
р : С1С2С3 ^ (ж, у) = (хоЖіЖ2,уоуіу2)
по следующим правилам: С2 определяет пару (жо,уо), С1 определяет пару (хі,уі), Сз определяет пару (х2,у2).
Нуклеотид определяет пару цифр по правилу (А), масштаб (2-адическая норма) пары задаётся правилом (В).
Рассмотрим 2-мерный вариант отображения Монна (р-адической замены переменной) следующего вида. Занумеруем строки и столбцы 2-адической плоскости по следующему правилу:
П : Z/8Z ^ {1, 2, 3, 4, 5, 6, 7, 8}, п : ж ^ ж, у ^ у;
П : хо + 2ж1 + 4х2 ^ 1 + 4хо + 2х1 + ж2;
П : уо + 2уі + 4у2 ^ 1 + 4уо + 2уі + у2.
Эквивалентно такое отображение может быть введено следующим образом:
П : 0, 4, 2, 6,1, 5, 3, 7 ^ 1, 2, 3, 4, 5, 6, 7, 8.
Отметим, что метрика на множестве кодонов была введена с использование отображения р, но без использования отображения п. Получаем 2-ади-ческую плоскость кодонов вида
ААА ААС САА САС АСА АСС ССА ССС
ААи ААС САи САС АСи АСС ССи ССС
иАА иАС САА САС иСА иСС ССА ССС
иАи иАС САи САС иСи иСС ССи ССС
АиА АиС СиА СиС АСА АСС ССА ССС
Аии АиС сии СиС АСи АСС ССи ССС
ииА иис СиА СиС иСА иСС ССА ССС
иии иис Сии СиС иСи иСС ССи ССС
Применяя к 2-адической плоскости кодонов митохондриальный генетический код, получим таблицу аминокислот на 2-адической плоскости следующего вида:
Lys Glu Ter Gly
Asn Asp Ser
Ter Gln Trp Arg
Tyr His Cys
Met Val Thr Ala
Ile
Leu Leu Ser Pro
Phe
Таким образом, вырождение генетического кода описывается локальным постоянством отображения 2-адического аргумента на малых расстояниях. В частности, в вышеприведенной таблице прообраз Lys есть половина шара диаметра 1/4 относительно стандартной 2-мерной метрики (3), прообраз Pro есть целый такой шар. В следующем пункте обсуждается вопрос о том, как выбирать метрику, чтобы вырождение описывалось шарами (а не половинками шаров).
3. Метрическое пространство генетического кода. На пространстве кодонов (2-адической плоскости) можно рассмотреть двумерную 2-адическую деформированную метрику вида
di,q(x,y) = max(|xi - yi|2,q|x2 - У2І2), 1/2 < q < 1.
Напомним, что на таблице кодонов оси координат направлены следующим образом: x1 — сверху вниз, x2 — слева направо.
Теперь прообраз Lys есть шар диаметром q/4, прообраз Pro есть шар диаметром 1/4. Относительно метрики di,q области вырождения кода являются шарами. Тем не менее хотелось бы иметь возможность более эффективно подгонять параметры метрики под свойства кода.
Для этого рассмотрим следующую метрику из семейства (2) на Z/8Zx2, отвечающую параметрам на шарах относительно стандартной метрики di,i:
1/2 < q < 1.
Здесь показаны параметры метрики s на шарах относительно di,i диаметра 1, 1/2, 1/4 соответственно. Параметры на шарах диаметра 1/4 отвечают за вырождение (описывают области вырождения генетического кода). Параметры на шарах диаметра 1/2 отвечают за характер вырождения (в частности, в двух подшарах диаметра q/2 в правом верхнем шаре диаметра 1/2 вырождение генетического кода носит разный характер, на 2 и 4 кодона соответственно).
Работа частично поддержана грантом «Математическое моделирование» университета Карла Линнея (Векшо, Швеция). Один из авторов (С. Козырев) был частично поддержан грантами
DFG Project 436 RUS 113/809/0-1 и DFG Project 436 RUS 113/951, грантами РФФИ 08-01-00727-а,
(i,i),
(q,1) (q,1)
(q,1) (q,1)
(1,q) (1,q) (1,q) (i,i)
(1,q) (1,q) (1,q) (i,i)
(1,q) (i,i) (i,i) (i,i)
(1,q) (i,i) (i,i) (i,i)
09-01—12161—офи-м и 11—01—00828—а, грантом Президента Российской Федерации на поддержку научных школ НШ-7675.2010.1 и программой Отделения математики РАН «Современные проблемы теоретической математики».
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Albeverio S., Kozyrev S. V. Multidimensional p-adic wavelets for the deformed metric // p-Adic Numbers, Ultrametric Analysis, and Applications, 2010. Vol. 2, no. 4. Pp. 265-277.
2. Albeverio S., Kozyrev S. V. Pseudodifferential p-adic vector fields and pseudodifferentiation of a composite p-adic function // p-Adic Numbers, Ultrametric Analysis, and Applications, 2010. Vol. 2, no. 1. Pp. 21-34.
3. Koonin E. V., Novozhilov A. S. Origin and Evolution of the Genetic Code: The Universal Enigma// IUBMB Life, 2009, February. Vol. 61(2). Pp. 99-111, arXiv: 0807.4749.
4. Khrennikov A. Yu., Kozyrev S. V. Genetic code on the dyadic plane// Physica A, 2007. Vol. 381. Pp. 265-272, arXiv: q-bio/0701007.
5. Khrennikov A. Yu., Kozyrev S. V. 2-Adic clustering of the PAM matrix // Journal of Theoretical Biology, 2009. Vol. 261. Pp. 396-406, arXiv: 0903.0137.
6. Козырев С. В., Хренников А. Ю. 2-Адические числа в генетике и симметрия Румера// Докл. Акад. Наук, 2010. Т. 430, № 1. С. 32-34; англ. пер. Kozyrev S. V., Khrennikov A. Yu. 2-Adic numbers in genetics and Rumer’s symmetry// Dokl. Math., 2010. Vol. 81, no. 1. Pp. 128-130.
7. Dragovich B., Dragovich A. A p-Adic Model of DNA Sequence and Genetic Code// p-Adic Numbers, Ultrametric Analysis and Applications, 2009. Vol. 1, no. 1. Pp. 34-41, arXiv: q-bio/0607018v1.
8. Khrennikov A. Yu. Gene expression from polynomial dynamics in the 2-adic information space// Chaos, Solitons, and Fractals, 2009. Vol. 42, no. 1. Pp. 341-347.
Поступила в редакцию 20/X/2010; в окончательном варианте — 15/II/2011.
MSC: 54E35
MULTIDIMENSIONAL p-ADIC METRIC AND GENETIC CODE
S. V. Kozyrev1, A. Yu. Khrennikov2
1 Steklov Mathematical Institute, Russian Academy of Sciences,
8, Gubkina st., Moscow, 119991, Russia.
2 Linnffius University,
82, Kalmar, Vaxjo, sE-391, Sweden.
E-mails: [email protected], [email protected]
We discuss the family of metrics in multimensional p-adic spaces. For a metric under consideration the set of balls differs from the set of balls for the standard multidimensional metric. Moreover, we it is possible to consider the metrics for which the form of the sets of balls depends on the scale and position. As the example of the introduced metric spaces we study the 2-adic parametrization of the genetic code. We show that the degeneracy of the genetic code is described by the metric space from the considered family, i.e. the map of the genetic code is constant for the balls with respect to the metric from the introduced class.
Key words: genetic code, ultrametric.
Original article submitted 20/X/2010; revision submitted 15/II/2011.
Sergey V. Kozyrev (Dr. Sci. (Phys. & Math.)), Leading Researcher, Dept. of Mathematical Physics. Andrei Yu. Khrennikov (Dr. Sci. (Phys. & Math.)), Director of the Centre, International Center for Mathematical Modeling, Dept. of Mathematics.