АНАЛИЗ ПОПУЛЯЦИОННО-ГЕНЕТИЧЕСКОЙ СТРУКТУРЫ НАСЕЛЕНИЯ ТАТАРСТАНА ЧЕРЕЗ ФАМИЛЬНЫЙ ЛАНДШАФТ
Ельчинова Г.И., Васильева Т.А., Зинченко Р.А.
Учреждение Российской академии медицинских наук Медико-генетический научный
центр РАМН, Москва
Применение фамилий в качестве биологического маркера давно и успешно используется во всем мире и позволяет исследователям получать оценки популяционно-генетических параметров на больших территориях при относительно низких материальных и временных затратах. Получение таких оценок, помимо чисто научного интереса, необходимо для анализа территориальной распространенности наследственной патологии, ее груза и спектра, и входит в разработанный в лаборатории генетической эпидемиологии МГНЦ РАМН алгоритм комплексного медико-популяци-онно-генетического обследования населения изучаемого региона, в данном случае населения Республики Татарстан. Корректность использования изонимного метода при работе с татарскими фамилиями показана нами ранее [Ельчинова, Зинченко, 2010]. Фамилии выкопированы из списков избирателей тотально для 16 районов Татарстана в 2009 году, их распределение подробно рассмотрено ранее [Ельчинова и др., 2012а]. Для исследования выбирались районы с преобладанием титульной нации. В качестве популяционной единицы выбран сельский округ, в состав которого входит один или несколько соседних населенных пунктов. Ряд характеристик, таких как случайный инбридинг и параметры Барраи, также получен ранее. Анализ схем фамильных ландшафтов наглядно показывает характер меж- и внутрипопуляционных взаимоотношений в изучаемом регионе и неоднократно применен при работе в различных популяциях России. Для подсчета дистанционных матриц выбраны фамилии с частотой, превышающей 0.1%, выборка которых охватывает от 32% населения в Бугульминском районе до 83% в Атнинском районе. Затем проведен стандартный кластерный анализ среднесвязывающим методом с порогом 0.05, результаты которого отражены на схемах фамильных ландшафтов. Проведен визуальный анализ пяти ландшафтных схем. В районах с моноэтническим составом населения эквидистантные фигуры концентричны, ориентированы вдоль путей сообщения. В полиэтнических районах кластеризация происходит по этническому принципу, кластеры взаиморасположены по типу «пазла», подтверждая обнаруженный ранее крайне низкий уровень метисации между представителями различных этнических групп в Республике Татарстан. Размер элементарной популяции оценен нами как группа соседних районов, населенных представителями одной этнической подгруппы татар (тептяри, мишари и др.). Полученные нами результаты сопоставимы с такими популяционно-генетическими характеристиками, как индекс эндогамии и длина средней квадратичной миграции, полученными при анализе брачных записей за 1990-2000 гг.
Ключевые слова: изонимия, фамильный ландшафт, элементарная популяция, кластер
Применение фамилий в качестве биологического маркера, называемое изонимным методом, позволяет исследователям получать оценки попу-ляционно-генетических параметров на больших территориях при относительно низких материальных и временных затратах. Получение таких оценок необходимо для анализа территориальной распространенности наследственной патологии и входит в алгоритм комплексного медико-популя-ционно-генетического обследования населения
изучаемого региона, в данном случае населения Татарстана. При использовании изонимного метода описания популяционно-генетической структуры изучаемого региона помимо оценок случайного инбридинга Райта и параметров Барраи, что мы сделали ранее [Ельчинова и др., 2011а; Ельчинова и др., 2012б], рассматриваются и схемы фамильного ландшафта, позволяющие получить наглядную картину внутрипопуляционной дифференциации и характера взаимоотношений между
Таблица 1. Численность населения и национальный состав изученных районов Татарстана [цит. по: http://www.valerytishkov.ru/, http://ru.wikipedia.org/]
Район Численность населения {тыс. чел.) Татары (%) Русские (%) Марийцы (%) Чуваши (%) Удмурты (%)
Арский 51.6 92.5 6.4 0.5
Атнинский 14,4 95.1 4.0
Дрожжановский 27.8 58.4 0.9 40.5
Алькеевский 21.0 61.7 16.5 21,3
Ачнакаевский 64.3 81.2 15.3 1.1
Муслюмовский 22.9 89.1 7.5 2.9
Актанышский 32 96.4 0.6
Балтасинский 34.3 84.3 1.2 0.8 12.5
Бугульминский 112.3 44.9 42.5 6.5
Буинский 46.6 62.3 15 21.9
Нурлатский 60.4 44.2 25.6 29.1
Кукморский 52.1 76.9 6.3 1.9 14.5
Мензелинский 36.3 60.4 35.2 2.7 0.6
Пестречинский 28.6 54.2 44.2 0.4
Черемшанский 21,1 52.1 18.9 22.4
Ютазинский 23.2 62.6 29.4 1.1 6.7
субпопуляциями. Метод предложен A.A. Ревазо-вым (1938-1989) и неоднократно использовался нами при анализе популяционно-генетической структуры населения различных регионов России. Наиболее подробно метод использован при работе с распределением частот фамилий в Якутии [Ельчинова, Тарская, 2006]. Корректность использования изонимного метода при работе в популяциях Республики Татарстан (РТ) показана нами ранее [Ельчинова, Зинченко, 2010]. Распределение фамилий изучено в 16 районах Татарстана (Буинский, Муслюмовский, Мензелинский, Акта-нышский, Азнакаеский, Бугульминский, Нурлатс-кий, Дрожжановский, Пестречинский, Ютазинский, Алькеевский, Балтасинский, Арский, Атнинский, Кукморский, Черемшанский) с общей численностью взрослого населения 480 178 чел. Численность населения и национальный состав в разных районах РТ существенно различается (табл. 1) [цит. по:
http://www.valerytishkov.ru/, http://ru.wikipedia.org/]. Фамилии выкопированы из списков избирателей тотально, ранее подробно рассмотрено их распределение [Ельчинова и др., 2011 в].
С использованием частых фамилий (частота более 0.1%) анализируются фамильные расстояния:
Фамилии рассматривались как аллели одного локуса, р1к и р2к частоты к-ой фамилии в изучаемых 1-ой и 2-ой популяциях [Cavalli-Sforza, Bodmer, 1971]. Величина, полученная таким способом, является безразмерной. В качестве попу-ляционной единицы нами выбран сельский округ, в составе которого один или несколько соседних населенных пунктов. С использованием средне-
связывающего метода проводится стандартный кластерный анализ с порогом 0.05 [Дерябин, 1983]. Затем составляется схема фамильного ландшафта [Ельчинова и др., 1991], фактически являющаяся эпиморфной проекцией дендрограммы на географическую карту местности. В данной работе мы не стремились нарисовать схемы фамильного ландшафта каждого их обследованных районов, что очень загромоздило бы работу, мы лишь старались выявить характерные для региона особенности популяционного ландшафта и оценить размер элементарной популяции.
На рис. 1 изображена схема фамильного ландшафта Арского и Атнинского районов. Эквидистантные фигуры концентричны, без самопересечений, оба района объединены в один кластер, граница между районами отсутствует. Кластеры ориентированы вдоль путей сообщения. Со времени административного разделения районов в 1990 году прошло менее поколения, чем вполне объяснимо отсутствие границы между районами. Районы можно считать моноэтническими - татары составляют более 90% (табл. 1). Эндогамия в районах невысока - 0.62 в Арском районе и 0.56
в Атнинском [Ельчинова и др., 2011 б]. Совсем другой характер эквидистантных фигур на рис. 2, где представлен фамильный ландшафт полиэтнического Черемшанского района - заметны два кластера, соответствующие татарскому (первый) и чувашскому и русскому населению (второй), расположенные друг к другу по принципу «пазла», которые формально должны быть нарисованы взаимопересекающимися.
Аналогичная картина наблюдается и при анализе фамильного ландшафта Буинского и Дрож-жановского районов, население которых также представлено в основном татарами и чувашами (рис. 3). Один кластер соответствует татарскому населению, второй - чувашскому. Такая сложная картинка получилась потому, что фактически кластеры являются самопересекающимися, что подтверждает наш тезис [Ельчинова и др., 2012а] о крайне низком уровне метисации в сельском населении Татарстана. Граница между районами также фактически отсутствует, как и на рис. 1. Эндогамия районов: 0.70 - Дрожжановский и 0.57 -Буинский.
Отсутствие межрайонной границы подтверждает основанное на уровне эндогамии предположение о том, что размер элементарной популяции в Татарстане превышает район [Ельчинова и др., 2012а]. Однако, ранее в наших исследованиях мы неоднократно наблюдали межрайонную границу. Поэтому мы рассмотрели схему фамильного ландшафта для Кукморского и Вятско-Полянс-кого района Кировской области (из архива лаборатории генетической эпидемиологии МГНЦ РАМН). Схема представлена на рис. 4. Граница между районами прослеживается достаточно четко, объединение районов происходит на последнем уровне кластеризации, несмотря на то, что расстояние между Кукмором и Вятскими Полянами всего 7 км, и они соединены железной дорогой, являющейся наиболее сильным связующим фактором в условия российского бездорожья. Однако приграничные Средние Шуни и Старая Пинегерь оказываются в кластере Кукморского района. Эквидистантные фигуры в кластере Вят-ско-Полянского района концентричны, в Кукмор-ском районе присутствуют 2 кластера, опять же расположенные «пазлом» и отражающие этнический состав населения района.
Для проверки присутствия/отсутствия межрайонной границы мы рассмотрели схему фамильного ландшафта Муслюмовского (эндогамия 0.62) и Актанышского (эндогамия 0.74) районов с преобладанием татарского населения (табл. 1). Районы не претерпевали в последнее время серьезных административно-территориальных преобразований [http://ru.wikipedia.org/wiki] и расположены достаточно далеко от Казани. Схема представлена на рис. 5. Граница между районами отсутствует, кластеры концентричны.
Таким образом, мы подтвердили наше предположение о том, что граница элементарной популяции в Татарстане превышает район, возможно, составляет группы районов, соответствующие этническим подгруппам татар. При кластеризации районов в качестве популяционной единицы это предположение косвенно подтверждается [Ельчинова и др., 2012а]. Не противоречит данному тезису и размер средней квадратичной миграции, составивший в изученных районах РТ 46-110 км [Ельчинова и др., 2011 б]. Крайне низкая интенсивность метисации [Ельчинова и др., 2011а] между различными этносами отражена в кластеризации по этническому принципу. Такие особенности популяционной структуры должны оказать влияние на особенности территориального распространения наследственной патологии в населении Республики Татарстан.
Работа выполнена в рамках комплексного медико-популяционно-генетического изучения населения Республики Татарстан при частичном финансировании РФФИ (10-04-00411, 11-0400012, 12-06-00004) и ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технического комплекса России на 20072012 годы».
Библиография
Дерябин В.Е. Многомерная биометрия для антропологов. М.: МГУ, 1983. 227 с.
Ельчинова Г.И., Кадошникова М.Ю., Зинченко (Маме-дова) P.A. Выявление особенностей генетической структуры популяций с помощью метода описания «генетического ландшафта» // Генетика, 1991. Т. 27. № 11. С. 19942001.
Ельчинова Г.И., Тарская Л.А. Анализ распределения фамилий в Республике Саха (Якутия) // Медицинская генетика, 2006. Т. 5. № 7(49). С. 21-26. Ельчинова Г.И., Зинченко P.A. Допустимость использования татарских фамилий в качестве квазигенетического маркера в популяционно-генетических исследованиях // Вестник Московского университета. Серия XXIII. Антропология. 2010. № 2. С. 55-61. Ельчинова Г.И., Вафина З.И., Зинченко P.A. Этническая ассортативность сельского населения Татарстана // Генетика, 2011 (а). Т. 47. № 2. С. 268-271 Ельчинова Г.И., Симонов Ю.И., Вафина З.И., Зинченко P.A. Эндогамия и изоляция расстоянием в населении Татарстана // Генетика, 2011 (б). Т. 47. № 8. С. 11261130.
Ельчинова Г.И., Вафина З.И., Порядина O.A., Зинченко P.A. Распределение фамилий в Татарстане // Вестник Московского университета. Серия XXIII. Антропология. 2012 (а). № 2. С. 76-86
Ельчинова Г.И., Игумнов П.С., Векшина A.B., Зинченко P.A. Инбридинг и эндогамия в Татарстане // Генетика, 2012 (б).
Cavalli-Sforza L.L., Bodmer W.F. The Genetics of Human populations // San Francisco: Ed. W.H.Freeman and Company. 1971. 965 p.
URL: http://www.valerytishkov.ru/cntnt/publikacii3/ kollektivn/na_puti_k_/respublika8.html (дата обращения 26.01.2010)
URL:http://ru.wikipedia.org/wiki (дата обращения 26.01.2010)
Контактная информация:
Ельчинова Галина Ивановна: e-mail: elchinova@med-gen.ru; Васильева Татьяна Aлексеевна:: e-mail: vasilyeva_debrie@mail.ru;
Зинченко Pена Aбульфазовна: e-mail: renazinchenko@mail.ru.
THE АNALYSIS OF POPULATION GENETIC STRUCTURE OF TATARSTAN INHABITANCES THROUGH THE SURNAME LANDSCAPE
G.I. El'chinova, T.A.Vasilyeva, R.A. Zinchenko
Research Center for Medical Genetics of the Russian Academy of Medical Science, Moscow
The surnames as a biological marker are successfully used all over the world for a long time and allow to receive estimations of population-genetic parameters on the large territories at rather low material and time expenses. Such estimations are valuable not only for scientific purpose, but also are necessary for the analysis of territorial prevalence of a hereditary pathology, its cargo and spectrum. These parameters are included in the algorithm of complex medic-population-genetic inspection of the population of studied regions. This strategy is used in the study of the Republic Tatarstan population conducted in the laboratory of genetic epidemiology in RCMG of the Russian Academy of Medical Science. Accuracy of using of the method of isonymy at work with the Tatar surnames is shown earlier by us [EnbHUHoea, 3uHneHKo, 2010]. Surnames were totally copied from lists of electors for 16 regions of Tatarstan in 2009, their distribution is considered earlier in detail [EnbHUHoea u dp., 2012]. The regions with prevalence of the title nation were picked up for this research. The rural district with one or several neighbour settlements is chosen as a population unit. Some characteristics, such as random inbreeding and parameters of Barrai, also were received earlier. The analysis of surname landscapes schemes demonstrates the character of inter- and intrapopulation mutual relations in studied region and it was repeatedly applied in researching of various populations of Russia. For calculation of distancy matrixes surnames with the frequency exceeding 0.1% are chosen. The sample covers from 32% of the population in Bugulminsky area to 83% in Atninsky area. Standard cluster analysis by a meadow-connection method with a threshold 0.05 is made, results are reflected in schemes of surname landscapes. The visual analysis of five landscape schemes is carried out. In regions with monoethnic population structure the equidistant figures are concentric, focused along means of communication. In polyethnic areas clustering occurs by an ethnic principle, the clusters dispose as a «puzzle», confirming the lowest level of metisation between various ethnic groups in the Republic Tatarstan found out earlier. The size of elementary population is estimated as group of the next areas occupied by inhabitances of one ethnic subgroup of Tatars. The results received are agreed with such population-genetic characteristics, as an index of endogamy and length of the average square-law migration, received from the analysis of marriage records for 19902000.
Keywords: isonymy, a family landscape, elementary population, cluster