УДК 577.21
Мультилокусный анализ генетической предрасположенности к инфаркту миокарда у русских: репликационное исследование
Н. Г. Кукава1*, Б. В. Титов12*, Г. Ж. Осьмак12, Н. А. Матвеева12, О. Г. Кулакова12, А. В. Фаворов3, Р. М. Шахнович1, М. Я. Руда1, О. О. Фаворова1,2*
Национальный медицинский исследовательский центр кардиологии Минздрава РФ, 121552, Москва, 3-я Черепковская ул., 15а
2Российский национальный исследовательский медицинский университет им. Н.И. Пирогова Минздрава РФ, 117997, Москва, ул. Островитянова, 1
3Oncology Biostatistics and Bioinformatics, Johns Hopkins School of Medicine, Baltimore, MD 21205, US
#Эти авторы внесли равный вклад в исследование. *E-mail: [email protected] Поступила в редакцию 14.04.2017 Принята к печати 28.09.2017
РЕФЕРАТ В поисках генетических маркеров риска инфаркта миокарда (ИМ), обладающих прогностической значимостью для русского этноса, провели репликационное исследование ассоциации с ИМ вариантов генов PCSK9 (rs562556), APOE (эпсилон-полиморфизм, rs7412 и rs429358), LPL (rs320), MTHFR (rs1801133), eNOS (rs2070744) и области 9p21 (rs1333049) у 405 пациентов, перенесших ИМ, в сравнении с 198 индивидами контрольной группы. Наблюдали значимую ассоциацию вариантов генов липидного обмена PCSK9, APOE и LPL, а также гена eNOS с ИМ. Варианты гена MTHFR и rs1333049 области 9p21 оказались незначимыми поодиночке, но входили в состав нескольких различных ИМ-ассоциированных аллельных сочетаний, обнаруженных с помощью мультилокусного анализа. Нелинейных эпистатических взаимодействий между компонентами найденных сочетаний не обнаружено. Сделано заключение, что кумулятивный эффект генов в составе сочетания возникает в результате суммирования их малых независимых вкладов. С помощью ROC-анализа оценивали прогностическую значимость аддитивной композитной модели, построенной с использованием генов PCSK9, APOE, LPL и eNOS как генетических маркеров. После включения этих маркеров в ранее опубликованную нами композитную модель индивидуального генетического риска ИМ предсказательная эффективность достигла значения AUC = 0.676. Однако результаты, полученные в настоящем исследовании, безусловно, нуждаются в воспроизведении на независимой выборке русских. КЛЮЧЕВЫЕ СЛОВА аллельный полиморфизм, генетические маркеры, гены, инфаркт миокарда, мультило-кусный анализ, русские.
СПИСОК СОКРАЩЕНИЙ AUC - площадь под кривой (area under curve) при ROC-анализе; GWAS - полногеномное ассоциативное исследование (genome-wide association study); NO - оксид азота; ROC - рабочая характеристика приемника (receiver operating characteristic); SNP - однонуклеотидный полиморфизм (single nucleotide polymorphism); ДИ - доверительный интервал; ИБС - ишемическая болезнь сердца; ИМ -инфаркт миокарда; ОШ - отношение шансов; ПО - программное обеспечение; ПЦР - полимеразная цепная реакция; ПЦР-SSP - ПЦР с применением аллель-специфических праймеров; ССЗ - сердечно-сосудистые заболевания; ср. в. - средний возраст.
ВВЕДЕНИЕ
Инфаркт миокарда (ИМ) - наиболее тяжелая форма ишемической болезни сердца (ИБС). Несмотря на значительный прогресс в предотвращении и лечении сердечно-сосудистых заболеваний (ССЗ), достиг-
нутый за последние десятилетия в ведущих странах мира, ИМ остается наиболее частой причиной смерти населения в мировом масштабе.
Как ИМ, так и ИБС представляют собой мульти-факториальные полигенные заболевания, и прису-
щий им не-Менделевский характер наследования является следствием взаимодействия вариантов ряда генов. Генетическая предрасположенность к ИБС хорошо изучена с помощью полногеномных ассоциативных исследований (GWAS), тогда как для ИМ как отдельного фенотипа проведено относительно немного полногеномных исследований [1, 2]. Наблюдается довольно плохая воспроизводимость немногочисленных ИМ-ассоциированных локусов, выявленных в отдельных работах, что может быть связано с этническими различиями между выборками. Хотя GWASs направлены на поиск генетических вариантов, которые позволили бы оценивать риск ИМ, отмечается, что пока они не привели к прогрессу в прогнозировании риска этого заболевания [3].
Не удивительно, что традиционный подход «ген-кандидат» сохраняет свою значимость. Накоплены обширные данные по ассоциации отдельных генов-кандидатов с ИМ у жителей России, многие из которых получены российскими участниками международных проектов MONICA [4] и HAPIEE [5]. Особое значение при выявлении факторов генетической предрасположенности придается воспроизведению (репликации) полученных результатов как на независимых выборках представителей того же этноса, так и в других этнических группах. Ранее мы наблюдали, что варианты генов FGB, TGFB1, CRP, IFNG и PTGS1, продукты которых вовлечены в системы воспаления и коагуляции, ассоциированы с риском развития ИМ у этнических русских, и реплицировали эти результаты на независимой выборке русских [6]. Показана прогностическая значимость найденных маркеров, причем эффективность прогноза существенно повышается при суммировании вкладов отдельных генов. Однако идентифицированные локусы объясняют только незначительную долю риска ИМ. В поисках других генетических маркеров риска ИМ, имеющих прогностическую значимость для русских, в настоящей работе мы расширили круг исследуемых нами генов-кандидатов, включив в него гены системы липидного обмена (PCSK9, LPL и APOE), гены MTHFR и eNOS, а также локус в области 9p21.
Известно, что продукты выбранных генов липид-ного обмена вовлечены в развитие ССЗ. Показано, что белок PCSK9 (пропротеин-конвертаза субтили-зин-кексинового типа 9), кодируемый геном PCSK9, участвует в деградации рецепторов липопротеинов низкой плотности и служит мишенью при терапии дислипидемией и связанных с ней ССЗ [7]. Продукт гена APOE, аполипопротеин E, участвует в транспорте липидов и играет важную роль в развитии ССЗ [8]. Кодируемая геном LPL липопротеинлипаза является ключевым ферментом метаболизма и транспорта липидов и участвует в патогенезе атеросклероза [9].
Хорошо известна также роль продуктов генов MTHFR и eNOS в патогенезе ССЗ. MTHFR кодирует фермент метилентетрагидрофолатредуктазу, участвующую в превращении гомоцистеина в метионин. Гомоцистеинемия может приводить к дисфункции эндотелия, что является фактором риска атеросклероза и связанных с ним ССЗ. [10]. Кодируемая геном eNOS эндотелиальная синтаза оксида азота (NO) катализирует образование NO, участвующего в регуляции тонуса и проницаемости сосудистой стенки; нарушения в системе NO могут приводить к атеросклерозу, гипертонии и тромбозу [11].
Ассоциацию ге1333049 в области 9p21 с ИМ наблюдали в нескольких GWAS и валидировали в ряде этносов. В этом локусе находится ген некодирующей регуляторной РНК ANRIL. Эта РНК может влиять на экспрессию ингибиторов циклинзависимых ки-наз p15INK4a и p16INK4b, которые кодируются генами CDKN2A и CDKN2B, расположенными в той же области. Предполагают, что область 9p21 может участвовать в патогенезе атеросклероза через регуляцию пролиферации и апоптоза гладкомышечных клеток [12].
Целью нашей работы было репликационное исследование ассоциации вариантов генов PCSK9, АРОЕ, LPL, MTHFR, eNOS и области 9p21 с риском развития ИМ у русских. В табл. 1 представлены характеристики выбранных генов и однонуклео-тидных полиморфизмов (SNP). Мы провели также мультилокусный анализ ассоциации сочетаний вариантов этих генов/локусов с ИМ, поскольку такой подход создает возможность выявления кумулятивного эффекта генов [13], и исследовали природу этого эффекта. Мы оценили прогностическую эффективность найденных маркеров как по отдельности, так и совместно с ранее найденными маркерами [6].
ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ
В исследовании методом «случай-контроль» использовали образцы геномной ДНК больных ИМ, которые проходили лечение в отделе неотложной кардиологии Национального медицинского исследовательского центра кардиологии Минздрава РФ. Группа больных включала 405 человек, этнических русских, средний возраст (ср. в.) ± стандартное отклонение 57.5 ± 12.8 лет. Из них 271 мужчина (ср. в. 53.4 ± 11.9 лет) и 134 женщины (ср. в. 65.6 ± 10.3 лет). Диагноз ИМ ставился согласно критериям [14]. Контрольная группа состояла из 198 лиц, русских, без ССЗ в анамнезе, ср. в. 59.8 ± 13.3 лет. Из них 112 мужчин (ср. в. 57.1 ± 11.9 лет) и 86 женщин (ср. в. 63.2 ± 14.2 лет). От всех индивидов получено информированное согласие на проведение исследования.
ЭКСПЕРИМЕНТАЛЬНЫЕ СТАТЬИ Таблица 1. Включенные в исследование гены и их полиморфные участки
Ген Хромосомная локализация Продукт(ы) гена Полиморфный участок*
SNP rs ID
PCSK9 1p32.3 Пропротеин-конвертаза суб-тилизин-кексинового типа 9 1420G > A rs562556
APOE 19q13.2 Аполипопротеин Е эпсилон-полиморфизм rs7412, rs429358
LPL 8p22 Липопротеинлипаза 495T > G (HindlII H+>H-) rs320
MTHFR 1p36.22 5,10-Метилентетрагидро-фолатредуктаза 677C > T rs1801133
eNOS (другое название NOS3) 7q36 Эндотелиальная синтаза оксида азота -786T > C rs2070744
кластер генов ANRIL и CDKN2A/2B 9p21.3 Длинная некодирующая РНК (ген ANRIL); ингибиторы 2А и 2В циклинзависимой кина-зы (гены CDKN2A, CDKN2В) C > G rs1333049
*Исследуемый однонуклеотидный полиморфизм (SNP) и его обозначение по референсной нуклеотидной последовательности генома человека (^ Ю).
Геномное типирование проводили методами, основанными на полимеразной цепной реакции (ПЦР). Для эпсилон-полиморфизма гена APOE (rs7412, rs429358) [15], 495T > G гена LPL (rs320) [16], 677C > T MTHFR (rs1801133) [17] и -786T>C гена eNOS (rs2070744) [18] проводили анализ полиморфизма длин рестрикционных фрагментов продуктов ПЦР. Геномное типирование rs562556 PCSK9, rs1333049 в области 9р21.3 осуществляли методом ПЦР в режиме реального времени с применением набора TaqMan® SNP Genotyping Assay (Applied Biosystems).
Статистический анализ
Анализ отклонения наблюдаемых частот генотипов от равновесия Харди-Вайнберга проводили с использованием программы Haploview 4.2 [19]. Поиск ассоциаций носительства аллелей и генотипов отдельных SNP и их сочетаний с развитием ИМ проводили с помощью программного обеспечения (ПО) APSampler [20]. Значимость найденных ассоциаций оценивали с помощью точного критерия Фишера и по значениям отношения шансов (ОШ). Для величин p по Фишеру вводили поправку на число тестов (множественных сравнений) в соответствии с методом Бонферрони (pcorr). Величиы р и pcorr считали значимыми при уровне < 0.05 при условии, что значения 95% доверительного интервала (ДИ) для ОШ не пересекали 1. Считали SNP ассоциированным с ИМ, если ассоциация была значимой либо в рецессивной, либо в доминантной модели.
Для выявления возможного нелинейного взаимодействия (эпистаза) между аллелями в найден-
ных биаллельных сочетаниях использовали подход, предложенный нами ранее [6], определяя величины р в точном трехфакторном тесте [21] и фактор синергии (SF) [22]. Взаимодействие между аллелями в сочетании рассматривали как эпистатическое, если величина p была менее 0.05, а значение 95% ДИ для SF не пересекало 1.
Для построения предиктивных моделей использовали метод логистической регрессии с пошаговым включением переменных (пакет stats v.3.3.1 for R). Прогностическую эффективность оценивали по площади под кривой (AUC) при ROC (receiver operating characteristic) анализе с использованием пакета pROC v. 1.8 for R; парные сравнения проводили по методу [23]. Для оценки чувствительности и специфичности предиктивных моделей рассчитывали пороговый уровень вероятности по методу [24].
РЕЗУЛЬТАТЫ
Равновесие Харди-Вайнберга соблюдалось для исследованных полиморфных участков в контрольной группе (p > 0.05). На рис. 1 представлены частоты аллелей всех исследованных локусов в контрольной группе в сравнении с частотами минорных аллелей (global MAF) из базы данных SNP [25] по данным проекта «1000 геномов», фаза 3. Абсолютные различия наблюдаемых частот аллелей от данных базы SNP составляют до 10%.
Данные о носительстве аллелей и генотипов генов PCSK9 (rs562556), APOE (эпсилон-полиморфизм, rs7412 и rs429358), LPL (rs320), MTHFR (rs1801133), eNOS (rs2070744) и области 9p21 (rs1333049) у 405 пациентов, перенесших ИМ, и 198 индивидов контроль-
Ген/ rs ID область
PCSK9 rs562556 rs7412 rs429358 rs320
APOE
LPL
eNOS rs2070744
MTHFR rs 1801133
9p21.3 rs1333049
Частоты аллелей исследованных локусов в контрольной группе
G=0.18 A=0.82
£2=0.08 £3=0.82 £4=0.10
G=0.24 T =0.76
C=0.31 T=0.69
T=0.33 C=0.67
G=0.48 C=0.52
___I_ 1
Частота минорного
аллеля по данным dbSNP NCBI G=0.13
T=0.075 (е2)
С=0.15 (е4)
G=0.26
C=0.23
T=0.25*
С=0.42
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Рис. 1. Частоты аллелей исследованных локусов в контрольной группе (этнические русские) по сравнению с частотами аллелей из базы данных dbSNP NCBI [25].
*В базе данных dbSNP NCBI частота минорного аллеля (MAF) приведена по комплементарной цепи.
ной группы представлены в табл. 2. Наблюдали значимые различия в частотах носительства аллелей и генотипов полиморфных участков всех трех генов липидного обмена: PCSK9, APOE и LPL. Значимые различия выявлены также для гена eNOS, но не MTHFR и области 9p21. Факторами риска развития ИМ оказались генотипы PCSK9*A/A (р = 0.013, ОШ = 1.45), APOE*c3/c3 (р = 0.017, ОШ = 1.52) и LPL*G/G (р = 0.032, ОШ = 1.96), а также носительство аллеля eNOS*C (р = 0.0034, ОШ = 1.63). Следует отметить, однако, что величина р , полученная с поправкой Бонферрони на число тестов (множественных сравнений), была значимой только в случае вариантов генов APOE и eNOS.
С помощью ПО APSampler, использующего динамический метод Монте-Карло, мы провели муль-тилокусный анализ, направленный на выявление совместного вклада в предрасположенность к ИМ сочетаний аллелей и генотипов исследуемых генов. Обнаружены ассоциированные с риском ИМ би- и триаллельные сочетания, характеризующиеся большим размером эффекта и большим уровнем значимости ассоциации с ИМ, чем компоненты этих сочетаний. В состав сочетаний входят не только варианты генов PCSK9, APOE, LPL и eNOS, значимо ассоциированные с ИМ поодиночке, но и аллели/генотипы MTHFR и rs1333049 в области 9p21. На рис. 2
(А-В) приведены значения ОШ и 95% ДИ для сочетаний, содержащих варианты двух последних локусов: MTHFR*C, rs1333049*C и rs1333049*C/G. Видно, что во всех случаях перечисленные варианты, представленные в нижней части каждого рисунка, не значимы. Однако сочетание аллеля MTHFR*C с аллелем eNOS*C оказывается значимым (р = 0.0006; ОШ = 1.80), причем более значимым, чем носительство одного аллеля eNOS*C (рис. 2А). С риском ИМ ассоциировано также триаллельное сочетание (LPL*G/G + MTHFR*C + rs1333049*C) (р = 0.018; ОШ = 2.83) и входящее в его состав биаллельное сочетание (LPL*G/G + MTHFR*C) (р = 0.021; ОШ = 2.30), которое ассоциировано слабее, чем это триал-лельное сочетание, но более значимо, чем один генотип LPL*G/G (рис. 2Б). Еще одно триаллельное сочетание (APOE*e4 + eNOS*T + rs1333049*C/G) негативно ассоциировано с риском ИМ (р = 0.00041; ОШ = 0.30) (рис. 2В). Слабее с риском ИМ ассоциированы входящие в его состав биаллельные сочетания (APOE*e4 + rs1333049*C/G) и (APOE*e4 + eNOS*T). Однако эта ассоциация сильнее, чем у единственного значимого поодиночке компонента сочетания - носительства аллеля APOE*e4. Таким образом, с помощью мультилокусного анализа удалось выявить участие в формировании предрасположенности к ИМ в составе нескольких аллельных сочетаний вариантов
Таблица 2. Распределение аллелей и генотипов полиморфных участков исследуемых генов у больных ИМ (405 человек) и в контрольной группе (198 человек)
Носительство аллелей и генотипов Пациенты, П (%) Контроль, п (%) P p * 1 ^гг ОШ (95% ДИ) для значимых различий**
PCSK9 ^562556
А 389(96) 193(97) НЗ НЗ
G 102(25) 65(33) 0.013 НЗ 0.69 (0.47-1.00)
А/А 303(75) 133(67) 0.013 НЗ 1.45 (1.00-2.10)
А^ 86(21) 60(30) 0.010 НЗ 0.62 (0.42-0.91)
G/G 16(4) 5(3) НЗ НЗ
APOE гэ7412, ^429358 (эпсилон-полиморфизм)
е2 63(16) 30(15) НЗ НЗ
еЗ 393(98) 194(98) НЗ НЗ
е4 40(10) 38(19) 0.0013 0.0091 0.46 (0.28-0.75)
е2/е2 5(1) 2(1) НЗ НЗ
е2/еЗ 55(14) 26(13) НЗ НЗ
е2/е4 3(1) 2(1) НЗ НЗ
еЗ/еЗ 305(75) 132(67) 0.017 НЗ 1.52 (1.05-2.2)
еЗ /е4 33(8) 36(18) 0.00033 0.0023 0.40 (0.24-0.66)
е4/е4 4(1) 0(0)
LPL rs320
G 192(47) 85(43) НЗ НЗ
Т 363(90) 187(94) 0.032 НЗ 0.51 (0.25-0.99)
G/G 42(10) 11(6) 0.032 НЗ 1.96 (1.00-3.91)
G/T 150(37) 74(37) НЗ НЗ
Т/Т 213(53) 113(57) НЗ НЗ
MTHFR ^1801133
С 369(91) 174(87) НЗ НЗ
Т 206(51) 106(54) НЗ НЗ
С/С 199(49) 92(46) НЗ НЗ
С/Т 170(42) 82(41) НЗ НЗ
Т/Т 36(9) 24(13) НЗ НЗ
eNOS rs2070744
С 253(62) 100(50) 0.0034 0.024 1.63 (1.16-2.30)
Т 343(85) 174(88) НЗ НЗ
С/С 62(15) 24(12) НЗ НЗ
С/Т 191(47) 76(38) НЗ НЗ
Т/Т 152(38) 98(50) 0.0034 0.024 0.61 (0.43-0.86)
9р21 rs1333049
С 313(78) 155(78) НЗ НЗ
G 305(75) 146(74) НЗ НЗ
С/С 100(25) 52(26) НЗ НЗ
C/G 213(53) 103(52) НЗ НЗ
G/G 92(22) 43(22) НЗ НЗ
'Приведены значения р с поправкой Бонферрони на число тестов (множественных сравнений). **р < 0.05.
л
eN0S*C+MTHFR*C -
eNOS*C -
MTHFR*C
значения р <0.001
<0.01
>0.05
1.0 1.5 2.0
Отношение шансов, ОШ (95% ДИ)
LPL*0/0+MTHFR*C+9p21 rs 1333049*С -
MTHFR*C
9р21гБ1333049*С
- 1№
1
- к н
2 : 5 4 5 6
значения р
10.02
>0.05
Отношение шансов, ОШ (95% ДИ)
В
ap0e*e4+en0s*t+9p21 гб 1333049*0/0
АР0Е*£4+9р21гз1333049*С/0
AP0E*£4+eN0S*T
АР0Е*с4
eN0S*T
9р21гБ1333049*С/0
I-
значения р <0.001
<0.01
>0.05
Рис. 2. Мульти-локусный анализ, позволивший выявить ассоциацию с ИМ гб1801133 в гене MTHFR и гб1333049 в области 9р21, которые поодиночке значимо не ассоциированы с ИМ. Графически представлены значения отношения шансов (ОШ), доверительные интервалы (ДИ) и уровни значимости (качественно, градацией цвета кружка, соответствующего значению ОШ), для ассоциированных с ИМ сочетаний, которые включают варианты гена MTHFR и/или гб1333049, а также для компонентов этих сочетаний. Л — биаллель-ное сочетание (MTHFR*С + eN0S*С), позитивно ассоциированное с ИМ, и его компоненты. Б - триал-лельное сочетание (/_Р/_*С/С + МШРК*С +
333049*С), позитивно ассоциированное с ИМ, и его компоненты. В - триал-лельное сочетание (АРОЕ*е 4 + еЫ<Э5*Т + г51333049*С/С), негативно ассоциированное с ИМ, и его компоненты
0.5 1.0
Отношение шансов, ОШ (95% ДИ)
Б
Рис. 3. ROC-анализ эффективности моделей, построенных на основе различных генетических маркеров индивидуального риска возникновения ИМ. А - эффективность классификации индивидов с помощью моделей, построенных на основе носительства отдельных генетических маркеров (вариантов генов PCSK9, АРОЕ, LPL и eNOS), и модели, учитывающей носительство вариантов всех четырех генов (композитный генетический маркер, зеленая линия). Б - прогностическая эффективность обобщенной композитной модели индивидуального генетического риска ИМ (красная линия), полученной при дополнении ранее описанной модели [6] (синяя линия) данными о носительстве вариантов генов PCSK9, LPL, eNOS и АРОЕ (зеленая линия). Значения АиС (площади под кривой) для различных моделей представлены на рисунке тем же цветом, что и соответствующая этой модели кривая
гена MTHFR (^1801133) и локуса 9р21 (^1333049), которые не были значимо ассоциированы с ИМ поодиночке.
Для выяснения вопроса о том, чем объясняется наблюдаемый кумулятивный эффект аллелей разных генов - суммированием малых взаимно независимых вкладов отдельных аллелей или же эпистатическими взаимодействиями между этими аллелями - мы провели анализ трехфакторных взаимодействий с помощью статистического подхода, описанного нами ранее [6]. Полученные при этом значения фактора синергии (SF) с 95% ДИ и величины р в точном трех-факторном тесте, аналогичные ОШ с 95% ДИ и величине р в тесте Фишера при стандартной оценке ассоциаций между фенотипом и генотипом (т.е. в двухфакторном тесте), оказались незначимыми. Таким образом, мы не выявили значимых эпистати-ческих взаимодействий между компонентами всех найденных сочетаний.
Для оценки прогностической значимости обнаруженных генетических факторов риска с помощью метода логистической регрессии была рассчитана индивидуальная вероятность возникновения ИМ
у каждого индивида в зависимости от носительства вариантов генов PCSK9, APOE, LPL и eNOS. Оценивали вклад совместного носительства аллелей/ генотипов риска этих генов с помощью ROC-анализа (рис. 3А), исходя из эффективности классификации индивидов на больных и здоровых. Видно, что рассматриваемые генетические факторы поодиночке являются плохими классификаторами риска возникновения ИМ (AUC < 0.60). Однако при совместном учете данных о носительстве аллелей/генотипов PCSK9, APOE, LPL и eNOS достигается удовлетворительная прогностическая эффективность (AUC = 0.604). Надо отметить, что добавление в модель незначимых поодиночке аллелей гена MTHFR и области 9p21, входящих в состав выявленных с помощью APSampler сочетаний, не делает ее более эффективной.
Эти данные использованы для улучшения полученной нами ранее композитной генетической модели риска ИМ, включающей в качестве предикторов варианты генов TGFB1, FGB и CRP, а также эпистатическое сочетание IFNG с PTGS1 [6]. На рис. 3Б показаны три ROC-кривые: ROC-кривая, полученная в исследованной выборке для композитной модели, описанной в [6],
ROC-кривая для совместного носительства найденных новых маркеров, представленная на рис. 3А, и ROC-кривая для обобщенной композитной модели, включающей как маркеры из предыдущей, так и из настоящей работы. Видно значимое (p = 0.014) повышение прогностической эффективности модели от AUC 0.641 в модели без новых маркеров до 0.676 в обобщенной композитной модели.
ОБСУЖДЕНИЕ
Проведенный методом «случай-контроль» мульти-локусный анализ ассоциации полиморфных вариантов PCSK9 (rs562556), APOE (эпсилон-полиморфизм, rs7412 и rs429358), LPL (rs320), MTHFR (rs1801133), eNOS (rs2070744) и области 9p21 (rs1333049) с риском развития ИМ позволил выявить значимо ассоциированные с ИМ аллели/генотипы PCSK9, APOE, LPL и NOS, а также би- и триаллельные сочетания, несущие, помимо вариантов перечисленных генов, еще и аллели/генотипы MTHFR и области 9p21.
Каждый из исследованных нами генов системы липидного обмена - PCSK9, LPL и APOE - оказался ассоциированным с риском ИМ; ОШ для генотипов риска лежит в пределах от 1.45 до 1.96, однако уровень значимости невелик (от 0.013 до 0.032). Вовлечение генов системы липидного обмена в развитие ИМ хорошо согласуется с общеизвестным фактом, что нарушения обмена липидов и повышение уровня холестерина и индекса атерогенности приводят к атеросклеротическим поражениям интимы артерий. Однако опубликованные данные об участии изученных нами вариантов генов системы липидного обмена в формировании ССЗ противоречивы.
rs562556 в гене PCSK9 определяет замену Ile на Val в положении 474 кодируемого белка, что, по всей видимости, не влияет на уровень его продукции [26]. Мы наблюдали ассоциацию генотипа А/А этого SNP с ИМ у русских. Однако у японцев не наблюдали различий в распределении вариантов rs562556 у больных с ИМ и в контрольной группе, хотя этот SNP был ассоциирован с уровнем холестерина [27]. Выявлена связь между полиморфизмом rs562556, присутствием антифосфолипидных антител и развитием у носителей этих антител тромбоза - фактора риска ИМ [28]. Ассоциация с ИМ других вариантов гена PCSK9, а именно rs11206510 [29] и rs11591147 [30], показана в различных популяциях. Таким образом, полученные нами данные об ассоциации гена PCSK9 с возникновением ИМ находятся в соответствии с опубликованными данными.
Отдельные аллельные варианты включенного в наше исследование эпсилон-полиморфизма гена APOE практически во всех популяциях ассоциированы с ССЗ и, в частности, с ИМ. Согласно проведен-
ным метаанализам, с риском развития ИМ ассоциирован аллель е4, а е2 является протективным [31, 32]. Однако выводы, полученные при метаанализе, включающем различные этносы, нельзя автоматически распространять на отдельные популяции, в которых наблюдается большой разброс в оценке роли отдельных аллелей в предрасположенности к ИМ. Вероятно, основной причиной плохой сходимости результатов отдельных исследований является существенная разница в частотах аллелей в различных популяциях и даже в одной и той же популяции, проживающей на разных территориях [33]. В частности, в нашем исследовании, выполненном для русских из Центральной России, генотипом риска оказался е3/е3, а в выборке мужчин из сибирской популяции -генотип е2/е3 [34].
rs320, известный также как HindIII-полиморфизм, определяет замену T на G в интроне 8 гена LPL. Предполагают, что он находится в регуляторной области и влияет на экспрессию LPL [35]. Мы наблюдали ассоциацию rs320 с ИМ в нашей выборке. Связь этого полиморфизма с развитием ИМ показана и в ряде других исследований [36, 37], в том числе и у русских [38]. Описаны и другие полиморфизмы этого гена, ассоциированные с ИМ в японской популяции [39]. Однако данные об ассоциации отдельных аллелей с ИМ не всегда совпадают.
Еще один локус, вариант которого значимо ассоциирован с ИМ в нашей работе - это rs2070744 гена eNOS. Этот полиморфный участок находится в про-моторной области гена. Аллель C, ассоциированный с риском ИМ в нашем исследовании, связан с уменьшением экспрессии мРНК и соответственно уровня белка eNOS [40]. Наши данные совпадают с результатами других исследований [41].
Замена C на T в rs1801133 гена MTHFR приводит к замещению Ala в положении 222 белка на Val [42] и к почти к 50% снижению ферментативной активности метилентетрагидрофолатредуктазы [43]. В большинстве исследований не наблюдали ассоциации rs1801133 с риском развития ИМ в различных этносах, включая европеоидов [44] и русских [45]. Мы также не выявили ассоциации rs1801133 с риском развития ИМ у русских, однако носительство аллеля С оказалось значимо ассоциированным с риском ИМ в сочетании с носительством аллеля С гена eNOS (см. рис. 2А) или с носительством генотипа G/G гена LPL (см. рис. 2Б). Мы полагаем, что эти данные могут быть интерпретированы как аргумент в пользу вовлечения гена MTHFR в формирование предрасположенности к ИМ.
Область 9p21 - единственная область генома, вовлеченность которой в формирование ИМ воспроизведена в нескольких GWASs с полногеномным
уровнем значимости ^ < 5 х 10-8) [2]. Эти данные подтверждены в ряде валидационных исследований, в том числе для ^10757278 и ге1333049 на выборке больных ИМ и контрольных групп из сибирской популяции (без указания этнической принадлежности) [46]. Мы не наблюдали значимой ассоциации ^1333049 с ИМ у русских, однако мультилокусный анализ позволил выявить ряд сочетаний, содержащих этот SNP. Носительство аллеля ге1333049*С в составе триаллельного сочетания ассоциировано с риском ИМ (см. рис. 2Б), а генотип ге1333049*С^ в составе би- и триаллельного сочетаний оказался протективным (см. рис. 2В), в хорошем соответствии с результатами работы [46].
Проведенный статистический анализ трехфактор-ных взаимодействий свидетельствует об отсутствии эпистатических взаимодействий между компонентами всех найденных сочетаний. В то же время все би-аллельные сочетания, ассоциированные с риском ИМ (ОШ > 1), имеют по сравнению с входящими в них отдельными аллелями/генотипами больший уровень значимости и большие значения ОШ (соответственно для протективных сочетаний с ОШ < 1 - меньшие значения ОШ). Аналогичная закономерность проявляется для триаллельных сочетаний при сравнении с биаллельными. Мы приходим к заключению, что наблюдаемые в настоящей работе кумулятивные эффекты возникают в результате аддитивности вкладов отдельных генов. Аддитивность эффекта при этом обусловлена тем, что в сравнительно небольшой выборке статистическая значимость наблюдения ассоциации заболевания с сочетанием слабых генетических факторов, действующих в одном направлении, выше, чем при наблюдении каждого из этих факторов. Следовательно, есть все основания предположить, что локусы MTHFR (ге1801133) и 9р21 (ге1333049) являются самостоятельными факторами риска ИМ с малыми эффектами, для выявления значимых ассоциаций с которыми в исследуемой нами выборке оказалось недостаточно статистической мощности, а использование мультилокусного анализа позволило восполнить этот недостаток.
Аналогичным образом, вследствие малых эффектов локусов MTHFR (^1801133) и 9р21 (^1333049), их добавление в композитную генетическую модель риска ИМ не повышало ее прогностической эффективности. Здесь следует отметить преимущество эпистатических сочетаний перед сочетаниями аддитивными в качестве классификаторов риска. Действительно, в работе [6] одним из предикторов риска ИМ оказалось эпистатическое сочетание
IFNG с PTGS1, оба компонента которого поодиночке не были ассоциированы с заболеванием. В то же время выявление генетических вариантов, входящих в состав аддитивных сочетаний, открывает возможность обнаружить их ассоциацию с заболеванием поодиночке на выборках большего объема.
Прогностическая эффективность композитной генетической модели риска ИМ, построенной на основании результатов настоящего исследования, хотя и значима, но невелика. Это справедливо и для модели, полученной нами ранее [6]. При объединении двух моделей удалось достичь величины AUC 0.676, что при пороге вероятности (cut-off) 0.74 соответствует чувствительности 0.80 и специфичности 0.45. В целом, на сегодняшний день ни результаты GWAS, ни данные, полученные с использованием подхода «ген-кандидат», не позволяют эффективно использовать данные генетического анализа для предсказания возникновения ИМ.
ЗАКЛЮЧЕНИЕ
Таким образом, проведенный анализ ассоциации полиморфных участков шести генов-кандидатов показал их значимую ассоциацию с ИМ или поодиночке, или в составе сочетаний. В целом, мы реплицировали на независимых выборках русских из Центральной России ассоциацию с ИМ полиморфных вариантов генов PCSK9, APOE, LPL, MTHFR, eNOS и области 9p21. Поскольку варианты одних и тех же генов (rs1801133 гена MTHFR или rs1333049 области 9p21), не значимые поодиночке, входили в состав нескольких различных сочетаний, между компонентами которых не выявлено эпистатических взаимодействий, можно заключить, что обнаруженный с помощью мультилокусного анализа кумулятивный эффект генов в составе сочетания возникает в результате суммирования их малых независимых вкладов.
Включение найденных маркеров в ранее опубликованную нами модель индивидуального генетического риска ИМ [6] значимо повышает ее предсказательную эффективность, хотя полученные нами результаты, безусловно, нуждаются в воспроизведении на независимой выборке русских. Для дальнейшего повышения предсказательной способности композитной модели необходимо улучшать ее путем включения других генетических предикторов риска и уточнения значений коэффициентов уравнения регрессии на расширенных выборках.
Работа поддержана Российским научным фондом (грант № 16-14-10251).
СПИСОК ЛИТЕРАТУРЫ
1. Dai X., Wiernek S., Evans J.P., Runge M.S. // World J. Cardiol. 2016. V. 8. № 1. P. 1-23.
2. http://www.ebi.ac.uk/gwas
3. Dehghan A., Bis J.C., White C.C., Smith A.V., Morrison A.C., Cupples L.A., Trompet S., Chasman D.I., Lumley T., Völker U., et al. // PLoS One. 2016. V. 11. № 3. e0144997.
4. http://www.thl.fi/monica/
5. http://www.ucl.ac.uk/easteurope/hapiee.html
6. Barsova R.M., Lvovs D., Titov B.V., Matveeva N.A., Shakh-novich R.M., Sukhinina T.S., Kukava N.G., Ruda M.Y., Karamova I.M., Nasibullin T.R., et al. // PLoS One. 2015. V. 10. № 12. e0144190.
7. Catapano A.L., Papadopoulos N. // Atherosclerosis. 2013. V. 228. № 1. P. 18-28.
8. Mahley R.W. // J. Mol. Med. (Berlin). 2016. V. 94. № 7. P. 9-46.
9. Li Y., He P.P., Zhang D.W., Zheng X.L., Cayabyab F.S., Yin W.D., Tang C.K. // Atherosclerosis. 2014. V. 237. № 2. P. 597608.
10. Ueland P.M., Refsum H. // J. Lab. Clin. Med. 1989. V. 114. № 5. P. 473-501.
11. Liu D., Jiang Z., Dai L., Zhang X., Yan C., Han Y. // Gene. 2014. V. 545. № 1. P. 175-183.
12. Holdt L.M., Teupser D. // Arterioscler. Thromb. Vasc. Biol. 2012. V. 32. № 2. P. 196-206.
13. Lvovs D., Фаворова О.О., Фаворов А.В. // Acta Naturae. 2012. Т. 4. № 3. С. 62-75.
14. Third Universal definition of myocardial infarction // Eur. Heart J. 2012. V. 33. P. 2551-2567.
15. Hixson J.E., Vernier D.T. // J. Lipid. Res. 1990. V. 31. P. 545548.
16. Shimo-Nakanishi Y., Urabe T., Hattori N., Watanabe Y., Nagao T., Yokochi M., Hamamoto M., Mizuno Y. // Stroke. 2001. V. 32. P. 1481-1486.
17. Genest J., Rozen R. // Arterioscler. Thromb. Vasc. Biol. 1997. V. 17. № 3. P. 569-573.
18. Augeri A.L., Tsongalis G.J., van Heest J.L., Maresh C.M., Thompson P.D., Pescatello L.S. // Atherosclerosis. 2009. V. 204. № 2. e28-34.
19. http://www.broad.mit.edu/mpg/haploview
20. https://sourceforge.net/projects/apsampler/
21. White D.R., Pesner R., Reitz K.P. // Behavior Sci. Res. 1983. V. 18. P. 103-122.
22. Cortina-Borja M., Smith A.D., Combarros O., Lehmann D.J. // BMC Res. Notes. 2009. V. 2. P. 105-111.
23. DeLong E.R., DeLong D.M., Clarke-Pearson D.L. // Biometrics. 1988. V. 44. P. 837-845.
24. Youden W.J. // Cancer. 1950. V. 3. № 1. P. 32-35.
25. www.ncbi.nlm.nih.gov/snp/
26. Астракова (Бенимецкая) К.С., Шахтшнейдер Е.В., Ивано-щук Д.Е., Орлов П.С., Рагино Ю.И., Воевода М.И. // Атеросклероз. 2016. Т. 12. № 2. С. 18-24.
27. Shioji K., Mannami T., Kokubo Y., Inamoto N., Takagi S., Goto Y., Nonogi H., Iwai N. // J. Hum. Genet. 2004. V. 49. № 2. P. 109-114.
28. Ochoa E., Iriondo M., Manzano C., Fullaondo A., Villar I., Ruiz-Irastorza G., Zubiaga A.M., Estonba A. // PLoS One. 2016. V. 11. № 1. e0146990.
29. Myocardial Infarction Genetics Consortium, Kathiresan S., Voight B.F., Purcell S., Musunuru K., Ardissino D., et al. // Nat. Genet. 2009. V. 41. № 3. P. 334-341.
30. Kathiresan S., Myocardial Infarction Genetics Consortium // N. Engl. J. Med. 2008. V. 358. № 21. P. 2299-2300.
31. Wang Y.L., Sun L.M., Zhang L., Xu H.T., Dong Z., Wang L.Q., Wang M.L. // FEBS Open Bio. 2015. V. 5. P. 852-858.
32. Xu H., Li H., Liu J., Zhu D., Wang Z., Chen A., Zhao Q. // PLoS One. 2014. V. 9. № 8. e104608.
33. Боринская С.А., Кальина Н.Р., Санина Е.Д., Кожекбаева Ж.М., Гупало Е.Ю., Гармаш И.В., Огурцов П.П., Паршукова О.Н., Бойко С.Г., Веселовский Е.М. и др. // Генетика. 2007. Т. 43. № 10. С. 1434-1440.
34. Воевода М.И., Шахтшнейдер Е.В., Максимов В. Н., Куликов И.В., Ромащенко А.Г. // Атеросклероз. 2008. Т. 4. № 1.
C. 11-26.
35. Chen Q., Razzaghi H., Demirci F.Y., Kamboh M.I. // Atherosclerosis. 2008. V. 200. № 1. P. 102-108.
36. Tanguturi P.R., Pullareddy B., Rama Krishna B.S., Murthy
D.K. // Indian Heart J. 2013. V. 65. № 6. P. 653-657.
37. Gigek Cde O., Chen E.S., Cendoroglo M.S., Ramos L.R., Araujo L.M., Payao S.L., Smith Mde A. // Clin. Chem. Lab. Med. 2007. V. 45. № 5. P. 599-604.
38. Малыгина Н.А., Мелентьев А.С., Костомарова И.В., Ме-лентьев И.А., Сайгитов Р.Т., Смирнова Ю.Б., Серова Л.Д. // Молекуляр. биология. 2001. Т. 35. № 5. С. 787-791.
39. Matsuoka R., Abe S., Tokoro F., Arai M., Noda T., Watanabe S., Horibe H., Fujimaki T., Oguri M., Kato K., et al. // Int. J. Mol. Med. 2015. V. 35. № 5. P. 1451-1459.
40. Doshi A.A., Ziolo M.T., Wang H., Burke E., Lesinski A., Bin-kley P. // J. Card. Fail. 2010. V. 16. № 4. P. 314-319.
41. Kong X.Z., Zhang Z.Y., Wei L.H., Li R., Yu J. // Med. Sci. Monit. 2017. V. 11. № 23. P. 759-766.
42. Dayakar S., Goud K.I, Reddy T.P., Rao S.P., Sesikeran S.B., Sadhnani M. // Genet. Test. Mol. Biomarkers. 2011. V. 15. № 11. P. 765-769.
43. Xuan C., Bai X.Y., Gao G., Yang Q., He G.W. // Arch. Med. Res. 2011. V. 42. № 8. P. 677-685.
44. Alizadeh S., Djafarian K., Moradi S., Shab-Bidar S. // Int. J. Cardiol. 2016. V. 217. P. 99-108.
45. Назаренко Г.И., Скворцова В.И., Клейменова Е.Б., Константинова М.В. // Журн. неврологии и психиатрии им. С.С. Корсакова. 2009. T. 109. № 10. Прилож. 2. С. 19-25.
46. Максимов В.Н., Куликов И.В., Орлов П.С., Гафаров В.В., Малютина С.К., Ромащенко А.Г., Воевода М.И. // Вест. РАМН. 2012. Т. 67. № 5. С. 24-29.