Научная статья на тему 'Исследование свойств не полностью пенетрантных вариантов генома, ассоциированных с кардиомиопатиями'

Исследование свойств не полностью пенетрантных вариантов генома, ассоциированных с кардиомиопатиями Текст научной статьи по специальности «Биотехнологии в медицине»

CC BY
1
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
первичная кардиомиопатия / неполная пенетрантность / популяционная частота / предсказание патогенности / primary cardiomyopathy / incomplete penetrance / population frequency / pathogenicity prediction

Аннотация научной статьи по биотехнологиям в медицине, автор научной работы — Зайченока М., Раменский В. Е., Киселева А. В., Букаева А. А., Ершова А. И.

Цель. Изучить и описать свойства ассоциированных с различными кардиомиопатиями вариантов нуклеотидной последовательности генома, для которых показана неполная пенетрантность. Материал и методы. В исследовании использовались данные о пенетрантности вариантов генома из ранее опубликованного исследования. Для вариантов была проведена аннотация с помощью Ensembl VEP, а также информации из баз gnomAD, ClinVar и dbNSFP. Результаты. Для всех наборов данных были получены значимые корреляции пенетрантности (коэффициент корреляции Спирмена от -0,75 до -0,90) с популяционной частотой вариантов в базе gnomAD. Среди вариантов с низкими значениями пенетрантности наблюдалось обогащение вариантами с неизвестной значимостью, большинство низкопенетрантных вариантов были миссенс-заменами. Среди вариантов с высокими значениями пенетрантности наблюдалось обогащение вариантами, классифицированными как патогенные, большая часть из них оказались вариантами со сдвигом рамки считывания. Были получены значимые корреляции с весами, рассчитанными различными вычислительными методами предсказания патогенности вариантов; для всех наборов данных значение пенетрантности статистически значимо коррелировало с предсказаниями четырех методов — CADD, BayesDel с учетом частоты и без, а также ClinPred. Заключение. Впервые была показана связь популяционной частоты варианта, его типа и предсказания его патогенности со значением пенетрантности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биотехнологиям в медицине , автор научной работы — Зайченока М., Раменский В. Е., Киселева А. В., Букаева А. А., Ершова А. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Properties of incompletely penetrant cardiomyopathy-associated genome variants

Aim. To study and describe the properties of nucleotide sequence variants with incomplete penetrance associated with various cardiomyopathies. Material and methods. The study used penetrance data of genome variants from a previously published study. The variants were annotated using Ensembl VEP, as well as information from the gnomAD, ClinVar, and dbNSFP databases. Results. For all datasets, significant correlations of penetrance (Spearman correlation coefficient from -0,75 to -0,90) with the population frequency of variants in the gnomAD database were obtained. Variants with low penetrance values were enriched in variants of unknown significance. Most of the low-penetrance variants were missense substitutions. High-penetrance values were enriched in variants classified as pathogenic, most of which were frameshift variants. Significant correlations were obtained with weights calculated by different computational methods for predicting variant pathogenicity. For all data sets, the penetrance value was significantly correlated with the predictions of four following methods: CADD, BayesDel with and without frequency, and ClinPred. Conclusion. For the first time, a relationship of the population frequency, type and pathogenicity prediction of a variant with the penetrance value was shown.

Текст научной работы на тему «Исследование свойств не полностью пенетрантных вариантов генома, ассоциированных с кардиомиопатиями»

Кардиоваскулярная терапия и профилактика.2024;23(12):4262. doi: 10.15829/1728-8800-2024-4262 ISSN 1728-8800 (Print) ISSN 2619-0125 (Online)

акт

* «мииг

РОПНИЗ

российское

кардиологическое общество

Исследование свойств не полностью пенетрантных вариантов генома, ассоциированных с кардиомиопатиями

Зайченока М.1'2, Раменский В. Е.2'3, Киселева А. В.2, Букаева А. А.2, Ершова А. И. Мешков А. Н.2, Драпкина О. М

2

1ФГАОУ ВО "Московский физико-технический институт (национальный исследовательский университет)". Долгопрудный; 2ФГБУ "Национальный медицинский исследовательский центр терапии и профилактической медицины" Минздрава России. Москва; 3ФГБОУ ВО "Московский государственный университет им. М. В. Ломоносова". Москва, Россия

Цель. Изучить и описать свойства ассоциированных с различными кардиомиопатиями вариантов нуклеотидной последовательности генома, для которых показана неполная пенетрантность. Материал и методы. В исследовании использовались данные о пенетрантности вариантов генома из ранее опубликованного исследования. Для вариантов была проведена аннотация с помощью Ensembl VEP, а также информации из баз дпотАЭ, СНП/аг и dbNSFP. Результаты. Для всех наборов данных были получены значимые корреляции пенетрантности (коэффициент корреляции Спирмена от -0,75 до -0,90) с популяционной частотой вариантов в базе дпот^. Среди вариантов с низкими значениями пенетрантности наблюдалось обогащение вариантами с неизвестной значимостью, большинство низкопенетрантных вариантов были миссенс-заме-нами. Среди вариантов с высокими значениями пенетрантности наблюдалось обогащение вариантами, классифицированными как патогенные, большая часть из них оказались вариантами со сдвигом рамки считывания. Были получены значимые корреляции с весами, рассчитанными различными вычислительными методами предсказания патогенности вариантов; для всех наборов данных значение пенетрантности статистически значимо коррелировало с предсказаниями четырех методов — CADD, BayesDel с учетом частоты и без, а также ClinPred.

Заключение. Впервые была показана связь популяционной частоты варианта, его типа и предсказания его патогенности со значением пенетрантности.

Ключевые слова: первичная кардиомиопатия, неполная пене-трантность, популяционная частота, предсказание патогенности.

Отношения и деятельность: нет.

Поступила 08/11-2024 Рецензия получена 17/12-2024 Принята к публикации 18/12-2024

Для цитирования: Зайченока М., Раменский В. Е., Киселева А. В., Букаева А. А., Ершова А. И., Мешков А. Н., Драпкина О. М. Исследование свойств не полностью пенетрантных вариантов генома, ассоциированных с кардиомиопатиями. Кардиоваскулярная терапия и профилактика. 2024;23(12):4262. doi: 10.15829/1728-8800-20244262. EDN ZEFRUU ■■■

Properties of incompletely penetrant cardiomyopathy-associated genome variants

Zaychenoka M.1,2, Ramenskiy V. E.2,3, Kiseleva A. V.2, Bukaeva A. A.2, Ershova A. I.2, Meshkov A. N.2, Drapkina O. M.2

1Moscow Institute of Physics and Technology (National Research University). Dolgoprudny; 2National Medical Research Center for Therapy

and Preventive Medicine. Moscow; 3Lomonosov Moscow State University. Moscow, Russia

Aim. To study and describe the properties of nucleotide sequence variants with incomplete penetrance associated with various cardiomyopathies.

Material and methods. The study used penetrance data of genome variants from a previously published study. The variants were annotated using Ensembl VEP, as well as information from the gnomAD, ClinVar, and dbNSFP databases.

Results. For all datasets, significant correlations of penetrance (Spearman correlation coefficient from -0,75 to -0,90) with the population frequency of variants in the gnomAD database were obtained. Variants with low penetrance values were enriched in variants of unknown significance. Most of the low-penetrance variants were missense sub-

stitutions. High-penetrance values were enriched in variants classified as pathogenic, most of which were frameshift variants. Significant correlations were obtained with weights calculated by different computational methods for predicting variant pathogenicity. For all data sets, the penetrance value was significantly correlated with the predictions of four following methods: CADD, BayesDel with and without frequency, and ClinPred.

Conclusion. For the first time, a relationship of the population frequency, type and pathogenicity prediction of a variant with the pene-trance value was shown.

Keywords: primary cardiomyopathy, incomplete penetrance, population frequency, pathogenicity prediction.

*Автор, ответственный за переписку (Corresponding author): e-mail: [email protected]

[Зайченока М.* — аспирант, ORCID: 0000-0002-2798-9811, Раменский В. Е. — к.ф.- м.н., руководитель, в.н.с., руководитель научной группы "ИИ в биоинформатике и медицине", ORCID: 00000001-7867-9509, Киселева А. В. — к.б.н., руководитель, в.н.с., ORCID: 0000-0003-4765-8021, Букаева А. А. — н.с., ORCID: 0000-0002-5932-1744, Ершова А. И. — д.м.н., руководитель, зам. директора по фундаментальной науке, ORCID: 0000-0001-7989-0760, Мешков А. Н. — д.м.н., руководитель, ORCID: 0000-0001-5989-6233, Драпкина О. М. — д.м.н., профессор, академик РАН, директор, ORCID: 0000-0002-4453-8430].

Relationships and Activities: none.

Zaychenoka M.* ORCID: 0000-0002-2798-9811, Ramenskiy V. E. ORCID: 0000-0001-7867-9509, Kiseleva A. V. ORCID: 0000-0003-47658021, Bukaeva A. A. ORCID: 0000-0002-5932-1744, Ershova A. I. ORCID: 0000-0001-7989-0760, Meshkov A. N. ORCID: 0000-0001-5989-6233, Drapkina O. M. ORCID: 0000-0002-4453-8430.

Corresponding author: [email protected]

Received: 08/11-2024 Revision Received: 17/12-2024 Accepted: 18/12-2024

For citation: Zaychenoka M., Ramenskiy V. E., Kiseleva A. V., Bukaeva A. A., Ershova A. I., Meshkov A. N., Drapkina O. M. Properties of incompletely penetrant cardiomyopathy-associated genome variants. Cardiovascular Therapy and Prevention. 2024;23(12):4262. doi: 10. 15829/1728-8800-2024-4262. EDN ZEFRUU

ДКМП — дилатационная кардиомиопатия, ГКМП — гипертрофическая кардиомиопатия, КМП — кардиомиопатия, ФР — факторы риска.

Ключевые моменты Что известно о предмете исследования?

• Первичные кардиомиопатии вызываются большим спектром вариантов в различных генах. Для многих из этих вариантов наблюдается неполная пенетрантность.

• Такие варианты обладают рядом свойств, вызывающих низкую или высокую пенетрантность.

Что добавляют результаты исследования?

• Показана значимая корреляция оценок пене-трантности и популяционных частот вариантов, что свидетельствует о высокой пенетрантности редких вариантов генома.

• Для вариантов с неполной пенетрантностью характерна корреляция пенетрантности и предсказания их патогенности различными методами.

Key messages What is already known about the subject?

♦ Primary cardiomyopathies are caused by a wide range of variants in various genes. For many of these variants, incomplete penetrance is observed.

♦ Such variants have a number of properties that cause low or high penetrance.

What might this study add?

♦ A significant correlation was shown between penetrance estimates and population frequencies of variants, which indicates high penetrance of rare geno-mic variants.

♦ Variants with incomplete penetrance are characterized by a correlation between penetrance and prediction of their pathogenicity using various methods.

Введение

Явление неполной пенетрантности патогенных вариантов генома проявляется в отсутствии соответствующего моногенного фенотипа у части носителей варианта [1]. Неполную пенетрантность можно оценить как долю людей — носителей варианта, у которых проявляется заболевание или фенотип [2]. На проявление неполной пене-трантности варианта влияют как тип и зиготность варианта (его присутствие в гетеро- или гомозиготном состоянии), так и пол, возраст пациента, его полигенный фон и наличие внешних факторов риска (ФР) [3].

Ранее неполную пенетрантность вариантов генома наиболее часто исследовали в семьях, где изучали сегрегацию варианта вместе с фенотипом, или же в клинических когортах. Можно предположить, что такой подход значительно завышает оценку пенетрантности, т.к. заранее подразумевает наличие определенного фенотипа, а также общий полигенный фон и внешние ФР [4]. Благодаря наличию больших популяционных когорт появилась возможность исследовать явление неполной пенетрантности на популяционном уровне [5-7]. С одной стороны, такой подход освобождает от не-

обходимости делать предположения о наличии заболевания, с другой, такие исследования плохо учитывают заболевания, связанные со смертельными исходами в раннем возрасте, и обогащены заболеваниями с поздним началом [4]. Постепенное увеличение объема данных о пенетрантности патогенных вариантов при моногенных заболеваниях позволяет исследовать их свойства, в первую очередь те, которые можно связать с ожидаемым уровнем пенетрантности варианта.

Первичные кардиомиопатии (КМП) — это моногенные заболевания, связанные с широким спектром известных генетических факторов [8, 9]. При ДНК (дезоксирибонуклеиновая кислота)-диагностике у пациентов с наследственными формами КМП в ~60% случаев удается найти вариант, ставший причиной проявления заболевания [10]. Клинические проявления наследственных КМП широко варьируются в зависимости от типа КМП, морфофункционального варианта, характера ремо-делирования и пр.; наиболее грозными последствиями могут быть жизнеугрожающие аритмии или внезапная сердечная смерть [11-13].

Для многих КМП описана неполная пене-трантность вызывающих их вариантов генома [14].

Таблица 1

Распределение количества вариантов по уровню пенетрантности и заболеваниям в работе МеОигк КА, й а1. (2023) [6]

Заболевание Средняя пенетрантность Неизвестная пенетрантность

ДКМП 59 вариантов 45 вариантов

ГКМП 257 вариантов 293 варианта

Примечание: ДКМП — дилатационная кардиомиопатия, ГКМП — гипертрофическая кардиомиопатия.

Средняя пенетрантность Неизвестная пенетрантность

Тип варианта

Ц Миссенс замена Ц Вариант в сайте сплайсинга Ц Новый стоп-кодон

I I Индел без сдвига рамки считывания Ц Вариант со сдвигом рамки считывания

Средняя пенетрантность Неизвестная пенетрантность

Тип варианта

Ц Миссенс замена Ц Вариант в сайте сплайсинга Ц Новый стоп-кодон

I I Индел без сдвига рамки считывания Ц Вариант со сдвигом рамки считывания

Рис. 1 Распределение вариантов по типам аннотации в группах вариантов со средней и неизвестной пенетрантностью относительно заболеваний: А) ДКМП и Б) ГКМП, исследуемых в МеОигк КА, е! а1. (2023) [6]. Примечание: ДКМП — дилатационная кардиомиопатия, ГКМП — гипертрофическая кардиомиопатия. Цветное изображение доступно в электронной версии журнала.

Цель работы — изучение свойств и аннотации таких вариантов на основе результатов, полученных в работе МеОигк КА, е! а1. (2023) [6] для выявления различий между высоко-пенетрантными и средне-пенетрантными вариантами генома.

Материал и методы

Сбор данных. В работе МеОигк КА, е! а1. (2023) [6] были изучены варианты, ассоциированные с гипертрофической КМП (ГКМП) в генах МУН7, ИУВРС3, ИУ12, МУЬЗ, АСТС1, ТЖ13, ТШТ2, ТРМ1, и с дилатационной

150 -

100

К

50

-Г-

0,0

—г~

0,8

0,2

0,4

Пенетрантность

0,6

Заболевание

□ ДКМП

□ ГКМП

Рис. 2 Распределение оценок пенетрантности в данных МсОигк КА, е! а1. (2023) [6].

Примечание: ДКМП — дилатационная кардиомиопатия, ГКМП — гипертрофическая кардиомиопатия. Цветное изображение доступно в электронной версии журнала.

КМП (ДКМП) в генах BAG3, DES, DSP, LMNA, MYH7, PLN, RBM20, SCN5A, TNNC1, TNNT2, TTN. В исследовании использовались данные секвенирования 10400 пациентов с ГКМП и 2564 пациентов с ДКМП, а также выборки UK Biobank (16748 участников) и gnomAD (125748 участников) в качестве популяционных выборок. В анализе учитывались белок-изменяющие варианты с высокой или средней степенью воздействия в MANE (Matched Annotation from NCBI and EMBL-EBI) транскриптах согласно аннотации Ensembl и Sequence Ontology. Для каждого варианта авторами исходной публикации была проведена дальнейшая ручная курация на основе информации из базы данных ClinVar [15] и критериев ACMG (The American College of Medical Genetics and Genomics) [16]. В результате исследуемые варианты были классифицированы по клинической значимости в один из пяти классов: патогенные, вероятно патогенные, варианты с неизвестной значимостью, вероятно безвредные и безвредные.

Для оценки пенетрантности авторы использовали формулу Байеса [17]:

Пенетрантность

Распространенность заболевания

Частота варианта среди больных

Частота варианта среди здоровых

В дальнейший анализ были включены следующие две группы вариантов (таблица 1):

• Группа, названная авторами анализируемой статьи "вариантами со средней пенетрантностью": количество аллелей в выборке пациентов с соответствующим заболеванием >1, и количество аллелей в контрольной попу-

ляционной группе также >1. Для таких вариантов можно рассчитать частоту и оценить пенетрантность;

• Группа, названная авторами "вариантами с неизвестной пенетрантностью" (предположительно, высокой): количество аллелей в группе пациентов >1, количество аллелей в контрольной группе <2. Для таких вариантов невозможно достоверно определить частоту в популяции и, соответственно, невозможно рассчитать пенетрантность.

Биоинформатический и статистический анализ. Варианты из исследования McGurk KA, et al. (2023) [6] были аннотированы нами с помощью Ensembl VEP v. 111 [18], а также актуальными данными баз ClinVar от 01.07.2024 [15], gnomAD v. 4.1.0 [19] и dbNSFP v. 4.7а [20]. База dbNSFP объединяет предсказания патогенности несинонимичных вариантов генома, выполненные различными многочисленными методами [20]. В работе использовалось 49 различных методов предсказания патогенности вариантов и оценок консервативности позиции мутации: SIFT4G_converted, Polyphen2_HDIV, Polyphen2_HVAR, LRT_converted, MutationTaster_converted, MutationAssessor, FATHMM_converted, PROVEAN_converted, VEST4, MetaSVM, MetaLR, MetaRNN, M-CAP, REVEL, MutPred, MVP, gMVP, MPC, PrimateAI, DEOGEN2, BayesDel_ addAF, BayesDel_noAF, ClinPred, LIST-S2, VARITY_R, VARITY_ER, VARITY_R_LOO, VARITY_ER_LOO, ESM1b, EVE, AlphaMissense, CADD_raw, DANN, fathmm-MKL_coding, fathmm-XF_coding, Eigen-raw_coding, Eigen-PC-raw_coding, GenoCanyon, integrated_fitCons, LINSIGHT, GERP++_RS, phyloP100way_vertebrate, phyloP470way_mammalian, phyloP17way_primate,

0

X

ГКМП

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ДКМП

125

100 -

10

75 ■

К

50

5

25 -

0,0

0,2

0,4

Источник

I | Миссенс замена

Индел без сдвига рамки считывания

0,6 0,0 Пенетрантность

0,2

| Вариант в сайте сплайсинга I I Вариант со сдвигом рамки считывания

0,4

I I Новый

0,6

стоп-кодон

0,8

Рис. 3 Распределение пенетрантности вариантов в работе МеОигк КА, е! а1. (2023) [6] по типам вариантов.

Примечание: ДКМП — дилатационная кардиомиопатия, ГКМП — гипертрофическая кардиомиопатия. Цветное изображение доступно в электронной версии журнала.

0

0

phastCons100way_vertebrate, phastCons470way_mammalian, phastCons17way_primate, SiPhy_29way_logOdds, bStatistic_ converted. Для исследуемых инструментов были получены ранговые оценки патогенности, где 0 означает безвредный вариант, 1 — патогенный. Статистический анализ проводили, используя среду R 4.1.2 с открытым исходным кодом. Для оценки корреляций использовали коэффициент корреляции Спирмена. Уровень статистической значимости в корреляционном анализе после поправки Бонферрони на множественное сравнение равнялся 1,02*10-3. Для сравнения ранговых оценок между группами вариантов использовали односторонний тест Манна-Уитни-Вилкоксона с уровнем значимости <0,05.

Результаты

Спектр описанных вариантов

Распределение вариантов по типам аннотации из работ МеОигк КА, е! а1. (2023) [6] представлено на рисунке 1. Подавляющее большинство вариантов являлось миссенс-заменами: от 60 до 87% в зависимости от группы и заболевания. Следующей широко представленной группой были варианты в канонических сайтах сплайсинга (от 2 до 11%) и новые стоп-кодоны (от 2 до 20%).

Распределение оценок пенетрантности для подгруппы "средняя пенетрантность" представлено

ДКМП

125 -

ГКМП

10 -

100 -

75

5 -

50 -

25 -

0,0

0,2

0,4

0,6

0

0,8 0,0 Пенетрантность

0,2

0,4

0,6

Классификация варианта Патогенные Вероятно патогенные

I I Безвредные

^ Варианты с неизвестной значимостью I I Вероятно безвредные

Рис. 4 Распределение пенетрантности вариантов в работе МсОигк КА, е! а1 (2023) [6] по классам патогенное™.

Примечание: ДКМП — дилатационная кардиомиопатия, ГКМП — гипертрофическая кардиомиопатия. Цветное изображение доступно в электронной версии журнала.

0

на рисунке 2. Большинство вариантов для ДКМП (п=42, 71,2%) и для ГКМП (п=244, 94,9%) обладают пенетрантностью <25%. Распределение вариантов по типам в зависимости от оценок пенетрантности приведено на рисунке 3. Укорачивающие белок варианты (стоп-кодоны, сдвиг рамки считывания или мутации в сайтах сплайсинга) были более представлены среди вариантов с высокими значениями пенетрантности, чем с низкими. Медианное значение пенетрантности миссенс-замен равнялось 6,0% для ДКМП и 1,7% для ГКМП, для вариантов всех остальных типов — 35,9% для ДКМП и 5,2% для ГКМП. Более высокие значения для них объясняются тем, что это, в основном, укорачивающие белок варианты с добавлением небольшого числа инделов без сдвига рамки считывания.

На рисунке 4 представлено распределение вариантов генома по классам патогенности [6]. Самой распространенной группой являлись варианты с неизвестной значимостью для ДКМП (п=33, 55,9%) и для ГКМП (п=151, 58,7%). Для них харак-

терны низкие значения пенетрантности с медианным значением 9,2% для ДКМП и 1,0% для ГКМП. В случае ДКМП второй самой распространенной группой были вероятно патогенные варианты (п=14), в случае ГКМП — патогенные варианты (п=29), медианное значение пенетрантности для них составило 37,2% и 15,6%, соответственно.

Свойства вариантов с неполной пенетрантностью

Для вариантов, определенных авторами публикации [6] как "группа со средней пенетрантностью", наблюдалась значимая корреляция оценки пенетрантности и популяционной частоты варианта в данных gnomAD у.4.1.0: коэффициент корреляции равнялся -0,90 [95% ДИ (доверительный интервал): -0,95 — -0,80] (р<0,001) для ДКМП и -0,75 [95% ДИ: -0,81- -0,68] (р<0,001) для ГКМП. Такой результат вполне ожидаем, т.к. оценка пенетрантности в этой работе выполнялась, в т.ч. на основе значений популяционной частоты варианта [17].

Для этих вариантов нами были изучены корреляции между значениями пенетрантности и ранго-

0,6 ч

^ сГ

Метод

Метод

А

log Р

log Р

I

.

20 15 10 5

Рис. 5 Распределение значений корреляции ранговых оценок патогенности с оценками пенетрантности из МсОигк КА, е! а1. (2023) [6] для А) ДКМП и Б) ГКМП.

Примечание: ДКМП — дилатационная кардиомиопатия, ГКМП — гипертрофическая кардиомиопатия. Цветное изображение доступно в электронной версии журнала.

выми оценками патогенности миссенс-вариантов, выполненных 49 различными инструментами предсказания из базы ёЬ^РР. Такие оценки были получены для 37 вариантов со средней пенетрант-ностью в случае ДКМП и 160 вариантов в случае ГКМП. Далее были рассмотрены только те корреляции, для которых р-значение после поправки Бонферрони было <1,02х10-3: 12 значимых корреляций для вариантов, связанных с ДКМП, и 22 для связанных с ГКМП (рисунок 5).

Для обоих заболеваний в список 5 самых высоко коррелирующих с пенетрантностью методов предсказания вошло 4 метода: САББ, Вауе$Бе1 (с учетом частоты и без), СИпРгеё. Значения коэффициента корреляции Спирмена для них составили 0,62-0,68 для ДКМП и 0,34-0,57 для ГКМП. С помощью этих методов были получены оценки предсказанной патогенности для вариантов из группы с неизвестной пенетрантностью. Для трех инструментов — СИпРгеё, Вауе$Бе1 с учетом частоты и без — тестом Манна-Уитни-Вилкоксона было получено, что ранговые оценки патогенности значимо больше в группе вариантов с неизвестной пе-нетрантностью, чем в группе вариантов со средней пенетрантностью в случае ДКМП, и для всех 4-х — в случае ГКМП (рисунки 6 и 7).

Обсуждение

В рамках настоящей работы исследованы варианты генома, описанные в работе МсОигк КА, е! а1. [6], которая представляет один из наиболее крупных курируемых наборов данных по оценкам пене-трантности вариантов генома.

В изученном спектре вариантов значительно преобладали миссенс-замены (от 59 до 89% из всей группы вариантов), что объясняется широкой распространенностью таких вариантов в геноме человека [21]. Среди вариантов с относительно высокими оценками пенетрантности оказались наиболее представлены варианты со сдвигом рамки считывания, т.к. они зачастую приводят к гаплонедостаточности или формированию аберрантного белка [22]. Была также исследована корреляция частот вариантов в новейшей версии 4.1.0 базы gnomAD с оценками пенетрантности. Для всех вариантов были получены отрицательные оценки корреляции с частотой варианта в базе gnomAD, что позволяет предположить, что при увеличении пенетрантности вариант встречается в популяциях реже. Другой возможной причиной высокой корреляции этих величин является то, что пенетрантность варианта рассчитывалась с учетом его популяционной частоты. Также наблюдалось обогащение вариантами с неизвестной

Б

2,0

с

IS

с

Ц

3

1,5

1,0

0,5

0,0

0,00

A Метод

— BayesDel_addAF

_ BayesDel_noAF

_ CADD_raw ClinPred

0,25

0,50

Ранговая оценка

0,75

1,00

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

б-

£ 4-

—I—

0,8

—I—

0,9

0,5

0,б

0,7

Ранговая оценка

Метод

— BayesDel_addAF

— BayesDel_noAF

— CADD_гaw ОтРгей

Рис. 6 Распределение значений ранговых оценок патогенности для ДКМП из МсОигк КА, е1 а1. (2023) [6] для А) вариантов со средней пе-

нетрантностью, Б) вариантов с неизвестной пенетрантностью. Примечание: ДКМП — дилатационная кардиомиопатия. Цветное изображение доступно в электронной версии журнала.

2

0

значимостью среди вариантов с низкими оценками пенетрантности, и, вероятно, патогенных и патогенных вариантов среди вариантов с высокими оценками пенетрантности, что дополнительно ставит под вопрос клиническую значимость вариантов с оценкой пенетрантности <0,2. Миссенс-замены обладали более низкой медианной пенетрантностью, чем варианты остальных типов, что вполне ожидаемо, т.к. последние, как правило, приводят к более серьезным последствиям для продукта гена.

В рамках работы были изучены связи оценок пенетрантности вариантов и предсказания их па-тогенности различными инструментами. Из 4-х инструментов, показавших лучшие результаты для всех наборов данных — САББ, Вауе$Бе1 с учетом частоты и без, и СНпРгеё, — три используют частоту

как один из предсказательных признаков: CADD, BayesDel с учетом частоты и ClinPred. Таким образом, данный результат ожидаем, если учитывать наблюдаемую нами корреляцию частоты и оценки пенетрантности. Часть методов, показавших значимую корреляцию с оценками пенетрантности для ГКМП, являются метапредикторами (например, MetaSVM, REVEL, MetaLR), и учитывают предсказания других методов, использующих частоту варианта как предиктор.

В случае BayesDel без учета частоты коэффициент корреляции Спирмена составил 0,64 и 0,34 для ДКМП и ГКМП, соответственно. Помимо этого метода, популяционные частоты не используются лишь в нескольких методах (MutationTaster, ESMlb, PrimateAI), и значения коэффициента

3 -|

1 -

0

-1-

0,50

Ранговая оценка

0,00

A

Метод

— BayesDel_addAF

— BayesDel_noAF

— CADD_raw ClinPred

0,25

0,75

1,00

4 -

Й H

■J

о

S 2 -

о

0

-1-

0,50

Ранговая оценка

0,25

0,75

1,00

0,00 Метод

— BayesDel_addAF

— BayesDel_noAF

— CADD_гaw ClinPгed

Рис. 7 Распределение значений ранговых оценок патогенное™ для ГКМП из МсОигк КА, е1 а1 (2023) [6] для А) вариантов со средней пе-

нетрантностью и Б) вариантов с неизвестной пенетрантностью. Примечание: ГКМП — гипертрофическая кардиомиопатия. Цветное изображение доступно в электронной версии журнала.

2

5

1

корреляции Спирмена для Б8М1Ъ и Рпша1еА1 них ощутимо ниже, чем для методов, учитывающих частоты: 0,21 и 0,27 для ГКМП, соответственно, при этом значимой корреляции с пенетрантностью для ДКМП показано не было. Метод Ми1а1:юпТа$1ег продемонстрировал относительно высокий коэффициент корреляции Спирмена (0,57) в случае ДКМП, но не показал значимой корреляции с ГКМП. В работе систематически наблюдаются более высокие корреляции для ДКМП, чем для ГКМП, что, предположительно, может быть объяснено как различиями в молекулярных механизмах неполной пенетрантности для заболеваний, так и различием в количестве исследуемых вариантов.

Для группы вариантов, которая в работе [6] была описана как варианты с неизвестной (но, предпо-

ложительно, высокой) пенетрантностью было получено, что 3 инструмента — BayesDel с учетом частоты и без, и ClinPred — дают значимо большие оценки патогенности, чем в группе вариантов со средней пенетрантностью для обоих заболеваний.

Настоящая работа имеет несколько ограничений. Во-первых, McGurk KA, et al. [6] использовали теорему Байеса для частот вариантов в когортах больных и условно здоровых участников исследования. В работе использовалась часть данных из базы gnomAD в расчетах, что влияет на полученные в исследовании оценки корреляций. Во-вторых, в нашей работе использовался лишь один из двух доступных наборов данных о пенетрантности вариантов генома в отношении КМП. Второй набор данных из работы Forrest IS, et al. (2022) [5] обла-

дает рядом существенных недостатков, в частности, множественных проблем с аннотацией вариантов как по классам патогенности, так и относительно корректности ассоциации с фенотипом [4].

Заключение

В рамках работы были описаны связи популя-ционной частоты варианта генома, его типа, и оценки его пенетрантности. Также были изучены корреляции пенетрантности варианта и предсказаний его патогенности. В работе впервые показано, что использование вычислительных предсказаний па-

Литература/References

1. Kingdom R, Wright CF. Incomplete Penetrance and Variable Expressivity: From Clinical Studies to Population Cohorts. Front Genet. 2022;13:920390. doi:10.3389/fgene.2022.920390.

2. Coll M, Perez-Serra A, Mates J, et al. Incomplete Penetrance and Variable Expressivity: Hallmarks in Channelopathies Associated with Sudden Cardiac Death. Biology (Basel). 2017;7(1):3. doi:10.3390/ biology7010003.

3. Cooper DN, Krawczak M, Polychronakos C, et al. Where genotype is not predictive of phenotype: towards an understanding of the molecular basis of reduced penetrance in human inherited disease. Hum Genet. 2013;132(10):1077-130. doi:10.1007/s00439-013-1331-2.

4. Wright CF, Sharp LN, Jackson L, et al. Guidance for estimating pe-netrance of monogenic disease-causing variants in population cohorts. Nat Genet. 2024;56(9):1772-9. doi:10.1038/s41588-024-01842-3.

5. Forrest IS, Chaudhary K, Vy HMT, et al. Population-Based Penetrance of Deleterious Clinical Variants. JAMA. 2022;327(4): 350-9. doi:10.1001/jama.2021.23686.

6. McGurk KA, Zhang X, Theotokis P, et al. The penetrance of rare variants in cardiomyopathy-associated genes: A cross-sectional approach to estimating penetrance for secondary findings. Am J Hum Genet. 2023;110(9):1482-95. doi:101016/j.ajhg.2023.08.003.

7. Goodrich JK, Singer-Berk M, Son R, et al. Determinants of penetrance and variable expressivity in monogenic metabolic conditions across 77184 exomes. Nat Commun. 2021;12(1):3505. doi:101038/s41467-021-23556-4.

8. Shestak AG, Bukaeva AA, Saber S, et al. Allelic Dropout Is a Common Phenomenon That Reduces the Diagnostic Yield of PCR-Based Sequencing of Targeted Gene Panels. Front Genet. 2021; 12:620337. doi:10.3389/fgene.2021.620337.

9. Myasnikov R, Bukaeva A, Kulikova O, et al. A Case of Severe Left-Ventricular Noncompaction Associated with Splicing Altering Variant in the FHOD3 Gene. Genes (Basel). 2022;13(2):309. doi:10.3390/ genes13020309.

10. Bukaeva A, Myasnikov R, Kulikova O, et al. A Rare Coincidence of Three Inherited Diseases in a Family with Cardiomyopathy and Multiple Extracardiac Abnormalities. Int J Mol Sci. 2024; 25(14):7556. doi:10.3390/ijms25147556.

11. Myasnikov R, Brodehl A, Meshkov A, et al. The Double Mutation DSG2-p.S363X and TBX20-p.D278X Is Associated with Left Ventricular Non-Compaction Cardiomyopathy: Case Report. Int J Mol Sci. 2021; 22(13):6775. doi:10.3390/ijms22136775.

12. Burnasheva GA, Myasnikov RP, Kulikova OV, et al. Prognostic value of morphological, biochemical, molecular markers of fibrosis in patients with hypertrophic cardiomyopathy. Cardiovascular Therapy

тогенности вариантов генома может использоваться для отделения высоко-пенетрантных вариантов от средне-пенетрантных. Можно надеяться, что по мере увеличения размера выборок и разнообразия исследуемых заболеваний будет получена более объективная картина применимости вычислительных методов для предсказания не только патоген-ности, но и пенетрантности вариантов генома.

Отношения и деятельность: все авторы заявляют об отсутствии потенциального конфликта интересов, требующего раскрытия в данной статье.

and Prevention. 2023;22(12):3839. (In Russ.) Бурнашева Г. А., Мясников Р. П., Куликова О. В. и др. Прогностическая ценность морфологических, биохимических, молекулярно-генетических маркеров фиброза у пациентов с гипертрофической кардио-миопатией. Кардиоваскулярная терапия и профилактика. 2023;22(12):3839. doi:1015829/1728-8800-2023-3839.

13. Meshkov AN, Myasnikov RP, Kiseleva AV, et al. Genetic landscape in Russian patients with familial left ventricular noncompaction. Frontiers in Cardiovascular Medicine. 2023;10:1205787. doi:10.3389/ fcvm.20231205787.

14. Serpa F, Finn CM, Tahir UA. Navigating the penetrance and phe-notypic spectrum of inherited cardiomyopathies. Heart Fail Rev. 2024;29(5):873-81. doi:101007/s10741-024-10405-x.

15. Landrum MJ, Lee JM, Riley GR, et al. ClinVar: public archive of re la-tionships among sequence variation and human phenotype. Nucleic Acids Res. 2014;42(Database issue):D980-5. doi:10.1093/nar/ gkt1113.

16. Miller DT, Lee K, Chung WK, et al. ACMG SF v3.0 list for reporting of secondary findings in clinical exome and genome sequencing: a policy statement of the American College of Medical Genetics and Genomics (ACMG). Genet Med. 2021;23(8):1381-90. doi:101038/ s41436-021-01172-3.

17. Minikel EV, Vallabh SM, Lek M, et al. Quantifying prion disease penetrance using large population control cohorts. Sci Transl Med. 2016;8(322):322ra9. doi:101126/scitranslmed.aad5169.

18. McLaren W, Gil L, Hunt SE, et al. The Ensembl Variant Effect Predictor. Genome Biol. 2016;17(1):122. doi:101186/s13059-016-0974-4.

19. Chen S, Francioli LC, Goodrich JK, et al. A genomic mutational constraint map using variation in 76156 human genomes. Nature. 2024;625(7993):92-100. doi:101038/s41586-023-06045-0.

20. Liu X, Li C, Mou C, Dong Y, et al. dbNSFP v4: a comprehensive database of transcript-specific functional predictions and annotations for human nonsynonymous and splice-site SNVs. Genome Med. 2020; 12(1): 103. doi:101186/s13073-020-00803-9.

21. Lek M, Karczewski KJ, Minikel EV, et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 2016;536(7616):285-91. doi:101038/nature19057.

22. Ryzhkova OP, Kardymon OL, Prokhorchuk EB, et al. Guidance for the interpretation of human DNA sequence data from massively parallel sequencing (MPS) (2018 Revision, Version 2). Medical Genetics. 2019; 18(2):3-23. (In Russ.) Рыжкова О. П., Кардымон О. Л., Прохорчук Е. Б. и др. Руководство по интерпретации данных последовательности ДНК человека, полученных методами массового параллельного секвенирования (MPS) (редакция 2018, версия 2). Медицинская генетика. 2019;18(2):3-23. doi:10.25557/2073-7998.2019.02.3-23.

i Надоели баннеры? Вы всегда можете отключить рекламу.