Научная статья на тему 'Структурный и филогенетический анализ генов VvmybA1, VvmybA2 и VvmybA3'

Структурный и филогенетический анализ генов VvmybA1, VvmybA2 и VvmybA3 Текст научной статьи по специальности «Биологические науки»

CC BY
238
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНТОЦИАН / ДНК / ГЕН / ПРОТЕОМ / ЭВОЛЮЦИЯ / VITIS / ARABIDOPSIS / ГОМОЛОГИЧНЫЕ ГЕНЫ / РЕГУЛЯТОРНЫЕ ДНК-ЭЛЕМЕНТЫ / ANTHOCIAN / DNA / GENE / PROTEOM / EVOLUTION / HOMOLOGOUS GENES / REGULATORY DNA ELEMENTS

Аннотация научной статьи по биологическим наукам, автор научной работы — Милованов Александр Валериевич, Звягин Андрей Сергеевич, Трошин Леонид Петрович

Статья представляет структурный и филогенетический анализ генов VIT_02s0033g00410, VIT_02s0033g00390 и VIT_02s0033g00450 генома винограда и близкородственного ортологичного гена MYB114 генома арабидопсиса. Данные гены ответственны за биосинтез антоциана в органах модельных растений и представляют интерес не только для практического производства и селекции, но и для фундаментальных работ по генетике. Данные гены были проанализированы на GC-состав нуклеотидов, наличие cis-регуляторных элементов и промотерных регионов. ДНК и протеиновые последовательности были выровнены для поиска схожих элементов, что позволило далее проанализировать ультраконсервативные домены четырех генов. По результатам поиска и выявления консервативных регионов было построено кластерное древо, позволившее выявить отделение побочных линий генов от, предположительно, главного. При этом, построение консенсусных древ, основанных на ДНК и протеиновых последовательностях, выявило абсолютное их сходство. «Древо минимальной эволюции» позволило подсчитать примерные даты появления мутаций и расхождения ветвей генов между собой. При этом за точку отсчета времени бралось само появление семейства Vitis, его отделение от порядка Rosales. В конце был произведен поиск гомологичных метаболических путей у винограда и арабидопсиса, который выявил наличие в виноградном протеомегомологичных протеинов. В свою очередь, это уже подтверждает наличие сходных путей биосинтеза и, как следствие, интеракций типа «ДНК-белок» и «белок-белок»

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биологическим наукам , автор научной работы — Милованов Александр Валериевич, Звягин Андрей Сергеевич, Трошин Леонид Петрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STRUCTURAL AND PHYLOGENETIC ANALYSIS OF VVMYBA1, VVMYBA2 AND VVMYBA3 GRAPEVINE GENES

The article presents the structural and phylogenetic analysis of VIT_02s0033g00410, VIT_02s0033g00390 and VIT_02s0033g00450 genes of the grapevine genome and the closely related orthologous gene MYB114 of the Arabidopsis genome. These genes are responsible for the biosynthesis of anthocyanin in the organs of model plants and are of interest not only for practical production and breeding, but also for fundamental research. These genes were analyzed for GC-composition of nucleotides, the presence of cis-regulatory elements and promoter regions. DNA and protein sequences were aligned to look for similar elements, which allowed further analysis of the ultraconservative domains of four genes. Based on the results of search and identification of the conservative regions, a cluster tree was constructed, which made it possible to identify the separation of gene sidelines from, presumably, the main one. At the same time, the construction of consensus trees based on DNA and protein sequences revealed their absolute similarity. "The Minimal Evolution Tree" allowed calculating the approximate dates of the appearance of the mutations and the divergence times of the gene branches between each other. At the same time, the appearance of the Vitis genus and its separation from the Rosales was taken as the time first divergence point. In the end, homologous metabolic pathways were searched between grapevine and Arabidopsis, which revealed the presence of homologous proteins in the grape proteome. In this turn, it already confirms the existence of similar biosynthetic pathways and, as a consequence, interactions such as "DNA-protein" and "protein-protein"

Текст научной работы на тему «Структурный и филогенетический анализ генов VvmybA1, VvmybA2 и VvmybA3»

УДК 577.212.2

03.00.00 Биологические науки

СТРУКТУРНЫЙ И ФИЛОГЕНЕТИЧЕСКИЙ АНАЛИЗ ГЕНОВ VVMYBA1, VVMYBA2 И VVMYBA3

Милованов Александр Валериевич к.б.н., старший преподаватель

Звягин Андрей Сергеевич к.б. н.

Трошин Леонид Петрович д.б.н., профессор

Кубанский государственный аграрный университет, Краснодар, Россия

Статья представляет структурный и филогенетический анализ генов VIT_02s0033g00410, VIT_02s0033g00390 и VIT_02s0033g00450 генома винограда и близкородственного ортологичного гена MYB114 генома арабидопсиса. Данные гены ответственны за биосинтез антоциана в органах модельных растений и представляют интерес не только для практического производства и селекции, но и для фундаментальных работ по генетике. Данные гены были проанализированы на GC-состав нуклеотидов, наличие cis-регуляторных элементов и промотерных регионов. ДНК и протеиновые последовательности были выровнены для поиска схожих элементов, что позволило далее проанализировать ультраконсервативные домены четырех генов. По результатам поиска и выявления консервативных регионов было построено кластерное древо, позволившее выявить отделение побочных линий генов от, предположительно, главного. При этом, построение консенсусных древ, основанных на ДНК и протеиновых последовательностях, выявило абсолютное их сходство. «Древо минимальной эволюции» позволило подсчитать примерные даты появления мутаций и расхождения ветвей генов между собой. При этом за точку отсчета времени бралось само появление семейства Vitis, его отделение от порядка Rosales. В конце был произведен поиск гомологичных метаболических путей у винограда и арабидопсиса, который выявил наличие в виноградном протеомегомологичных протеинов. В свою очередь, это уже подтверждает наличие сходных путей биосинтеза и, как следствие, интеракций типа «ДНК-белок» и «белок-белок»

Ключевые слова: АНТОЦИАН, ДНК, ГЕН, ПРОТЕОМ, ЭВОЛЮЦИЯ, VITIS, ARABIDOPSIS, ГОМОЛОГИЧНЫЕ ГЕНЫ, РЕГУЛЯТОРНЫЕ ДНК-ЭЛЕМЕНТЫ

UDC 577.212.2 Biological sciences

STRUCTURAL AND PHYLOGENETIC ANALYSIS OF VVMYBA1, VVMYBA2 AND VVMYBA3 GRAPEVINE GENES

Milovanov Alexander Valerievich Cand.Biol.Sci., Senior Lecturer

Zvyagin Andrey Sergeevich Cand.Biol.Sci.

Troshin Leonid Petrovich Dr.Sci.Biol., Professor

Kuban State Agrarian University, Krasnodar, Russia

The article presents the structural and phylogenetic analysis of VIT_02s0033g00410, VIT_02s0033g00390 and VIT_02s0033g00450 genes of the grapevine genome and the closely related orthologous gene MYB114 of the Arabidopsis genome. These genes are responsible for the biosynthesis of anthocyanin in the organs of model plants and are of interest not only for practical production and breeding, but also for fundamental research. These genes were analyzed for GC-composition of nucleotides, the presence of cis-regulatory elements and promoter regions. DNA and protein sequences were aligned to look for similar elements, which allowed further analysis of the ultraconservative domains of four genes. Based on the results of search and identification of the conservative regions, a cluster tree was constructed, which made it possible to identify the separation of gene sidelines from, presumably, the main one. At the same time, the construction of consensus trees based on DNA and protein sequences revealed their absolute similarity. "The Minimal Evolution Tree" allowed calculating the approximate dates of the appearance of the mutations and the divergence times of the gene branches between each other. At the same time, the appearance of the Vitis genus and its separation from the Rosales was taken as the time first divergence point. In the end, homologous metabolic pathways were searched between grapevine and Arabidopsis, which revealed the presence of homologous proteins in the grape proteome. In this turn, it already confirms the existence of similar biosynthetic pathways and, as a consequence, interactions such as "DNA-protein" and "protein-protein"

Keywords: ANTHOCIAN, DNA, GENE, PROTEOM, EVOLUTION, VITIS, ARABIDOPSIS, HOMOLOGOUS GENES, REGULATORY DNA ELEMENTS

Научный журнал КубГАУ, №134(10), 2017 года йо!: 10.21515/1990-4665-134-026

Введение

Антоциановая окраска ягод винограда является одной из самых отличительных характеристик данной ценной сельскохозяйственной культуры. И метаболические пути этого признака кодируются тремя генами VvmybA1, VvmybA2 и VvmybA3 (7, 11). В свою очередь известно, что VvmybA1 в большинстве сортов не транскрибируется нигде кроме кожицы ягод, в то время как в сорте Бэйли Аликан. А эта особенность была утеряна (8). В норме все три гена располагаются друг за другом во второй хромосоме ядерного генотипа винограда (16), но случается и так, что ввиду огромной делеции они теряются из генома, как это случилось, например, с сортом Пино нуар (23), что привело к появлению ныне популярного сорта винограда Пино блан.

Как известно, отбор человеком различных гибридов и клонов привел к созданию огромного разнообразия сортов винограда. Большинство из них принадлежит к европейским видам УШ8 vinifera L., происходящих из множественных центров одомашнивания дикорастущего лесного винограда УШ8 silvestris Gmel. (3). Параллельный отбор клонов и спонтанные скрещивания породили еще большее разнообразие в фенотипах, были отобраны основные белые, розовые и красные сорта.

В виду того, что изначально и далее человеком отбирались гибриды по свойствам ягод, а именно окраске, это создало определенное генетическое разнообразие среди сортов именно в строении генов VvmybA1, VvmybA2 и VvmybA3. Но, несмотря на это, строение данных генов является довольно консервативным при их сравнении, что говорит об их значимости и для филогенетического анализа при сравнении культурных с дикими формами. Таким образом, мы проведем небольшой

Ыф://д .kubagro.ru/2017/10^/26^

структурный и филогенетический анализ генов, ответственных за синтез антоциана в ягодах.

Материалы и методы

Для исследований использовались сиквенсы генов VIT_02s0033g00410, VIT_02s0033g00390 и VIT_02s0033g00450 генома винограда и MYB114 генома арабидопсиса (как наиболее близкий по протеиновой последовательности), загруженные с сайта EnsemblPlants (10).

Анализ GC-нуклеотидов производился в GC-Profile (5). Описание регуляторных cis-мотивов в сиквенсах производился с помощью Possum (14) и Nsite (19). Поиск промотерных регионов осуществляли с помощью веб-ресурса Tfsitescan (http://www.ifti.org/cgi-bin/ifti/Tfsitescan.pl).

Уравнение ДНК и протеиновых последовательностей производилось с помощью ClustalO (18). Анализ наличия консервативных последовательностей проводился при помощи NCBI CD-search (13). Гомологичные сиквенсы рода Vitis и близкородственных растений осуществлялись с помощью NCBIBLAST (1). Филогенетическое древо создавалось при помощи MEGA7 (12).

Для изучения общих свойств между растениями, был выбран ортологичный ген MYB114 арабидопсиса, визуализированный при помощи программы BAC ePlant (21).

Результаты и обсуждение

Изучение GC состава. Сиквенсы, загруженные с EnsemblPlants, были проанализированы на AT/GC-состав для составления первичного представления о качественной структуре генов и полученные данные отображены в таблице 1 и на рисунках 1-4.

Таблица 1. - AT/GC-состав изученных последовательностей

Название AT (%) GC (%)

VIT 02s0033g00410 58.33 41.67

VIT 02s0033g00390 58.24 41.76

VIT 02s0033g00450 58.80 41.20

MYB114 66.64 33.36

Как мы можем видеть из таблицы 1, содержание GC-нуклеотидов у генов винограда примерно одинаковое и почти на 10% выше, чем у арабидопсиса, что говорит о более высокой термостабильности генов в целом. Тем не менее, как мы можем видеть из изображений 1-4, общая тенденция повышения-понижения количества GC-нуклеотидов сохраняется не только между генами у винограда, но и при сравнении с геном арабидопсиса.

Рисунок 1 - Изменение GC-состава Рисунок 2 - Изменение GC-состава у гена VIT_02s0033g00410 у гена VIT_02s0033g00390

Рисунок 3 - Изменение GC-состава Рисунок 4 - Изменение GC-состава у гена VIT_02s0033g00450 у гена MYB114

При этом важно отметить, что повышение содержания GC совпадает с положением экзонных последовательностей генов у обоих видов. В то время как положение интронных последовательностей совпадает с повышенным содержанием AT, что не противоречит современным представлениям о строении генома (4, 17). С другой стороны, с 200 по 400 нуклеотид у арабидопсиса имеется повышение количества GC-нуклеотидов, несмотря на то, что там расположен интрон. Но это объяснимо тем, что общее содержание GC-нуклеотидов в гене MYB114 арабидопсиса значительно ниже, чем у винограда и поэтому небольшое повышение их количества так отразилось на диаграмме, во-первых, и наложением нескольких сиквенсов нескольких генов (по данным EnsemblPlants), во-вторых. Тем не менее, к сожалению, до сих пор неизвестно, какие эволюционные силы формируют создание такого разнообразия в ходе эволюции.

Анализ регуляторных мотивов. Как уже было сказано, поиск Cis-элементов проводили при помощи программы Possum. Результаты представлены на рисунке 5 и в таблице 2.

Рисунок 5 - Схематическое изображение Cis-элементов в изученных

генах

Черные линии на рисунке 5 указывают на сходные места расположения изученных элементов. Как мы можем видеть, изученные виноградные гены имеют сходные паттерны Cis-элементов, которые расположены примерно в одних и тех же местах. Например, в первом случае - это NF-1-элемент, во втором и третьем - Myf, и в пятом - LSF. Интересно, что в четвертом полное совпадении паттернов выявлено у VIT_02s0033g00410 и VIT_02s0033g00390 (Myf), в то время как у VIT_02s0033g00450 - Ets, но тоже на обратной цепи ДНК. Хотя с другой стороны, такой же элемент был выявлен у MYB114, который является гомологичным этим генам, но уже на «передней» цепи ДНК. Сравнение с геном MYB114 арабидопсиса показывает относительное сродство с генами винограда в расположении элементов, но при том, что у него они расположены зачастую на «обратной» цепи ДНК и они сами по себе другие. Так, в первом случае - это Myc, во втором - Sp1, в третьем - Myc, в четвертом - Ets и в пятом случае - LSF, также как и у генов винограда. Более детальное описание Cis-элементов приведено в таблице 2.

Таблица 2. - Описание Cis-элементов, обнаруженных у четырех

изученных генов

MYB114 VIT 02s0033g00450

Название Позиция Нить ДНК Сиквенс Название Позиция Нить ДНК Сиквенс

SRF 24 - 36 - tctatctttggtc NF-1 120 - 137 + tgttgggaaaatcccaga

Ets 59 - 69 + ttgaggaaagg ERE 155 - 168 + aaatcaccctcacc

Myc 128 - 137 - ggcaaatggc Tef 233 - 244 - cagaggcttgcg

Tef 154 - 165 - agctggtatgta TATA 241 - 255 - tgcgagactttatag

TATA 329 - 343 + acatatatagaccgg GATA 278 - 290 - gggtttatctctc

TATA 331 - 345 + atatatagaccgggg Ets 293 - 303 - ttcttcctgga

Sp1 340 - 352 + ccggggttggtcc ERE 324 - 337 + tggtgaccatgcca

SRF 434 - 446 + gaccaactattgg NF-1 323 - 340 - gtggtgaccatgccaata

Ets 465 - 475 + tagaggaagat Tef 356 - 367 + agcagtcctccc

CCAAT 566 - 581 - tctacgattggtttgt Myf 452 - 463 + gaacagcttcag

Myc 622 - 631 + aacacgtgcg Myf 617 - 628 - ctgcagcttttt

Myc 622 - 631 - aacacgtgcg Ets 739 - 749 + gaggggaacca

Ets 757 - 767 + tgcaggaaaag LSF 737 - 751 - cggaggggaaccaga

Ets 810 - 820 + gagaggaaaat Ets 782 - 792 - catttcctcag

LSF 971 - 985 + acctggtcggaccgc AP-1 845 - 855 - atcgagtcaac

LSF 903 - 917 - caacctcgaacctgt

GATA 915 - 927 - tgttctatctcat

AP-1 925 - 935 + catgactcgga

SRF 943 - 955 - cccctaattggtt

CCAAT 943 - 958 - cccctaattggttgat

VIT 02s0033g00410 VIT 02s0033g00390

Название Позиция Нить ДНК Сиквенс Название Позиция Нить ДНК Сиквенс

Tef 2 - 13 - agcatgaatgca Myf 68 - 79 + ccacagctgtag

NF-1 81 - 98 + tgttgggtgtatcccaga Myf 71 - 82 - cagctgtagttt

NF-1 82 - 99 - gttgggtgtatcccagaa NF-1 93 - 110 + ccttggcaaggctttgga

ERE 116 - 129 + aaatcaccctcacc TATA 122 - 136 - ggtgaggttttatag

GATA 201 - 213 + ttgcgataagcat GATA 194 - 206 + ttgcgataagcat

Myf 216 - 227 - ctccagaagccg NF-1 199 - 216 - ataagcatctctccagaa

AP-1 227 - 237 - gaaaagtcagt Myf 209 - 220 - ctccagaagccg

Ets 320 - 330 - ggcttcctgga AP-1 220 - 230 - gaaaagtcagt

Myf 357 - 368 + ccacagctgtag Myf 350 - 361 + ccacagctgtag

Myf 360 - 371 - cagctgtagttt Myf 353 - 364 - cagctgtagttt

NF-1 382 - 399 + ccttggcaaggctttgga NF-1 375 - 392 + ccttggcaaggctttgga

GATA 448 - 460 - gggtttatctctc Ets 456 - 466 - ttcttcctgga

Ets 463 - 473 - ttcttcctgga ERE 487 - 500 + tggtgaccatgcca

AP-1 495 - 505 + ggtgactatgc NF-1 486 - 503 - gtggtgaccatgccaata

NF-1 493 - 510 - gtggtgactatgccaata Tef 519 - 530 + agcagtcctccc

Tef 526 - 537 + agcagtcctccc Myf 615 - 626 + gaacagcttcag

Myf 622 - 633 + gaacagcttcag GATA 743 - 755 - cttgatatctggc

Myf 787 - 798 - ctgcagcttttt Myf 780 - 791 - ctgcagctcttt

Ets 909 - 919 + gaggggaacca Ets 903 - 913 + gaggggaacca

LSF 907 - 921 - cggaggggaaccaga LSF 901 - 915 - cggaggggaaccaga

Ets 952 - 962 - catttcctcag Ets 946 - 956 - catttcctcag

AP-1 1015 - 1025 - atcgagtcaac

Из данной таблицы видно, что всего было обнаружено 15, 20, 22 и 21 элемент для каждого сиквенса: МУБ114, VIT_02s0033g00450, VIT_02s0033g00410 и VIT_02s0033g00390 соответственно. Анализ присутствия/отсутствия элементов представлен в таблице 3 ниже.

Таблица 3. - Таблица встречаемости Cis-элементов у изученных

генов

Название MYB114 VIT 02s0033g00450 VIT 02s0033g00410 VIT 02s0033g00390

TATA - + - +

CCAAT + + - -

Sp1 + - - -

AP-1 - + + +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

CRE - - - -

Ets + + + +

ERE - + - +

Myc + - - -

NF-1 - + + +

GATA - + + +

E2F - - - -

LSF + + + +

Mef-2 - - - -

SRF + - - -

Myf - + + +

Tef + + + +

Как мы можем увидеть из таблицы 3, были обнаружены уникальные и распространенные элементы, в то время как некоторые не были обнаружены вообще. С другой стороны, некоторые элементы были обнаружены, например, только у двух сиквенсов, что вызывает сомнения в их функциональной значимости, несмотря на их наличие.

Таким образом, у всех сиквенсов присутствуют такие элементы как Ets, LSF и Tef, что говорит о их ультраконсервативной природе в виду распространения между видами, а также в виду того, что Ets и LSF располагаются примерно в одинаковых местах, чего нельзя сказать о Tef, который находится в сходных позициях у сиквенсов VIT_02s0033g00410 и VIT_02s0033g00390.

Далее, поиск функционально значимых транскрипционных факторов проводили при помощи Nsite. Всего было обнаружено 34 транскрипционных фактора, результаты с уровнем гомологии сиквенсов не ниже 80% отображены в таблице 4.

Таблица 4. - Обнаруженные транскрипционные факторы

VIT 02s0033g00410

Название вида Транскрипционный фактор Сиквенс

Spinaciaoleracea PetH/TFBS: CT-B /BF: unknown nuclear factor 317 catccacttc 308

Arabidopsisthaliana AVP1/TFBS: Q-motif /BF: homeodomain transcription factor 505 gcatagtcaccac 493

Spinaciaoleracea rps22/TFBS: rGC /BF: unknown nuclear factor 155 tccatgggtccctttt 170

Phaseolusvulgaris grp1.8/TFBS: VSF-1 BS1 /BF: VSF-1 116 ttccatttgatgtgg 102

Arabidopsisthaliana MYB44 (At5g67300)/TFBS: VRE1 /BF: VIP1 359 acagctgta 367

Arabidopsisthaliana ANAC019/TFBS: HB05/HB12 BS2 /BF: HB05; HB12 774 caattattt 766

Arabidopsisthaliana Synthetic oligonucleotides/TFBS: R2R3-MYB TFs BS 307 accacaacc 299

Всего 7 транскрипционных мотивов

VIT 02s0033g00390

Названиевида Транскрипционный фактор Сиквенс

Arabidopsisthaliana Synthetic oligonucleotides/TFBS: Hex motif /BF: TGA1; GBF1; 20 tgacgtgg 27 300 tgacgtgg 307

Triticumaestivum H3/TFBS: Hex /BF: HBP-11(17); HBP-1b(c38); 307 ccacgtca 300/27 ccacgtca 20

Lycopersiconesculentu m rbcS3A/TFBS: GT-1/16 JJ1 /BF: unknown nuclear factor 869 attaatttgtgt 858

Arabidopsisthaliana Synthetic oligonucleotides/TFBS: Hex motif /BF: OBF4; OBF5 18 ggtgacgtgga 28/298 ggtgacgtgga 308

Arabidopsisthaliana MYB44 (At5g67300)/TFBS: VRE1 /BF: VIP1 70 acagctgta 78/352 acagctgta 360

Arabidopsisthaliana ANAC019/TFBS: HB05/HB12 BS2 /BF: HB05; HB12 767 caattattt 759

Arabidopsisthaliana Synthetic oligonucleotides/TFBS: R2R3-MYB TFs BS 20 accacaacc 12/300 accacaacc 292

Всего 12 транскрипционных мотивов

VIT 02s0033g00450

Названиевида Транскрипционный фактор Сиквенс

Spinaciaoleracea rps22/TFBS: rGC /BF: unknown nuclear factor 194 tccatgggtccctttg 209

Nicotianatabacum Adh2/TFBS: D-box /BF: D factor 807 cttgggtcca 816

Phaseolusvulgaris grp1.8/TFBS: VSF-1 BS1 /BF: VSF-1 155 ttccatttgatgtgg 141

Arabidopsisthaliana YUC4 (At5g11320)/TFBS: STY1 BS (YUC4) /BF: STY1 45 acactctactc 35

Arabidopsisthaliana ANAC019/TFBS: HB05/HB12 BS2 /BF: HB05; HB12 604 caattattt 596

Arabidopsisthaliana Synthetic oligonucleotides/TFBS: P8 (ext) /BF: GT-4 3 gattaacaactttggaacttaaaat 27

Всего 6 транскрипционных мотивов

MYB114

Названиевида Транскрипционный фактор Сиквенс

Hordeumvulgare HVA22/TFBS: G-box /BF: unknown nuclear factor 631 cgcacgtgtt 622

Lycopersiconesculentu m rbcS3C/TFBS: AT-rich V /BF: unknown nuclear factor 506 tagaacattttaaaaaaaaaaaaaaaaaaaaatctt 471

Arabidopsisthaliana STK/TFBS: GA-2 /BF: BPC1 691 agaaagaga 699

Arabidopsisthaliana STK/TFBS: GA-4 /BF: BPC1 809 agagaggaa 817

Solanumtuberosum St4cl-1/TFBS: FP2 /BF: unknown nuclear factor 354 tcggaccaacccc 342

Arabidopsisthaliana BiP2/TFBS: TL1 /BF: TBF1 850 gaagaagaa 842

Arabidopsisthaliana Synthetic oligonucleotides/TFBS: SEQ20 /BF: WRKY70 563 taaacgactttt 552

Oryzasativa OsYSL2/TFBS: IDE2 (1) /BF: IDEF2 798 gccaagtatca 808

Arabidopsisthaliana Synthetic oligonucleotides/TFBS: O-box (oligo1) /BF: ORA47 429 ataccgaccaac 440

Всего 9 транскрипционных мотивов

Как мы можем видеть из таблицы 4, различные транскрипционно значимые факторы, принадлежащие к разным видам растений, были найдены. Тем не менее, в виду того, что они являются ультраконсервативными и распространены среди всего живого, это не удивительно, а вполне ожидаемо. Помимо этого, как мы видим, у виноградных генов ярко выражена гомология с арабидопсисом в виду того, что абсолютное большинство выявленных транскрипционных факторов

принадлежит именно к классу факторов этого растения, что дополнительно указывает на их в прошлом общую эволюционную филогению.

Интересно, что у всех трех изученных генов нашлись сиквенсы, которые относятся к генам регулирования синтеза антоциана арабидопсиса, в то время как у самого гена МУБ114 прямых совпадений не нашлось. Тем не менее, большинство совпадений с транскрипционными факторами арабидопсиса у МУБ114 показали совпадения с факторами клеточного и органного развития, что также указывает на его значимость в регулировании метаболических путей. В любом случае это было неожиданным, так как протеиновая последовательность арабидопсиса имеет достаточно высокую гомологию, хотя и короче, чем у винограда.

Несмотря на высокую гомологию генов, достаточно сложно найти у них одинаковые транскрипционные факторы, тем не менее, некоторые совпадают. Например, ttccatttgatgtgg присутствует у VIT_02s0033g00410 и VIT_02s0033g00450; acagctgta у VIT_02s0033g00410 и VIT_02s0033g00390; саайаШ у всех трех виноградных генов, но не у арабидопсиса; accacaacc у VIT_02s0033g00410 и VIT_02s0033g00390. Домены tgacgtgg, tgacgtgg, ccacgtca и ggtgacgtgga широко распространены внутри гена VIT_02s0033g00390, в то время как не могут быть обнаружены ни у одного другого гена.

Таким образом, мы видим, что, несмотря на то, что данные четыре гена кодируют гомологичную протеиновую последовательность, имеются структурные различия, что говорит о том, что гены разнесены в эволюционной дистанции. Также важно отметить, что у генов винограда имеются сходства в строении транскрипционных факторов с другими генами арабидопсиса типа МУБ, что указывает нам на гомологичность и с другими генами.

Поиск промотерных регионов. Далее, мы провели поиск гомологичных промотерных регионов у всех четырех выбранных последовательностей (таблица 5).

Таблица 5. - Список обнаруженных промотерных регионов

VIT 02s0033g00410 VIT 02s0033g00390 VIT 02s0033g00450 МУБ114

8-13 БЛБ-12 16-9 НУОЛМУБ 12- 5 8ББ-1 68-73 БЛБ-12

30-25 БЛБ-12 17-24 TGA1 21-16 БЛБ-12 79-74 БЛБ-12

183-178 БЛБ-12 20-25 Л8Б-1 47-52 БЛБ-12 105-110 БЛБ-12

303-296 НУОЛМУБ 20-25 НБР-1 69-64 БЛБ-12 142-147 БЛБ-12

310-315 БЛБ-12 57-63 0T-1 222-217 БЛБ-12 199-194 БЛБ-12

346-352 0T-1 85-90 БЛБ-12 306-301 БЛБ-12 246-241 БЛБ-12

374-379 БЛБ-12 115-110 БЛБ-12 340-345 БЛБ-12 309-304 БЛБ-12

404-399 БЛБ-12 176-171 БЛБ-12 446-451 БЛБ-12 330-324 0T-1

476-471 БЛБ-12 296-289 НУОЛМУБ 467-462 БЛБ-12 376-381 БЛБ-12

496-502 0T-1 297-304 TGA1 499-505 0^1 464-459 БЛБ-12

510-515 БЛБ-12 300-305 Л8Б-1 563-568 БЛБ-12 547-542 БЛБ-12

616-621 БЛБ-12 300-305 НБР-1 686-692 0T-1 604-609 БЛБ-12

637-632 БЛБ-12 339-345 0^1 778-783 БЛБ-12 643-648 БЛБ-12

669-675 0^1 367-372 БЛБ-12 785-780 БЛБ-12 662-667 БЛБ-12

733-738 БЛБ-12 397-392 БЛБ-12 822-817 БЛБ-12 755-760 БЛБ-12

856-862 0T-1 469-464 БЛБ-12 975-980 БЛБ-12 823-828 БЛБ-12

948-953 БЛБ-12 503-508 БЛБ-12 982-977 БЛБ-12 910-904 Zmhoxla

955-950 БЛБ-12 609-614 БЛБ-12 1002-997 БЛБ-12 930-924 0T-1

992-987 БЛБ-12 630-625 БЛБ-12 1002-997 БЛБ-12

662-668 0T-1 1060-1066 MybSt1

726-731 БЛБ-12 1075-1069 0T-1

849-855 0^1

942-947 БЛБ-12

949-944 БЛБ-12

986-981 БЛБ-12

Как мы можем видеть, всего было выявлено 83 промотерных региона, 19 (VIT_02s0033g00410), 18 (VIT_02s0033g00450), 25 (VIT_02s0033g00390) и 21 (МУБ114) для каждой изученной последовательности. При этом очевидно наличие у всех генов таких регионов как БЛБ-12 и 0^1. При этом, только у VIT_02s0033g00410 и VIT_02s0033g00390 были обнаружены промотеры нуолмуб, в то время как у VIT_02s0033g00450 ничего подобного не было. Но у МУБ114 арабидопсиса был обнаружен фактор МуЬ8П, родственный нуолмуб

винограда. Также был обнаружен ряд уникальных для каждой последовательности промотеров, которые отображены в таблице 5. Интересно отметить, что в отличие от винограда у арабидопсиса MybSt1 располагается в другом конце гена, что вполне ожидаемо в виду того, что часть его cis-элементов расположена на обратной цепи.

Мы полагаем, что появление такой последовательности как DAF-12 является ошибкой или просто совпадением, поэтому мы не принимаем ее во внимания. Несмотря на это, стоит отметить, что Plant Transcription Factor Database (9) при поиске указывает на последовательности, родственные MYB фактору пшеницы. Тем не менее, не вызывает сомнения наличие GT-1, MybSt1 и HvGAMYB в связи с тем, что они являются последовательностями, сходными по их назначению. Также, по данным Plant Transcription Factor Database, все эти три домена являются родственными MYB-like ДНК связывающими доменами, выполняющими сходные функции, такие как регуляция транскрипции.

Сравнение ДНК и протеиновых последовательностей. Для сравнения ДНК и кодируемых трансляционных протеиновых последовательностей мы провели их «уравнение», используя программу ClustalO. Результаты сравнения последовательностей приведены на рисунках 6 и 7.

Рисунок 5 - Сравнение ДНК последовательностей

Рисунок 6 - Сравнение протеиновых последовательностей

М¥В114

У1Т_0250033§00450 У1Т_0250033§60410 У1Т_02£0033Й00390

М¥В134

У1Т_0250033§00450 У1Т_02&0033§00410 У1Т_0250033§00390

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

М¥В114

У1Т_0250033§00450 У1Т_02&0033§00410 У1Т_02&0033§00390

М¥В134

У1Т_0250033§00450 VIT_02s0033g00410 У1Т_02&0033§00390

МУВ114

У1Т_0250033§00450 У1Т_02500 33§00410 У1Т_02&0033§00390

МУВ114

У1Т_0250033§00450 У1Т_0250033§00410 У1Т_0250033§00390

Г1УВ114

У1Т_0250033§00450 У1Т_0250033§00410 У1Т_02&0033§00390

АТТСАДТАТАССбДССААСТАТТббАААСТТТААТбТТбААСТТ- -АбАббААААТТТТТ ТТТАТСТСТСССТТСТТССТебААСТбААССТТСТТТТТСААбТббТбАССАТйССААТА ТТ ТАТСТ СТ С ССТТ СТТС С Тб 6ААС ТбАА С СТ С СТТТ ТТб ААбТ ббТбАСТА Т 6С С ДАТА ТТТТТТТСТСССТТСГТССТббААСТбМССТТСТТТТТСАабТбаТбАССАТйССААТА

ТТТТТТТТТТТТТТТТААААТбТТСТАТбТТТАТСТАСбТТАСАТАТТСТААААЙСАДАА 6ТТСТТ6АСАТСАТТА(5СД6ТССТСССТ(56АА6ССТАССС6СААТСАА66ДССАТСТАТА 6Т ТСТТб АСАТСАТ ТАбСАбТ ССТС С СТбб АА О ССТАССС б С ДАТ САЙ б 6АС С АТ С ТАТА б Т ТСТТб А САТС А Т ТАбСАбТ С СТС С СТбб АА б ССТАССС б С ААТ САй б 6АС С АТ С ТАТА

ТбСб---ААСТТССбААААбТСбТТТААТТСТАСбАТТббТТТбТСТТСТААТТСАТААА

САСбСАСАЙСАТСАбАСАААбТА-ТСААСТбААСАбСТ-----СТТТТбТААбТТСТбАА

САСбСАСААСАТСАОАСАААбТА-ТСААСТбААСАбСТ.....СТТТТбТААбТТСТбАА

САСбСАСААСАТСАйАСАААбТА-ТСААСТбААСАбСТ.....СТТТТбТААбТТСТбАА

ТбААТТТАбТбААА------бТТТТТАТАСбААСАСбТбСбТАТбТбТбТАТАОТАС - - А

СА С СТТ С АбААСТААТАТ ААТ АТСА ТТ АТ С АА б СТАб ТАС Т Тбй 6ТТА ТТАТА ЗА С ТТб С САбСТТСАбААСТМТАТААТАТСАТТАТСААбСТАбТАСТТбАбТТАТТАТАбАСТТбС САб СТТ С АбААСТААТАТ АА Т А ТСА ТТАТС АА б СТАб ТАС Т ТбАбТТА ТТАТАбА С ТТб С

ТТ б ТТ-Т СТАТТббТбТб С й Т АбАТ ТСТТТ АТ бАТААААТТАТАбА--------------

СТ б ТТС С С СДАСАААТТб ТбйАбСС ТААТ С ЙТ б АбАТ СААСС Т С 6ТСТ ААТб САААСТСТ СТбТТССССААСАААТТбТбААбССТААТСАТбАбАТСААССТСбТСТААТбСАЙАСТСТ СТ б ТТСС ССААСАААТТб ТбААбСС ТААТ С АТ б АбА Т СААС СТСбТСТААТбС АААСТС Т

----ААб йбАСАб С ААТС ТТ С ТТАб б ТТТААС ТААТб ТСАА ТТАТТбб ТТТТб Тй б ббС Т

СС ТСТСТ ТбАТАТ С СббС ТТ С АААТ ААТТб Аб С САТ С ТСАА С СТ бСАб С ТТТТ ТС б 6САТ СС ТСТСТ ТбАТАТ С СббС ТТ С АААТ ААТТб Аб С САТ С ТСАА С СТ бСАб С ТТТТ ТС б 6САТ СС ТСТСТ ТбАТАТ С ТббС ТТ С АААТ ААТТб Аб С САТС ТСАА ТСТ б САб СТСТТТЙббСАТ

АААТС бб ТС С АббААДАб Т Тб ТАбА С Т ААб-АТббТТАААСТйТТТбААбССААбТА-----

СТАТТСАА--------СС С Тб СААЙ С ТСАА 6А АААСб АААС ТСТ ТТ - ААбСААААСАбАА

СТАТТСАА--------СС С Тб СААЙ С ТСАА 6А АААТб АААС ТСТ ТТ - ААбСААААСАбАА

СТАТТСАА........СССТбСАААСТСМбААААСбАААСТСТТТ-ААбСААААСАбАА

Для наглядности гомологичности и идентичности последовательностей ДНК приведена только часть сравнения середины нуклеотидных цепей, в то время как 5' и 3' концы имеют разнородное нуклеотидное строение, а также укорочены. Тем не менее, суммируя приведенные факты с прошлым разделом, мы можем сделать вывод, что они не отличаются функционально. Что же касается укорочения генов, то это вполне нормальное эволюционное явление, которое встречается довольно часто и служит для удаления «лишней» ДНК (2, 6, 20).

Сравнение протеиновых последовательностей показало высокую консервативность, несмотря на то, что само строение генов у винограда и арабидопсиса сильно отличается даже в центральной части. Тем не менее, как мы можем видеть на картинке 6, часть аминокислот у МУБ114 отсутствует, также как и у VIT_02s033g00450, но это, видимо, не влияет на их функциональность. При этом важно отметить, что концы остальных двух протеиновых последовательностей винограда сильно отличаются по набору аминокислот, хотя и выполняют схожие функции.

В конце стоит отметить на расположение названия сиквенсов. В обоих случаях они расположены в одинаковом порядке, который нам указывает на гомологию между ними. Следовательно, наиболее гомологичными сиквенсами являются MYB114 и VIT_02s033g00450, в то время как остальные два отделены филогенетически. В связи с этими данными мы провели поиск консервативных регионов и филогенетический анализ.

Поиск консервативных регионов. В виду того, что выбранные для изучения гены являются близкородственными, следовательно, они должны обладать сходными консервативными последовательностями. Для подтверждения данного предположения мы провели анализ в NCBICD-search. Результаты представлены ниже на рисунках 7 - 10.

Рисунок 7 - Консервативные домены VIT_02s0033g00410

RF -3

Specific hits

Non-specif ic hits

Supepf anilies

I List of domain hits 4

И Name Accession Description Interval E-value

[+] PLN03212 PLN03212 Transcription repressor MYB5; Provisional 412-567 2.18e-09

[+] SANT «100197 'SWI3. ADA2. N-CoR and TFIIIB' DNA-binding domains. Tandem copies of Ihe domain bind telomeric ... 490-567 1.30e-04

[+] Myb_DNA-blnding pfam00249 Myb-lihe DNA-binding domain: This family contains the DNA binding domains from Myb proteins. .. 496-567 1.49e-04

[+] SANT smart00717 SANTSWI3, ADA2, N-CoR and TFI IIB" DNA-binding domains; 496-567 9.50e-04

[+] PLN03091 PLN03091 hypothetical protein; Provisional 684-1001 1.87e-23

[-] Myb DNA-binding ||fam00249 Myb-lihe DNA-binding domain: This family contains the DNA binding domains from Myb proteins. .. ■ 765-995 3.84e-07

Myb-llke DNA-binding domain; This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family.

Pssm-IO: 306703 Cd Length: 47 Bit Score: 46.01 E-value: 3.84e-07

10 20 30 40 50 60 70

----*----I----*----I----*----I----*----I----*----I----*----I----*----I----*. .

lcl|seqsig_GAGCA_a04e6feEleaSe70a9fld793e402c:b3e7 12 KGAb.'IQE EDVLL R КС IE KYG EG KL\'H LVP LRAG nmkekgisiylcf Ft wllkef hf 1 ef agi NR С RK SC R LR'.'JLNYL SB Cdd:pfam00249 1 RG PWTPE E DEL LIEAVE KHS NG NL\'K KIA KH LP------------------------------GRTDKQCKHRWQNYL 47

Рисунок 8 - Консервативные домены VIT_02s0033g00390

Рисунок 9 - Консервативные домены VIT_02s0033g00450

RF -1

DNfl binding site ■ ■ ■ t_

Specific hits

Myb_DNA—binding

Hon—specific hits

Superf aniiies

II SANT III

PLN03 091

REEl

SANT superfami lu

SANT superfami 1y

RF -3

Specific hits

Hon-specif ic hits

Superf aniiies

SANT superfamily

Search for similar domain architectures | ® Refine search | ®

1 List of domain hits •

H Name Accession Description Interval E-v< ilue

hypothetical protein; Provisional_

i DNA-binding domain; This family contains the DNA binding domains from n

Myb-like DNA-binding domain: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family.

Pssm-ID: 306708 Cd Length: 47 Bit Score: 49 86 E-value: 1 79e-08

514-831 4.78e-24 595-325 ] ЦИВШИаЯ

----*----1----*----1----*----I----*----I----*-----I----*----I----*-----I-----*. .

lcl|seqsig_AAQAT_51d997acbb563d0fSlc046b2e70Bcd2c 66 KGAl^TQEEDVLLRKCIEKYGEQKWHLVPLRAGnmkekgisislc-fftsvllkefrflefaglNRCRKSCRLRWLNYL 142 Cdd:pfamÔ0249 1 RG PL\'T P E E DE L LIE AVE К H3 NG NU'K Kl A KH L P------------------------------GRTDKQCKNRWQ'JYL 47

Рисунок 10 - Консервативные домены MYB114

1000 1076

Specific hits

Mon-specific hits

Superf anilies

:RNT sup«t»f

1 125 250 375 500 625 750 875 1000 1076

Specific hits

Non-specific hits

Superf anilies

PLN03212 :hnt super-

Search for similar domain architectures

Refine search

I List of domain hits ■

H Name Accession Description Interval E-value

[+] PLN03212 PLN03212 Transcription repressor MYB5; Provisional 745-888 I06O 10

[+] PLN03212 PLN03212 Transcription repressor MYB5; Provisional 56-163 4.89e-06

[-] Myb_DNA-biridin p pfam00249 Myb-like DNA-binding domain; This family contains the DNA binding domains from Myb proteins; ... ■I 65-160 2.69B-04

Myb-like DNA-binding domain; This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family.

Pssm-ID: 306708 Cd Length: 47 Bit Score: 37.92 E-value: 2.69e-04

10 20 39

—*— I —*— I —*— I..

lclIseqsig_TTTTC_9ba29ae9ffc6326fc5a8be0e4ce3630a 22 KGAU'TAEEDSLLRQCIGKYGEGKWHQVPLRAG 53 Cdd:pfam90249 1 RGPWTPEEDELLIEAVEKHGNGNWKKIAKHLP 32

Как мы можем видеть, все изученные гены содержат Myb-like DNA binding domain, как и предполагалось. При этом стоит отметить, что Evalue, определяющее достоверность, показало высокую точность результата. При этом все выявленные консервативные последовательности принадлежат к семейству SANT доменов, ответственных за связывание Myb протеинов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Также стоит обратить внимание, что у всех изученных последовательностей одна и та же часть идентифицировалась как консервативный домен: KGAWIQEEDVLLRKCIEKYGEGKWHLVPLRAG. При сравнении в ClustalO было выявлено, что данные участки практически идентичны у обоих видов, за исключением изменений шести аминокислот, что, очевидно, не влияет на функциональность.

Таким образом, мы видим, что изученные гены обладают и ультраконсервативными доменами связывания ДНК с Myb протеинами. Это еще раз говорит об их ортологичной взаимосвязи и чтобы установить, как именно она проявляется в рамках эволюционного родства, мы провели филогенетический анализ.

Филогенетический анализ. Для проведения филогенетического анализа взаимосвязей между изученными генами мы выбрали две основные стратегии: 1) сравнение ДНК сиквенсов; 2) сравнение протеиновых сиквенсов. Результаты сравнения отображены на рисунках 11 и 12.

Рисунок 11 - Филогенетическое сравнение ДНК последовательностей

Рисунок 12 - Филогенетическое сравнение протеиновых последовательностей

- VII 02з0033д00410

- VII 02э0033д00390

- VII 02э0033д00450

VII 02э0033д00410

VII 02э0033д00390

VII 02э0033д00450

Как мы можем видеть из рисунков, представленных выше, филогенетическое расстояние между семействами Вга881сасвав и УЫасвав достаточно большое, при этом явственно прослеживается отделение от, предположительно, основного гена (VIT_02s0033g00410) побочных (VIT_02s003g00390 и VIT_02s0033g0450).

Для представления более точного временного промежутка появления мутаций мы построили временное древо в программе МЕОЛ7 (с использованием параметров «древа минимальной эволюции»), получив дополнительные сиквенсы генов из баз данных КСБ1. Чтобы древо получилось наиболее консервативным, мы использовали протеиновые последовательности.

Рисунок 13 - Филогенетическое временное древо, основанное на протеиновых последовательностях трех изученных генов

BAH15078.1 mybrelated transcription factor Vitis vinifera

AIZ77250.1 mybrelated transcription factor partial Vitis davidii

AGH68552.1 mybrelated transcription factor A1 Vitis betulifolia

AGH68548.1 mybrelated transcription factor A1 Vitis piasezkii

BAF31138.1 mybrelated transcription factor VvMYBA22cs Vitis vinifera

ABL14066.1 R2R3 MYB transcription factor Vitis vinifera

BAD18978.1 mybrelared transcription factor VvMYBA2 Vitis vinifera

XP 008244325.1 PREDICTED: transcription factor MYB90like Prunus mume

XP 007216530.1 transcription factor MYB75 Prunus persica

XP 021811998.1 transcription factor MYB75like Prunus avium

sp|Q9FNV8|MY114 ARATH Transcription factor MYB114 OS Arabidopsis thaliana GN MYB114 PE 1 SV 1 ] outgroup

В связи с палеонтологическими остатками представителей рода УШ8 известно, что выделение его из подкласса Розид произошло примерно 110120 млн. лет назад (22). Поэтому размер шкалы - это каждый номер, который мы видим на узлах расхождения, умноженный на миллион. Таким образом, нами были взяты три семейства растений для вычисления времени произошедших мутаций: арабидопсис, розация и витацее. При этом стоит отметить, что в оригинальном древе арабидопсис располагается между розацией и витацией, точно также как и в классификации Вилкстрома и др., но так как в нашем древе он был выбран аут группой, то поэтому он вынесен за древо. Тем не менее, мы можем видеть четкое разделение групп по генам, как и в прошлый раз.

Таким образом, мы можем видеть, что мутации, приведшие к разделению известных генов, произошли примерно 32,17 и 3,5 млн. лет назад, пока что по неизвестным причинам. Также было обнаружено, что выявленные внутригенные различия у винограда появились примерно 2 и 3 млн. лет назад, при этом стоит отметить, что различия, появившиеся между видами при видообразовании старше, чем различия, обнаруженные внутри рода УШб.

Таким образом, мы видим, что ортологичные гены, кодирующие схожие белки, имеются у многих двудольных растений. Также важно, что не смотря на высокую консервативность, эти протеиновые последовательности возможно использовать для филогенетических исследований, так как они дают четкое разграничение между исследуемыми семействами, родами и видами.

Изучение интеракций протеиновой последовательности гена МУБ114. К сожалению, пока что еще не существует столь подробного описания взаимодействий белок-белок и белок-ДНК для винограда. Поэтому, для лучшего понимания строения и взаимодействия протеиновых последовательностей и их конформаций у винограда, мы провели исследование аналогичных функций у их ортолога МУБ114 арабидопсиса.

Рисунок 14 - Карта интеракций МУБ114 с взаимно экспрессирующимися белками

I TIF: irrisje FJi НГМ.ЗТС П Ы|Г| *Г|Я n'iTTdCT £П Vlp-I -Г nt Г'ПГ _;г.и[1ГТ| П .1 2f iilt г- 'Л'зр:^ F" а . . 1!

Как мы можем видеть из рисунка 14, ген MYB114 (AT1G66380 по европейской классификации) арабидопсиса ко-экспрессируется с тремя другими генами (AT1G63650, AT4G00480 и AT4G09820). При этом, коэффициент ко-экспрессии составляет от 0,25 до 0,4, что является

достаточно сильным показателем. При этом важно отметить, что данные три белка принадлежат к одному суперсемейству, которое включает в себя ДНК связывающие белки.

Далее, для того чтобы найти сходные метаболические пути у винограда, мы использовали EnsemblPlants, UniProt и NCBI BLAST. Стоит уточнить, что ввиду большого размера генов и дальности генетического расстояния между виноградом и арабидопсисом, мы использовали только протеиновые сиквенсы для поиска гомологичных последовательностей.

При сравнении с протеиновым сиквенсом, который кодируется геном AT1G63650, у винограда был обнаружен «myc anthocyanin regulatory protein», что говорит о наличии ортолога. При этом идентичность составила только 44%, в то время как Evalue - 3.1e-167, что говорит о том, что это гомологи.

При сравнении с протеиновым сиквенсом, который кодируется геном AT4G00480, у винограда не было обнаружено существенных сходств в протеоме. Тем не менее, «myc anthocyanin regulatory protein isoform X1» и «transcriptionfactor EGL1» показали существенные результаты в плане частичной гомологии функциональных участков. Поэтому вполне возможно сделать предложение о наличии у винограда ортолога данного протеина.

При сравнении с протеиновым сиквенсом, который кодируется геном AT4G09820, у винограда были обнаружены не охарактеризованные протеины. При этом важно, что, несмотря на низкую идентичность (49%), Evalue показал хорошие результаты (5e-105). Это также как и в прошлый раз говорит о том, что у винограда в протеоме есть гомолог данного сиквенса, хотя и достаточно отдаленно лишь его напоминающий.

Очень важен тот факт, что все три обнаруженных у винограда белка относятся к «MYC1b HLH-like DNA binding protein», так как уже было упомянуто, что к этому же суперсемейству относятся и протеины

арабидопсиса. Суммируя эти факты, можно заключить и то, что они должны выполнять схожие функции по интеракции ДНК типа «спираль-петля-спираль» (15).

Заключение

Как мы видим, изученные гены - важный элемент генома винограда и его метаболические пути еще не до конца изучены. Тем не менее, используя гомологичные структуры и модельные растения, мы можем узнать больше. Также использование современных ресурсов позволяет нам изучать структуру, филогенетику и метаболизм испытуемых растений, более того, предсказывать возможные белок-белок и белок-ДНК взаимодействия.

Суммируя вышеизложенное, содержание ОС-элементов в изученных генах является стандартным для кодирующих последовательностей, они обладают сходными функциональными cis-элементами и промотерными регионами. Уравнение последовательностей ДНК и протеинов показало, что они обладают схожими фрагментами, из чего было сделано (и подтверждено) предположение, что они включают в себя ультраконсервативные домены. Более того, было выявлено, что эти домены относятся к одному суперсемейству ДНК-связывающих фрагментов.

В связи с наличием ультраконсервативных регионов, филогенетический анализ показал четкое разделение в процессе эволюции генов между собой. При этом, первым отделился от основной ветви VIT_02s0033g00450 и потом VIT_02s0033g00390. Также было выявлено, что предположительно значительные изменения в структуре протеиновых последовательностей, вызванных мутациями (и возможно видообразованием) произошли 32 и 3,5 млн. лет назад.

В конце, в виду плохой изученности метаболических путей, мы провели поиск и сравнение гомологичных последовательностей у арабидопсиса и винограда. Было установлено, что продукты гена МУБ114 производят интеракции с тремя другими продуктами генов. Далее, при сравнении с протеомом винограда были выявлены три возможных ортолога этих же генов у винограда. Более того, все изученные последовательности содержали ультраконсервативные домены одного суперсемейства с функцией интеракции ДНК типа «спираль-петля-спираль».

Таким образом, мы установили некоторые особенности генома и протеома винограда. Тем не менее, данные вопросы нуждаются в дальнейшей разработке в виду того, что еще накоплено мало знаний о сортах и видах винограда, а также сиквенсов их генов для полномасштабного сравнения.

Список литературы

1. Altschul S. F. et al. Basic local alignment search tool // Journal of molecular biology. - 1990. - Т. 215. - №. 3. - С. 403-410.

2. Aminetzach Y. T., Macpherson J. M., Petrov D. A. Pesticide resistance via transposition-mediated adaptive gene truncation in Drosophila // Science. - 2005. - Т. 309. -№. 5735. - С. 764-767.

3. Arroyo □ Garcia R. et al. Multiple origins of cultivated grapevine (Vitis vinifera L. ssp. sativa) based on chloroplast DNA polymorphisms // Molecular ecology. - 2006. - Т. 15.

- №. 12. - С. 3707-3714.

4. Elhaik E. et al. Identifying compositionally homogeneous and non homogeneous domains within the human genome using a novel segmentation algorithm // Nucleic acids research. - 2010. - Т. 38. - №. 15. - С. 158-158.

5. Gao F., Zhang C. T. GC-Profile: a web-based tool for visualizing and analyzing the variation of GC content in genomic sequences // Nucleic acids research. - 2006. - Т. 34. -№. suppl_2. - С. 686-691.

6. Hao W., Golding G. B. Does gene translocation accelerate the evolution of laterally transferred genes? // Genetics. - 2009. - Т. 182. - №. 4. - С. 1365-1375.

7. Jaillon O. et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla // Nature. - 2007. - Т. 449. - №. 7161. - С. 463467.

8. Jeong S. T. et al. Expression of VvmybA1 gene and anthocyanin accumulation in various grape organs // American journal of enology and viticulture. - 2006. - Т. 57. - №. 4.

- С. 507-510.

9. Jin J. et al. PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants // Nucleic acids research. - 2017. - T. 45. - №. D1. - C. 1040-1045.

10. Kersey P. J. et al. Ensembl Genomes 2018: an integrated omics infrastructure for non-vertebrate species // Nucleic Acids Research. - 2017. - T. 10. - №. 12. - C. 2809-2816.

11. Kobayashi S. et al. Myb-related genes of the Kyoho grape (Vitis labruscana) regulate anthocyanin biosynthesis // Planta. - 2002. - T. 215. - №. 6. - C. 924-933.

12. Kumar S., Stecher G., Tamura K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets // Molecular biology and evolution. - 2016. - T. 33. -№. 7. - C. 1870-1874.

13. Marchler-Bauer A. et al. CDD/SPARCLE: functional classification of proteins via subfamily domain architectures // Nucleic acids research. - 2016. - T. 45. - №. D1. - C. 200203.

14. Mitchell E. M. et al. Use of techniques derived from graph theory to compare secondary structure motifs in proteins // Journal of Molecular Biology. - 1990. - T. 212. - №. 1. - C. 151-166.

15. Murre C. et al. Structure and function of helix-loop-helix proteins // Biochimicaet Biophysica Acta (BBA)-Gene Structure and Expression. - 1994. - T. 1218. - №. 2. - C. 129135.

16. Pelsy F. Molecular and cellular mechanisms of diversity within grapevine varieties // Heredity. - 2010. - T. 104. - №. 4. - C. 331-340.

17. Pozzoli U. et al. Both selective and neutral processes drive GC content evolution in the human genome // BMC evolutionary biology. - 2008. - T. 8. - №. 1. - C. 99.

18. Sievers F., Higgins D. G. Clustal omega // Current protocols in bioinformatics. -2014. - C. 3131-31316.

19. Solovyev V. V., Shahmuradov I. A., Salamov A. A. Identification of promoter regions and regulatory sites // Computational Biology of Transcription Factor Binding. -2010. - C. 57-83.

20. Velayudhan B. T. et al. Glycoprotein gene truncation in avian meta pneumovirus subtype C isolates from the United States // Virus genes. - 2008. - T. 37. - №. 2. - C. 266272.

21. Waese J. et al. ePlant: Visualizing and exploring multiple levels of data for hypothesis generation in plant biology // The Plant Cell Online. - 2017. - C. 73-79.

22. Wikstrom N., Savolainen V., Chase M. W. Evolution of the angiosperms: calibrating the family tree // Proceedings of the Royal Society of London B: Biological Sciences. - 2001. - T. 268. - №. 1482. - C. 2211-2220.

23. Yakushiji H. et al. A skin color mutation of grapevine, from black-skinned Pinot Noir to white-skinned Pinot Blanc, is caused by deletion of the functional VvmybA1 allele // Bioscience, biotechnology, and biochemistry. - 2006. - T. 70. - №. 6. - C. 1506-1508.

References

1. Altschul S. F. et al. Basic local alignment search tool // Journal of molecular biology. - 1990. - T. 215. - №. 3. - C. 403-410.

2. Aminetzach Y. T., Macpherson J. M., Petrov D. A. Pesticide resistance via transposition-mediated adaptive gene truncation in Drosophila // Science. - 2005. - T. 309. -№. 5735. - C. 764-767.

3. Arroyo □ Garcia R. et al. Multiple origins of cultivated grapevine (Vitis vinifera L. ssp. sativa) based on chloroplast DNA polymorphisms // Molecular ecology. - 2006. - T. 15. - №. 12. - C. 3707-3714.

4. Elhaik E. et al. Identifying compositionally homogeneous and non homogeneous domains within the human genome using a novel segmentation algorithm // Nucleic acids research. - 2010. - T. 38. - №. 15. - C. 158-158.

5. Gao F., Zhang C. T. GC-Profile: a web-based tool for visualizing and analyzing the variation of GC content in genomic sequences // Nucleic acids research. - 2006. - T. 34. -№. suppl_2. - C. 686-691.

6. Hao W., Golding G. B. Does gene translocation accelerate the evolution of laterally transferred genes? // Genetics. - 2009. - T. 182. - №. 4. - C. 1365-1375.

7. Jaillon O. et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla // Nature. - 2007. - T. 449. - №. 7161. - C. 463467.

8. Jeong S. T. et al. Expression of VvmybA1 gene and anthocyanin accumulation in various grape organs // American journal of enology and viticulture. - 2006. - T. 57. - №. 4. - C. 507-510.

9. Jin J. et al. PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants // Nucleic acids research. - 2017. - T. 45. - №. D1. - C. 1040-1045.

10. Kersey P. J. et al. Ensembl Genomes 2018: an integrated omics infrastructure for non-vertebrate species // Nucleic Acids Research. - 2017. - T. 10. - №. 12. - C. 2809-2816.

11. Kobayashi S. et al. Myb-related genes of the Kyoho grape (Vitis labruscana) regulate anthocyanin biosynthesis // Planta. - 2002. - T. 215. - №. 6. - C. 924-933.

12. Kumar S., Stecher G., Tamura K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets // Molecular biology and evolution. - 2016. - T. 33. -№. 7. - C. 1870-1874.

13. Marchler-Bauer A. et al. CDD/SPARCLE: functional classification of proteins via subfamily domain architectures // Nucleic acids research. - 2016. - T. 45. - №. D1. - C. 200203.

14. Mitchell E. M. et al. Use of techniques derived from graph theory to compare secondary structure motifs in proteins // Journal of Molecular Biology. - 1990. - T. 212. - №. 1. - C. 151-166.

15. Murre C. et al. Structure and function of helix-loop-helix proteins // Biochimicaet Biophysica Acta (BBA)-Gene Structure and Expression. - 1994. - T. 1218. - №. 2. - C. 129135.

16. Pelsy F. Molecular and cellular mechanisms of diversity within grapevine varieties // Heredity. - 2010. - T. 104. - №. 4. - C. 331-340.

17. Pozzoli U. et al. Both selective and neutral processes drive GC content evolution in the human genome // BMC evolutionary biology. - 2008. - T. 8. - №. 1. - C. 99.

18. Sievers F., Higgins D. G. Clustal omega // Current protocols in bioinformatics. -2014. - C. 3131-31316.

19. Solovyev V. V., Shahmuradov I. A., Salamov A. A. Identification of promoter regions and regulatory sites // Computational Biology of Transcription Factor Binding. -2010. - C. 57-83.

20. Velayudhan B. T. et al. Glycoprotein gene truncation in avian meta pneumovirus subtype C isolates from the United States // Virus genes. - 2008. - T. 37. - №. 2. - C. 266272.

21. Waese J. et al. ePlant: Visualizing and exploring multiple levels of data for hypothesis generation in plant biology // The Plant Cell Online. - 2017. - C. 73-79.

22. Wikstrom N., Savolainen V., Chase M. W. Evolution of the angiosperms: calibrating the family tree // Proceedings of the Royal Society of London B: Biological Sciences. - 2001. - T. 268. - №. 1482. - C. 2211-2220.

23. Yakushiji H. et al. A skin color mutation of grapevine, from black-skinned Pinot Noir to white-skinned Pinot Blanc, is caused by deletion of the functional VvmybAl allele // Bioscience, biotechnology, and biochemistry. - 2006. - Т. 70. - №. 6. - С. 1506-1508.

i Надоели баннеры? Вы всегда можете отключить рекламу.