Научная статья на тему 'Биоинформационный анализ низкомолекулярной фракции протеома penicilliumdigitatum'

Биоинформационный анализ низкомолекулярной фракции протеома penicilliumdigitatum Текст научной статьи по специальности «Фундаментальная медицина»

CC BY
101
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БИОИНФОРМАТИКА / BIOINFORMATICS / MALDI-TOF-МАСС-СПЕКТРОМЕТРИЯ / PENICILLIUM DIGITATUM / СПЕКТРООБРАЗУЮЩИЕ БЕЛКИ / MASS-SPECTRA-FORMING PROTEINS / ТРЕТИЧНАЯ СТРУКТУРА БЕЛКА / PROTEIN TERTIARY STRUCTURE / MALDI-TOF-MASS-SPECTROMETRY

Аннотация научной статьи по фундаментальной медицине, автор научной работы — Рябинин Игорь Андреевич, Лякишева Е. В., Васильева Н. В.

В исследовании проведено аннотирование масс-спектра, полученного в результате MALDI-TOF-масс-спектрометрии клеточного экстракта мицелия Penicillium digitatum 1, по протоколу, пригодному для видовой идентификации. С иcпользованием серии биоинформационных ресурсов TagIdent, Protein BLAST, Swiss-Model и RaptorX идентифицировали белки и пептиды, с наибольшей вероятностью образующие масс-спектр, также по аминокислотным последовательностям удалось воссоздать их третичную структуру, выявить гомологи среди других видов микромицетов, установить некоторые свойства. В результате проведенной работы выявили и описали в составе низкомолекулярной фракции протеома 33 полипептида, из которых 9 имеют гомологи у других микромицетов, а 13 являются уникальными для изученного вида. Большинство исследованных полипептидов ранее были предсказаны только методами молекулярной генетики и не снабжены подробными структурными и функциональными характеристиками.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по фундаментальной медицине , автор научной работы — Рябинин Игорь Андреевич, Лякишева Е. В., Васильева Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BIONFORMATICAL ANALYSIS OF THE LOW-MOLECULAR-WEIGHT FRACTION OF PENICILLIUM DIGITATUM PROTEOME

The annotation of the mass-spectrum, which was obtained by MALDI-TOF-mass-spectrometry of the mycelium extract of Penicillium digitatum 1 using a protocol suitable for species identification, was carried out in this study. Proteins and peptides which most likely forming the mass-spectrum were identified with using a series of bioinformatics resources (TagIdent, Protein BLAST, Swiss-Model and RaptorX), as well as it was possible to reconstruct their tertiary structure, to reveal homologs among other species of micromycetes, to establish some other properties based on amino acids sequences. As a result of this work, 33 polypeptide of the low-molecular-weight fraction of proteome were detected and described, of which 9 have homologs in other micromycetes and 13 are unique for the studied species. Most of the investigated polypeptides were previously predicted only by molecular genetics methods and are not provided with detailed structural and functional characteristics.

Текст научной работы на тему «Биоинформационный анализ низкомолекулярной фракции протеома penicilliumdigitatum»

УДК 621.384.8:582.282.123.2

БИОИНФОРМАЦИОННЫИ АНАЛИЗ

НИЗКОМОЛЕКУЛЯРНОИ ФРАКЦИИ ПРОТЕОМА PENICILLIUM DIGITATUM

1Рябинин И.А. (м.н.с.)*, 2Лякишева Е.В. (ординатор), 1,2 Васильева Н.В. (директор института, зав. кафедрой)

Северо-Западный государственный медицинский университет им. И.И. Мечникова: 1 НИИ медицинской микологии им. П.Н. Кашкина, 2 кафедра медицинской микробиологии, Санкт-Петербург, Россия

© Коллектив авторов, 2017

В исследовании проведено аннотирование масс-спектра, полученного в результате MALDI-TOF-масс-спектрометрии клеточного экстракта мицелия Penicillium digitatum 1, по протоколу, пригодному для видовой идентификации. С использованием серии биоинформационных ресурсов Tagldent, Protein BLAST, Swiss-Model и RaptorX идентифицировали белки и пептиды, с наибольшей вероятностью образующие масс-спектр, также по аминокислотным последовательностям удалось воссоздать их третичную структуру, выявить гомологи среди других видов микромицетов, установить некоторые свойства. В результате проведенной работы выявили и описали в составе низкомолекулярной фракции протеома 33 полипептида, из которых 9 - имеют гомологи у других микромицетов, а 13 - являются уникальными для изученного вида. Большинство исследованных полипептидов ранее были предсказаны только методами молекулярной генетики и не снабжены подробными структурными и функциональными характеристиками.

Ключевые слова: биоинформатика, MALDI-TOF-масс-спектрометрия, Penicillium digitatum, спектрообразующие белки, третичная структура белка

BIONFORMATICAL ANALYSIS OF THE LOW-MOLECULAR-WEIGHT FRACTION OF PENICILLIUM DIGITATUM PROTEOME

Ryabinin I.A.1 (junior scientific collaborator), Lyakischeva E.V.2 (resident physician), Vasilyeva N.V.1,2 (director of the institute, head of the chair)

North-Western State Medical University named after I.I. Mechnikov: 1 Kashkin Research Institute of Medical Mycology, 2 Chair of medical microbiology, St. Petersburg, Russia © Collective of authors, 2017

The annotation of the mass-spectrum, which was obtained by MALDI-TOF-mass-spectrometry of the mycelium extract of Penicillium digitatum 1 using a protocol suitable for species identification, was carried out in this study. Proteins and peptides which most likely forming the mass-spectrum were identified with using a series of bioinformatics resources (Tagldent, Protein BLAST, Swiss-Model and RaptorX), as well as it was possible to reconstruct their tertiary structure, to reveal homologs among other species of micromycetes, to establish some other properties based on amino acids sequences. As a result of this work, 33 polypeptide of the low-molecular-weight fraction of proteome were detected and described, of which 9 - have homologs in other micromycetes and 13 - are unique for the studied species. Most of the investigated polypeptides were previously predicted only by molecular genetics methods and are not provided with detailed structural and functional characteristics.

Key words: bioinformatics, MALDI-TOF-mass-spectrometry, mass-spectra-forming proteins, Penicillium digitatum, protein tertiary structure

* Контактное лицо: Рябинин Игорь Андреевич, e-mail: [email protected]

ВВЕДЕНИЕ

P. digitatum (Persoon) Saccardo, 1881 - микромицет, оказывающий разнофакторное влияние на здоровье и качество жизни человека. Данный гриб известен как вредитель пищевых продуктов (наиболее частая причина порчи плодов цитрусовых), индуктор микоген-ной аллергии (IgE к аллергену данного гриба определяют в диагностических целях) и, как недавно установили, продуцент микотоксинов - триптоквиаланина А и В - веществ, сходных с триптоквивалином Aspergillus fumigatus, близких по химическому строению к алкалоидам спорыньи [1, 2]. Описали необычный случай микоза легких со смертельным исходом, вызванный этим грибом [3]. Пациентом оказался мужчина 78 лет пониженного питания, страдавший на протяжении 12 лет бронхиальной астмой и эмфиземой легких. Рентгенологически поражение проявилось расширяющейся полостью распада в верхней доле левого легкого. Первоначально состояние расценили как аспергилле-му. Противогрибковую терапию проводили в течение несколько месяцев итраконазолом, микафунгином, во-риконазолом и амфотерицином В, однако эти препараты позитивного эффекта не дали. По мере прогрессии заболевания у пациента началось отхождение гнойной мокроты, появился плевральный выпот, отметили снижение показателей функции внешнего дыхания. Смерть наступила от почечной недостаточности. Культуру P digitatum выделили из мокроты, идентифицировали по частичной последовательности ß-тубулина. Антитела к антигенам P digitatum и Aspergillus flavus (перекрестная реакция) выявили в сыворотке и плевральной жидкости методом встречной иммунодиффу-зии по Оухтерлони.

В отношении диагностики и лечения микогенной аллергии, индуцированной Penicillium spp., следует обратить внимание на некоторые проблемные аспекты. Известно, что антигены и аллергены Penicillium spp. и Aspergillus spp. способны вызывать синтез перекрестно реагирующих антител. Еще в 1996 г. Brouwer J. показал, что сыворотки пациентов, в составе которых в реакции преципитации обнаружили антитела к Penicillium spp., также реагируют с антигенами A. fumigatus в ИФА, притом IgG к Penicillium spp. связывают антигены A. fumigatus молекулярной массой от 28 до 130 kDa. Учитывая подобное обстоятельство, в составе протеома и гликома Penicillium spp. необходимо выявить биомолекулы, которые одновременно отличались бы от прочих компонентов антигенностью / аллергенностью и специфичностью для конкретного вида данных грибов. Решение этой задачи позволит до некоторой степени устанавливать или отвергать связь между существующей у пациента аллергической патологией и биодеструкцией жилого или производственного помещения представителями рода Penicillium, хотя такому выводу может помешать смешанный состав микробиоты помещения и наличие полисенсибилизации у пациента. Для специфической иммунотерапии аллергенами (специфической гипосенсибилизации) на современном этапе применяют пептидные препараты. Появились сообщения об их использовании при микогенной аллергии. Данный аспект вновь обращает внимание на необходимость выявления специфических антигенных и аллергенных биомолекул, в частности - пептидной природы. С технической точки зрения одним из

наиболее удачных методов изучения смеси пептидов и низкомолекулярных белков, экстрагируемых из клеток грибов, является MALDI-TOF-масс-спектрометрия.

Цель исследования - определение состава низкомолекулярной фракции протеома P. digitatum.

МАТЕРИАЛЫ И МЕТОДЫ

Первичное исследование. Использовали штамм P. digitatum 1, переданный сотрудниками центральной клинико-диагностической лаборатории РНИ-ИТО им. Р.Р. Вредена. Субкультивирование, масс-спектрометрическое изучение штамма и видовую идентификацию выполняли согласно Riabinin I.A., et al. [4] с применением MALDI-TOF-масс-спектрометра спектра Autoflex speed TOF/TOF (Bruker Daltonik GmbH, Германия). Полученный масс-спектр показан на рисунке 1.

Рис. 1. Масс-спектр низкомолекулярной фракции протеома P. digitatum 1.

Аннотирование масс-спектра провели по Riabinin I.A. [5]. В кратком изложении методика подразумевает идентификацию спектрообразующих белов с помощью ресурса Tagldent (http://web.expasy.org/tagident/) на основании некоторых допущений в трактовке процесса MALDI-ионизации полипептидов. При работе с ресурсом применяли данные Wilkins M.R. и соавт. (1996, 1998), а также Gasteiger E. и соавт. (2005). Поиск гомологов осуществляли в ресурсе protein BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) среди представителей таксона Fungi (taxid: 4751), а при отсутствии гомологов у грибов - среди иных представителей живого мира. Гомологи регистрировали при соблюдении 2-х критериев: идентичность последовательностей

(анализируемой и гомологичной) не менее 60%, перекрытие последовательностей - не менее 90%. Фактически полученные пределы идентичности и перекрытия фиксировали в результатах. При отсутствии гомологов, отвечающих указанным критериям, определяли общие аминокислотные мотивы с последовательностями отдаленно схожих белков, если такие удалось найти.

Реконструкцию третичной структуры спектрообразующих полипептидов проводили преимущественно с применением ресурса Swiss-Model (https://swissmodel.expasy.org/), согласно работе Arnold K. и соавт. (2006) и более поздним сообщениям [6, 7, 8], исключая пептиды, состоящие менее чем из 30 остатков, что является ограничением для моделирования. В случае если указанный ресурс не позволял провести реконструкцию, применяли редактор RaptorX (http:// raptorx.uchicago.edu/) [9, 10]. При использовании данных ресурсов учитывали и выкопировали значения показателей точности моделирования. Для краткости их определения и правила трактовки здесь не приведены, с данной информацией можно подробно ознакомиться в соответствующих разделах упомянутых сетевых редакторов [11, 12].

Анализ биологических свойств и межбелковых взаимодействий выполняли с помощью ресурсов InterPro (http://www.ebi.ac.uk/interpro/) и String 10.5 (https://string-db.org/).

РЕЗУЛЬТАТЫ АНАЛИЗА

Описание низкомолярной фракции протеома P.

digitatum на основании аннотирования масс-спектра представлено в таблицах 1 и 2, а также далее в тексте. Для удобства обозначения полипептиды, выявленные при анализе, отмечены аббревиатурой Pdp (Pénicillium digitatum (poly)peptide) и цифровым номером.

Таблица 1

Перечень обнаруженных белков и пептидов с краткими характеристиками

№ Mw m/z 5Mw N.. St. 1 St. 2

Pdp1 2322 2171,192 151 22 + +

2179,273 143

Pdp2 2551 2493,855 57 23 + —

Pdp3 2805 2728,513 76 25 + +

2749,007 56

2771,188 34

Pdp4 2897 2855,277 42 29 + +

Pdp5 3003 2985,851 17 29 + +

Pdp6 3305 3287,167 18 30 + +

Pdp7 3342 3329,485 14 28 + +

Pdp8 3355 3354,267 1 33 + +

Pdp9 3376 3370,979 5 29 + +

Pdp10 3386 3384,195 2 29 + +

Pdp11 3563 3553,840 9 32 + +

Pdp12 3789 3780,157 9 32 + +

Pdp13 3884 3880,276 4 31 + —

Pdp14 4335 4328,483 7 39 + +

Pdp15 5008 5004,155 4 45 + +

Pdp16 5562 5556,695 5 53 + +

Pdp17 5974 5966,857 7 48 + +

Pdp18 6011 6006,712 4 54 + +

Pdp19 6077 6072,225 5 56 + +

Pdp20 6087 6087,402 0 55 + +

Pdp21 6130 6128,879 1 55 + +

Pdp22 6632 6601,430 31 59 — +

Pdp23 6728 6720,674 7 63 + +

Pdp24 6761 6761,802 0 60 + +

Pdp25 6783 6780,735 2 65 + +

Pdp26 7026 7024,343 2 61 + +

Pdp27 7275 7268,110 7 66 + +

Pdp28a 7380 7378,745 1 68 + +

Pdp28b 7380 67 — +

Pdp29 7407 7400,366 7 67 — +

Pdp30 7422 7418,821 3 67 + +

Pdp31 7454 7445,018 9 69 + +

Pdp32 8844 8842,803 1 74 + +

Условные обозначения: № - наименование полипептида; Mw - молекулярная масса предполагаемого полипептида; m/z - одноименная величина пика из масс-листа, приведенная в Da; 5Mw - разница значений молекулярной массы предполагаемого полипептида и величиной m/z образуемого им пика, округленная до целого значения; Na/a (number of amino acids) - количество аминокислотных остатков в полипептиде; St. 1 (strain 1) - наличие данного полипептида в протеоме штамма P. digitatum PHI26/CECT 20796; St. 2 (strain 2) - наличие данного полипептида в протеоме штамма P. digitatum Pd1/CECT 207950.

Таблица 2

Первичная структура спектрообразующих пелипептидов P. digitatum

№ Аминокислотная последовательность в коде FASTA

Pdp1 GEVLWSGFFNASATVADFDKCG

Pdp1p MRSLAWLVSLPMVADAGEVLWSGFFNASATVADFDKCG

Pdp2 CTFLSLPGSILEAYNRLKKDGKP

Pdp2p MHTTRAVALNFLEMTLCCTFLSLPGSILEAYNRLKKDGKP

Pdp3 LDLMDSRPDLHHIPARPEATAVPRP

Pdp3p MHLYYLLIIRISVLGQCLDLMDSRPDLHHIPARPEATAVPRP

Pdp4 MAGGVQMGPCQVIAGSQCGFLLDEASVLD

Pdp5 MTSQAVAGHSALHKFQVPTAVQPLPATSQ

Pdp6 MYTLGGVLVLDAHNDLKHCSRFLDFAGLVV

Pdp7 TKESEVDEDESEEDFQKRVEEAVQNMKL

Pdp7p MILWVLYPLTFCVTTLNTKESEVDEDESEEDFQKRVEEAVQNMKL

Pdp8 MVELSTLLAGSGCPKNLGEPILCDFGSAVMGDE

Pdp9 MQKSEHLHGFLPGMCMMLRKESISRLLCV

Pdp10 MYSDHRGTGEVRSPYLFVYHSPGCWRIGN

Pdp11 MVGVPHSKGCSLCRERRIKVNVNSHGKIELSK

Pdp12 MVLGVQRRDEGLNWSGYKYFNWRGRVRGAGFL

Pdp13 MKPTDKHFRCDVCQRAFTRIDHLKRHSLRRM

Pdp14 MIHMLCAKLITRLDSHDGSSKSLDRGLGRPMSLILPRSK

Pdp15 MSNSGQVLSGLEDTQITMNSPPQFPINIMPETWDIVKKVEEDTVS

Pdp16 MQRLVHAQTDQAISAPLSPRCQVAAPGSRALTTAPPFWPDVELGGRFGAGPFS

Pdp17 MRWESKGIETFWRGAHFARLSHVALFFSFLVIFRVEIEVKGRYWRVKW

Pdp18 MKPDSSSIGSLPVKILCFVFHLLGPFGLVSINQTSSKFHKRVQPQRTHFTVEVA

Pdp19 MCMKAICSTCNKVTWWGCGSHISSVLDSIPEGEWCSCTPQVEKDGKKYPPKA ARAG

Pdp20 MDNVFSNGHGSLLMGTLRSPPLFQLSRAMKRMSAETWGRRSYNTGRTAKIG VCVV

Pdp21 MNSVHRANVAAYASNSPRTPSRGPARGFYQCGVCKKDYGRADHLIRHVRSR MLLG

Pdp22 MRSFGVEIPGERGILSKLSLKQRAGVCSSLGVRVSTSKFAVTCTYYRSTTYRTRE RVLK

Pdp23 MCSLGVWAGAIPIQKVWGLRGILSPSGTLHSELQRHGCLDHIACSSDPATGYAL RAHFELQIG

Pdp24 MIPKIQRQETFPSIDISAIGGVSFNRLHEKGRVKKEIETFATSLYEIDHIIDIKSIDSGS

Pdp25 MISHLSETNSLTVRETDEAGNPTATYVYSGDVASSITSSKTPAGRVDVIVGIPVN VLGYLPNTSE

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Pdp26 MGFDRGLGALTFPYYHTLPTPIFLSHIVLFHTEPDTYDHRVWKTGLPVRSAVLK PHILHSQ

Pdp27 MNPDSRSQPREEQSPGSLNCNRGRIRALIQTSDGERHYFSGTVSTDLCLMVNNA QPAPSPAPLEYL

Pdp28a MGGGGKIPYPKEVWSPSGGWYAQPANWRANTAIMGAFVIGVAAVAFSISADRE HRDKMPEPGRFFPSR

Pdp28b MYWVPYPQAGGCTGGSGANFFLAMTGTQKRVAMSGLELNWLLRNVYRSIDES VDVSLTGRKQLPLLI

Pdp29 MADNVPVGMLCSHQDDLERVSAKQDQKVHPESAPLDVDENEKHKREVAPDGG YGWVCVACVFWINAA

Pdp30 MPRYKEGDKVSYKPVGGAQSRTSKSVGLILETLGGRSSSDDEPRYKIENMHTHK SSSIKEGNIEGPAE

Pdp31 MPVIPESSDFPSAPHKEGNEAEKKPGQQLPKATATDFLSKGPQIPDNMPPKASK EELEARAKELNKSAN

Pdp32 MAGPSKSLILDPALQKYYELNANRYKYWRWTPRQARISFVYMALIPGILGYFAYK YEGKFELRGKRRGDTISE

Индексом «p» обозначены пептиды - предшественники.

В результате анализа для всех пиков масс-спектра удалось найти соответствующие полипептиды. Предположительно, два пептида с массами 2322 Da и 2805 Da (Pdpl и Pdp3) при ионизации образуют несколько типов ионов, что отражено в масс-спектре в виде нескольких пиков. Напротив, пик с m/z равном 7378,745 может быть образован двумя пептидами со сходными характеристиками, которые в таблицах отмечены Pdp28a и Pdp28b. Среди всех обнаруженных полипептидов до сих пор ни один не имеет ранее установленного функционального предназначения. Пептиды Pdpl, Pdp2, Pdp3 и Pdp7 предположительно формируются в результате протеолиза более крупных предшественников (пропептидов), последовательности которых также приведены в таблице 2. Компоненты Pdp2, Pdp17, Pdp18, Ppd28a и Pdp32 способны встраиваться в билипидную мембрану. Среди изученных полипептидов и белков 13 представителей (Pdp6, Pdp8 - 12, Pdp17, Pdp20, Pdp22, Pdp25, Pdp26, Pdp28b) являются уникальными для P. digitatum и не имеют близких гомологов у других микромицетов; 9 представителей (Pdp5, Pdp13, Pdp15, Pdp16, Pdp18, Pdp23, Pdp24, Pdp27, Pdp29) у других микромицетов, как правило, имеют гомологи в виде фрагментов в составе более крупных белков.

Пептид Pdpl имеет предшественника массой 4064 Da, состоящего из 38 аминокислот. При перекрытии не менее 89% и идентичности последовательностей не менее 60% сходные пропептиды удалось выявить у других представителей рода Penicillium (P. expansum, P. itallicum, P. chrysogenum, P. freii, P. camambertii, P. arisonense, P. nordicum, P. griseofulvum, P. oxalicum), а также у Aspergillus versicolor, A. udagawae, Sistotremastrum niveocremeum, S. suecicum. У некоторых грибов (Sphaerobolus stellatus и Exidia glandulosa) сходные пропептиды известны, как «углевод-связывающие модули белков семейства 1».

Пептид Pdp2 имеет предшественника массой 4484 Da, состоящего из 40 аминокислот. При перекрытии не менее 95% и идентичности последовательностей не менее 66% сходные пропептиды удалось обнаружить у других представителей рода Penicillium (P expansum, P. chrysogenum, P. rubens, P. camambertii) и Aspergillus (A. bombycis и A. sydowii). У P camambertii сходный про-пептид - цинковый «палец» CCHC-типа.

Пептид Pdp3 имеет предшественника массой 4823 Da, состоящего из 42 аминокислот. При перекрытии не менее 92% и идентичности последовательностей не менее 75% сходный пропептид смогли определить у P chrysogenum. Близкие по строению пептиды, возникающие в результате протеолиза, встречаются у других представителей рода Penicillium (P. rubens, P. camambertii, P. italicum, P. roqueforti, P. freii, P. expansum, P. nordicum, P. brasilianum, P. arizonense), а также рода Aspergillus (A. ruber, A. ochraceoroseus, A. rambellii) - перекрытие не менее 80%, идентичность не менее 60%.

Пептид Pdp4 имеет гомологи у других представителей рода Penicillium (P. rubens, P. camamberti, P. expansum, P. itallicum, P. roqueforti) при перекрытии 100% и идентичности последовательностей не менее 87%.

Пептид Pdp5. Отчасти сходные пептиды имеются в протеоме других представителей рода Penicillium, но их характеризуют меньшими величинами перекрытия

и идентичности, чем заданные пороговые значения.

Пептид Pdp7 имеет предшественника массой 5352 Da, состоящего из 45 аминокислот. Данный пропептид для P. digitatum является уникальным, а зрелый пептид (при перекрытии не менее 96% и идентичности не менее 62%) имеет аналоги у некоторых представителей рода Pénicillium (P. camamberti, P. roqueforti, P. rubens) и Aspergillus (A. glaucus, A. fumigatus, A. udagawae, A. zonatus). У P camamberti данный пептид сходен с участком последовательности белка из 206 аминокислот, несущего мотив типа TonB.

Пептид Pdp13 имеет цинковый «палец» типа C2H2. Сходных пептидов близкой длины цепи у других ми-кромицетов не выявили; данная последовательность гомологична участкам цепи некоторых белков, также несущих цинковый «палец» и ДНК-связывающий домен, но обладающих гораздо более длинной цепью аминокислот (свыше 600 остатков). Такие белки обнаружили у представителей родов Penicillium, Talaromyces, Aspergillus, Byssochlamys, Rasamsonia, Emmonsia, Paracoccidioides, Blastomyces, Histoplasma. Многих из них относят к регуляторам транскрипции.

Пептид Pdp14 при перекрытии 100% и идентичности 87% сходен с гипотетическим пептидом PITC из 42 аминокислот, который продуцирует P italicum.

Пептид Pdp15. Сходных пептидов у других микро-мицетов найти не удалось, однако наблюдали похожие участки в последовательностях белков у P expansum, P. chrysogenum и P. itallicum. Белки этих грибов более длинные (свыше 200 аминокислот), их функции не установлены.

Белок Pdp16 гомологичен фрагменту белка из 811 аминокислот у P. rubens.

Белок Pdp18. Сходных белков у других микроми-цетов установить не удалось, близкие фрагменты имеются в структуре более крупных белков из нескольких сотен остатков, которые известны в протеоме других Penicillium spp., в том числе - ГТФазная (SRP54) субъединица сигнал-распознающей частицы у P camamberti.

Белок Pdp19 при перекрытии не менее 89% и идентичности последовательностей не менее 60% имеет гомологи у широкого круга грибов, в том числе представителей родов Penicillium, Aspergillus, Phialocephala, Pestalotiopsis, Marssonina, Talaromyces, Trichoderma, Cordyceps, Lepidopterella, Fusarium, Dothistroma, Stachybotrys, Isaria, Pyrenophora, Ophiocordyceps, Glonium, Thermothelomyces, Cenococcum, Beauveria, Paraphaeosphaeria, Oidiodendron, Thielavia, Verticillium, Acidomyces, Colletotrichum и Magnaporthe. У P. camamberti сходный белок является железо- и серосвя-зывающим сайтом ферредоксина типа 2Fe-2S.

Белок Pdp21, несущий цинковый «палец» типа C2H2, сходен с белком, несущим цинковый «палец», у P. itallicum (перекрытие - 100%, идентичность - 75%). Сходный фрагмент есть в структуре неопределенного белка у P rubens, состоящего из 204 аминокислот.

Белок Pdp23 в виде самостоятельной последовательности имеется только у P. digitatum. У других микромицетов (родов Penicillium, Pseudogymnoascus, Aspergillus, Metarhizium, Pochonia, Talaromyces, Purpureocillium и Colletotrichum) сходные последовательности (с перекрытием до 98% и идентичностью до 60%) входят в структуру различных гидролитических ферментов. Среди таких ферментов - пептидазы, ги-

дролазы ^карбиноламин^-аминокислот, ß-аланин-синтаза, амидазы (гидантоиназа, карбамоилаза).

Белок Pdp24 в виде самостоятельной последовательности имеется только у P. digitatum. У других представителей рода Penicillium сходные последовательности (с перекрытием до 91% и идентичностью до 71%) входят в структуру РНК-зависимой ДНК-полимеразы P camemberti и белка неуточненной функции у P freii.

Белок Pdp26. Сходные последовательности у штаммов P digitatum входят в состав L-лизин^З-аминомутаз (107-119 аминокислот), у других микро-мицетов достаточно близкие (с учетом установленных показателей) последовательности в виде отдельных белков или в составе более крупных полипептидов не обнаружили.

Белок Pdp27 в виде самостоятельной последовательности имеется только у P digitatum. Найдены гомологичные участки в составе белее крупных белков (137 остатков) у других представителей рода Penicillium, но их функции неизвестны.

Белки Pdp28a и Pdp28b в формировании пика, как было указано выше, являются альтернативными. Pdp28a, по-видимому, относится к весьма консервативным, поскольку с перекрытием не менее 95% и идентичностью не менее 69% сходные последовательности нашли у представителей 56 родов аскомицетов. Однако функции этих белков неизвестны. Для Pdp28b гомологов у других микромицетов выявить не удалось.

Белок Pdp29 в виде самостоятельной последовательности имеется только у P. digitatum. Найдены гомологичные участки в составе белее крупных транспортных белков (более 500 остатков) у других представителей рода Penicillium (перекрытие не менее 98%, идентичность не менее 75%).

Белок Pdp30 несет домен DUF2945 (домен неизвестной функции). Сходные белки при перекрытии последовательности 100% и идентичности не менее 63% нашли у P expansum, P. nordicum, P. camemberti, P. roqueforti, P. rubens, P. arizonense.

Белок Pdp31 при перекрытии не менее 95% и идентичности последовательностей не менее 61% имеет гомологи у других представителей рода Penicillium (P griseofulvum, P. rubens, P. freii, P. expansum, P. nordicum, P. roqueforti, P. brasilianum, P. oxalicum, P. arizonense) и Aspergillus (A. flavus, A. clavatus, A. nidulans, A. sydowii, A. versicolor). У P. italicum сходная последовательность входит в состав белка, участвующего в репарации ДНК (1038 аминокислот).

Белок Pdp32 несет домен NDUF_B4 (домен субъединицы В15 НАДФ-убиквитин-оксидоредуктазы). Сходные белки при перекрытии последовательности 91% и идентичности не менее 67% нашли у представителей родов Penicillium, Aspergillus, Talaromyces, Byssochlamys, Emmonsia, Blastomyces, Paracoccidioides, Coccidioides, Histoplasma, Arthroderma, Trichophyton.

Pdp6, Pdp9, Pdp20 и Pdp28b не имеют достаточно близких структурных гомологов не только среди белков грибов, но и других живых организмов. В отношении Pdp8 следует заметить, что удалось найти некоторые значительно более крупные белки, перекрывающие своими сходными фрагментами последовательность Pdp8 на ~60%. После некоторой корректировки перечня найденных белков с удалением отдельных

гомологов, «выпадающих» из общего ряда по особенностям структуры, обнаружили общий для них мотив в аминокислотной последовательности, который имеет следующий вид (неидентичные участки отмечены знаком «-» по числу различающихся остатков, которое обозначено нижним индексом, где «v» - вариабельное):

EEE(-)9Y-P-RIGE(-)5YQ-VGKLG-G(-)2ST-WLARD(-)v V-LK(-)8G(-)5EL(-)2Y(-)vH-G(-)3VR-LLD-F(-)3GP(-)3 H-CLVH-PL(-)2S(-)3FL-RNP(-)3LP(-)7L(-)3AL(-)3H-EC(-)3HT(-)2K-DNI(-)5D-S(-)4FE(-)2E(-)3P-PRK(-)vR(-)2 Y-S(-)2L(-)2P(-)3G-P-LCDF-S(-)3GD(-)7QP(-)2YR-P-VIL(-)2PW-Y(-)2D-WN(-)2C(-)vW(-)3EG(-)3F(-)3DPE(-)3

YRSRAHLA(-)4LL.

Белки, обладающие такой структурной особенностью, оказались протеинкиназами некоторых классов из P. chrysogenum, P. camemberti, P. roqueforti, Madurella mycetomatis, Coniochaeta ligniaria, Acremonium chrysogenum, Histoplasma capsulatum, Pochonia chlamydosporia, а также гипотетическими белками неясной функции из P. vulpinum, Penicilliopsis zonata, A. wentii и Pseudogymnoascus sp.

Пептид Pdp10 имеет общий короткий мотив с белками пенициллов (P. italicum, P. flavigenum, P. roqueforti и P. nalgiovense): Y-D(-)3TGEV-SPYLFVYH(-)2G. Притом у P roqueforti и P italicum такие гомологи являются ААА-доменами АТФаз. Pdp11 отделенные гомологи перекрывают сходными регионами немногим более чем на 50%; гомологичные белки, по большей части, неуточненной функции, отдельные представители Zn-зависимые ДНК-связывающие белки - факторы транскрипции грибов рода Aspergillus и Penicillium, но единого общего аминокислотного мотива представители этой группы не имеют. Pdp12 и гипотетический белок P rubens из 216 аминокислот имеют общий мотив MVLGV-RR-EGLNWSGY-YF-WRGRVRG. Пептид Pdp17 и крупные белки (свыше 470 остатков) других пенициллов (P nordicum, P. camemberti, P. rubens), один из которых является сахарозно-протонным-симпорте-ром, несут довольно условный мотив вида G-E(-)2W(-)4 FA-LS(-)4F-SFL(-)4V-I-VKGR-W(-)3W.

Мотив V(-)2P-E(-)2ILSK(-)2LK(-)4V(-)2S-GVR(-)2T(-)2 F(-)2TCTYY(-)3T(-)6V-K является общим для пептида Pdp22 и белка из 80 аминокислот, открытого у P. polonicum. Для Pdp25 найдены лишь отдаленные гомологи у Penicillium spp. и Aspergillus spp., сходство с которыми выражается меньшими величинами идентичности и перекрытия, чем установленные в дизайне исследования; эти белки состоят, в среднем, примерно из 500 аминокислот, практически не имеют общих для всей подборки аминокислотных остатков, некоторые из них авторами отмечены, как обладатели домена неизвестной функции DUF647, а также члены семейства трансмембранных белков RUS1.

Результаты реконструкции третичной структуры выявленных полипептидов, по данным ресурса Swiss-Model, представлены на рисунке 2 и в таблице 3, а для тех полипептидов, структуру которых моделировали в RaptorX, итоги реконструкции показаны на рисунке 3 и в таблице 4. В целом, у анализируемых полипептидов полученные модели характеризуются относительно низкими показателями точности, исключая Pdp2p, Pdp13 и Pdp27. У моделей, построенных в RaptorX, обращает внимание достаточно небольшой показатель P-уровня, но при этом у Pdp6 и Pdp14 опти-

мальное для коротких последовательностей значение GDT (ненормализованный общий тест дистанции, в данном случае более 50).

Pdplp

Pdp2p

Pdp7p

<!$ сД

РОрВ

PdpH

Pdp12

Pdp13

Pdp15

Pdp16

Pdp17*

Pdp18

Pdp20

Pdp21

Pdp19*

Pdp22

¿V

Pdp23

Pdp24

Pdp25

tyt v,

Pdp26 Pdp27 Pdp28a

Pdp2Sb

Pdp30

Pdp31

Pdp32

Рис. 2. Третичная структура спектрообразующих белков и пептидов P. digitatum 1 по данным Swiss-Model. Знаком «*» отмечены полипептиды, для которых модель удалось построить не для всей цепи.

Таблица 3

Модели, использованные для воссоздания вероятной пространственной конформации спектрообразующих полипептидов Р. МдИвЫт

Таблица 4

Характеристики моделей спектрообразующих полипептидов P. digitatum, построенных с помощью ресурса RaptorX

Pdps Белок-«шаблон», его происхождение и номер. QMEAN Seq.Id.

Pdp32 Субъединица 4А субкомплекса 1р НАДН-убихинон-дегидрогеназы респираторного суперкомплекса I1III2IV1 млекопитающих. Шаблон № 5qup.40. -3,07 26,00%

Pdp31 Спиральный домен фактора сплайсинга пре-мРНК SF1 из мышиных эмбриональных фибробластов линии NIH 3T3. Шаблон № 4fxx.1. -1,93 26,92%

Pdp30 Гипотетический белок CNAG_02591 из Cryptococcusneoformans. Шаблон № 4p5n.1. -1,80 15,38%

Pdp29 Невозможно построить модель.

Pdp28b Гликозилированная бифункциональная нукле-аза TBN1 из томата. Шаблон № 3snq.1. -1,25 36,67%

Pdp28a Субъединица SecE транслоказы белков Escherichia coli. Шаблон № 5abb.1. -3,21 10,00%

Pdp27 Кальциевый переносчик из митохондрий человека. Шаблон № 5kuq.1. 0,59 32,35%

Pdp26 Белок М130, обогащенный цистеином — корецептор мембранного белка CD163 свиньи. Шаблон № 5hrj.1. -3,48 8,57%

Pdp25 Гликозидгидролаза семейства 9 (целлюлаза CbhA) из Clostridium thermocellum. Шаблон № 3k4z.1. -2,25 30,00%

Pdp24 CRISPR-ассоциированная эндорибонуклеаза C2c2 из Leptotrichia shahii. Шаблон № 5wtj.1. -1,23 32,50%

Pdp23 Р-аланин-синтаза из Saccharomyces kluyveri. Шаблон № 1r43.1. 0,31 26,47%

Pdp22 5,10-метилтетрагидрофолатредуктаза из E. coli. Шаблон № 1zp3.1. -0,83 27,27%

Pdp21 ДНК-связывающий димеризующийся белок мыши, несущий «цинковый палец». Шаблон № 1f2i.1. -2,34 32,35%

Pdp20 Домен PU.1 фактора транскрипции семейства Ets мыши. Шаблон № 1pue.1. -3,53 21,21%

Pdp19* Белок задержки роста 2 мыши. Шаблон № 1v5r.1. -2,81 19,05%

Pdp18 F-домен 4 (распознающий) из комплекса убиквитин-лигазы SCF(Fbx4) человека. Шаблон № 3l2o.1. -2,37 20,00%

Pdp17* Синтетический р-складчатый белок OR485 искусственного происхождения. Шаблон № 5kph.1. 1,57 46,67%

Pdp16 Паркин (белок, стабилизирующий Е3 убикви-тин-протеин-лигазу) крысы. Шаблон № 4k95.1. -2,01 24,24%

Pdp15 Никотинат-фосфорибозилтрансфераза из Enterococcus faecalis. Шаблон № 2f7f.1. -0,53 15,63%

Pdp14 Невозможно построить модель.

Pdp13 Крюппель-подобный фактор 5 человека. Шаблон № 2ebt.1. -1,71 43,33%

Pdp12* Белок Crybq3 мыши, несущий домен р/у-кристаллина. Шаблон № 4fd9.1. -3,59 27,78%

Pdp11* ДНК-связывающий белок GAL4 из Saccharomyces cerevisiae. Шаблон № 1aw6.1. -3,36 16,67%

Pdp8* 4-оксалокротонат-декарбоксилаза NahK из Pseudomonas putida. Шаблон № 5d2f.1. -1,37 33,33%

Pdp7p Субъединица F АТФ-синтазы типа V из Thermus thermophilus. Шаблон № 5qar.1. -1,64 7,14%

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Pdp6 Невозможно построить модель.

Pdp3p Невозможно построить модель.

Pdp2p Гликопротеин Е2 коронавируса SARS. Шаблон № 2bez.1. -0,86 31,25%

Pdp1p Белок-репрессор оперона устойчивости к мышьяку из Bacteroides vulgatus. Шаблон № 3ktb.1. -0,51 21,43%

Pdps Показатели точности моделирования Белковый «шаблон»

Pdp29 Р-уровень=4,36е-02 uGDT=18 GDT=27 uSeqId=4 SeqId=6 Score=19 Переносчик дофамина Drosophila melanogaster. Шаблон № 4xp4:A.

Pdp14 Р-уровень=3,33е-02 uGDT=20 GDT=52 uSeqId=7 SeqId=18 Score=17 Комплекс (гетеродимер) ДНК-связывающих теломер-ных белков а и ß из Sterkiella (Oxytricha) nova. Шаблон № 2i0qB.

Pdp6 Р-уровень=1,93е-02 uGDT=24 GDT=81 uSeqId=7 SeqId=23 Score=16 Цистатионин-у-синтаза E. coli. Шаблон № 1cs1A.

Pdp3p Р-уровень=3,27е-02 uGDT=17 GDT=42 uSeqId=8 SeqId=19 Score=18 АТФ-зависимая рестриктаза-ДНК-модифицирующий белок LlaBIII (типа ISP) Lactococcus lactis. Шаблон № 4xqkA.

Условные обозначения: Pdps - спектрообразующие полипептиды P. digitatum; звездочкой (*) отмечены те Pdp, у которых найденный «шаблон» отличается низким сходством с анализируемой последовательностью; QMEAN -показатель качества моделирования в ресурсе Swiss-Model; Seq. Id. - сходство анализируемой последовательности Pdp и белка-«шаблона».

Рис. 3. Третичная структура спектрообразующих белков и пептидов Р. ШдКа^т 1 по данным Кар1:огХ.

Поиск функциональной принадлежности выявленных белков и пептидов с использованием биоинформационных ресурсов оказался мало результативным. Ресурс ШегРго не позволил установить дополнительные данные о биологических свойствах и

клеточной локализации. В базе STRING 10.5 для представителей рода Penicillium межбелковые взаимодействия приведены только для штаммов P. chrysogenum (P notatum) Wisconsin 54-1255 и P marneffei ATCC 18224. Среди белков второго из указанных видов ранее проведенный поиск гомологов не выявил совпадений, а некоторым белкам и пептидам P chrysogenum гомологичны Pdpl, Pdp2, Pdp3 и Pdp15. Тем не менее, для близких полипептидов P. chrysogenum межбелковые взаимодействия, как выяснилось, еще неизвестны.

ЗАКЛЮЧЕНИЕ

В результате проведенного исследования анализируемый масс-спектр фракции протеома удалось аннотировать полностью, однако для большинства слагающих его пептидов и низкомолекулярных белков еще не установлена четкая функциональная принадлежность. Значительная доля компонентов явилась консервативной и, как оказалось, представлена полипептидами, сходными как у представителей семейства Trichocomaceae (рода Penicillium, Aspergillus, Talaromyces, Byssochlamis), так и у представителей других таксонов аскомицетов.

Заметим, что наиболее стабильной третичной структурой обладают белки, состоящие примерно из n*100 аминокислотных остатков. Относительно короткие последовательности, выявленные в данном анализе, обладают весьма подвижной пространственной конформацией (особенно в растворе), которую трудно рассматривать как истинную третичную структуру. Тем не менее, ее реконструкция представляет определенный интерес, поскольку взаимодействия типа «субстрат-фермент» и «лиганд-рецептор», а также «эпитоп (антигена)-паратоп (антитела)» требуют от низкомоле-

кулярного вещества-участника находится в специфичной для данного взаимодействия пространственной конфигурации.

В дальнейшем представляет интерес исследование антигенных и аллергенных свойств данных веществ при конъюгировании с адъювантом, а также выявление перекрестных реакций антител типа IgE и других классов, полученных в ответ на введение таких аллергенов, с аллергенами (антигенами) других микромице-тов и антигенами немикробной природы.

Помимо прикладного исследования, представляет интерес вопрос о биологической функции выявленных полипептидов и их клеточной топологии. Многие обнаруженные полипептиды гомологичны последовательностям в структурах белков более крупного размера. Неясно, следует ли данный феномен расценивать как возникшие в эволюции P. digitatum мутации, которые привели к укорочению кодирующей области более протяженных предковых генов. Ответить на данные вопросы станет возможным только после сравнительного исследования регионов генома P digitatum и других микромицетов, с компонентами протеома у которых удалось найти сходства.

За предоставление штамма для исследования выражаем благодарность врачам-бактериологам В.В. Шаба-новой и А.Н. Рукиной (центральная клинико-диагностическая лаборатория, научное отделение профилактики и лечения раневой инфекции РНИИТО им. Р.Р. Вредена).

Работа поддержана в рамках НИР по Государственному заданию Минздрава РФ «Молекулярные предикторы развития микозов и микоаллерго-зов различного генеза на основе иммунопатогенеза» (№АААА-А16-116042010012-0).

ЛИТЕРАТУРА

1.

Marcet-Houben M., et al. Genome sequence of the necrotrophic fungus Penicillium digitatum, the main postharvest pathogen of citrus. BMC Genomics. 2012; 13.

Dhanasekaran D., Thajuddin N., Panneerselvam A. Antimicrobials: synthetic and natural compounds. CRC Press, 2015: 524 p. Oshikata C., et al. Fatal pneumonia caused by Penicillium digitatum: a case report. BMC Pulm. Med. 2013; 13. Riabinin I.A., Vasilyeva N.V., Bogomolova T.S., et al. MALDI-TOF-mass-spectrometry of protein extracts for ascertainment of phylogenetic relationships between clinical isolates of Aspergillus fumigatus and A. niger. 6th Advances Against Aspergillosis. 2014: 119-120.

Riabinin I.A. Polypeptides from Aspergillus spp. forming mass-spectra during MALDI-TOF-mass-spectrometry// Wu Lien-Teh Forum. The 3rd China-Russian International Conference on Microbiology, Immunology and Related Diseases (CRICMID 2016). 2016: 36-38.

Biasini M., Bienert S., Waterhouse A., et al. SWISS-MODEL: modelling protein tertiary and quaternary structure using evolutionary information. Nucleic Acids Research. 2014; 42 (W1): 252-258.

Kiefer F., Arnold K., Künzli M., et al. The SWISS-MODEL repository and associated resources. Nucleic Acids Research. 2009; 37: D387- D392.

Guex N., Peitsch M.C., Schwede T. Automated comparative protein structure modeling with SWISS-MODEL and Swiss-PdbViewer: a historical perspective. Electrophoresis. 2009; 30 (1): 162-173.

Ma J., Wang S., Zhao F., Xu J. Protein threading using context-specific alignment potential. Bioinformatics. 2013; 29 (13): 257265.

10. KällbergM., WangH., WangS., et al. Template-based protein structure modeling using the RaptorX web server. Nature Protocols. 2012; 7 (8): 1511-1522.

11. SWISS-MODEL Help [Electronic resource]. - 2017. https://swissmodel.expasy.org/docs/help.

12. RaptorX Docs [Electronic resource]. - 2017. http://raptorx.uchicago.edu/documentation/.

Поступила в редакцию журнала 21.08.2017 Рецензент: Е.Р. Рауш

5.

6.

7.

8.

9.

i Надоели баннеры? Вы всегда можете отключить рекламу.