УДК 621.384.8:582.282.123.2
БИОИНФОРМАЦИОННЫИ АНАЛИЗ
НИЗКОМОЛЕКУЛЯРНОИ ФРАКЦИИ ПРОТЕОМА PENICILLIUM DIGITATUM
1Рябинин И.А. (м.н.с.)*, 2Лякишева Е.В. (ординатор), 1,2 Васильева Н.В. (директор института, зав. кафедрой)
Северо-Западный государственный медицинский университет им. И.И. Мечникова: 1 НИИ медицинской микологии им. П.Н. Кашкина, 2 кафедра медицинской микробиологии, Санкт-Петербург, Россия
© Коллектив авторов, 2017
В исследовании проведено аннотирование масс-спектра, полученного в результате MALDI-TOF-масс-спектрометрии клеточного экстракта мицелия Penicillium digitatum 1, по протоколу, пригодному для видовой идентификации. С использованием серии биоинформационных ресурсов Tagldent, Protein BLAST, Swiss-Model и RaptorX идентифицировали белки и пептиды, с наибольшей вероятностью образующие масс-спектр, также по аминокислотным последовательностям удалось воссоздать их третичную структуру, выявить гомологи среди других видов микромицетов, установить некоторые свойства. В результате проведенной работы выявили и описали в составе низкомолекулярной фракции протеома 33 полипептида, из которых 9 - имеют гомологи у других микромицетов, а 13 - являются уникальными для изученного вида. Большинство исследованных полипептидов ранее были предсказаны только методами молекулярной генетики и не снабжены подробными структурными и функциональными характеристиками.
Ключевые слова: биоинформатика, MALDI-TOF-масс-спектрометрия, Penicillium digitatum, спектрообразующие белки, третичная структура белка
BIONFORMATICAL ANALYSIS OF THE LOW-MOLECULAR-WEIGHT FRACTION OF PENICILLIUM DIGITATUM PROTEOME
Ryabinin I.A.1 (junior scientific collaborator), Lyakischeva E.V.2 (resident physician), Vasilyeva N.V.1,2 (director of the institute, head of the chair)
North-Western State Medical University named after I.I. Mechnikov: 1 Kashkin Research Institute of Medical Mycology, 2 Chair of medical microbiology, St. Petersburg, Russia © Collective of authors, 2017
The annotation of the mass-spectrum, which was obtained by MALDI-TOF-mass-spectrometry of the mycelium extract of Penicillium digitatum 1 using a protocol suitable for species identification, was carried out in this study. Proteins and peptides which most likely forming the mass-spectrum were identified with using a series of bioinformatics resources (Tagldent, Protein BLAST, Swiss-Model and RaptorX), as well as it was possible to reconstruct their tertiary structure, to reveal homologs among other species of micromycetes, to establish some other properties based on amino acids sequences. As a result of this work, 33 polypeptide of the low-molecular-weight fraction of proteome were detected and described, of which 9 - have homologs in other micromycetes and 13 - are unique for the studied species. Most of the investigated polypeptides were previously predicted only by molecular genetics methods and are not provided with detailed structural and functional characteristics.
Key words: bioinformatics, MALDI-TOF-mass-spectrometry, mass-spectra-forming proteins, Penicillium digitatum, protein tertiary structure
* Контактное лицо: Рябинин Игорь Андреевич, e-mail: [email protected]
ВВЕДЕНИЕ
P. digitatum (Persoon) Saccardo, 1881 - микромицет, оказывающий разнофакторное влияние на здоровье и качество жизни человека. Данный гриб известен как вредитель пищевых продуктов (наиболее частая причина порчи плодов цитрусовых), индуктор микоген-ной аллергии (IgE к аллергену данного гриба определяют в диагностических целях) и, как недавно установили, продуцент микотоксинов - триптоквиаланина А и В - веществ, сходных с триптоквивалином Aspergillus fumigatus, близких по химическому строению к алкалоидам спорыньи [1, 2]. Описали необычный случай микоза легких со смертельным исходом, вызванный этим грибом [3]. Пациентом оказался мужчина 78 лет пониженного питания, страдавший на протяжении 12 лет бронхиальной астмой и эмфиземой легких. Рентгенологически поражение проявилось расширяющейся полостью распада в верхней доле левого легкого. Первоначально состояние расценили как аспергилле-му. Противогрибковую терапию проводили в течение несколько месяцев итраконазолом, микафунгином, во-риконазолом и амфотерицином В, однако эти препараты позитивного эффекта не дали. По мере прогрессии заболевания у пациента началось отхождение гнойной мокроты, появился плевральный выпот, отметили снижение показателей функции внешнего дыхания. Смерть наступила от почечной недостаточности. Культуру P digitatum выделили из мокроты, идентифицировали по частичной последовательности ß-тубулина. Антитела к антигенам P digitatum и Aspergillus flavus (перекрестная реакция) выявили в сыворотке и плевральной жидкости методом встречной иммунодиффу-зии по Оухтерлони.
В отношении диагностики и лечения микогенной аллергии, индуцированной Penicillium spp., следует обратить внимание на некоторые проблемные аспекты. Известно, что антигены и аллергены Penicillium spp. и Aspergillus spp. способны вызывать синтез перекрестно реагирующих антител. Еще в 1996 г. Brouwer J. показал, что сыворотки пациентов, в составе которых в реакции преципитации обнаружили антитела к Penicillium spp., также реагируют с антигенами A. fumigatus в ИФА, притом IgG к Penicillium spp. связывают антигены A. fumigatus молекулярной массой от 28 до 130 kDa. Учитывая подобное обстоятельство, в составе протеома и гликома Penicillium spp. необходимо выявить биомолекулы, которые одновременно отличались бы от прочих компонентов антигенностью / аллергенностью и специфичностью для конкретного вида данных грибов. Решение этой задачи позволит до некоторой степени устанавливать или отвергать связь между существующей у пациента аллергической патологией и биодеструкцией жилого или производственного помещения представителями рода Penicillium, хотя такому выводу может помешать смешанный состав микробиоты помещения и наличие полисенсибилизации у пациента. Для специфической иммунотерапии аллергенами (специфической гипосенсибилизации) на современном этапе применяют пептидные препараты. Появились сообщения об их использовании при микогенной аллергии. Данный аспект вновь обращает внимание на необходимость выявления специфических антигенных и аллергенных биомолекул, в частности - пептидной природы. С технической точки зрения одним из
наиболее удачных методов изучения смеси пептидов и низкомолекулярных белков, экстрагируемых из клеток грибов, является MALDI-TOF-масс-спектрометрия.
Цель исследования - определение состава низкомолекулярной фракции протеома P. digitatum.
МАТЕРИАЛЫ И МЕТОДЫ
Первичное исследование. Использовали штамм P. digitatum 1, переданный сотрудниками центральной клинико-диагностической лаборатории РНИ-ИТО им. Р.Р. Вредена. Субкультивирование, масс-спектрометрическое изучение штамма и видовую идентификацию выполняли согласно Riabinin I.A., et al. [4] с применением MALDI-TOF-масс-спектрометра спектра Autoflex speed TOF/TOF (Bruker Daltonik GmbH, Германия). Полученный масс-спектр показан на рисунке 1.
Рис. 1. Масс-спектр низкомолекулярной фракции протеома P. digitatum 1.
Аннотирование масс-спектра провели по Riabinin I.A. [5]. В кратком изложении методика подразумевает идентификацию спектрообразующих белов с помощью ресурса Tagldent (http://web.expasy.org/tagident/) на основании некоторых допущений в трактовке процесса MALDI-ионизации полипептидов. При работе с ресурсом применяли данные Wilkins M.R. и соавт. (1996, 1998), а также Gasteiger E. и соавт. (2005). Поиск гомологов осуществляли в ресурсе protein BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) среди представителей таксона Fungi (taxid: 4751), а при отсутствии гомологов у грибов - среди иных представителей живого мира. Гомологи регистрировали при соблюдении 2-х критериев: идентичность последовательностей
(анализируемой и гомологичной) не менее 60%, перекрытие последовательностей - не менее 90%. Фактически полученные пределы идентичности и перекрытия фиксировали в результатах. При отсутствии гомологов, отвечающих указанным критериям, определяли общие аминокислотные мотивы с последовательностями отдаленно схожих белков, если такие удалось найти.
Реконструкцию третичной структуры спектрообразующих полипептидов проводили преимущественно с применением ресурса Swiss-Model (https://swissmodel.expasy.org/), согласно работе Arnold K. и соавт. (2006) и более поздним сообщениям [6, 7, 8], исключая пептиды, состоящие менее чем из 30 остатков, что является ограничением для моделирования. В случае если указанный ресурс не позволял провести реконструкцию, применяли редактор RaptorX (http:// raptorx.uchicago.edu/) [9, 10]. При использовании данных ресурсов учитывали и выкопировали значения показателей точности моделирования. Для краткости их определения и правила трактовки здесь не приведены, с данной информацией можно подробно ознакомиться в соответствующих разделах упомянутых сетевых редакторов [11, 12].
Анализ биологических свойств и межбелковых взаимодействий выполняли с помощью ресурсов InterPro (http://www.ebi.ac.uk/interpro/) и String 10.5 (https://string-db.org/).
РЕЗУЛЬТАТЫ АНАЛИЗА
Описание низкомолярной фракции протеома P.
digitatum на основании аннотирования масс-спектра представлено в таблицах 1 и 2, а также далее в тексте. Для удобства обозначения полипептиды, выявленные при анализе, отмечены аббревиатурой Pdp (Pénicillium digitatum (poly)peptide) и цифровым номером.
Таблица 1
Перечень обнаруженных белков и пептидов с краткими характеристиками
№ Mw m/z 5Mw N.. St. 1 St. 2
Pdp1 2322 2171,192 151 22 + +
2179,273 143
Pdp2 2551 2493,855 57 23 + —
Pdp3 2805 2728,513 76 25 + +
2749,007 56
2771,188 34
Pdp4 2897 2855,277 42 29 + +
Pdp5 3003 2985,851 17 29 + +
Pdp6 3305 3287,167 18 30 + +
Pdp7 3342 3329,485 14 28 + +
Pdp8 3355 3354,267 1 33 + +
Pdp9 3376 3370,979 5 29 + +
Pdp10 3386 3384,195 2 29 + +
Pdp11 3563 3553,840 9 32 + +
Pdp12 3789 3780,157 9 32 + +
Pdp13 3884 3880,276 4 31 + —
Pdp14 4335 4328,483 7 39 + +
Pdp15 5008 5004,155 4 45 + +
Pdp16 5562 5556,695 5 53 + +
Pdp17 5974 5966,857 7 48 + +
Pdp18 6011 6006,712 4 54 + +
Pdp19 6077 6072,225 5 56 + +
Pdp20 6087 6087,402 0 55 + +
Pdp21 6130 6128,879 1 55 + +
Pdp22 6632 6601,430 31 59 — +
Pdp23 6728 6720,674 7 63 + +
Pdp24 6761 6761,802 0 60 + +
Pdp25 6783 6780,735 2 65 + +
Pdp26 7026 7024,343 2 61 + +
Pdp27 7275 7268,110 7 66 + +
Pdp28a 7380 7378,745 1 68 + +
Pdp28b 7380 67 — +
Pdp29 7407 7400,366 7 67 — +
Pdp30 7422 7418,821 3 67 + +
Pdp31 7454 7445,018 9 69 + +
Pdp32 8844 8842,803 1 74 + +
Условные обозначения: № - наименование полипептида; Mw - молекулярная масса предполагаемого полипептида; m/z - одноименная величина пика из масс-листа, приведенная в Da; 5Mw - разница значений молекулярной массы предполагаемого полипептида и величиной m/z образуемого им пика, округленная до целого значения; Na/a (number of amino acids) - количество аминокислотных остатков в полипептиде; St. 1 (strain 1) - наличие данного полипептида в протеоме штамма P. digitatum PHI26/CECT 20796; St. 2 (strain 2) - наличие данного полипептида в протеоме штамма P. digitatum Pd1/CECT 207950.
Таблица 2
Первичная структура спектрообразующих пелипептидов P. digitatum
№ Аминокислотная последовательность в коде FASTA
Pdp1 GEVLWSGFFNASATVADFDKCG
Pdp1p MRSLAWLVSLPMVADAGEVLWSGFFNASATVADFDKCG
Pdp2 CTFLSLPGSILEAYNRLKKDGKP
Pdp2p MHTTRAVALNFLEMTLCCTFLSLPGSILEAYNRLKKDGKP
Pdp3 LDLMDSRPDLHHIPARPEATAVPRP
Pdp3p MHLYYLLIIRISVLGQCLDLMDSRPDLHHIPARPEATAVPRP
Pdp4 MAGGVQMGPCQVIAGSQCGFLLDEASVLD
Pdp5 MTSQAVAGHSALHKFQVPTAVQPLPATSQ
Pdp6 MYTLGGVLVLDAHNDLKHCSRFLDFAGLVV
Pdp7 TKESEVDEDESEEDFQKRVEEAVQNMKL
Pdp7p MILWVLYPLTFCVTTLNTKESEVDEDESEEDFQKRVEEAVQNMKL
Pdp8 MVELSTLLAGSGCPKNLGEPILCDFGSAVMGDE
Pdp9 MQKSEHLHGFLPGMCMMLRKESISRLLCV
Pdp10 MYSDHRGTGEVRSPYLFVYHSPGCWRIGN
Pdp11 MVGVPHSKGCSLCRERRIKVNVNSHGKIELSK
Pdp12 MVLGVQRRDEGLNWSGYKYFNWRGRVRGAGFL
Pdp13 MKPTDKHFRCDVCQRAFTRIDHLKRHSLRRM
Pdp14 MIHMLCAKLITRLDSHDGSSKSLDRGLGRPMSLILPRSK
Pdp15 MSNSGQVLSGLEDTQITMNSPPQFPINIMPETWDIVKKVEEDTVS
Pdp16 MQRLVHAQTDQAISAPLSPRCQVAAPGSRALTTAPPFWPDVELGGRFGAGPFS
Pdp17 MRWESKGIETFWRGAHFARLSHVALFFSFLVIFRVEIEVKGRYWRVKW
Pdp18 MKPDSSSIGSLPVKILCFVFHLLGPFGLVSINQTSSKFHKRVQPQRTHFTVEVA
Pdp19 MCMKAICSTCNKVTWWGCGSHISSVLDSIPEGEWCSCTPQVEKDGKKYPPKA ARAG
Pdp20 MDNVFSNGHGSLLMGTLRSPPLFQLSRAMKRMSAETWGRRSYNTGRTAKIG VCVV
Pdp21 MNSVHRANVAAYASNSPRTPSRGPARGFYQCGVCKKDYGRADHLIRHVRSR MLLG
Pdp22 MRSFGVEIPGERGILSKLSLKQRAGVCSSLGVRVSTSKFAVTCTYYRSTTYRTRE RVLK
Pdp23 MCSLGVWAGAIPIQKVWGLRGILSPSGTLHSELQRHGCLDHIACSSDPATGYAL RAHFELQIG
Pdp24 MIPKIQRQETFPSIDISAIGGVSFNRLHEKGRVKKEIETFATSLYEIDHIIDIKSIDSGS
Pdp25 MISHLSETNSLTVRETDEAGNPTATYVYSGDVASSITSSKTPAGRVDVIVGIPVN VLGYLPNTSE
Pdp26 MGFDRGLGALTFPYYHTLPTPIFLSHIVLFHTEPDTYDHRVWKTGLPVRSAVLK PHILHSQ
Pdp27 MNPDSRSQPREEQSPGSLNCNRGRIRALIQTSDGERHYFSGTVSTDLCLMVNNA QPAPSPAPLEYL
Pdp28a MGGGGKIPYPKEVWSPSGGWYAQPANWRANTAIMGAFVIGVAAVAFSISADRE HRDKMPEPGRFFPSR
Pdp28b MYWVPYPQAGGCTGGSGANFFLAMTGTQKRVAMSGLELNWLLRNVYRSIDES VDVSLTGRKQLPLLI
Pdp29 MADNVPVGMLCSHQDDLERVSAKQDQKVHPESAPLDVDENEKHKREVAPDGG YGWVCVACVFWINAA
Pdp30 MPRYKEGDKVSYKPVGGAQSRTSKSVGLILETLGGRSSSDDEPRYKIENMHTHK SSSIKEGNIEGPAE
Pdp31 MPVIPESSDFPSAPHKEGNEAEKKPGQQLPKATATDFLSKGPQIPDNMPPKASK EELEARAKELNKSAN
Pdp32 MAGPSKSLILDPALQKYYELNANRYKYWRWTPRQARISFVYMALIPGILGYFAYK YEGKFELRGKRRGDTISE
Индексом «p» обозначены пептиды - предшественники.
В результате анализа для всех пиков масс-спектра удалось найти соответствующие полипептиды. Предположительно, два пептида с массами 2322 Da и 2805 Da (Pdpl и Pdp3) при ионизации образуют несколько типов ионов, что отражено в масс-спектре в виде нескольких пиков. Напротив, пик с m/z равном 7378,745 может быть образован двумя пептидами со сходными характеристиками, которые в таблицах отмечены Pdp28a и Pdp28b. Среди всех обнаруженных полипептидов до сих пор ни один не имеет ранее установленного функционального предназначения. Пептиды Pdpl, Pdp2, Pdp3 и Pdp7 предположительно формируются в результате протеолиза более крупных предшественников (пропептидов), последовательности которых также приведены в таблице 2. Компоненты Pdp2, Pdp17, Pdp18, Ppd28a и Pdp32 способны встраиваться в билипидную мембрану. Среди изученных полипептидов и белков 13 представителей (Pdp6, Pdp8 - 12, Pdp17, Pdp20, Pdp22, Pdp25, Pdp26, Pdp28b) являются уникальными для P. digitatum и не имеют близких гомологов у других микромицетов; 9 представителей (Pdp5, Pdp13, Pdp15, Pdp16, Pdp18, Pdp23, Pdp24, Pdp27, Pdp29) у других микромицетов, как правило, имеют гомологи в виде фрагментов в составе более крупных белков.
Пептид Pdpl имеет предшественника массой 4064 Da, состоящего из 38 аминокислот. При перекрытии не менее 89% и идентичности последовательностей не менее 60% сходные пропептиды удалось выявить у других представителей рода Penicillium (P. expansum, P. itallicum, P. chrysogenum, P. freii, P. camambertii, P. arisonense, P. nordicum, P. griseofulvum, P. oxalicum), а также у Aspergillus versicolor, A. udagawae, Sistotremastrum niveocremeum, S. suecicum. У некоторых грибов (Sphaerobolus stellatus и Exidia glandulosa) сходные пропептиды известны, как «углевод-связывающие модули белков семейства 1».
Пептид Pdp2 имеет предшественника массой 4484 Da, состоящего из 40 аминокислот. При перекрытии не менее 95% и идентичности последовательностей не менее 66% сходные пропептиды удалось обнаружить у других представителей рода Penicillium (P expansum, P. chrysogenum, P. rubens, P. camambertii) и Aspergillus (A. bombycis и A. sydowii). У P camambertii сходный про-пептид - цинковый «палец» CCHC-типа.
Пептид Pdp3 имеет предшественника массой 4823 Da, состоящего из 42 аминокислот. При перекрытии не менее 92% и идентичности последовательностей не менее 75% сходный пропептид смогли определить у P chrysogenum. Близкие по строению пептиды, возникающие в результате протеолиза, встречаются у других представителей рода Penicillium (P. rubens, P. camambertii, P. italicum, P. roqueforti, P. freii, P. expansum, P. nordicum, P. brasilianum, P. arizonense), а также рода Aspergillus (A. ruber, A. ochraceoroseus, A. rambellii) - перекрытие не менее 80%, идентичность не менее 60%.
Пептид Pdp4 имеет гомологи у других представителей рода Penicillium (P. rubens, P. camamberti, P. expansum, P. itallicum, P. roqueforti) при перекрытии 100% и идентичности последовательностей не менее 87%.
Пептид Pdp5. Отчасти сходные пептиды имеются в протеоме других представителей рода Penicillium, но их характеризуют меньшими величинами перекрытия
и идентичности, чем заданные пороговые значения.
Пептид Pdp7 имеет предшественника массой 5352 Da, состоящего из 45 аминокислот. Данный пропептид для P. digitatum является уникальным, а зрелый пептид (при перекрытии не менее 96% и идентичности не менее 62%) имеет аналоги у некоторых представителей рода Pénicillium (P. camamberti, P. roqueforti, P. rubens) и Aspergillus (A. glaucus, A. fumigatus, A. udagawae, A. zonatus). У P camamberti данный пептид сходен с участком последовательности белка из 206 аминокислот, несущего мотив типа TonB.
Пептид Pdp13 имеет цинковый «палец» типа C2H2. Сходных пептидов близкой длины цепи у других ми-кромицетов не выявили; данная последовательность гомологична участкам цепи некоторых белков, также несущих цинковый «палец» и ДНК-связывающий домен, но обладающих гораздо более длинной цепью аминокислот (свыше 600 остатков). Такие белки обнаружили у представителей родов Penicillium, Talaromyces, Aspergillus, Byssochlamys, Rasamsonia, Emmonsia, Paracoccidioides, Blastomyces, Histoplasma. Многих из них относят к регуляторам транскрипции.
Пептид Pdp14 при перекрытии 100% и идентичности 87% сходен с гипотетическим пептидом PITC из 42 аминокислот, который продуцирует P italicum.
Пептид Pdp15. Сходных пептидов у других микро-мицетов найти не удалось, однако наблюдали похожие участки в последовательностях белков у P expansum, P. chrysogenum и P. itallicum. Белки этих грибов более длинные (свыше 200 аминокислот), их функции не установлены.
Белок Pdp16 гомологичен фрагменту белка из 811 аминокислот у P. rubens.
Белок Pdp18. Сходных белков у других микроми-цетов установить не удалось, близкие фрагменты имеются в структуре более крупных белков из нескольких сотен остатков, которые известны в протеоме других Penicillium spp., в том числе - ГТФазная (SRP54) субъединица сигнал-распознающей частицы у P camamberti.
Белок Pdp19 при перекрытии не менее 89% и идентичности последовательностей не менее 60% имеет гомологи у широкого круга грибов, в том числе представителей родов Penicillium, Aspergillus, Phialocephala, Pestalotiopsis, Marssonina, Talaromyces, Trichoderma, Cordyceps, Lepidopterella, Fusarium, Dothistroma, Stachybotrys, Isaria, Pyrenophora, Ophiocordyceps, Glonium, Thermothelomyces, Cenococcum, Beauveria, Paraphaeosphaeria, Oidiodendron, Thielavia, Verticillium, Acidomyces, Colletotrichum и Magnaporthe. У P. camamberti сходный белок является железо- и серосвя-зывающим сайтом ферредоксина типа 2Fe-2S.
Белок Pdp21, несущий цинковый «палец» типа C2H2, сходен с белком, несущим цинковый «палец», у P. itallicum (перекрытие - 100%, идентичность - 75%). Сходный фрагмент есть в структуре неопределенного белка у P rubens, состоящего из 204 аминокислот.
Белок Pdp23 в виде самостоятельной последовательности имеется только у P. digitatum. У других микромицетов (родов Penicillium, Pseudogymnoascus, Aspergillus, Metarhizium, Pochonia, Talaromyces, Purpureocillium и Colletotrichum) сходные последовательности (с перекрытием до 98% и идентичностью до 60%) входят в структуру различных гидролитических ферментов. Среди таких ферментов - пептидазы, ги-
дролазы ^карбиноламин^-аминокислот, ß-аланин-синтаза, амидазы (гидантоиназа, карбамоилаза).
Белок Pdp24 в виде самостоятельной последовательности имеется только у P. digitatum. У других представителей рода Penicillium сходные последовательности (с перекрытием до 91% и идентичностью до 71%) входят в структуру РНК-зависимой ДНК-полимеразы P camemberti и белка неуточненной функции у P freii.
Белок Pdp26. Сходные последовательности у штаммов P digitatum входят в состав L-лизин^З-аминомутаз (107-119 аминокислот), у других микро-мицетов достаточно близкие (с учетом установленных показателей) последовательности в виде отдельных белков или в составе более крупных полипептидов не обнаружили.
Белок Pdp27 в виде самостоятельной последовательности имеется только у P digitatum. Найдены гомологичные участки в составе белее крупных белков (137 остатков) у других представителей рода Penicillium, но их функции неизвестны.
Белки Pdp28a и Pdp28b в формировании пика, как было указано выше, являются альтернативными. Pdp28a, по-видимому, относится к весьма консервативным, поскольку с перекрытием не менее 95% и идентичностью не менее 69% сходные последовательности нашли у представителей 56 родов аскомицетов. Однако функции этих белков неизвестны. Для Pdp28b гомологов у других микромицетов выявить не удалось.
Белок Pdp29 в виде самостоятельной последовательности имеется только у P. digitatum. Найдены гомологичные участки в составе белее крупных транспортных белков (более 500 остатков) у других представителей рода Penicillium (перекрытие не менее 98%, идентичность не менее 75%).
Белок Pdp30 несет домен DUF2945 (домен неизвестной функции). Сходные белки при перекрытии последовательности 100% и идентичности не менее 63% нашли у P expansum, P. nordicum, P. camemberti, P. roqueforti, P. rubens, P. arizonense.
Белок Pdp31 при перекрытии не менее 95% и идентичности последовательностей не менее 61% имеет гомологи у других представителей рода Penicillium (P griseofulvum, P. rubens, P. freii, P. expansum, P. nordicum, P. roqueforti, P. brasilianum, P. oxalicum, P. arizonense) и Aspergillus (A. flavus, A. clavatus, A. nidulans, A. sydowii, A. versicolor). У P. italicum сходная последовательность входит в состав белка, участвующего в репарации ДНК (1038 аминокислот).
Белок Pdp32 несет домен NDUF_B4 (домен субъединицы В15 НАДФ-убиквитин-оксидоредуктазы). Сходные белки при перекрытии последовательности 91% и идентичности не менее 67% нашли у представителей родов Penicillium, Aspergillus, Talaromyces, Byssochlamys, Emmonsia, Blastomyces, Paracoccidioides, Coccidioides, Histoplasma, Arthroderma, Trichophyton.
Pdp6, Pdp9, Pdp20 и Pdp28b не имеют достаточно близких структурных гомологов не только среди белков грибов, но и других живых организмов. В отношении Pdp8 следует заметить, что удалось найти некоторые значительно более крупные белки, перекрывающие своими сходными фрагментами последовательность Pdp8 на ~60%. После некоторой корректировки перечня найденных белков с удалением отдельных
гомологов, «выпадающих» из общего ряда по особенностям структуры, обнаружили общий для них мотив в аминокислотной последовательности, который имеет следующий вид (неидентичные участки отмечены знаком «-» по числу различающихся остатков, которое обозначено нижним индексом, где «v» - вариабельное):
EEE(-)9Y-P-RIGE(-)5YQ-VGKLG-G(-)2ST-WLARD(-)v V-LK(-)8G(-)5EL(-)2Y(-)vH-G(-)3VR-LLD-F(-)3GP(-)3 H-CLVH-PL(-)2S(-)3FL-RNP(-)3LP(-)7L(-)3AL(-)3H-EC(-)3HT(-)2K-DNI(-)5D-S(-)4FE(-)2E(-)3P-PRK(-)vR(-)2 Y-S(-)2L(-)2P(-)3G-P-LCDF-S(-)3GD(-)7QP(-)2YR-P-VIL(-)2PW-Y(-)2D-WN(-)2C(-)vW(-)3EG(-)3F(-)3DPE(-)3
YRSRAHLA(-)4LL.
Белки, обладающие такой структурной особенностью, оказались протеинкиназами некоторых классов из P. chrysogenum, P. camemberti, P. roqueforti, Madurella mycetomatis, Coniochaeta ligniaria, Acremonium chrysogenum, Histoplasma capsulatum, Pochonia chlamydosporia, а также гипотетическими белками неясной функции из P. vulpinum, Penicilliopsis zonata, A. wentii и Pseudogymnoascus sp.
Пептид Pdp10 имеет общий короткий мотив с белками пенициллов (P. italicum, P. flavigenum, P. roqueforti и P. nalgiovense): Y-D(-)3TGEV-SPYLFVYH(-)2G. Притом у P roqueforti и P italicum такие гомологи являются ААА-доменами АТФаз. Pdp11 отделенные гомологи перекрывают сходными регионами немногим более чем на 50%; гомологичные белки, по большей части, неуточненной функции, отдельные представители Zn-зависимые ДНК-связывающие белки - факторы транскрипции грибов рода Aspergillus и Penicillium, но единого общего аминокислотного мотива представители этой группы не имеют. Pdp12 и гипотетический белок P rubens из 216 аминокислот имеют общий мотив MVLGV-RR-EGLNWSGY-YF-WRGRVRG. Пептид Pdp17 и крупные белки (свыше 470 остатков) других пенициллов (P nordicum, P. camemberti, P. rubens), один из которых является сахарозно-протонным-симпорте-ром, несут довольно условный мотив вида G-E(-)2W(-)4 FA-LS(-)4F-SFL(-)4V-I-VKGR-W(-)3W.
Мотив V(-)2P-E(-)2ILSK(-)2LK(-)4V(-)2S-GVR(-)2T(-)2 F(-)2TCTYY(-)3T(-)6V-K является общим для пептида Pdp22 и белка из 80 аминокислот, открытого у P. polonicum. Для Pdp25 найдены лишь отдаленные гомологи у Penicillium spp. и Aspergillus spp., сходство с которыми выражается меньшими величинами идентичности и перекрытия, чем установленные в дизайне исследования; эти белки состоят, в среднем, примерно из 500 аминокислот, практически не имеют общих для всей подборки аминокислотных остатков, некоторые из них авторами отмечены, как обладатели домена неизвестной функции DUF647, а также члены семейства трансмембранных белков RUS1.
Результаты реконструкции третичной структуры выявленных полипептидов, по данным ресурса Swiss-Model, представлены на рисунке 2 и в таблице 3, а для тех полипептидов, структуру которых моделировали в RaptorX, итоги реконструкции показаны на рисунке 3 и в таблице 4. В целом, у анализируемых полипептидов полученные модели характеризуются относительно низкими показателями точности, исключая Pdp2p, Pdp13 и Pdp27. У моделей, построенных в RaptorX, обращает внимание достаточно небольшой показатель P-уровня, но при этом у Pdp6 и Pdp14 опти-
мальное для коротких последовательностей значение GDT (ненормализованный общий тест дистанции, в данном случае более 50).
Pdplp
Pdp2p
Pdp7p
<!$ сД
РОрВ
PdpH
Pdp12
Pdp13
Pdp15
Pdp16
Pdp17*
Pdp18
Pdp20
Pdp21
Pdp19*
Pdp22
¿V
Pdp23
Pdp24
Pdp25
tyt v,
Pdp26 Pdp27 Pdp28a
Pdp2Sb
Pdp30
Pdp31
Pdp32
Рис. 2. Третичная структура спектрообразующих белков и пептидов P. digitatum 1 по данным Swiss-Model. Знаком «*» отмечены полипептиды, для которых модель удалось построить не для всей цепи.
Таблица 3
Модели, использованные для воссоздания вероятной пространственной конформации спектрообразующих полипептидов Р. МдИвЫт
Таблица 4
Характеристики моделей спектрообразующих полипептидов P. digitatum, построенных с помощью ресурса RaptorX
Pdps Белок-«шаблон», его происхождение и номер. QMEAN Seq.Id.
Pdp32 Субъединица 4А субкомплекса 1р НАДН-убихинон-дегидрогеназы респираторного суперкомплекса I1III2IV1 млекопитающих. Шаблон № 5qup.40. -3,07 26,00%
Pdp31 Спиральный домен фактора сплайсинга пре-мРНК SF1 из мышиных эмбриональных фибробластов линии NIH 3T3. Шаблон № 4fxx.1. -1,93 26,92%
Pdp30 Гипотетический белок CNAG_02591 из Cryptococcusneoformans. Шаблон № 4p5n.1. -1,80 15,38%
Pdp29 Невозможно построить модель.
Pdp28b Гликозилированная бифункциональная нукле-аза TBN1 из томата. Шаблон № 3snq.1. -1,25 36,67%
Pdp28a Субъединица SecE транслоказы белков Escherichia coli. Шаблон № 5abb.1. -3,21 10,00%
Pdp27 Кальциевый переносчик из митохондрий человека. Шаблон № 5kuq.1. 0,59 32,35%
Pdp26 Белок М130, обогащенный цистеином — корецептор мембранного белка CD163 свиньи. Шаблон № 5hrj.1. -3,48 8,57%
Pdp25 Гликозидгидролаза семейства 9 (целлюлаза CbhA) из Clostridium thermocellum. Шаблон № 3k4z.1. -2,25 30,00%
Pdp24 CRISPR-ассоциированная эндорибонуклеаза C2c2 из Leptotrichia shahii. Шаблон № 5wtj.1. -1,23 32,50%
Pdp23 Р-аланин-синтаза из Saccharomyces kluyveri. Шаблон № 1r43.1. 0,31 26,47%
Pdp22 5,10-метилтетрагидрофолатредуктаза из E. coli. Шаблон № 1zp3.1. -0,83 27,27%
Pdp21 ДНК-связывающий димеризующийся белок мыши, несущий «цинковый палец». Шаблон № 1f2i.1. -2,34 32,35%
Pdp20 Домен PU.1 фактора транскрипции семейства Ets мыши. Шаблон № 1pue.1. -3,53 21,21%
Pdp19* Белок задержки роста 2 мыши. Шаблон № 1v5r.1. -2,81 19,05%
Pdp18 F-домен 4 (распознающий) из комплекса убиквитин-лигазы SCF(Fbx4) человека. Шаблон № 3l2o.1. -2,37 20,00%
Pdp17* Синтетический р-складчатый белок OR485 искусственного происхождения. Шаблон № 5kph.1. 1,57 46,67%
Pdp16 Паркин (белок, стабилизирующий Е3 убикви-тин-протеин-лигазу) крысы. Шаблон № 4k95.1. -2,01 24,24%
Pdp15 Никотинат-фосфорибозилтрансфераза из Enterococcus faecalis. Шаблон № 2f7f.1. -0,53 15,63%
Pdp14 Невозможно построить модель.
Pdp13 Крюппель-подобный фактор 5 человека. Шаблон № 2ebt.1. -1,71 43,33%
Pdp12* Белок Crybq3 мыши, несущий домен р/у-кристаллина. Шаблон № 4fd9.1. -3,59 27,78%
Pdp11* ДНК-связывающий белок GAL4 из Saccharomyces cerevisiae. Шаблон № 1aw6.1. -3,36 16,67%
Pdp8* 4-оксалокротонат-декарбоксилаза NahK из Pseudomonas putida. Шаблон № 5d2f.1. -1,37 33,33%
Pdp7p Субъединица F АТФ-синтазы типа V из Thermus thermophilus. Шаблон № 5qar.1. -1,64 7,14%
Pdp6 Невозможно построить модель.
Pdp3p Невозможно построить модель.
Pdp2p Гликопротеин Е2 коронавируса SARS. Шаблон № 2bez.1. -0,86 31,25%
Pdp1p Белок-репрессор оперона устойчивости к мышьяку из Bacteroides vulgatus. Шаблон № 3ktb.1. -0,51 21,43%
Pdps Показатели точности моделирования Белковый «шаблон»
Pdp29 Р-уровень=4,36е-02 uGDT=18 GDT=27 uSeqId=4 SeqId=6 Score=19 Переносчик дофамина Drosophila melanogaster. Шаблон № 4xp4:A.
Pdp14 Р-уровень=3,33е-02 uGDT=20 GDT=52 uSeqId=7 SeqId=18 Score=17 Комплекс (гетеродимер) ДНК-связывающих теломер-ных белков а и ß из Sterkiella (Oxytricha) nova. Шаблон № 2i0qB.
Pdp6 Р-уровень=1,93е-02 uGDT=24 GDT=81 uSeqId=7 SeqId=23 Score=16 Цистатионин-у-синтаза E. coli. Шаблон № 1cs1A.
Pdp3p Р-уровень=3,27е-02 uGDT=17 GDT=42 uSeqId=8 SeqId=19 Score=18 АТФ-зависимая рестриктаза-ДНК-модифицирующий белок LlaBIII (типа ISP) Lactococcus lactis. Шаблон № 4xqkA.
Условные обозначения: Pdps - спектрообразующие полипептиды P. digitatum; звездочкой (*) отмечены те Pdp, у которых найденный «шаблон» отличается низким сходством с анализируемой последовательностью; QMEAN -показатель качества моделирования в ресурсе Swiss-Model; Seq. Id. - сходство анализируемой последовательности Pdp и белка-«шаблона».
Рис. 3. Третичная структура спектрообразующих белков и пептидов Р. ШдКа^т 1 по данным Кар1:огХ.
Поиск функциональной принадлежности выявленных белков и пептидов с использованием биоинформационных ресурсов оказался мало результативным. Ресурс ШегРго не позволил установить дополнительные данные о биологических свойствах и
клеточной локализации. В базе STRING 10.5 для представителей рода Penicillium межбелковые взаимодействия приведены только для штаммов P. chrysogenum (P notatum) Wisconsin 54-1255 и P marneffei ATCC 18224. Среди белков второго из указанных видов ранее проведенный поиск гомологов не выявил совпадений, а некоторым белкам и пептидам P chrysogenum гомологичны Pdpl, Pdp2, Pdp3 и Pdp15. Тем не менее, для близких полипептидов P. chrysogenum межбелковые взаимодействия, как выяснилось, еще неизвестны.
ЗАКЛЮЧЕНИЕ
В результате проведенного исследования анализируемый масс-спектр фракции протеома удалось аннотировать полностью, однако для большинства слагающих его пептидов и низкомолекулярных белков еще не установлена четкая функциональная принадлежность. Значительная доля компонентов явилась консервативной и, как оказалось, представлена полипептидами, сходными как у представителей семейства Trichocomaceae (рода Penicillium, Aspergillus, Talaromyces, Byssochlamis), так и у представителей других таксонов аскомицетов.
Заметим, что наиболее стабильной третичной структурой обладают белки, состоящие примерно из n*100 аминокислотных остатков. Относительно короткие последовательности, выявленные в данном анализе, обладают весьма подвижной пространственной конформацией (особенно в растворе), которую трудно рассматривать как истинную третичную структуру. Тем не менее, ее реконструкция представляет определенный интерес, поскольку взаимодействия типа «субстрат-фермент» и «лиганд-рецептор», а также «эпитоп (антигена)-паратоп (антитела)» требуют от низкомоле-
кулярного вещества-участника находится в специфичной для данного взаимодействия пространственной конфигурации.
В дальнейшем представляет интерес исследование антигенных и аллергенных свойств данных веществ при конъюгировании с адъювантом, а также выявление перекрестных реакций антител типа IgE и других классов, полученных в ответ на введение таких аллергенов, с аллергенами (антигенами) других микромице-тов и антигенами немикробной природы.
Помимо прикладного исследования, представляет интерес вопрос о биологической функции выявленных полипептидов и их клеточной топологии. Многие обнаруженные полипептиды гомологичны последовательностям в структурах белков более крупного размера. Неясно, следует ли данный феномен расценивать как возникшие в эволюции P. digitatum мутации, которые привели к укорочению кодирующей области более протяженных предковых генов. Ответить на данные вопросы станет возможным только после сравнительного исследования регионов генома P digitatum и других микромицетов, с компонентами протеома у которых удалось найти сходства.
За предоставление штамма для исследования выражаем благодарность врачам-бактериологам В.В. Шаба-новой и А.Н. Рукиной (центральная клинико-диагностическая лаборатория, научное отделение профилактики и лечения раневой инфекции РНИИТО им. Р.Р. Вредена).
Работа поддержана в рамках НИР по Государственному заданию Минздрава РФ «Молекулярные предикторы развития микозов и микоаллерго-зов различного генеза на основе иммунопатогенеза» (№АААА-А16-116042010012-0).
ЛИТЕРАТУРА
1.
Marcet-Houben M., et al. Genome sequence of the necrotrophic fungus Penicillium digitatum, the main postharvest pathogen of citrus. BMC Genomics. 2012; 13.
Dhanasekaran D., Thajuddin N., Panneerselvam A. Antimicrobials: synthetic and natural compounds. CRC Press, 2015: 524 p. Oshikata C., et al. Fatal pneumonia caused by Penicillium digitatum: a case report. BMC Pulm. Med. 2013; 13. Riabinin I.A., Vasilyeva N.V., Bogomolova T.S., et al. MALDI-TOF-mass-spectrometry of protein extracts for ascertainment of phylogenetic relationships between clinical isolates of Aspergillus fumigatus and A. niger. 6th Advances Against Aspergillosis. 2014: 119-120.
Riabinin I.A. Polypeptides from Aspergillus spp. forming mass-spectra during MALDI-TOF-mass-spectrometry// Wu Lien-Teh Forum. The 3rd China-Russian International Conference on Microbiology, Immunology and Related Diseases (CRICMID 2016). 2016: 36-38.
Biasini M., Bienert S., Waterhouse A., et al. SWISS-MODEL: modelling protein tertiary and quaternary structure using evolutionary information. Nucleic Acids Research. 2014; 42 (W1): 252-258.
Kiefer F., Arnold K., Künzli M., et al. The SWISS-MODEL repository and associated resources. Nucleic Acids Research. 2009; 37: D387- D392.
Guex N., Peitsch M.C., Schwede T. Automated comparative protein structure modeling with SWISS-MODEL and Swiss-PdbViewer: a historical perspective. Electrophoresis. 2009; 30 (1): 162-173.
Ma J., Wang S., Zhao F., Xu J. Protein threading using context-specific alignment potential. Bioinformatics. 2013; 29 (13): 257265.
10. KällbergM., WangH., WangS., et al. Template-based protein structure modeling using the RaptorX web server. Nature Protocols. 2012; 7 (8): 1511-1522.
11. SWISS-MODEL Help [Electronic resource]. - 2017. https://swissmodel.expasy.org/docs/help.
12. RaptorX Docs [Electronic resource]. - 2017. http://raptorx.uchicago.edu/documentation/.
Поступила в редакцию журнала 21.08.2017 Рецензент: Е.Р. Рауш
5.
6.
7.
8.
9.