УДК 577.217
МЕТОД МОЛЕКУЛЯРНОГО ДОКІНГУ ЗА УЧАСТЮ ЯН2-ДОМЕНІВ
В. В. ГУРМАЧ, О. М. БАЛИНСЬКИЙ, М. О. ПЛАТОНОВ,
П. О. БОРИСКО, Ю. І. ПРИЛУЦЬКИЙ
Київський національний університет імені Тараса Шевченка E-mail: [email protected]
Отримано 11.11.2011
Створення новітніх фармацевтичних препаратів для лікування хвороб, пов’язаних з порушеннями функціону ван ня про теїно вих комп лексів, є важ ли вою ме ди ко-соціаль ною проб ле мою, яка пот ре -бує комплексного підходу до її вирішення, зокрема врахування останніх досягнень в галузі комп’ютерного моделювання біологічних процесів.
В огляді узагальнено дані літератури щодо структури, функціонування, класифікації, молекулярних порушень доменів SH2 (Src Homology), а також подано характеристику методу молекулярного докінгу, як одного з найперспективніших методів фармакологічних досліджень. Показано, що найбільший інтерес з погляду практичного застосування для отримання нових патентоспроможних інгібіторів протеїн-протеїнових взаємодій методом молекулярного докінгу становлять саме S^-до-мени, оскільки вони беруть активну участь у внутрішньоклітинній передачі сигналів, виступаючи як по се ред ни ки цих спе цифічних взаємодій.
Ключові слова: протеїнові комплекси, S^-домени, молекулярний докінг.
Біологічні процеси у живих системах відбуваються за участю великого різноманіття протеїнових молекул, які функціонують завдяки взаємодії одна з одною у складі стабільних або динамічних протеїнових комплексів. Кількість і різноманітність протеїнових взаємодій настільки велика, що графічне по дан ня їх має виг ляд надз ви чай -но складної і заплутаної мережі [1-7]. А відтак знання просторової структури комплексів клітинних протеїнів та їхніх лігандів є важливим кроком на шляху до розуміння механізмів їх функціонування.
У наш час методи комп’ютерного моделювання слугують невід’ємною частиною фундаментальних досліджень, метою яких, зокрема в біології, є з’ясування молекулярних ме ханізмів функціону ван ня про теїнів. Метод молекулярного моделювання, який дає змо гу відна хо ди ти комп лек си ліган ду та протеїну-мішені, називається молекулярним докінгом (МД). Саме за його допомогою створю ють бібліоте ки інгібіторів про теїн-про -теїнових взаємодій на прикладі 8Н2-, 8Н3-, PDZ-, бромо-, хромо-доменів і т. д [8].
Найменш дослідженими серед них є 8Н2-домени. Вони беруть активну участь у внутрішнь оклітинній сиг налізації, віді -гра ють важ ли ву роль в он то ге незі як по се -
редни ки спе цифічних про теїн-про теїно вих взаємодій. Нап рик лад, шля хом бло ку ван ня 8Н2-доменів пригнічується прогресування злоякісних пухлин, модулюється передача сиг налів на клітин но му та ор ган но му рівнях.
Метою цієї роботи є узагальнення даних літератури щодо комп’ютерних методів вивчення поведінки вН2-доменів, як важливого фак то ра внутрішнь оклітин но го функціону -вання, та взаємодії їх із речовинами, які модулюють активність і характеристики цих мо ле ку ляр них комп лексів, для ство рен ня унікального алгоритму дослідження 8Н2-до-менів з використанням МД, що уможливлює його подальше застосування для передбачення мож ли вих внутрішнь оклітин них по ру -шень, пов’язаних з дією вН2-доменів, та їх терапевтичного усунення.
Молекулярний докінг
Зв’язки між протеїнами, нуклеїновими кислотами, вуглеводами та ліпідами відіграють головну роль у передачі сигналів. Окрім того, взаємна орієнтація двох взаємодіючих структур впливає на тип і силу сигналу. За допомогою комп’ютерного моделювання міжмолекулярних взаємодій вдається отримати
оптимальні просторові структурні комплекси ліганду та протеїну-мішені [9]. Їх детальний аналіз дає змогу визначити основні сили, що сприяють зв’язуванню найбільш комплементарних один до одного частин молекул. Як наслідок, існує можливість цілеспрямовано впливати на характеристики такого зв’язування модифікацією однієї або декількох взаємодіючих молекул. Головним результатом МД-розрахунку є визначення оп ти маль ної взаємної прос то ро вої орієнтації ліганду/протеїну та протеїну-мішені [10] (рис. 1).
Рис. 1. Схематичне зображення взаємодії протеїнів А і В
МД про во дять для прог но зу ван ня міц -ності зв’язування тих чи інших молекулярних комплексів і типу вихідного сигналу, орієнтації малих молекул (можливо, певного фармацевтичного препарату) під час взаємодії з протеїном-мішенню, щоб отримати необхідну інформацію про силу зв’язування та їхню функціональну активність. Отже, цей ме тод є перс пек тив ним для роз роб лен ня лікарських препаратів [11]. Виходячи з цього значні зусилля наразі спрямовані на вдосконалення чисельних методів МД з метою передбачення міжмолекулярних взаємодій. Розглянемо два основних методи МД, які зарекомендували себе якнайкраще, — гнучкий докінг та жорсткий докінг.
Метод жорсткого докінгу не враховує конформаційну рухливість як для протеїну, так і для ліганду. У цьому разі завдання докін-гу зво дить ся до по шу ку оп ти маль ної орієн -тації ліганду (в конкретній конформації) у сайті зв’язування протеїну [12]. З погляду обчислення цей метод є простим [13-15], однак досліджен ня кон фор маційно-рух ли вих лігандів за ним провести складно. Зазвичай жорсткий докінг ви ко рис то ву ють для оці -нювання енергії конкретного молекулярного комплексу [16-18].
Гнуч кий докінг вра хо вує кон фор маційну рухливість ліганду. По суті, він зводиться до автоматичного перебирання конформацій та орієнтацій ліганду в сайті зв’язування і оцінювання енергії міжмолекулярних вза-ємо дій. Ру хи вклю ча ють транс фор мацію жорстко го тіла ліган ду, по во ро ти, зміну йо -го внутрішньої структури і торсійного кута. Кожен рух у конформаційному просторі ліганду зумовлює зміну енергії в системі й після кожного такого руху потрібно ще раз обчислювати її загальну енергію. Головною перевагою цього методу є те, що він моделює процеси, наближені до реальності, тобто ті, які відбу ва ють ся за міжмо ле ку ляр них взаємодій. Недоліком його є те, що він потребує тривалого часу для розрахунків.
Ви ко рис тан ня МД є не мож ли вим без зас -то су ван ня так зва них ско ринг-функцій, за допомогою яких описують міцність зв’язування між двома молекулами. Найчастіше од на з мо ле кул — це не ве ли ка ор ганічна сполука, а друга — її біологічна мішень (рецептор, протеїн) [19]. Також скоринг-функції потрібні для вивчення взаємодії між двома різними макромолекулярними структурами, нап рик лад між дво ма про теїна ми [20] або між протеїном і лігандом, ДНК [21].
Існує три основних класи ско-ринг-функцій:
1) силове поле: сила зв’язування визна-чаєть ся су мою міжмо ле ку ляр них ван-дер-ва аль со вих та елект рос та тич них взаємодій між усіма атомами двох міжмолекулярних комплексів;
2) емпіричний: базується на підрахунку числа різних типів взаємодій між двома досліджуваними молекулами [22], зокрема кіль кості атомів ліган ду і ре цеп то ра, що контактують між собою, або комплексу доступ ної для роз чин ни ка по верхні порівня но з вільним лігандом і протеїном;
3) заснований на знанні/передбаченні: ґрунтується на статистичних спостереженнях міжмо ле ку ляр них кон тактів між 3D-структурами. Структури зазвичай беруть з 3D баз даних (наприклад, Кембри-джсь ка струк тур на ба за да них). При пус ка -ють, що близькі міжмолекулярні взаємодії між різ ни ми ато ма ми або функціональ ни ми групами виникають випадково частіше, ніж цього очікують. Як наслідок, вони роблять значний внесок у міжмолекулярне зв’язування.
Незважаючи на існування різноманітних варіантів МД, у кожному окремому випадку алгоритм проведення докінгу буде унікальним і залежатиме від структурних та функ-
ціо наль них особ ли вос тей досліджу ва них об’єктів. У класичному варіанті МД завдання ал го рит му кон фор маційно го по шу ку зво -диться до перебирання комплексів, утворених унаслідок варіацій торсійних кутів ліганду та його руху, як цілої частини, відносно нерухомої структури протеїну-мішені.
Су часні ал го рит ми МД мож на звес ти до такої простої схеми, як «ключ-замок», де потрібно знайти правильну орієнтацію ключа, який відкриває замок. Ту частина протеїну, з якою взаємодіє ліганд, розглядають як замок, а сам ліганд — як ключ. Але для проведення якісного МД потрібно враховувати рухливість як ліганду, так і протеїну, при чо му діапа зон рух ли вості мо же бу ти різним — від невеликих рухів бічних частин до масштабних доменних рухів [23]. Якщо розглядати структуру протеїну в комплексі з лігандом близького хемотипу, то результат МД буде точнішим, ніж якщо брати інший ске фолд ліган ду або вза галі ви ко рис то ву ва -ти апоформу. Це неможливо зробити в рамках схеми «ключ-замок», однак вдається за допомогою схеми «рука в рукавичці» [24].
На перший погляд логічним розв’язанням цієї проб ле ми є вра ху ван ня рух ли вості протеїну в комп’ютерній програмі, за допомогою якої проводять МД. Наявні обчислювальні засоби не дозволяють проводити таке мо де лю ван ня за прий нят ний час для ве ли -ких баз да них, оскіль ки мо ле ку ла про теїну ду же ве ли ка і вра ху ван ня її рух ли вості за всіма ступенями вільності може призвести до так званого комбінаторного вибуху (аст-ро номічно го збіль шен ня чис ла мож ли вих варіантів). Лише у деяких програмах передбачена обмежена рухливість сайтів зв’язу-ван ня про теїну (як пра ви ло, на рівні не ве ли -кої адаптації конформацій бічних частин залишків активного центру). Інший підхід полягає в МД декількох різних конформацій од но го й то го ж са мо го про теїну з нас туп ним відби ран ням найоп ти мальніших варіантів з кожного запуску МД. Ще один спосіб полягає в тому, щоб знайти універсальну структуру протеїну-мішені, за участю якої МД давав би задовільні результати для різних класів лігандів, зменшуючи при цьому кількість пропущених, але правильних розв’язків.
Отже, найбільш перспективні, але при цьому й найбільш складні, методи МД вра-хо ву ють кон фор маційну рух ливість не ли ше ліган ду, але й ре цеп то ра. На сь о годні існує низ ка роз ра хун ко вих прог рам них па кетів, у яких реалізовано ці можливості. Найпрос-ті шим чи сель ним ме то дом се ред них є гнуч -кий докінг, який дає змогу врахувати кон-
формаційну рухливість бічних ланцюгів амінокислотних послідовностей, розміщених безпосередньо в сайті зв’язування. У більшості випадків сучасні алгоритми кон фор маційно го по шу ку за ко рот кий час знаходять потрібні конформації, близькі до експериментальних. Як приклад, таке моделювання можна провести за участю 8Н2-до-менів, оскільки вони є складовою частиною майже усіх класів протеїнів і на цей час є недостатньо вивченими.
ЯИ2-домени
SH2 — компактний глобулярний домен, який взаємодіє з протеїнами, що містять фосфорильований залишок тирозину (Tyr). Здебільшого він міститься в онкопротеїнах (Src oncoprotein) та в протеїнах, які входять до сигнальних каскадів клітини. Бере участь у знаходженні інших протеїнів, розпізнаванні фос фо ти ро зи ну на їхній по верхні.
Геном людини кодує близько 120 8Н2-доменів, які входять до 110 протеїнів і бе руть ак тив ну участь у про теїн-про теїно -вих взаємодіях. Вони присутні у найрізноманітніших класах протеїнів, включаючи протеїнкінази (Src, Lck), фосфатази (SHP2, SHIP2), фосфоліпази (PLCyl), фактори транскрипції (STAT), регуляторні протеїни (SOCS), адаптери протеїнів (Grb2), структурні протеїни (SHC) та ін. Широка розповсю-дженість SH2-доменів в організмі тварин і май же пов на відсутність їх у мікро ор га ніз -мах (наприклад, примітивний SH2-фрагмент у дріжджах) дозволяє зробити припущення, що їхня поява пов’язана з ускладненням механізмів передачі сигналів у багатоклітинних організмах [25].
Саме протеїн-протеїнові взаємодії віді-гра ють важ ли ву роль у клітин но му рості та розвиткові. Вони реалізуються шляхом роз-піз на ван ня ко рот ких спе цифічних аміно -кислотних послідовностей [26]. Пептидні послідовності є індивідуальними для кожного протеїну і S^-домен, у свою чергу, відіграє роль по се ред ни ка, тоб то час ти ни, де відбу -вається зв’язування.
Що стосується структури S^-домену, то він складається з двох а-спіралей та семи в-структур (рис. 2). S^-домени мають високу спорідненість до фосфотирозину. Вони є найбільшим класом pTyr — розпізнавальних доменів [27, 28].
Функціонально S^-домени, як правило, зв’язані з ти ро зинкіна за ми про теїнів (PTK). Вони беруть активну участь у внут -ріш нь оклітинній пе ре дачі сиг налів, що
Рис. 2. S^-домен, зв’язаний із фосфотирозином
пов’язано з їхньою здатністю специфічно розпізнавати фосфотирозин. Завдяки цьому можна визначити локалізацію конкретних сайтів фосфотирозину. Цей процес має фундаментальне значення при передачі сигналів через мембрану: коли сигнал надходить у по заклітин ний простір, він конт ро люєть ся за допомогою рецепторів; потрапивши знов у клітину — контролюється структурами, які здатні розпізнати фосфотирозин. Фосфо-рилювання тирозину призводить до активації про теїн-про теїно вих взаємодій, унаслідок чого SH2-вмісні протеїни зв’язуються із фос-фотирозиновим сайтом. Оскільки цей процес є досить чутливим до будь-яких змін, він може стати причиною мутацій SH2-доменів або їхніх фрагментів (табл. 1). Здебільшого це стосується 142-169 амінокислотних залишків. Такі мутації порушують специфічні взаємодії SH2-доменів з партнерами і можуть спричинювати збої у клітинній сигналізації, впливати на зв’язування Src із субстратом, зокрема протеїнами цитосклета і тому можуть бути причиною різноманітних захворювань людини (найчастіше це онкозахворювання; таблиця) [25].
Роботи Cantley et al. відзначено як перші систематичні дослідження специфіки про-теїн-протеїнових взаємодій за участю S^-до-менів [29]. Використовуючи пептидну бібліотеку з лігандів SH2, було відібрано найбільш оптимальні структурні фрагменти для 25 SH2-доменів, які поділили на 5 груп залежно від наявності в них pD5-складки. Подальші дослідження виявили, що SH2-домени впізнають певні специфічні залишки C-кінця фосфотирозину (pTyr) +1, +2 і +3 (тобто залишки з
певною позицією після pTyr упізнаються окремим SH2-доменом). Звідси випливає, що кожен окремий S^-домен зв’язується лише з конкретними фосфотирозинвмісним фрагментом (рис. 3). Наприклад, Src SH2 переважно впізнають Glu-Glu-Ile (зв’язувальний фрагмент позначається як pYEEI), тимчасом як Grb2 S^-домен зв’язується з іншим фрагментом pYVNV. Однак повне розуміння цього ефекту потребує детального вивчення термодинамічних особливостей взаємодії фосфопеп-тидів із SH2-доменами.
Рис. 3. Варіанти зв’язування 8И2-доменів (стрічкова та поверхнева діаграми) [25]:
А — структура S^-домену, зв’язаного з pTyr-Glu-Glu-ІІе-пептидом (PDB, 1SPS). Поверхню SH2-домену показано як напівпрозору частину, а вторинні структурні елементи — голубим кольором; аА
— спіраль справа, аВ — спіраль зліва; Arg рВ5, залишок для зв’язування pTyr, показано жовтим кольором; N-кінець pTyr-пептиду (червоний колір) займає pTyr-зв’язувальну кишеню. Пептид рухається повз центральну в -частину SH2-домену; +1 і + 2 глутамати зв’язуються з поверхнею домену, а бічна частина +3 (зліва) входить у гідрофобну кишеню.
Б — Grb2 SH2 в комплексі з pYVNV (червоний колір), (PBD, 1BMB) і Trp (зелений колір) стабілізу ють кон фор мацію в-струк ту ри, кри тич -но необхідну для високоафінного зв’язування.
В — дві фосфотирозинзв’язувальні кишені подано в одному SH2-домені APS. Одна APS SH2 молекула зв’язана з pYETDpY (червоний колір) пептидом активаційної петлі INSR; pTyr-1158 взаємодіє з Arg-438 (зелений колір), Lys-455 і Lys-457 (помаранчевий колір) створюють іншу кишеню зв’язування для pTyr-1162 (PDB, 1RQQ).
Г — SH2D1A/SAP у комплексі з нефосфорильо-ваним SLAM пептидом KSLTIYAQVQK (червоний колір) (PBD, 1D4T)
Захворювання людини, пов’язані з мутаціями генів SH2-доменів
№ Наз ва S^-вмісно го протеїну Короткий опис мутацій Фенотип
1 ABL1 t(9;22) транслокація призводить до злиття з геном BCR Хронічна лейкемія, гостра лімфобластомна лейкемія
2 ABL2 t(1;12)(q25;p13) транслокація з ETV6/TEL Гостра мієлогенна лейкемія (Cazzaniga et al., 1999)
3 BLNK Заміна пари основ у місці сплайсингу призводить до зменшення або повної втрати BLNK-транскриптів Імунодефіцит людини (Minegishi et al., 1999) Попередник гострого лімфатичного лейкозу (Jumaa et al., 2003)
4 BTK Мутації сайтів сплайсингу Хвороба Брутона
5 CBL Зміни в частинах MLL-гена: t(4;11)(q21;q23) t(11;14)(q23;q32) t(11;22)(q23;q12) Гост ра мієло ген на лей кемія Гостра лейкемія Лімфома В-клітин Сар ко ма
6 CRK Вилучення з локусу MDLS, MDS, MDCR, DEL17p13.3, C17DELp13.3 частини 17p13.3 Синдром лісенцефалії Міллера-Дікера
7 ITK t(5;9)(q33;q22) транслокація в SYK Синдром лісенцефалії Міллера-Дікера
8 JAK2 t(9;12)(p24;p13) зливаються з TEL Мутації лінії клітин V617F Периферійні Т-клітинні лімфоми (Streubel et al., 2005) Гостра лімфатична лейкемія, хронічна мієло ген на лей кемія
9 JAK3 Унаслідок вставки або видалення нуклеотидів зсувається рамка зчитування або процес взагалі об ри ваєть ся Справжня поліцитемія
10 LCK Зниження експресії p56 (lck), можливо через альтернативний сплайсинг екзона 7 Іму но дефіцит, лімфо пенія (Russell et al., 1995) Гострий лейкоз Т-клітин (Burnett et al., 1991)
11 PTPN11 Унаслідок missense мутації амінокислота D61 замінюється на N-SH2, через що посилюється функціональна активність. Missense мутації у родині екзотів 7, 12 та 13 становлять 95%; мутації родини екзотів та дефекти у родині 13 впливають на протеїнові фосфатази тирозинового домена, унаслідок чого по си люєть ся функціональність Імунодефіцит (Goldman et al., 1998) Синдром Нунана (Tartaglia et al., 2001) Прогресивна кардіоміопатія (LS) (Digilio et al., 2002) Мієло мо но ци тар ний лей коз (Tartaglia et al., 2003)
12 SH2D1A Мутації, пов’язані з неправильним функціонуванням протеїну Хвороба Брутона
13 STAT1 Унаслідок нуклеотидних замін передчасно генерується стоп-кодон Зростає уразливість до вірусних і бактеріальних захворювань
14 STATT5B Гомозиготні мутації A630P Імунодефіцит
В роботі [25] автори проаналізували специфіку 8Н2-доменів з точки зору сайта зв’язу ван ня із фос фо ти ро зи но вим за лиш -ком. Ці результати розширюють уявлення щодо взаємодії 8Н2-доменів, але вони є обмеженими, оскільки розрахувати вільну енергію для 8Н2-доменів — надзвичайно складне завдання. Складнощі в обчисленнях та кож зу мов лені ве ли кою кількістю елект -ростатичних взаємодій, що виникають під час зв’язування, і значною гнучкістю лігандів. Підходи до розрахунку вільної енергії
зв’язування з використанням термодинамічної схеми відірваності ліганду від свого се ре до ви ща у ць о му разі є не доціль ни ми. Навіть мала статистична похибка у розра-хун ку віль ної енергії ліган ду знач но пе ре ви -щує її експериментальне значення.
Для здійснення вищезазначених розрахунків ви ко рис то ву ють ме тод си му ляції вільної енергії МД. Показано, що такі розрахунки афінності зв’язування фосфотирози-нового пептиду pYEEI з Lck 8Н2 добре узгоджуються з експериментальними даними.
Це свідчить про те, що атомні моделі можуть достатньо точно відтворювати молекулярні взаємодії.
Компоненти SH2-доменів людини
Після видалення повторень і спрощення варіантів псевдогенів загалом визначено 120 SH2-доменів, які містяться в 110 різних протеїнах, 10 з яких мають подвійні S^-домени. Частину із цих 110 протеїнів людини наведено в таблиці із зазначенням місцезнаходження кожного гена в хромосомах, мутацій та хвороб, пов’язаних з ними.
Згідно з ос тан нь ою кла сифікацією, S^-домени поділено на 11 функціональних категорій, які базуються на модульній структурі домену (рис. 4). Функціональний вплив, на п рик лад, будь-яко го ре цеп то ра ти -розинкінази (РТК) залежить від підвідділів S^-вмісних протеїнів (таблиця), які вона мобілізує безпосередньо або опосередковано через фосфорильовані молекули скефолда. Ці дані визначають головні шляхи впливу РТК на внутрішньоклітинні процеси. pTyr-залежні взаємодії в S^-вмісних про -теїнах спрямовують сигнал РТК у визначену точку. Цей процес охоплює фосфорилювання тирозину (через цитоплазматичні РТК і тиро-зин-фосфатазу), контроль метаболізму фос-фоліпідів (фосфатидилінозитол, інозитолфосфат), регуляцію маленьких ГТФаз (включаючи Ras, Rho і Rap родини) гу-анінвмісни ми об мін ни ми фак то ра ми і ген ну експресію ГТФаз (у рамках сигнальних каскадів). Звідси випливає, що SH2-домени діють як адаптери (Grb2, Crk і Nck), кожен з яких спрямований на групу зв’язувальних протеїнів з подібними функціями. Так, Nck мобілізує ци то ск летні ре гу ля то ри, зок ре ма нейронні протеїни N-Wasp i Pak серин/тре-онінові кінази [30]. Адаптерний протеїн Grb2 зв’язується із Sos-репресором i Gab1 (ген, що кодує Grb2), які беруть участь у MAPK/PI3K сигналізації та взаємодії Crk (специфічний інгібітор кіназ) з гуаніновими обмінними факторами. Крім того, значна частина SH2-доменів регулює тривалість PTK-сигналізації. Наприклад, супресори сигналізації цитокінів SOCS-протеїни, транскрипційно індуковані JAK/STAT-сигналами, блокують JAK-тирозинкіназну активність. Cbl (про теїни убіквітинліга зи) ін ду ку ють убіквітування pTyr-залежного рецептора і, таким чином, створюють зв’язувальні місця для внутрішньоклітинних протеїнів з центрами убіквітинового зв’язування, що беруть участь у клітинному транспортуванні.
S^-домени також можуть взаємодіяти з актив ни ми сай та ми ре цеп торів ти ро зинкіназ (RTKs). Як приклад, можна навести S^-до-мени APS-адаптерного протеїну, який одночасно гомодимеризується і зв’язує фосфо-риль о ва ну ак ти ваційну пет лю інсуліно во го рецептора (INSR), унаслідок чого відбувається стабілізація його активного стану [31]. SH2-домен Grb14 протеїну також зв’язує фосфорильовану активаційну петлю інсулінового рецептора, але при цьому слід врахувати, що в нього є певна послідовність (BPS-частина), розміщена між SH2- та PH-доменами, яка антагонізує рецепторну активність, виступаючи псевдосубстратом [32]. Отже, S^-домени, окрім того що діють як on/off-регулятори внутрішньоклітинних біохімічних процесів, можуть модифікувати активність, кінетику і субстратну специфічність тирозинкіназних сигналів. Така велика кількість різноманітних зв’язків і каталітичних до менів у про те омі лю ди ни доз во ляє асоціювати S^-домен з SH3-, PTB-, PH-, GEF, GAP-доменами, кіназами, фосфатазами (рис.
4). Запуск сигнальних каскадів SH2 доменами починається біля плазматичної мембрани і лише потім запускаються специфічні сигнальні каскади, які індукують клітинний ріст, диференціацію, морфологію і метаболізм.
Однак дослідження S^-доменів, враховуючи їхні структурні особливості, є не лише складним завданням, але й таким, яке зазвичай не виправдовує затрачених ресурсів. Тому для спрощення розрахунків С-кінці S^-доменів часто виключають із послідовностей при використанні певних біоінформативних чисельних методів. Незважаючи на те, що С-кінцева ділянка S^-домену більш консервативна, ніж N-терміналь або центральні послідовності, вона все ж здатна впливати на стабільне проходження фолдингу і зв’язування з лігандом.
За допомогою методу виключення С-кінців S^-домену з використанням бази даних Pfam та SMART було уточнено амінокислотний склад SH2-доменів. Застосовуючи комп’ютер ну прог ра му для вирівню ван ня послідовностей ClustalW, отримали дерево SH2-доменів (рис. 5). Кожен колір цього дерева позначає функціональний клас протеїнів, які містять певний S^-домен.
Про а налізу вав ши функціональні та
структурні особливості S^-доменів, вдалося виділити невелику кількість тих, які раніше досить рідко згадувались у літературі. Наприклад, LOC284948 член родини S^-вміс-них протеїнів, який включає SLP-76, BLNK, MIST/CLNK і SH2D5 (LOC400745), має структуру домену, подібну до Shc-родини.
Adaptors
нск і 'i
Сі К, Ci hi “ ~
C-irti^ Сзглр. С-ідіія.
SLA?. SLAPS О fw
ScaffoWs
Shcl.2.3.4 ------
ELNK MJfil. iLNH---------
SLPT& “■ “
SH2D5
КІПП5Ї5
К
PhoEpl>ata.EeE
РТРма.п -v
Я-fiS, J-СГ
Sic, Сцк, Malk,
Fgr. Fyn. Tte:. Иск.
Lrk. Lyn Hlk hifc. 1
P.ґч. SfiVift
Z3p7[Jr тЫ —B4J------ 1 '■
ЛМ1.ЛЫ2
Бік. Tcl. Ilk Biruc Tyk
ЛЛК1,І,3, Tykl
Signal Regulation
SHTTI-W.R —'
йосаі у,:н сірн
ЗОСЫ.5,9,7 5H$.(J.e.r внайМ, НКН^Ії SHSDJA.B &Ь7,1(1,14 APE. Ink. SH23 Г'АРРІ DRDGl, DKS
suwi
smnа
CM CNh gtl;
PlKSRS
pik’ri.;1
PLOjI.i
SHIP
-3HIP2
Тгапїс-гірИчп
iJblquJtlnatlon —ВЧ+ —
Phospholipid Sdisnd Messenger Signaling
v^m-
TciiC 1 ■ПЧК пчди ТІЧЙ1
Sjp.aii
RASAl
RCA43
№1-2,3
W9W1.?.3
СГіГі1.2
Cyt-osketetal Regulation
▼------------------------
-----------------”---
Chromatin Ramorielln-g Small GTPa&e Signaling -----------•—
,,—,.
Legend:
Згс Нстпсівду 2 HtmwfcflY -
l''l ЙІїг(5дір-іаМо(іі *f _І“^Я Ivrccre Кіпавс- | t' ■■ —
■■ я ftardrtgp Нлтпігі Ыирр^этсг Cyfctunefiigrriing
Khc&pho^ipTQunp bindrfl do^win Кас Аекс alien
RhhT.AP —■•і RmCjEF ШпШ HltftOFF РЬофЫаве E1 “e К пай Сзірсгіп homology
Pteckstnn (Інтнйсдо
“ Ring dorian —■ HhjyLh
' iSllLHM Ы A het« bLrtdlc
і-.ч L.liji.il.iii .^>ук.іч;и1і.:ічгінгі
СЩ
FF
Рис. 4. Протеїни, до складу яких входять SH2-домени [25]
Кожен член родини HSH2D, який бере участь у кровотворенні, містить один 8Н2-до-мен. За відсутності інших доменів вони класифікуються, як сигнал регулювальні протеїни. Про їхні клітинні функції відомо мало. Протеїни цієї родини дуже схожі між собою, але відрізняються положенням 8Н2-доменів, тому їх часто відносять до окремих родин.
Транскрипційний фактор Supt6h є архаїчним протеїном, який зберігся від дріжджів до людини [34]. Він містить найпримітив-ніший варіант 8Н2-подібних послідовностей, що трапляються лише у дріжджах. На
відміну від більшості S^-вмісних протеїнів, Supt6h не розширив своє різноманіття у більш складних організмах. Але той факт, що SH2-домен зберігся у Supt6h, свідчить про важливість його функціональної ролі в організмі. Слід також зазначити, що SH2-домен протеїну Supt6h не має pTyr-спорідненості. Це притаманно багатьом іншим SH2-доменам. Так, член родини протеїнів JAK TYK2 має His, а не критичний ArgB5, який ко ор ди нує фос фог ру пу pTyr. Хоча SH^-домени людини JAK1, JAK2, JAK3 мають ArgbB5, вони відрізня-
Рис. 5. Дендрограма 8И2-доменів людини, яка демонструє послідовну подібність між 8Н2-доменами,
наведеними в таблиці [33]
ються в ^кінцевій частині. Заміна А^В5 у JAK1 8Н2-домені не впливає на локалізацію і функціонування JAK1 [35]. Інтактний 8Н2-домен потрібен для JAK для того, щоб зв’язуватись із цитокіновими рецепторами. Незважаючи на те, що в JAK 8Н2-доменах може бути відсутня рТуг-зв’язувальна здатність, вони залишаються важливими рецепторами розпізнавання. Дійсно, моделювання JAK2 передбачає, що 8Н2-домен може взаємодіяти з ^кінцем FERM-доменом [35]. Так само в 8И2-доменах Rin 2 (НібЬВ5) та 8И2Б5 може бути відсутнім А^ЬВ5. Вони також можуть не зв’язувати рТуг-ліганди, хоча наразі відомо про функціонування 8Н2-доменів в обох протеїнах.
Деякі 8Н2-домени можуть зв’язувати ліганди без пептиду. Так, 8Н2-домен фосфа-тидилінозитолу (РІ) може зв’язувати РІ (3,
4, 5) Р3, який перешкоджає розпізнаванню рТуг-вмісних пептидів і, таким чином, забезпечує зворотний зв’язок інгібування
8Н2-фосфопротеїнових взаємодій. Подібно до цього 8гс 8Н2 може зв’язатись із РІР3 [фос фа ти диліно зи тол (3, 4, 5) три фос фат].
Отже, найбільш перспективні, але при цьому й складні, методи МД дають змогу вра хо ву ва ти кон фор маційну рух ливість не лише ліганду, але й рецептора. У кожному окремому випадку методика проведення МД є різною залежно від структурних і функціональних особливостей протеїну-мішені. Проведений аналіз різноманіття 8Н2-до-менів, їхніх біохімічних властивостей до-пов нює на яв ну інфор мацію що до про теїнів ти ро зинкіназ та ти ро зин фос фа таз [36], а та -кож організації та функцій 8Н2-вмісних протеїнів. Розглянуті дослідження 8Н2-до-менів ме то да ми МД умож лив лю ють оп ти мі -за цію шляхів ство рен ня (ди зай ну) но вих фар ма цев тич них пре па ратів для ліку ван ня хвороб, пов’язаних із функціонуванням 8Н2-доменів.
ЛІТЕ РА ТУ РА
1. Alm E., Arkin A P. Biological networks // Curr. Opin. Struct. Biol. — 2003. — V 13. — P.193-202.
2. Claverie J. M. Gene number. What if there are only 30,000 human genes? // Science. — 2001. — V. 291. — P. 1255-1257.
3. Cesareni G., Ceol A., Gavrila C. et al. Comparative interactomics // FEBS Lett. — 2005. — V. 579. — P. 1828-1833.
4. Pieroni E., de la Fuente van Bentem S., Mancosu G. et al. Protein networking: insights into global functional organization of proteomes // Proteomics. — 2008. — V. 8. — P. 799-816.
5. Li S., Armstrong C. M., Bertin N. et al. A map of the interactome network of the metazoan C. elegans // Science. — 2004. — V. 303. — P. 540-543.
6. Rual J. F., Venkatesan K., Hao T. et al. Towards a proteome-scale map of the human protein-protein interaction network // Nature.
— 2005. — V. 43, N 7062. — P. 1173-1178.
7. Stelzl U., Worm U., Lalowski M. et al. A human protein-protein interaction network // Cell. — 2005 — V. 122. — P. 957-968.
8. Pawson T. Specificity in signal transduction: from phosphotyrosine-sh2 domain interactions to complex cellular systems // Ibid. — 2004. — V. 116. — P. 191-203.
9. Lengauer T., Rarey M. Computational methods for biomolecular docking // Curr. Opin. Struct. Biol. — 1996. — V 6. — P. 402-406.
10. Косинский Ю. А., Пырков Т. В., Луценко С. В., Ефремов Р. Г. Предсказание структуры комплексов белок-лиганд: от компьютерной мо де ли к би о ло ги чес кой функ ции // РХЖ. — 2006 — Т. 2. — P. 36-44.
11. Kitchen D. B., Decornez H., Furr J. R., Bajorath J. Docking and scoring in virtual screening for drug discovery: methods and applications // Nat. Rev. Drug. Disc. — 2004. — V. 3. — P. 935-949.
12. Shoichet B. K,, Kuntz I. D,, Bodian D. L. Molecular docking using shape descriptors // J. Com-put. Chem. — 2004. — V. 13. — P. 380-397.
13. Cai W., Shao X., Maigret B. Protein-ligand recognition using spherical harmonic molecular surfaces: towards a fast and efficient filter for large virtual throughput screening // J. Mol. Graph. Model. — 2002. — V. 20. — P.313-328.
14. Morris R. J., Najmanovich R. J., Kahraman A., Thornton J. M. Real spherical harmonic expansion coefficients as 3D shape descriptors for protein binding pocket and ligand comparisons // Bioinformatics. — 2005. — V. 21, N 10. — P. 2347-2355.
15. Kahraman A., Morris R. J., Laskowski R. A., Thornton J. M. Shape variation in protein binding pockets and their ligands // J. Mol. Biol. — 2007. — V. 368, N 1. — P. 283-301.
16. MengE. C, Shoichet B. K., Kuntz I. D. Automated docking with grid-based energy evaluation // J. Comput. Chem. — 2004. — V. 13. — P. 505-524.
17. Morris G. M., Goodsell D. S., Halliday R. S. et al. Automated docking using a Lamarckian genetic algorithm and an empirical binding free energy function // Ibid. — 1998. — V. 19. — P. 1639-1662.
18. Feig M., OnufrievA., Lee M. S. et al. Performance comparison of generalized born and Poisson methods in the calculation of electrostatic solvation energies for protein structures // Ibid. — 2004. — V. 25, N 2. — P. 265-284.
19. Jain A. N. Scoring functions for protein-ligand docking // Curr. Protein Pept. Sci. — 2006. — V. 7, N 5. — P. 407-420.
20. Lensink M. F., Mendez R., Wodak S. J. Docking and scoring protein complexes // Proteins. —
2007. — V. 69, N 4. — P. 704-718.
21. Robertson T. A., Varani G. An all-atom, distance-dependent scoring function for the prediction of protein-DNA interactions from structure // Ibid. — 2007. — V. 66, N 2. — P. 359-374.
22. Bohm H. J. Prediction of binding constants of protein ligands: a fast method for the prioritization of hits obtained from de novo design or 3D database search programs // J. Comput. Aided Mol. Des. — 1998. — V. 12, N 4. — P. 309-323.
23. Betts M. J., Sternberg M. J. An analysis of conformational changes on protein-protein association: implications for predictive docking // Prot. Eng. — 1999. — V. 12, N 4. — P. 271-283.
24. Jorgensen W. L. Rusting of the lock and key model for protein-ligand binding // Science. — 1991. — V. 254. — P. 954-955.
25. Liu B. A., Jablonowski K., Raina M. et al. The human and mouse complement of SH2 domain proteins-establishing the boundaries of phosphotyrosine signaling // Mol. Cell. — 2006. — V. 22, N 6. — P. 851-868.
26. Gu H., Neel B. G., Pao L. The Shp’ing news: SH2 domain-containing tyrosine phosphatases in cell signaling // Trends Biochem. Sci. — 2003. — V. 28, N 6. — P. 284-293.
27. Pawson T., Gish G. D., Nash P. SH2 domains, interaction modules and cellular wiring // Trends Cell Biol. — 2001. — V. 11, N 12. — P.504-511.
28. Huang H., Li L., Wu C. et al. Defining the specificity space of the human SRC homology 2 domain // Mol. Cell. Proteomics. —
2008. — V. 7, N 4. — P. 768-784.
29. Czar M. J., Kersh E. N., Mijares L. A. et al. Altered lymphocyte responses and cytokine production in mice deficient in the X-linked lymphoproliferative disease gene SH2D1A/ DSHP/SAP // Proc. Natl. Acad. Sci. — 2001. — V. 98. — P. 7449-7454.
30. Buday L., Wunderlich L., Tamas P. The Nck family of adapter proteins: regulators of
actin cytoskeleton // Cell. Signal. — 2002. — V. 14,N 9.— P. 723-731.
31. Chiang Y. J., Kole H. K., Brown H. et al. Cbl-b regulates the CD28 dependence of T-cell activation // Nature. — 2000. — V. 403, N 6766. — P.216-220.
32. Depetris R. S., Hu J., Gimpelevich I. et al. Structural basis for inhibition of the insulin receptor by the adaptor protein grb14 // Mol. Cell. — 2005. — V. 20, N 2. — P. 325-333.
33. http://sh2.uchicago.edu/tree.html.
34. Giordanetto F., Kroemer R. T. Prediction of the structure of human Janus kinase 2 (JAK2) comprising JAK homology domains
1 through 7 // Prot. Eng. — 2002. — V. 15, N 9. — P. 727-737.
35. Radtke S., Haan S., Jorissen A. et al. The Jak1 SH2 domain does not fulfill a classical SH2 function in Jak/STAT signaling but plays a structural role for receptor interaction and up-regulation of receptor surface expression // J. Biol. Chem. — 2005.
— V. 280, N 27. — P. 25760-2576.
36. Manning G., Whyte D. B., Martinez R. et al. The protein kinase complement of the human genome // Science. — 2002. — V. 298, N 5600. — P. 1912-1934.
МЕТОД МОЛЕКУЛЯРНОГО ДОКИНГА С УЧАСТИЕМ S^-ДОМЕНОВ
В. В. Гурмач О. М. Ба ли нс кий М. О. Платонов П. А. Бориско Ю. И. Прилуцкий
Ки евс кий на ци о наль ный уни вер си тет имени Тараса Шевченко
E-mail: [email protected]
Соз да ние но вей ших фар ма цев ти чес ких препаратов для лечения болезней, связанных с нарушениями функционирования протеиновых комп лек сов, яв ля ет ся важ ной ме ди ко-со -ци аль ной проб ле мой, что тре бу ет комп ле кс но -го подхода к ее решению, в том числе учета пос лед них дос ти же ний в об лас ти компь ю тер -ного моделирования биологических процессов.
В обзоре обобщены данные литературы по струк ту ре, функ ци о ни ро ва нию, клас си фи ка -ции молекулярных нарушений доменов SH2 (Src Homology), а также дана характеристика ме то да мо ле ку ляр но го до кин га, как од но го из наиболее перспективных методов фармакологических исследований. Показано, что наи-боль ший ин те рес с точ ки зре ния прак ти чес ко -го при ме не ния для по лу че ния но вых патентоспособных ингибиторов протеин-про-те и но вых вза и мо дей ствий ме то дом мо ле ку -лярного докинга представляют именно SH2-домены, поскольку они принимают активное участие во внутриклеточной передаче сигналов, выступая посредниками этих специ-фи чес ких вза и мо дей ствий.
Клю че вые сло ва: про те и но вые комп лек сы, SH2-домены, молекулярный докинг.
MOLECULAR DOCKING METHOD INVOLVING SH2-DOMAINS
V. V. Hurmach A. M. Balynskyi M. O. Platonov P. O. Borysko Yu. I. Prylutskyy
Kyiv National Taras Shevchenko University
E-mail: [email protected]
The creation of new pharmaceuticals for treating diseases associated with impaired functioning of protein complexes is an important medical and social problem that requires a comprehensive approach to its solution, including consideration of recent advances in computer modeling of biological processes.
The review summarizes literature data about structure, functioning, classification, molecular disturbances of SH2-domains (Src Homology) and also provides description of the method of molecular docking as one of the most promising methods for pharmacological studies. It is shown that SH2-domains are of the most interest in terms of practical applications for new patentable inhibitor protein — protein interactions using molecular docking, because they are actively involved in intracellular signal transmission acting as mediators of specific interactions.
Key words: protein complexes, SH2-domains, molecular docking.