ФАРМАКОЛОГИЯ, ФАРМАЦИЯ, МЕДИЦИНСКАЯ ХИМИЯ
УДК 615:681.3:541.4
ПРИМЕНЕНИЕ КОМПЬЮТЕРНОЙ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ ДЛЯ ПРОГНОЗА ФАРМАКОЛОГИЧЕСКОЙ АКТИВНОСТИ СТРУКТУРНО РАЗНОРОДНЫХ ХИМИЧЕСКИХ СОЕДИНЕНИЙ
П.М. Васильев, А.А. Спасов
Кафедра фармакологии ВолГМУ
Одной из актуальных задач современной фармакологии является поиск новых соединений с высокой биологической активностью. Экспериментальное изучение всех синтезируемых веществ на весь спектр видов активности чрезвычайно длительно и трудоемко. Академией наук России одним из приоритетных направлений исследования свойств органических соединений объявлено использование для этих целей компьютерных информационных технологий, основанных на исследовании зависимостей "структура - свойство" [9]. Для решения таких задач разработаны специализированные системы, позволяющие выполнять прогноз активности новых еще не синтезированных и не испытанных веществ, используя в качестве исходной информации только структурную формулу соединения -например, система PASS [7] и рассматриваемая в настоящем исследовании информационная технология "Микрокосм" [1].
ЦЕЛЬ РАБОТЫ
Проверка точности прогноза с использованием информационной технологии "Микрокосм" различных видов фармакологической активности существенно различающихся по своему химическому строению соединений и сопоставление полученных результатов с данными о точности прогноза этих же видов активности в системе PASS.
МЕТОДИКА ИССЛЕДОВАНИЯ
Основой методики прогноза являются полученные методами теории распознавания образов закономерности, связывающие между собой факт наличия/отсутствия активности и структуру соединений, представленную в виде матрицы структурных дескрипторов.
Исследование выполнялось в несколько этапов.
Формирование обучающих выборок. В качестве обучающих выборок использовались созданные с помощью стандартных компьютерных химических программ 20 наборов структур соединений по различным видам фармакологической (биологической) активности. Каждый набор содержит структуры как активных (достоверно проявляющих данный вид активности), так и неактивных (достоверно не проявляющих данный вид активности) соединений.
Данные по 13 видам активности взяты из справочника [12] и дополнены данными из более поздних литературных источников (совместно с Г.П. Дудченко); в качестве неактивных добавлены случайно выбранные достоверно неактивные структуры из [12].
Данные по 6 видам активности получены в результате анализа журнальных публикаций (совместно с М.С. Новиковым и В.А. Сажиным).
Данные по канцерогенной активности взяты с сайта IARC http://www.iarc.fr, формирование обучающей выборки описано в [5].
Всего в базе данных 8863 структуры. Перечень 20 исследовавшихся активностей и объемы соответствующих выборок приведены в табл. 1.
Формирование моделей обобщенных образов. Структурные формулы соединений преобразовывались программой-транслятором в дескрипторы специализированного рабочего языка QL2, из которых формировались модели обобщенных образов классов активных/неактивных соединений, представленных в виде матрицы структурных дескрипторов.
/зык QL (QSAR Language, версия 2) представляет собой мультидескрипторный иерархический многоуровневый язык с подструктурной
нотацией, концепции и развитие которого изложены в работах [2, 11].
Таблица 1 Характеристики обучающих выборок
Число соединений в выборке
Вид активности Всего Актив- Неак-
ных тивных
Нейролептическая1 645 226 419
Транквилизирующая1 532 176 356
Антидепрессантная1 628 238 390
Ноотропная2 420 217 203
Анальгетическая нар-
котическая1 320 114 206
Местноанестезирую-
щая1 324 118 206
Кардиотоническая1 304 98 206
Кардиостимулирую-
щая1 233 27 206
Гипогликемическая1 230 115 115
Анаболическая1 175 91 84
Антисептическая1 494 234 260
Туберкулостатиче-
ская1 386 126 260
Фунгицидная1 471 211 260
Анти-ВИЧ2 1140 543 597
Антигерпесвирусная2 412 192 220
Антипикорнавирусная2 512 251 261
Противогриппозная2 72 18 54
Противолейкозная2 252 175 77
Противоопухолевая1 821 562 259
Канцерогенная3 492 245 247
Всего 8863 3976 4886
Данные из [12] дополнены литературными данными.
2 По результатам анализа журнальных публикаций.
3 Данные из [5].
Алфавит 01_ задается тремя типами элементарных дескрипторов.
1. Структурный дескриптор (СД) - фрагмент структуры соединения, обладающий достаточно выраженными электродонорными или электроакцепторными свойствами и представляющий собой неводородный атом или группу атомов с учетом ближайшего окружения. Подалфавит СД О1_ постулирован и состоит из 4352 видов дескрипторов, в том числе 372 видов гетероатомных СД (например, -1\1Н2, =0, -Б+<, Сг+П), 11 углеродных СД (например, -С+<, -СН3, -СН= , -С#), 3 типов циклических СД (простые, сопряженные с к з-элект-ронами или ароматические циклы размером п; всего 3963 вида циклических СД) и 6 видов СД инертных газов.
2. Дескриптор длины (ДД) - длина в связях кратчайшего пути по углеродной цепочке между двумя СД (принимает значения от 1 до 99) или число общих атомов при непосредственном на-
ложении СД друг на друга (индекс вхождения, принимает отрицательные значения).
3. Дескриптор связи (ДС) - типы связей, их количество и наличие сопряжения на ДД. Подалфавит ДС постулирован и состоит из 54 видов дескрипторов, каждый из которых формируется сочетанием 4 бинарных индексов: наличия одной или нескольких кратных (р, Р), ароматических (а, А) и нековалентных (п, Ы) связей и индекса сопряжения (0, 1).
Комбинации из двух, трех или четырех элементарных дескрипторов называются простыми составными дескрипторами соответствующего ранга. Дескрипторов второго ранга насчитывается четыре типа, дескрипторов третьего ранга -три типа, дескрипторов четвертого ранга (базовый дескриптор) - один тип.
Структура соединения описывается совокупностью входящих в нее ОЬдескрипторов до четвертого ранга включительно - всего 11 типами дескрипторов разного ранга. Такое описание полностью отражает молекулярный граф соединения, поэтому дескрипторы более высоких рангов не используются. Структура органического соединения средней сложности описывается обычно 50-400 видами ОЬдескрипторов.
Матрица структурных дескрипторов представляет собой таблицу, в которой по строкам расположены символьные обозначения уникальных ОЬдескрипторов 11 типов до четвертого ранга включительно, а по столбцам - номера соединений обучающих выборок. Каждая ячейка такой таблицы содержит число ОЬдескрипторов у-го вида в структуре соединения С. Дескрипторы в матрице расположены в порядке увеличения ранга и в лексикографическом порядке. Обозначения дескрипторов химически содержательны. Например, дескриптор (-0Н 5 =0 рА.1) представляет собой дескриптор 4-го ранга 11 типа СД1-ДД-СД2-ДС, в котором гидроксил связан с карбонильной группой углеродной цепочкой длиной 5, причем в цепочке есть одна з-связь, две или более ароматических связи, отсутствуют нековалентные связи и присутствует сопряжение. Матрицы для прогноза перечисленных в табл. 1 видов активности содержат от 2406 (противогриппозная) до 22461 (противоопухолевая) видов ОЬдескрипторов.
Формирование решающих правил. Основой информационной технологии "Микрокосм" является процедура обобщения с помощью трех различных схем принятия решений (стратегий прогноза) спектра промежуточных прогнозных оценок активности, полученных четырьмя различными методами прогноза по 11 уровням ОЬописания структуры соединений [4].
• Методы прогноза. Для получения спектра промежуточных прогнозных оценок используются четыре основанных на теории распознавания образов оригинальных метода, адаптированных
для использования в пространствах большой размерности. Каждый метод дает 11 прогнозных оценок (по числу типов QL-дескрипторов). Все четыре метода существенно отличаются друг от друга по способу построения решающего правила. Это дает основание полагать, что спектр из 44 прогнозных оценок достаточно адекватно отражает различные особенности обобщенного образа класса активных/неактивных соединений, что позволяет в дальнейшем достоверно оценивать итоговую активность прогнозируемого соединения.
Метод Байеса (вероятностный параметрический). Раннее разработанный алгоритм [5] при выполнении настоящего исследования был модифицирован. Логарифм вероятности принадлежности соединения C к классу активных а при наличии в нем di дескрипторов i-го типа j-го вида Bij
log[p (Cе a)] = log(0,5) + §log[P(BJCe a)],
j=1
где P(Bj | Сe a) - априорная вероятность
встречаемости дескриптора By в классе активных a соединений.
Соединение C считается активным по дескриптору i-го типа, если
log[p (C е a)] > log[p (C е n)].
Метод расстояния (геометрический параметрический). Ранее разработанный алгоритм [4] при выполнении настоящего исследования был модифицирован. Вычисляется взвешенное расстояние Пирсона в пространстве дескрипторов i-го типа от соединения C до центра класса а
di I I
Dai = § WjXij - Caij , j=1
где Xj - координаты в пространстве признаков соединения C по дескриптору ij;
caij - координаты центра класса а по дескриптору ij;
w ij = (caij + cnijfl - весовой коэффициент для дескриптора ij.
Соединение C по дескриптору i-го типа принадлежит к тому классу, расстояние до центра которого меньше.
Метод ближайшего соседа (геометрический непараметрический). Базовый алгоритм описан в [8] и при проведении настоящего исследования адаптирован для пространств большой размерности. В пространстве дескрипторов -го типа вычисляются расстояния Евклида от прогнозируемого соединения C до каждого соединения обучающей выборки
D2 =
£
i=i
x.. - y...
У iß
l = 1,...,N
jeX u¥
где Xj - координаты в пространстве признаков соединения C по дескриптору ij;
yiji - координаты в пространстве признаков соединения l по дескриптору ij;
N - число соединений обучающей выборки. По дескрипторам i-го типа соединение С принадлежит к тому классу, активность которого проявляет ближайшее к соединению С соединение обучающей выборки (ближайший сосед):
N
min (
D2 = min D) .
1=1
Метод локального распределения (смешанный непараметрический геометрический -параметрический вероятностны?1й) [6]. Вычисляется минимальное число объектов обучающей выборки, необходимых для построения локальной статистики (5 % от общего числа соединений, но не менее 3 и не более 15):
3, если йипе(# /20) < 2 Ь = <¡15, если йипе(# /20) > 14 . йипе(# /20) +1, иначе
Для прогнозируемого соединения С по каждому ¿-му типу ОЬдескрипторов вычисляются Ь ближайших соседей обучающей выборки с использованием супремальной метрики:
Dii = max \xij -yiji\ j=i
jcX u¥
l = 1,...,N
Затем по Ь отобранным соединениям методом Байеса производится классификация прогнозируемого соединения.
• Стратегии прогноза. Для обобщения спектра прогнозных оценок в информационной технологии "Микрокосм" реализованы три стратегии принятия решения об итоговой активности соединения [3].
Консервативная стратегия. Используется процедура простого голосования. Соединение С считается активным/неактивным, если из 44 промежуточных прогнозных оценок 27 или более одинаковые (95 % доверительный интервал для медианы).
Такой подход учитывает наиболее устойчивые, характерные именно для данного вида свойств, закономерности.
Нормальная стратегия. Предусматривает выбор из 4 методов прогноза, по результатам предварительного автотестирования обучающей выборки с обобщением 11 вычисленных в рамках каждого метода прогнозных оценок метода, лучшего по точности. В качестве процедуры голосования используется Байесовский бинарный классификатор [10]
2
d
d
L{x) = £ wixi + w0.
1=1
Весовые коэффициенты
wt = log Pai (1 - Pni); w0 = £ log———ai Pni(1 - Pai ) i=— 1 - Pni
ГДе Pki ="
nki +1
- априорная вероятность
Паг + Ппг + 2
классификации соединения С по дескриптору г'-го типа в класс активных а или неактивных п соединений;
пы - число правильно классифицированных по г'-му типу дескриптора активных (неактивных) соединений обучающей выборки.
В рамках каждого метода соединение С считается активным по всему ОЬописанию в совокупности, если ь(х) > 0 .
При использовании нормальной стратегии прогноза учитываются как стандартные, так и нестандартные, для данного вида свойств, закономерности.
Рисковая стратегия. Основана на выборе из 4 методов прогноза по результатам предварительного автотестирования обучающей выборки отдельно по каждому из 11 уровней ОЬописания лучшего по точности метода с учетом типа дескриптора. Процедуры итогового голосования нет, каждое из 44 прогнозных множеств рассматривается как самостоятельное информационное пространство.
Рисковая стратегия позволяет косвенно учитывать при прогнозе особенности, связанные с возможным механизмом эффектов, максимально учитывает новизну прогнозируемой структуры.
Тестирование решающих правил. Оценка точности прогноза наличия/отсутствия активности проводилась отдельно по каждой из 20 обучающих выборок для каждой из трех стратегий по четырем показателям распознающей и прогностической способности итогового решающего правила: результатам автопрогноза, скользящего, перекрестного и двойного скользящего контролей.
При прогнозе образ тестируемого соединения (в виде О1_-представления) сравнивается с моделями обобщенных образов из матрицы и рассчитываются метрики принадлежности прогнозируемой структуры к классу активных/неактивных соединений.
• Автопрогноз. Рассчитывается активность каждого из N соединений обучающей выборки без каких-либо изменений рабочей ОЬматрицы.
• Скользящий контроль. Каждое из соединений обучающей выборки поочередно исключается из расчетов рабочей ОЬматрицы, а затем
используется в качестве независимого тестового объекта - так N раз.
• Перекрестный контроль. По нечетным соединениям обучающей выборки рассчитывается рабочая ОЬматрица, четные соединения используются в качестве независимой тестовой выборки - затем наоборот; результаты тестирования усредняются.
• Двойной скользящий контроль. Из обучающей выборки исключается одно соединение. На выборке из оставшихся N-1 соединений выполняется процедура скользящего контроля. По результатам этого скользящего контроля рассчитываются параметры итогового решающего правила стратегии. С использованием этого решающего правила производится классификация удаленного из расчетов соединения - процедура повторяется N раз.
Программное обеспечение. Все расчеты выполнены с использованием программного комплекса "Микрокосм" (версия 3.1, июнь 2004 г.), который является практической реализацией теоретических концепций, методов и правил информационной технологии "Микрокосм". Комплекс разработан на языке 0е!р11у-6 в виде приложений для Windows-XP. База данных по структуре и активности соединений формировалась с помощью стандартной программы С1пет-РЫег-5.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
И ИХ ОБСУЖДЕНИЕ
Прогноз в информационной технологии "Микрокосм". В табл. 2-4 приведены результаты тестирования точности прогноза факта наличия/отсутствия у соединений 20 перечисленных в табл. 1 видов фармакологической активности.
В рамках бинарной классификации работоспособные прогнозные модели должны удовлетворять очевидному условию: общая точность прогноза Ро, точности прогноза активных Ра и неактивных Рп соединений должны быть не ниже 70 %.
Наиболее адекватными способами оценки прогностической способности решающих правил являются процедуры, основанные на последовательном изъятии одного или нескольких соединений из состава обучающей выборки с последующим использованием их в качестве тестовых [8]. Это прежде всего скользящий и перекрестный кон-троли; результаты автопрогноза и двойного скользящего контроля носят справочный характер.
Проведенный с учетом перечисленных ограничений анализ данных табл. 2 показал, что при использовании консервативной стратегии адекватный прогноз возможен для 16 из 20 рассматриваемых видов активности. Для 4 видов активности (фунгицидная, антигерпесвирусная, противогриппозная и противоопухолевая - выделены курсивом) результаты прогноза будут иметь невысокую достоверность. Минимальное значе-
ние точности прогноза при использовании консервативной стратегии составляет 58 % (Ра в перекрестном контроле для антигерпесвирусной активности), максимальное - 100 %; среднее значение изменяется от 82 % до 99 %.
Анализ данных табл. 3 показал, что при использовании нормальной стратегии адекватный прогноз возможен только для 15 видов активности. Для 5 видов активности (ноотропная, фунги-цидная, антигерпесвирусная, противогриппозная и противолейкозная) результаты прогноза будут малодостоверны. Минимальное значение точности прогноза при использовании нормальной стратегии составляет 63 % (Ра в перекрестном контроле для антигерпесвирусной активности), максимальное - 100 %; среднее значение изменяется от 82 % до 97 %.
Анализ данных табл. 4 показал, что при использовании рисковой стратегии адекватный прогноз возможен только для 15 видов активности. Для 5 видов активности (ноотропная, фунги-цидная, антигерпесвирусная, противолейкозная и противоопухолевая) результаты прогноза будут малодостоверны. Минимальное значение точности прогноза при использовании рисковой стратегии составляет 63 % (Ра в перекрестном контроле для антигерпесвирусной активности), максимальное - 100 %; среднее значение изменяется от 79 % до 96 %.
При совместном применении трех стратегий адекватный прогноз возможен уже для 18 видов
активности. Только для 2 видов активности (фун-гицидной и антигерпесвирусной) по всем трем стратегиям результаты прогноза будут малодостоверны.
Сравнение между собой трех стратегий показывает, что по точности они мало отличаются друг от друга: максимальное различие средних значений Fo составляет 4,3 % (между консервативной и рисковой стратегиями в перекрестном контроле), минимальное - 0,6 % (между нормальной и рисковой стратегиями в скользящем контроле). Некоторое преимущество в точности имеет консервативная стратегия. Однако, следует учитывать, что ее применение предусматривает возможность отказа от прогнозирования, т. е. выигрыш в точности может перекрываться потерей части полезной информации. В каждом конкретном случае выбор "лучшей" стратегии прогноза определяется желаемой степенью учета новизны химических структур и характером задачи, которую ставит перед собой исследователь.
Сравнение систем "Микрокосм" и PASS. С целью более жесткой оценки адекватности прогноза фармакологической активности в ин -формационной технологии "Микрокосм" проведено сопоставление полученных результатов с данными о точности прогноза этих же видов активности в системе PASS [7], взятых с сайта http://www.ibmh.msk.su/pass/ по состоянию на 14 января 2005 г.
Таблица 2
Точность прогноза различных видов фармакологической активности по результатам тестирования обучающих выборок по консервативной стратегии (%)
Вид активности Автопрогноз Скользящий контроль Перекрестный контроль Двойной скользящий контроль
Fo Fa Fn Fu Fo Fa Fn Fu Fo Fa Fn Fu Fo Fa Fn Fu
Нейролептическая 100 100 99 2 98 99 97 5 97 97 97 4 98 99 97 5
Транквилизирующая 100 100 100 7 90 80 94 16 89 75 95 14 90 80 94 16
Антидепрессантная 100 100 100 5 91 92 90 14 90 94 88 16 91 92 90 14
Ноотропная 99 100 98 14 78 78 78 27 70 71 70 22 78 78 78 27
Анальгетическая нарк. 100 100 99 3 96 97 95 5 95 98 94 5 96 97 95 5
Местноанестезир. 100 100 99 6 90 85 93 8 90 82 94 10 90 85 93 8
Кардиотоническая 100 100 100 8 91 79 96 11 92 80 97 10 91 79 96 11
Кардиостимулир. 100 100 100 4 95 83 96 4 94 74 97 7 95 83 96 4
Гипогликемическая 100 100 99 5 81 81 81 11 82 83 80 12 81 81 81 11
Анаболическая 100 100 100 0 99 99 100 1 99 99 100 1 99 99 100 1
Антисептическая 99 100 99 7 87 82 92 13 86 82 90 14 87 82 92 13
Туберкулостатическая 100 100 100 5 92 86 95 8 91 88 93 7 92 86 95 8
Фунгицидная 100 99 100 7 82 70 92 15 80 68 89 15 82 70 92 15
Анти-ВИЧ 98 95 100 16 81 70 91 25 81 70 90 23 81 70 91 25
Антигерпесвирусная 97 96 99 15 73 61 85 25 72 58 85 20 73 61 85 25
Антипикорнавирусная 98 98 98 10 86 86 86 13 88 90 86 13 86 86 86 13
Противогриппозная 100 100 100 7 91 67 100 4 91 67 100 3 91 67 100 4
Противолейкозная 98 97 99 15 81 85 75 25 79 82 72 21 81 85 75 25
1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ВЕСТНИК ВолПМУ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I
| 2005
Противоопухолевая 100 100 100 4 88 95 69 18 87 94 65 16 88 95 69 18
Канцерогенная 100 99 100 6 89 85 93 15 87 82 92 14 89 85 93 15
Среднее 99 99 99 7 88 83 90 13 87 82 89 13 88 83 90 13
Примечание. Ро - общая точность прогноза, %; Ра - точность прогноза активных соединений, %; Рп - точность прогноза неактивных соединений, %; Ри - отказ от прогноза, %.
Таблица 3
Точность прогноза различный видов фармакологической активности по результатам тестирования обучающих выборок по нормальной стратегии (%)
Вид активности Метод прогноза Автопрогноз Скользящий контроль Перекрестный контроль Двойной скользящий контроль
Ро Ра Рп Ро Ра Рп Ро Ра Рп Ро Ра Рп
Нейролептическая Ближ. соседа 100 100 100 96 95 97 95 93 95 96 95 97
Транквилизирующая Ближ. соседа 100 100 100 84 81 86 83 77 87 84 81 86
Антидепрессантная Локал. распр. 99 100 99 85 84 86 82 80 83 85 84 86
Ноотропная Локал. распр. 94 92 96 71 71 72 69 66 71 71 71 72
Анальгетическая нарк. Ближ. соседа 100 100 100 96 94 97 95 94 96 96 94 97
Местноанестезир. Ближ. соседа 100 100 100 90 86 92 91 86 94 90 86 92
Кардиотоническая Ближ. соседа 100 100 100 91 88 92 88 84 90 91 88 92
Кардиостимулир. Ближ. соседа 100 100 100 94 81 96 94 81 96 94 81 96
Гипогликемическая Ближ. соседа 100 100 100 80 82 78 78 78 78 80 82 78
Анаболическая Расстояния 99 100 99 99 99 99 98 98 99 99 99 99
Антисептическая Локал. распр. 98 98 98 84 81 86 82 78 85 84 81 86
Туберкулостатическая Расстояния 92 92 92 89 87 90 88 85 90 89 87 90
Фунгицидная Байеса 89 83 95 78 66 87 75 66 82 78 66 87
Анти-ВИЧ Локал. распр. 91 90 92 77 76 77 75 73 76 77 76 77
Антигерпесвирусная Локал. распр. 91 89 93 71 67 74 72 63 80 71 67 74
Антипикорнавирусная Ближ. соседа 100 100 99 80 86 75 82 88 76 80 86 75
Противогриппозная Расстояния 94 78 100 92 67 100 93 72 100 92 67 100
Противолейкозная Ближ. соседа 100 100 99 81 85 71 75 80 65 81 85 71
Противоопухолевая Байеса 90 88 92 81 83 77 78 81 73 81 83 77
Канцерогенная Локал. распр. 99 99 99 85 83 88 83 81 84 85 83 88
Среднее 97 95 98 85 82 86 84 80 85 85 82 86
Таблица 4
Точность прогноза различный видов фармакологической активности по результатам тестирования
обучающих выборок по рисковой с'ра'егии (%)
Вид активности Метод прогноза и тип дескриптора Автопрогноз Скользящий контроль Перекрестный контроль Двойной скользящий контроль
Ро Ра Рп Ро Ра Рп Ро Ра Рп Ро Ра Рп
Нейролептическая Ближ. соседа 4 100 100 100 96 95 96 94 93 94 96 95 96
Транквилизирующая Ближ. соседа 4 100 100 100 82 82 83 81 77 83 82 82 83
Антидепрессантная Локал. распр. 8 98 98 99 84 81 85 81 77 83 84 81 85
Ноотропная Локал. распр. 4 92 91 93 74 74 73 67 69 64 74 74 73
Анальгетическая нарк. Ближ. соседа 4 100 100 100 94 95 94 94 95 94 94 95 94
Местноанестезир. Ближ. соседа 11 100 100 100 89 86 90 91 87 93 89 86 90
Кардиотоническая Ближ. соседа 11 100 100 100 89 86 90 84 81 86 89 86 90
Кардиостимулир. Ближ. соседа 5 100 100 100 94 81 96 93 70 96 94 81 96
Гипогликемическая Расстояния 11 95 95 96 79 71 87 80 74 86 79 71 87
Анаболическая Локал. распр. 9 100 100 100 99 99 99 98 100 96 99 99 99
Антисептическая Байеса 11 92 90 94 82 77 87 81 77 85 82 77 87
Туберкулостатическая Расстояния 8 93 91 94 89 85 91 87 83 89 89 85 91
Фунгицидная Байеса 11 94 90 98 79 67 88 75 64 83 79 67 88
Анти-ВИЧ Локал. распр. 9 89 90 88 73 73 73 73 75 71 73 73 73
Антигерпесвирусная Локал. распр. 8 88 88 89 69 69 70 67 64 70 69 69 70
Антипикорнавирусная Байеса 11 88 94 83 81 86 77 81 83 79 81 86 77
Противогриппозная Расстояния 1 93 72 100 93 72 100 93 72 100 93 72 100
Противолейкозная Ближ. соседа 10 100 100 99 81 87 69 75 82 60 81 87 69
Противоопухолевая Байеса 11 95 94 98 83 86 78 82 88 68 83 86 78
Канцерогенная Локал. распр. 9 97 97 98 81 80 81 80 79 81 81 80 81
Среднее 96 95 96 85 82 85 83 79 83 85 82 85
В системе PASS используется только одна оценка точности прогноза - максимальная ошибка прогноза MEP в скользящем контроле; величина 100 - MEP соответствует в системе "Микрокосм" общей точности прогноза Fo по результатам скользящего контроля. Русским названиям активностей сопоставлены аналогичные английские термины из системы PASS (данные для противолейкозной активности на сайте отсутствуют).
Результаты приведены в табл. 5, анализ данных которой показал следующее.
Информационная технология "Микрокосм" в целом позволяет более точно прогнозировать фармакологическую активность, чем система PASS: средняя точность прогноза по консервативной стратегии в системе "Микрокосм" превышает среднюю точность прогноза в системе PASS на 9,8 %.
По 16 видам активности точность прогноза в системе "Микрокосм" существенно (от 4,8 % до 20,9 %) превышает аналогичный показатель в системе PASS, в том числе:
• более 20 % - для 2 активностей: нейролептическая, противогриппозная;
• от 10 до 20 % - для 7 активностей: антипи-корнавирусная, кардиостимулирующая, анаболическая, антисептическая, кардиотоническая, ан-тигерпесвирусная, ноотропная;
• до 10 % - для 7 активностей: противоопухолевая, туберкулостатическая, антидепрессантная, транквилизирующая, анальгетическая наркотическая, местноанестезирующая, канцерогенная.
По одному виду активности (фунгицидная) превышение статистически незначимо и составляет 1,3 %.
По двум видам активности точность прогноза в системе PASS незначительно превышает точность прогноза в системе "Микрокосм": для гипогликемической на 1,9 %, для анти-ВИЧ на 1,4 %; такие отличия статистически незначимы.
Следует также подчеркнуть, что в системе PASS используется только один метод прогноза и не используются интегральные решающие правила (стратегии). Напротив, в информационной технологии "Микрокосм" применяются 4 метода построения первичных решающих правил и реализованные на их основе 3 стратегии прогноза, в дополнение к мощному языку описания структуры соединений QL.
Таблица 5
Сравнение точности прогноза различных видов фармакологической активности по результатам скользящего контроля в системах "Микрокосм" и PASS
Название активности1 Точность прогноза, %
Микрокосм PASS Микрокосм, Fo2 PASS, 100-MEP Д3
Конс. Норм. Риск.
Нейролептическая Acute neurologic disorders treatment 97,7 96,3 95,7 76,8 20,9
Противогриппозная Antiviral (influenza) 91,3 91,7 93,1 71,2 20,1
Антипикорнавирусная Antiviral (Picornavirus) 86,1 80,5 81,1 67,2 18,9
Кардиостимулир. Cardiovascular analeptic 95,1 94,4 94,4 77,0 18,1
Анаболическая Anabolic 99,4 98,9 98,9 85,5 13,9
Антисептическая Antiseptic 87,2 83,6 82,0 74,7 12,5
Кардиотоническая Cardiotonic 90,8 90,8 88,8 79,9 10,9
Антигерпесвирусная Antiviral (herpes) 73,1 70,9 69,4 62,2 10,9
Ноотропная Nootropic 78,2 71,4 73,6 68,0 10,2
Противоопухолевая Antineoplastic 88,3 80,9 83,1 78,5 9,8
Туберкулостатическая Antituberculosic 92,1 88,6 88,9 83,0 9,1
Антидепрессантная Antidepressant 90,6 84,9 83,6 81,5 9,1
Транквилизирующая Anxiolytic 89,5 84,2 82,3 82,3 7,2
Анальгетическая нарк. Analgesic, opioid 95,7 95,6 94,4 89,1 6,6
Местноанестезир. Anesthetic local 90,3 89,8 88,6 84,6 5,7
Канцерогенная Carcinogenic 88,9 85,4 80,7 84,2 4,8
Фунгицидная Antifungal 82,1 77,7 78,8 80,8 1,3
Анти-ВИЧ Antiviral (HIV) 81,4 76,6 72,8 82,8 -1,4
Гипогликемическая Hypoglycemic 81,4 80,0 79,1 83,3 -1,9
Среднее 88,4 85,4 84,7 78,6 9,8
Названия активностей приведены в порядке уменьшения значения Д (см. п. 3). ; По консервативной, нормальной и рисковой стратегиям соответственно.
' Разница между Fo по консервативной стратегии в системе "Микрокосм" и 100-MEP в системе PASS.
Таким образом, полученные результаты позволяют утверждать, что точность прогноза фармакологической активности (на примере 19 различных ее видов) при использовании информационной технологии "Микрокосм" существенно выше, чем при использовании системы PASS.
ЗАКЛЮЧЕНИЕ
Информационная технология "Микрокосм" позволяет с высокой точностью проводить прогноз различных видов фармакологической активности структурно разнородных химических соединений.
Точность прогноза фармакологической активности с использованием информационной технологии "Микрокосм" значительно превышает точность прогноза активности с использованием системы PASS.
ЛИТЕРАТУРА
1. Васильев П.М. // Тез. докл. II Российской школы-конференции / СГУ. - Саратов, 2004. - С. 8-9.
2. Васильев П.М. // Тез. докл. XI Российского Национального конгресса "Человек и лекарство". - М., 2004. - С. 586.
3. Васильев П.М. // Труды междунар. науч.-техн. конф. - Пенза. - 2000. - С. 7.
4. Васильев П.М., Дербишер В.Е., Орлов В.В. // Химия и технология элементоорганических мономеров и полимерных материалов: сб. науч. тр., ВолгГТУ. -Волгоград, 1999. - С. 57-61.
5. Васильев П.М., Орлов В.В., Дербишер В.Е. // Хим.-фарм. журн. - 2000. - № 7. - Т. 34. - С. 19-22.
6. Васильев П.М., Спасов А.А., Косолапов В.А. и др. // Информационные технологии в образовании, технике и медицине: матер. Междунар. конф. - ВолгГТУ. -Волгоград, 2004. - Т. 3. - С. 180-186.
7. Глориозова Т.А., Филимонов Д.А., Лагунин А.А. и др. // Хим.-фарм. журн. - 1998. - № 12. - Т. 32. -С. 32-39.
8. Горелик А.Л., Скрипкин В.А. Методы распознавания. - М.: Высш. шк., 1984. - 208 с.
9. Приоритетные направления фундаментальных исследований // Изв. АН. Сер. хим. - 1998. - № 3. - С. 551.
10. Розенблит А.Б., Голендер В.Е. Логико-комбинаторные методы в конструировании лекарств. -Рига: Зинатне, 1983. - 352 с.
11. Vassiliev P.M., Breslaukhov A.G. // Second World Congress of Theoretical Organic Chemists: Abstracts. -Toronto. - 1990. - Abstr. AA-38.
12. Negwer M. (ed.) Organic-Chemical Drugs and Their Synonyms. - Berlin: Akademie-Verlag, 1987. -Vol. 1-3.
Vassiliev P.M., Spasov A.A. Computerized information technology in prognosis of pharmacologic activity of structurally heterogenous chemical compounds // Vestnik of Volgograd State Medical University. - 2005. - № 1. - P. 23-30.
УДК 615.3:547.466.3:615.22
АНТИИШЕМИЧЕСКОЕ ДЕЙСТВИЕ ТОЛИЛЬНЫХ ПРОИЗВОДНЫХ ГАММА-АМИНОМАСЛЯНОЙ КИСЛОТЫ
В.Н. Перфилова, И.Н. Тюренков
Кафедра фармакологии и биофармации ФУВ, НИИ фармакологии ВолГМУ
Экспериментальные данные, полученные на кафедре фармакологии Волгоградского медицинского института, свидетельствуют, что фе-нильные [1, 3, 5, 6, 9, 11] и толильные [7, 10] производные гамма-аминомасляной кислоты (ГАМК) обладают широким спектром фармакологической активности. р-толил-гамма-аминомасляная кислота (толибут) по некоторым видам активности превосходила р-фенил-гамма-аминомасляную кислоту (фенибут), но последнее, являясь менее токсичным соединением, было внедрено в практику.
Накопленные к настоящему времени экспериментальные данные показывают, что структурные аналоги ГАМК обладают антиангинальной
активностью [2, 4, 8, 11, 12]. Данные по противо-ишемическому действию толибута в литературе отсутствуют.
Учитывая положительный опыт создания высокоэффективных и малотоксичных веществ (пикамилона и пантогама) на основе ГАМК путем химического связывания с фармакологически активными соединениями - никотиновой и панто-теновой кислотами представляется целесообразным изучить антиангинальную активность новых производных толибута, включающего в свою структуру лимонную, янтарную, яблочную, щавелевую, глутаминовую и никотиновую кислоты.