визуализации и сохранения моделей. Пользователю предлагаются несколько стандартных профилей и редактор профилей, включающий редактор базисов СД, причем среди базисов также выделены стандартные как наиболее популярные у исследователей. Рисунок 4 иллюстрирует алгоритмическую насыщенность комплекса.
Использование новых методов учета симметрии расположения ПФ при реализации алгоритмов различения ГМС позволило на порядки поднять эффективность построения g-моделей для высокосимметричных ГМС. При этом основной упор сделан на исследование gco-моделей (со сверткой долей до орбит 1-групп), так как модели без свертки долей становятся слишком большими для последующего эффективного анализа. Эксперименты показали, что gco(bco)-модели в среднем обеспечивают более адекватные результаты анализа сходства ГМС при акцентировании на различиях в топологии, а не на метрических характеристиках.
На основе ГББ впервые появилась возможность построения программных средств интел-
лектуального анализа структурных данных нового поколения. Исследуемые отношения эквивалентности и толерантности на основе системы моделей SGM заметно отличаются от большинства рассматриваемых в настоящее время и могут дополнять используемые методы анализа сходства ГМС [3]. Предлагаемые программные средства достигли достаточного уровня эффективности для широкого научного и практического применения. Примером практического применения может служить реализация нечеткого поиска (в том числе уточняемого) в базах структурной информации.
Литература
1. Кохов В.А. Концептуальные и математические модели сложности графов. М.: Изд-во МЭИ, 2002.
2. Незнанов А.А., Кохов В.А. Программные средства для построения и исследования моделей структурной сложности и сходства // Одиннадцатая национ. конф. по искусствен. интел. с междунар. участ. КИИ-2008: тр. конф. М.: ЛЕНАНД, 2008. Т. 1. С. 216-224.
3. Cook D.J., Holder L.B. Mining Graph Data. Wiley-Interscience, 2006.
УДК 65.011.46, 65.011.56
ПОСТРОЕНИЕ И ОПТИМИЗАЦИЯ ПРОИЗВОДСТВЕННОЙ ПРОГРАММЫ РАЗДЕЛИТЕЛЬНОГО КОМПЛЕКСА
О.И. Хлытчиев, к.т.н.; А.О. Шелманов
(Национальный исследовательский ядерный университет «МИФИ», г. Москва,
кЫг;сЫеи@дтаИ. сот)
В статье рассматривается задача построения производственной программы разделительного комплекса. Предлагаются алгоритм построения допустимой программы для обеспечения всех потребностей при имеющихся ресурсах и алгоритм ее оптимизации при помощи усовершенствованного метода Зойтендейка.
Ключевые слова: оптимизация, производственная программа, разделительный комплекс, обогащенный урановый продукт, линейное программирование, симплекс-метод, ядерно-топливный цикл.
Атомная энергетика продолжает активно развиваться, несмотря на различные проблемы в мировой экономике. Энергетическая стратегия России на период до 2020 года учитывает увеличение доли атомной генерации в общем объеме производства электроэнергии с сегодняшних 16 до 23 % к 2020 году. А значит, как в ближайшее время, так и в долгосрочной перспективе планируется рост потребления ядерного топлива.
Мировая ядерная энергетика в основном базируется на топливе, произведенном из обогащенного урана. Россия обладает передовой технологией по обогащению урана - газоцентрифужной - и занимает в общей сложности порядка 40 % мирового рынка обогащения. Тем не менее, запасы дешевых урановых руд в основном сосредоточены в США, Канаде, ЮАР и Австралии, и доступ к ним для обогащения у России ограничен. В результате существует проблема поиска эффективных мето-
дов использования имеющихся в нашей стране мощностей и ресурсов.
Снабжение топливом имеет основополагающее значение для устойчивости любой энергетической системы. Поэтому важно, чтобы все заинтересованные в поставках ядерного топлива стороны имели возможность системного анализа отрасли на долгосрочную перспективу. Регулирование количества получаемого обогащенного уранового продукта, который используется для производства ядерного топлива, происходит заданием уровня отвалов. Снижение отвала позволяет получить больше обогащенного урана (топлива) из 1 кг природного урана, но требует больше работы разделения.
Возникает задача построения информационной системы, которая обеспечит планирование, отслеживание и постоянную корректировку и оптимизацию производственной программы разде-
лительного комплекса с учетом изменений прогнозов потребностей, цен на сырье и компоненты конечного продукта, корректировок плана развития мощностей разделительного комплекса, изменений на рынке сбыта, а также разного рода политических ограничений.
Разработка такой системы ведется авторами в рамках реализации мероприятия 1.3.1 ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг.
Главной отличительной особенностью системы станет возможность оптимизации производственных программ разделительного комплекса на длительный срок. Методы оптимизации должны позволять минимизировать себестоимость конечного продукта и, соответственно, максимизировать выручку предприятий разделительного комплекса как в отдельный промежуток времени, так и в среднем за длительный период.
Задача построения производственной программы
Для данной задачи предлагается использовать следующую модель. Пусть имеется п поставщиков, каждый из которых предоставляет один вид сырья с определенной концентрацией в нем П-235, размер этих поставок для некоторого периода ограничен. Пусть имеется к контрактов (или потребностей) на обогащение, по которым необходимо предоставить заказчику некоторое количество обогащенного урана с конкретным содержанием и-235 в определенные сроки. При этом мощность разделительных комбинатов ограниченна, а себестоимость единицы работы разделения задается программой модернизации мощностей.
Разобьем период времени, на который составляется программа, на несколько отрезков , , и сделаем допущение о неизменности всех показателей внутри одного отрезка. Этого всегда можно достичь, уменьшая величину отрезков. Назовем такой период периодом постоянства.
Задачу построения и оптимизации производственной программы разделительного комплекса формально можно представить в следующем виде. Рассмотрим целевую функцию АС (1), представляющую собой сумму затрат на сырье для каждого источника 1 для удовлетворения к-й потребности по цене и затрат на обогащение для мощности Е (1 5) по цене О для каждого временного отрезка:
т^с = £ 2 )Pi ) + ) • (1)
3=1к=И=1 3=1
В качестве ограничений рассмотрим лимит сырья у каждого поставщика и , (1 5):
ОзОз)= 1,2,...,п,я = 1,2,...,Т (2)
к=1
и выполнение всех контрактов (3) для поставки dik (ts) продукта i-м поставщиком для удовлетворения k-й потребности, а также использование всех доступных производственных мощностей (4) для обеспечения необходимым количеством ЕРР пЕРР i k (t s) для получения одного килограмма продукта из сырья i-го поставщика для удовлетворения k-й потребности и неотрицательности использованного сырья поставщиков (5):
dk (ts) = (ts), k = 1,2,...,I, s = 1,2,...,T; (3)
i=1
¿перр ik (ts)dk (ts) = E(ts), s = 1,2,...,T; (4)
k=1
dik (ts 0,fik (ts 0, (5)
i = 1,2,...,n, k = 1,2,...,I, s = 1,2,...,T.
Минимизация целевой функции (1) позволит получить оптимальное решение для каждого отрезка времени и построить оптимизированную производственную программу разделительного комплекса.
Для решения поставленной задачи предлагается построить допустимое решение и далее его оптимизировать.
Построение допустимого решения
Предлагаемый алгоритм основан на усовершенствованном методе Зойтендейка [1]. Введем следующие обозначения:
Н (f (tS) ,d (ts)) = ¿¿Перр ik (ts) dik (ts) • (6)
Вектор , где и также являют-
ся векторами.
Шаг 1. Пусть изначально s = 1 . Тогда задача нахождения допустимой области, образованной ограничениями (2) и (3), а также дополнительным условием (поскольку на данном
этапе переменные fik (ts) и dik (ts) не связаны), решается методом искусственного базиса [2]. Если эта задача не имеет решения, то исходная задача тоже не имеет решения.
Шаг 2. Далее на k-м шаге получаем точку
(fk (ts) , dk (ts) ) . Если н( fk (ts) , dk (ts) )e
eO (E (t s) ,8 ) , то допустимое решение для t = t s равно • Выполняем аналогичные действия
для следующего интервала s, пока s<T.
Иначе осуществляется поиск допустимого направления перехода S*:
max А = -sign (Hk - e)v
, ч/ (7)
VH(fk (ts) ,dk (ts)) S,
¿S?r = 0, r = 1,2,...,I, 1 £ 0, i e J,
i=1 r=1 (8)
Sfr £ 0, (i,r)e J0, Sd- £ 0,(i,r) e J0 , -1 < Sdr < 1; -1 < Sfr < 1,
где gi (f (t) ,d (t ))=}Tfik (t), (9)
Г=1
i = 1 ,2 ,. . .n, t= ts,
J = {i | g i (f (ts) ,d (ts) ) - активное ограничение}, Jo = { (i,r) | fir (ts) = о } Jd = { (i ,r) | dir (ts) = 0 }.
Если Д < 0 , то исходная задача не имеет допустимого решения. Иначе следует определить шаг :
к =
Ui(ts) -Z fir(ts)
is;:
r=1
l
», если ZS;: < 0,
-, если ZS;rf > 0,
(10)
= mi n i = 1 ,2 . . ,,n , i g J,
lf _ fir(ts)
К - '
ir
где и если
^¡r -
dir(ts) s,d .
(12)
где и если
А1 = т 1 п {А[Г,А^} , А1 = т 1 п {А1 , А1} .
- решение уравнения +ХЕ5*Г, dk+АES*d-E(ts)=0. Если на данном отрезке решений нет, то . Если решение
есть, то и выполняется переход в новую
точку:
(гк+1(ис1к+1а5)) = + (13)
Далее снова следует выполнить шаг 2 алгоритма. Если будет найдено допустимое решение для всех интервалов его можно оптимизировать.
Оптимизация полученного решения
Пусть и имеется допустимый план
. Тогда ищется допустимое направление :
1 п
(14)
Г = 1 ¡ = 1
11 1 ^ = о, г = 1,2,..., 1; ^ < о, I е I,
¡ = 1 Г=1
Ш(Г, dr)Т5 = 0 , - 1 < 5 ?г <1; - 1 < 5 [г < 1 .
Данная задача является задачей линейного программирования и решается симплекс-методом [2]. Если получено Д < 0 , то текущее решение является оптимальным, иначе выполняется поиск шага :
j =
Ui(ts) -Zfir(ts)
r=1
IS?
, если IS*: > 0,
(15)
<», если ZS;r < 0,
r=1
= mi n {A,} , i = 1 , 2 . . . n, i g J ;
,f _ fir(ts)
^¡r -
s*f
ir
dir(ts)
где и
где и
Х1 = т ¡п {Хг,ХГ} , = т 1 п{А1 ,ХЦ ,
А = т 1 п ^ ,£} .
Используя найденный шаг, выполняется переход в точку Для возврата к нелинейному ограничению необходимо в новой точке выполнить шаг 2 алгоритма поиска допустимого решения. Если допустимое решение для новой точки не найдено, то оптимизация закончена, в качестве оптимального решения для
берется . Если допустимое реше-
ние найдено, то опять следует выполнить алгоритм оптимизации для новой точки.
На основе полученных решений строится производственная программа в виде пар
(О , пЕрр (4 (О , d?k (О ) ) ,5 = 1 ,2.....Т. (1 8 )
При этом общие затраты на получение обогащенного урана будут находиться в следующем виде:
Т 1 п
т
ас = 2,2,2, ^эр^э+2, ^^ (19)
5 = 1 к=1 ¡ = 1 я=1
Предложенный алгоритм позволяет построить и оптимизировать производственную программу разделительного комплекса при известных ценах на сырье, количествах поставляемого сырья, разделительных мощностях разделительного комплекса и размерах потребностей для каждого периода постоянства и может использоваться в информационной системе планирования, оптимизации и отслеживания производственной программы разделительного комплекса. Полученная оптимальная производственная программа будет содержать информацию о каждом периоде постоянства.
Однако довольно часто для каждого периода постоянства нельзя определить значения доступного количества сырья и потребности в обогащенном урановом продукте, так как контракты на поставку урановой продукции могут заключаться на довольно длительное время, превышающее период постоянства. В этом случае следует учитывать возможные перераспределения ресурсов и продукции между такими связанными периодами.
Предлагаемый алгоритм может использоваться и в случае, если предварительно объединить связанные периоды постоянства, а затем распределить параметры, охватывающие несколько периодов постоянства, на эти периоды по определенной зависимости (например равномерно). Конечно, полученное решение будет не самым оптимальным, но позволит довольно просто получать
эффективную программу разделительного комплекса.
Литература
1. Зойтендейк Г. Методы возможных направлений. М.: Изд-во иностран. лит-ры, 1963. 175 с.
2. Хемди А. Таха. Введение в исследование операций. М.: Изд-во «Вильямс», 2007. 912 с.
УДК 519.688
ПРОГРАММА ДЛЯ ПОСТРОЕНИЯ ГЕНОМНЫХ ПРОФИЛЕЙ ВЕСОВЫХ МАТРИЦ
Е.С. Черемушкин, к.ф.-м.н. (Институт систем информатики им. А.П. Ершова СО РАН, г. Новосибирск, [email protected])
Целью данной работы явилась разработка программы для анализа геномных профилей весовых матриц. Геномным профилем автор называет гистограмму, построенную для графика плотности распределения сайтов связывания с транскрипционными факторами, найденными с помощью этой матрицы. Разработанная программа позволяет строить геномные профили для различных матриц и порогов поиска. Была экспериментально обнаружена независимость профиля матрицы от заданных порогов.
Ключевые слова: весовые матрицы, сайты связывания с транскрипционными факторами, геном, ДНК, программная система.
Регуляция транскрипции (считывания РНК) является одним из наиболее широко исследуемых биоинформатикой биомолекулярных процессов [1]. При считывании РНК важную роль играют специфические белки, называемые транскрипционными факторами (ТФ) [2]. Они образуют комплексы на участках ДНК, называемых промоторами (участками ДНК, расположенными до старта транскрипции). Если в клетке присутствует необходимый для данного промотора набор ТФ, то с некоторой вероятностью он образует белковый комплекс на этом промоторе, что позволяет РНК-полимеразе закрепиться на старте транскрипции этого гена и начать считывание РНК. Таким образом, за счет различного состава ТФ происходит дифференциация клеток: в разных клетках присутствуют всевозможные наборы ТФ, которые запускают транскрипцию различных генов, производящих различные белковые продукты. Эти белки, в свою очередь, тоже могут быть ТФ, запускающими, к примеру, следующую стадию развития клетки.
Небольшие фрагменты ДНК длиной в среднем 10-20 нуклеотидов, к которым прикрепляются ТФ, называются сайтами связывания с ТФ, или просто сайтами [3, 4]. Сайты одного и того же ТФ имеют схожие последовательности. Это объясняется тем, что ТФ обладают специфической формой, позволяющей им закрепляться на последовательностях определенного типа. Но, несмотря на кажущуюся простоту, определить, является ли заданная последовательность сайтом, сложно. Это
обусловлено тем, что на связывание, кроме характера последовательности, влияют и иные факторы, в частности, другие сайты в окрестности и т.д.
Разработан целый ряд алгоритмов и программ для распознавания сайтов на заданной последовательности ДНК [5]. Одним из лидеров в распознавании сайтов являются продукты компании Biobase, такие как библиотека весовых матриц Trans-fac и алгоритм поиска сайтов match [6]. Этой компанией была собрана БД известных сайтов, открытых биологическими методами. Затем по сайтам построены специальные модели, называемые весовыми матрицами. Весовые матрицы являются самым распространенным средством для выявления потенциальных сайтов связывания с ТФ на ДНК.
В данной работе для каждой весовой матрицы построены гистограммы распределения плотности сайтов на геноме человека, названные геномными профилями. Исследовались шесть весовых матриц библиотеки TRANSFAC компании Biobase: V$MYOD_01, V$E47_01, V$VMYB_01, V$CMYB_01, V$AP4_01, V$MEF2_01. Была экспериментально подтверждена независимость геномных профилей от порогов, задаваемых для поиска сайтов. Разработана программная система, позволяющая строить, выводить и сохранять геномные профили для заданных весовых матриц (см. http://nprog.ru/en/genomesignal.zip).
Алгоритм построения геномных профилей состоит в следующем. Каждая хромосома разби-