УДК 621.3: 681.3
Н. В. Слепцов
ФОРМАЛЬНЫЕ ПРЕДСТАВЛЕНИЯ ЭВОЛЮЦИОННО-ГЕНЕТИЧЕСКИХ ПРЕОБРАЗОВАНИЙ
Аннотация. Рассмотрены методы формально-математического описания эволюционных вычислений, обеспечивающие возможность прогнозирования влияния значений параметров эволюционных вычислений на результат эволюционного поиска. Представленные модели способствуют более глубокому пониманию динамики эволюционных вычислений и позволяют выделить некоторые специфичные свойства эволюционных процессов в целом.
Ключевые слова: генетические алгоритмы, моделирование, генетические операции, оптимизация, методы поиска.
Abstract. The methods of formal description for evolutionary transformations are investigated to rating the operating factors of evolutionary search influence on the output effect. The proposed models obtain the more deep understanding the evolutionary process behavior and determines some global essential properties of evolutionary calculus.
Keywords: genetic algorithms, simulation, genetic operations, optimization, search methods.
Введение
Методы эволюционной информатики являются востребованным инструментом в приложениях, где требуется проведение существенных объемов вычислений в отсутствие строгой формулировки конечной цели, границ процесса вычислений или невозможности получения в полном объеме данных с требуемой точностью. Примерами могут являться как задачи в экономических и социально-гуманитарных приложениях, решение которых сводится к исследованию с применением математических моделей (макроэволюцион-ные модели, прикладные задачи оптимизации), так и задачи анализа и проектирования сложных технических систем, автоматизированного программирования, машинного обучения и др.
Суть эволюционных вычислений [1, 2] можно свести к многократному эксперименту над некоторым множеством возможных решений. В традиционной модели вычислений, реализуемой архитектурой фон Неймана, проводится настройка одиночной среды решения задачи на уровне совокупности ячеек памяти и АЛУ, когда циклическое повторение итераций осуществляет по сути настройку содержимого ячеек памяти вплоть до некоторого конечного состояния, представляющего требуемое решение. При эволюционных вычислениях процесс решения организуется проведением преобразований некоторого множества (популяции) решений (в терминах эволюционных алгоритмов - особей), в которых случайно изменяются некоторые параметры, характеризующие решение задачи. Совокупность параметров формирует запись об особи и фактически дает одно из возможных решений, которое с помощью процедур оценивания либо оставляется для последующего процесса, либо отбрасывается. Отобранные особи с помощью преобразований, называемых эволюционными (генетическими) операторами, формируют следующее поколение особей, которое также оценивается и далее процесс повторяется.
Эволюционные операторы (мутация, инверсия, кроссовер, сегрегация, транслокация, удаление, вставка) имеют целью внесение в существующий набор параметров решений задачи либо случайных, либо целенаправленных изменений. Особенностью применения этих операторов является возможность воздействия как на одиночный параметр, так и на группу параметров решения, чем фактически обеспечивается на логическом уровне параллельный поиск в пространстве многопараметрических решений.
Наиболее существенные моменты процесса организации эволюционных вычислений представлены на рис. 1.
Рис. 1. Организация эволюционных вычислений
Общие названия эволюционные вычисления (ЭВ), эволюционно-генети-еские вычисления (ЭГВ), эволюционные алгоритмы (ЭА) объединяют ряд алгоритмов и методов, использующих для поиска решения эволюционные принципы, основными из которых являются генетические алгоритмы (ГА), эволюционное программирование (ЭП), эволюционные стратегии (ЭС), генетическое программирование (ГП).
Реализация общих принципов ЭВ может быть существенно различной, поэтому под ЭВ понимаются не только алгоритмы в традиционном понимании, а некоторая методология решения прикладных задач. В связи с этим представляется существенным четкое формальное определение эволюционногенетических преобразований, учитывающих особенности требований максимально широкого круга задач.
1. Формальная модель эволюционного синтеза решения задач
Поставим задачу эволюционных вычислений следующим образом. Имеется реальный объект, который описывается неизвестным алгоритмом функционирования Р, преобразующим входные измерения x(t) е X в решения
у(0 е Y, где X и Y - конечномерные пространства. Функции x(t) и у(0 заданы при t е Т°, а функции xc(t) и уc(t) заданы при t е Т с Т°. При минимальной априорной информации относительно объекта известны предыстории хс(0 и ус(0, t е 7е, требуется синтезировать Р. X ^ Y. Адаптивный эволюционный синтез преобразователя Р базируется на понятиях структурированная модель (СМ), элементный материал, базовые изменения, список режимов изменений (РИ).
Структурированная модель Р (СМ-Р) - совокупность элементов/ (г е I) со свойствами 9г и отношениями между ними 5, образующая целостный составной объект. СМ-Р осуществляет отображение входных функций х(0 е X дискретного аргумента t ^ е Т, t = 0, 1, ...) в выходные функцииу(0 е Yтого же аргумента с помощью набора операторов из совокупности {/ I} в соответствии с отношением 5, которое определяет порядок следования / ( е I). Свойства 9г и 9 определяются множествами выходных функций элементов (Yf=/(X)) и СМ-Р (Y = Р(^)) соответственно оцениваемыми заданным критерием Q. Отношение 5, фиксирующее наборы операторов из совокупности {/ I} (число операторов N < I) и порядок их следования в суперпозиции при формировании выходных функций, определяет структуру СМ-Р.
Множество К из СМ-Р. ({/ Im}, 5т) таких, что {/ т с {/ I}, 5т е 5), называется классом К. ({/ I}, 5) структурированных моделей с заданными совокупностями операторов суперпозиции и структур.
Фиксация класса К приводит к фиксации уровня декомпозиции моделей, т.е. определяет простые элементы СМ и список базовых, простых и составных изменений, не выводящих СМ из класса К.
Каждая СМ как функциональный преобразователь Р является е-при-ближением некоторого преобразователя Р* (модели С*, адекватной реальному объекту) по заданному критерию Q. е = г^с*, Qc), где г - некоторая функция расстояния. Модель Си локально эффективна, если г^с-+1*, Qc) < Г^сг*, Qc), где С+1 синтезирована из Сг, с помощью некоторого преобразования. Модель С эффективна, если г^с*, Qc) < е при заданном е > 0.
Структурные и функциональные элементы СМ можно разделить на простые и составные. Составные элементы декомпозируются на простые, простые элементы не декомпозируются далее в заданном классе моделей (на заданном уровне детализации). Таким образом, любая СМ обладает набором простых и составных структурных и функциональных элементов, причем для СМ одного класса этот набор однотипен. Назовем его элементным материалом СМ из класса К. Список базовых, простых и составных изменений, не выводящих СМ из класса К, называется далее списком режимов изменений.
Эволюционная обработка информации является в целом процессом адаптивной структурной идентификации решающего правила, который включает следующие компоненты.
- эволюционный синтез решающего правила;
- формирование фактического решения.
Процесс синтеза е-приближений в заданном классе СМ реализуется ре-куррентно, при этом конечным результатом ^шага является формирование с помощью режима изменения Г модели С из модели Си, выбранной из совокупности П(Ре) локально-эффективных моделей на предыдущих шагах синтеза. Режим изменения Г выбирается стохастично из списка РИ и стохастично
реализуется. Требуемый F* (и, соответственно, модель С*) синтезируется с точностью є, если последовательность См (N = 1, 2, ...), удовлетворяет условиям _1 < при Яс* = max Q(c) или _1 > при Яс* = min Q(c).
KK
Процедуру структурного эволюционного синтеза можно представить последовательностью моделей: СN = (Гг- )Сn _і , где Гг- - і-й режим изменения из списка РИ. При этом осуществляется случайный поиск в пространстве структур СМ, а не в пространстве параметров, как в известных алгоритмах случайного поиска. Характер процедуры структурного случайного поиска обусловливается при этом использованием трех источников случайности: вероятностным выбором Гь его вероятностной реализацией и вероятностным выбором См-1 из П(Рє). Анализ показывает, что при использовании первых двух источников случайности семейство алгоритмов эволюционного структурного поиска составляют самообучающиеся и адаптивные алгоритмы с линейной и нелинейной тактикой, эффективные в случае одноэкстремальных функций Q. Добавление третьего источника случайности придает этим алгоритмам свойства глобальности, что выражается в их эффективности в случае многоэкстремальности функции Q.
На основе введенных понятий процесс синтеза СМ Ps описывается следующим многокомпонентным вектором:
Ps = (с0; G; Qi; 1С; Пс; Px; P2; л),
где С0 - исходная СМ класса K; G =< Гг-, і = 1, L > - список режимов изменений Гг- : Гг- (С) с K ; L - объем списка РИ; Qi: С ^ R1 - критерий отбора С-моделей; Ic = (Хс ,Yc) - обучающая выборка, состоящая из входной и выходной выборок; Пc =< Сі, і = 1, k > - совокупность локально-эффективных СМ, k - объем совокупности Пс;
__ k
Pi = (Pii,..., Pik) є Ik, Pu є [0,1], і = 1, k, 2 Pli = 1,
і=1
P^. - вероятность выбора моделей Сі є П,.;
__ L
P2 = (P21,..., P2L) є IL, Pjj є [0,1], і = 1,L, 2P2i = 1,
і=1
P2i - вероятность выбора режима изменения Гг- є G ;
L K s K L
Л: I x I x I ^ P(I x I ) - стратегия случайного поиска.
Процесс формирования фактического решения Pjj определяется многокомпонентным описанием:
Pj = (П0; V; P3; О2; r), где П0 =< Сj, j = 1, k > - совокупность синтезированных С-моделей; k - объем совокупности П0 ; V: П0 ^ R - оператор синтеза решения r є R;
___ Ь
Рз = (Р31,..., Рж ) е 1ь, Р37 е [0,1], 7 = 1, Ь, 2 Р37 = 1;
7=1
Рз - вероятность выбора модели Cj е П0 ; ^2 : Я ^ Я1 - критерий оценки
решения г е Я; г е Я - синтезируемое решение.
Оператор синтеза решения предполагается мажоритарный с использованием весов и т.д. Критерий Q2 оценки решения составляет с критериями Ql взаимосвязанную систему.
2. Формальное представление ГА
Рассмотрим основные черты эволюционных вычислений применительно к их реализации в форме ГА [2, 3].
Генетические алгоритмы - поисковые алгоритмы, основанные на механизмах натуральной селекции и натуральной генетики. Они реализуют принцип «выживания наиболее приспособленных» среди анализируемых структур, формируя и изменяя поисковый алгоритм на основе моделирования эволюции поиска. Базисным отличием ГА от алгоритмов случайного поиска является эффективное использование информации, накопленной в процессе эволюции.
Первоначальная популяция ГА формируется, как правило, случайным образом, но при этом она должна содержать ряд приемлемых решений. Чтобы оценить качество закодированных решений, или пригодность, используют функцию приспособленности, или пригодности. По результатам оценки особей наиболее приспособленные из них отбираются (селекция) для скрещивания, в результате которого посредством применения генетического оператора кроссовера создаются потомки, генетическая информация которых формируется в результате обмена хромосомной информацией между родительскими особями. Эти потомки формируют новую популяцию, причем часть потомков мутирует (генетический оператор мутации), что выражается в случайном изменении их генотипов. Этап, включающий последовательность операций оценки популяции, селекции, скрещивания и мутации носит название поколения. Эволюция популяции состоит из последовательности поколений. Окончание эволюции возможно в следующих ситуациях:
- нахождение приемлемого решения в результате эволюционного поиска;
- достижение граничных условий - ограничение на число поколений, количество вычислений целевой функции, общее время работы ГА;
- вырождение популяции, при которой степень разнородности хромосом в популяции становится меньше установленного значения.
В хромосоме кодируются параметры решения. Определение приспособленности 7-й особи в популяции производится в соответствии с оценкой решения, определяемого набором параметров, и зависит от рассматриваемой задачи. Основополагающим для использовании ГА является предположение, что в результате повторяющегося отбора наиболее приспособленных особей, их скрещивания и мутации будет производиться отсев неудовлетворительных решений и постепенное повышение качества существующих решений, иными словами, направление эволюционирования всей системы приводит к некоторому оптимуму.
Отличие в реализации других видов ЭВ от приведенной схемы ГА состоит в деталях реализации, например, способах кодирования параметров задачи, наборе и роли генетических операторов, особенностях их реализации, количестве подпопуляций, критериях и принципах эволюции (эволюции Дарвина, Ламарка, сальтационизм, номогенез, синтетическая эволюция Н. Дубинина и др. [2]). Пример возможной конкретной реализации эволюционного поиска в виде ГА приведен на рис. 2, где дополнительно введены компоненты, обеспечивающие взаимодействие двух параллельно эволюционирующих подпопуляций - блок эволюционной адаптации и блок миграции хромосом.
Рис. 2. Один из вариантов генетического поиска
Формально генетический алгоритм можно представить в следующем
виде
ГА = (Р0, X, 1,5, р, /, х),
где Р0 = (а0,..., а®) - исходная популяция, а° - решение задачи, представленное в виде хромосомы; X — размер популяции; I — длина каждой хромосомы популяции; 5 - оператор отбора; р - отображение, определяющее рекомбинацию (кроссовер, мутация, инверсия, сегрегация); / - функция пригодности (оценки); т - критерий остановки.
Оператор 5 порождает промежуточную популяцию Рг из популяции Р1 посредством отбора и генерации новых копий элементов Р1: Р1 = ?(РГ). Функция пригодности / используется для отбора конкурентоспособных особей популяции.
Отбор (селекция) проводится на основании значения вероятности Р5 (а7), вычисленной для каждой особи популяции, при этом применяются в основном следующие схемы отбора [4]:
- пропорциональная селекция;
- линейное ранжирование;
- равномерное ранжирование.
Для пропорциональной селекции
Р8 (а}) = 7 (а7)
7' X
2 7 К)
1=1
Для линейного ранжирования
Р5 (аг) т I Лшах (Лшах Лшт)"
X I 'шах \'1шах ■ 1шт/ х 1 у
где Лшт = 2 _ Лшах, 0 — Лшах — 2.
Для равномерного ранжирования с параметрами ц, X
1) = ^ 1/ц,1 — 7 — ц,
0, ц < 7 —X.
Приведенные варианты отбора имеют недостатки, главным из которых является негарантированность асимптотической сходимости, поэтому часто применяется элитный отбор, который всегда сохраняют наилучшие особи популяции. Такой вид отбора гарантирует асимптотическую сходимость, но скорость сходимости может существенно различаться в зависимости от вида конкретной задачи.
По завершении отбора выполняются генетические операции, практически всегда в их число входят кроссовер и мутация. Обе эти операции носят случайный характер (вероятность применения, выбор локуса внутри хромосомы).
Кроссовер чаще всего реализуется в виде одноточечного кроссовера, реализующего одну точку разрыва хромосомы. Его естественным развитием являются разновидности оператора с несколькими точками, предельным случаем выступает равномерный кроссовер, когда каждая пара битов внутри двух хромосом обменивается в соответствии с некоторой вероятностью. При всех различиях в реализации оператора кроссовера остается неизменным главное свойство - все типы кроссовера контролируют баланс между дальнейшим использованием уже найденных пригодных областей пространства поиска и исследованием новых подобластей. Это достигается за счет нераз-рушения общих блоков внутри хромосом-родителей, сохраняющих удачные фрагменты найденных решений и одновременном исследовании новых областей в результате обмена частями хромосом.
Совместное использование отбора и кроссовера приводит к тому, что области пространства, обладающие лучшей средней оптимальностью, содержат больше элементов популяции, и, таким образом, эволюция популяции
направляется к областям, содержащим оптимум с большей вероятностью, чем другие.
Мутации вносят новизну и предотвращают потерю аллелей в определенных позициях, которые не могут быть восстановлены кроссовером, тем самым ограничивая преждевременное сжатие пространства поиска. Мутация представляет случайное изменение бита с достаточно низкой вероятностью (рт ~ 0,001) и может рассматриваться как процесс перехода между различными состояниями пространства поиска. Циклическое применение последовательности «отбор - мутация» направляет эволюцию элементов популяции к наиболее перспективным областям пространства поиска.
ГА изначально вызваны к жизни попыткой моделировать естественные процессы эволюции для поиска решений, однако реальные процессы эволюции несравненно более сложные и включают большое количество механизмов, использование которых в полном объеме в ГА вряд ли возможно, хотя некоторые направления развития ГА следуют в этом направлении, например, мобильный ГА.
3. Модели эволюционно-генетического вычисления
Прежде всего отметим, что многие модели, рассматриваемые в популяционной генетике [2], схожи с моделями, реализуемыми в ЭГВ. При этом результаты, получаемые с использованием ЭГВ, особенно в ряде направлений, таких как адаптивное поведение, часто повторяют природные феномены (прерывистое равновесие, эффект Болдуина и др.). Эти обстоятельства позволяют сделать предположение о существовании определенной связи между природными процессами и компьютерными моделями.
Среди известных биологических моделей в теории ЭГВ нашли применение: модель Райта - Фишера, модель квазивидов, теорема Прайса и др. При этом в силу схожести терминологии и моделей, рассматриваемых в популяционной генетике и ЭА, часто возможен непосредственный «перенос результатов» между этими областями.
Проблему описания процесса ЭГВ можно интерпретировать как проблему описания макроскопических систем путем построения и анализа распределений микроскопических параметров элементов, входящих в эти системы, без рассмотрения каждого элемента в отдельности. Такую возможность для ряда задач обеспечивают методы статистической механики. Их применимость для анализа динамики ЭГВ обеспечивается тем, что в данном случае часто важнее проанализировать популяцию и ее параметры вместо того, чтобы отслеживать генотипические и фенотипические характеристики каждого гена каждой особи. Моделирование эволюции с использованием принципов статистической механики осуществляется посредством анализа ряда макропараметров популяции, характеризующих распределение приспособленностей.
Однако наиболее часто для построения моделей ЭГВ используются методы теории вероятностей в силу, прежде всего, стохастичности самих ЭГВ.
Поскольку в большинстве реализаций ЭГВ изменения зависят только от состава имеющейся популяции и не зависят от того, каким образом данная популяция получена, для моделирования ЭГВ принципиально очень удобен формализм марковских цепей. Обозначив популяцию в момент времени } через «(О, эволюцию популяции можно представить в виде
«(} + 1) = Г • «(}),
где Г - матрица переходных вероятностей, определяющая вероятность изменения хромосом в результате одной итерации эволюционного процесса.
Так как моделируемый процесс состоит в общем случае из циклической последовательности генетических операторов, то для тройки «селекция -воспроизводство - мутация» матрица Г вычисляется как произведение «промежуточных» матриц переходных вероятностей:
Г = Е • Я • М ,
где матрица Е задает вероятности селекционного отбора хромосом; Я, М -матрицы вероятностей изменения хромосом в результате скрещивания и мутации соответственно.
Определив матрицы Е, Я и М с учетом используемых эволюционных операторов, принципиально можно точно промоделировать эволюционный процесс:
«(} + 1) = Е • Я • М • «(}).
Очевидным ограничением здесь является размер получаемых матриц. Так, для модели ГА при хромосоме длиной 8 бит и популяции из восьми особей матрица переходов имеет более 1029 элементов. Ввиду вычислительной сложности прямой реализации точных моделей ЭГВ на основе цепей Маркова можно предложить альтернативные подходы.
Первым можно рассмотреть моделирование ЭГВ на основе статистической теории принятия решений, рассматривающее своеобразное «упрощение» целевой функции (ЦФ). При рассмотрении ЦФ она считается декомпозируемой и, таким образом, ее параметры независимы, среди них можно выделить параметр х0, наиболее значимо влияющий на приспособленность особей. Вклад в приспособленность особи остальных параметров рассматривается как аддитивный шум, влияющий на вероятность селективного отбора особей.
Второй подход основан на анализе представления данных задачи, решаемой средствами ЭГВ, это обеспечивает выбор компактного представления для конкретной задачи, конструктивность эволюционного поиска, возможность целенаправленного управления генетическими операторами. На этом пути возможно не просто решение задачи эволюционного отбора оптимального решения, но и задачи эволюционного развития особи, кодирующей максимальную приспособленность к окружающим требованиям с набором свойств, количественно отличающихся от первоначально определенных в исходной популяции.
Заключение
В завершение отметим следующее. Основным достоинством формально-математического описания ЭВ является возможность прогнозирования влияния значений параметров ЭВ на результат эволюционного поиска. Данное свойство позволяет осуществлять более тонкую настройку параметров ЭВ.
Модели способствуют более глубокому пониманию динамики ЭВ и позволяют выделить некоторые специфичные свойства эволюционных процес-
сов в целом. Примерами являются: прерывистое равновесие, описывающее эволюцию как смену периодов активного поиска и периодов «застоя», соответствующих «нейтральной» стадии эволюции; влияние конечного размера популяции на вид распределения приспособленности в процессе эволюции.
Кроме того, аналитические модели ЭВ позволяют получить оценки времени сходимости при решении ряда модельных задач, что представляет интерес при решении практических задач.
Представленный подход к ЭГВ обеспечивает возможности дальнейших исследований по следующим направлениям:
- способы представления/кодирования данных задач, решаемых средствами эволюционно-генетического поиска, обеспечивающих единый подход к представлению единичных и связанных областей данных;
- управление генетическими операциями на уровнях воздействия на признаки решения и на уровне системы эволюционных вычислений;
- исследование характеристик процесса оценки/выбора оптимального решения, его практической реализации, обеспечение необходимых характеристик эволюционного давления (обоснованные критерии эволюции применительно к классам решаемых задач, их применение);
- обеспечение конструктивности эволюционно-генетического поиска.
Список литературы
1. Букатова, И. Л. Эвоинформатика: теория и практика эволюционного моделирования / И. Л. Букатова, Ю. И. Михасев, А. М. Шаров. - М. : Наука,1991. - 206 с.
2. Емельянов, В. В. Теория и практика эволюционного моделирования / В. В. Емельянов, В. В. Курейчик, В. М. Курейчик. - М. : ФМЛ, 2003. - 432 с.
3. Слепцов, Н. В. Эволюционно-генетические методы и основания генетического программирования / Н. В. Слепцов // Надежность и качество : труды Международного симпозиума. - Пенза, 2006. - Т. 2. - С. 175-178.
4. Chambers, L. D. Practical handbook of genetic algorithms v 3 Complex coding systems 2 ed / L. D. Chambers. - Chapman@Hall, 2001. - 520 p.
Слепцов Николай Владимирович
кандидат технических наук, доцент, кафедра экономики и огранизации производства, Пензенский государственный университет
Sleptsov Nikolay Vladimirovich Candidate of engineering sciences, associate professor, sub-department of production economy and organization, Penza State University
E-mail: [email protected]
УДК 621.3: 681.3 Слепцов, Н. В.
Формальные представления эволюционно-генетических преобразований / Н. В. Слепцов // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2010. - № 1 (13). - С. 15-24.