Научная статья на тему 'Анализ модифицированного генетического алгоритма на основе теории схем'

Анализ модифицированного генетического алгоритма на основе теории схем Текст научной статьи по специальности «Математика»

CC BY
233
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / ХРОМОСОМА / ПОПУЛЯЦИЯ / СЕЛЕКЦИЯ / ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ / ТЕОРЕМА СХЕМ / GENETIC ALGORITHM / CHROMOSOME / POPULATION / SELECTION / GENETIC ALGORITHMS / SCHEME THEOREM

Аннотация научной статьи по математике, автор научной работы — Глушак А. В., Ломазов В. А., Петросов Д. А.

Приводится математическое обоснование модифицированного генетического алгоритма с применением турнирно-рулеточной селекции в виде аналога теоремы схем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A mathematical study of the modified genetic algorithm with roulette-tournament selection in the form of analog scheme theorem is proposed.

Текст научной работы на тему «Анализ модифицированного генетического алгоритма на основе теории схем»

МАТЕМАТИЧЕСКАЯ ФИЗИКА, МАТЕМАТИЧЕСКОЕ

МОДЕЛИРОВАНИЕ

УДК 519.6:004.8

АНАЛИЗ МОДИФИЦИРОВАННОГО ГЕНЕТИЧЕСКОГО АЛГОРИТМА

НА ОСНОВЕ ТЕОРИИ СХЕМ

ANALYSIS OF MODIFIED GENETIC ALGORITHM BASED ON THE THEORY

OF SCHEMES

А.В. Глушак, В.А. Ломазов, Д.А. Петросов A.V. Glushak, V.A. Lomazov, D.A. Petrosov

Белгородский национальный исследовательский университет, Россия, 308015, г.Белгород, ул. Победы, 85 Belgorod National Research University, 85 Pobedy St, Belgorod, 308015, Russia

Белгородский государственный аграрный университет им. В.Я. Горина, 308503, Белгородская обл.,

Белгородский р-н, п.Майский, ул. Вавилова, 1 Belgorod State Agricultural University by V.Y. Gorin, 1, Vavilova Street, p.Mayskiy, Belgorod district,

Belgorod region, 308503, Russia

Белгородский государственный аграрный университет им. В.Я. Горина, 308503, Белгородская обл.,

Белгородский р-н, п.Майский, ул. Вавилова, 1 Belgorod State Agricultural University by V.Y. Gorin, 1, Vavilova Street, p.Mayskiy, Belgorod district,

Belgorod region, 308503, Russia

E-mail: [email protected], [email protected], [email protected]

Аннотация. Приводится математическое обоснование модифицированного генетического алгоритма с применением турнирно-рулеточной селекции в виде аналога теоремы схем.

Resume. A mathematical study of the modified genetic algorithm with roulette-tournament selection in the form of analog scheme theorem is proposed.

Ключевые слова: генетический алгоритм, хромосома, популяция, селекция, генетические алгоритмы, теорема схем.

Key words: genetic algorithm, chromosome, population, selection, genetic algorithms, scheme theorem

Введение

Генетические алгоритмы, представляющие собой биоинспирированную эвристическую процедуру направленного случайного поиска численного решения задачи дискретной оптимизации, получает в настоящее время всё большее распространение (см., например, [1 - 3]). При многоэкстремаль-ности целевой функции, когда, например, метод конфигураций и другие традиционные методы прямого поиска нулевого порядка перестают быть эффективными и часто дают в качестве решения локальный экстремум, генетический алгоритм позволяет найти приближённое, удовлетворительное для многих практических задач решение, не прибегая к полному перебору элементов, хотя и конечного, но, как правило, большого по мощности пространства поиска.

В теории генетических алгоритмов используется словарь, заимствованный из естественной генетики. Мы будем придерживаться следующей терминологии (см., например, [1 - 3]):

каждое решение (особь) представимо битовой строкой (хромосомой) длины m: а = (ах,а2,...,а(. ,...,ат), а е {0,1};

популяция P - набор хромосом, соответствующий пространству поиска: Р = {0,1}™;

генерация - часть популяции, представляющая собой новое поколение хромосом после каждого шага / (/ = 0,1,2,...)генетического алгоритма, размер генерации будем считать одинаковым и равным М для всех V. 0(Г) с Р, )| = М;

родительский пул - часть текущей генерации , состоящая из хромосом, из которых путем скрещивания и мутации (генетические операторы) формируется новая генерация G(? +1);

приспособленность особи - целевая функция ц(а): Р ^ Я задачи оптимизации, заданная на множестве хромосом.

Анализ генетических алгоритмов базируются на понятии схемы (шаблона), отражающем сходство между хромосомами. Схема 5 представляет собой строку длины т в алфавите Р = {0,1,*}, где

* - символ безразличия. Хромосома а называется соответствующей схеме 5 = (5,5), если а = 5 при ф* для всех I = 1,2,.../и.

Отметим два важных понятия для схемы: порядок и определяющая длина схемы, которые используются при выводе фундаментальной теоремы генетических алгоритмов.

/ \ т Го, 5 = *,

Порядок схемы о(^)= > х,-, где х,- = < По-другому, порядок схемы - это ее длина ми-

[1, 5 ф *.

нус число символов безразличия. Определение порядка необходимо при вычислении вероятности выживания эталона при мутации.

Второе понятие - это определяющая длина схемы 1 (я) = шах{г: х, = 1}-шт{г: х, = 1}, которая представляет собой расстояние между первой и последней фиксированными позициями в строке. Это понятие дает оценку компактности информации, содержащейся в эталоне. Понятие определяющей длины важно при вычислении вероятности выживания эталона при скрещивании.

Итак, каждая хромосома а представляет потенциальное решение задачи дискретной оптимизации в конечном пространстве поиска. Эволюционный процесс представляет собой итерационную процедуру перехода от одной генерации хромосом к другой. При этом предполагается, что специальный способ перехода приводит к появлению в каждой последующей генерации более приспособленных особей чем в предыдущей генерации, т.е. к улучшению генерации, вплоть до нахождения близкого к оптимальному решения. Если дальнейшее выполнение итерационного процесса не приводит к улучшению уже достигнутого результата, то процесс прекращается.

В настоящее время при решении задач дискретной оптимизации во многих предметных областях широко используются различные модификации генетического алгоритма, в то время как математическое обоснование предположения об улучшении генерации (теорема схем) было известно (см. [4]) только для стандартного генетического алгоритма в случае рулеточной селекции. Для подтверждения возможности применения модификации генетического алгоритма в случае турнирно-рулеточной селекции при формировании родительского пула Р (см. [5, 6]) использовались только методы имитационного моделирования, состоящие в проведении многочисленных вычислительных экспериментов.

В работе предложено математическое обоснование модифицированного генетического алгоритма с применением турнирно-рулеточной селекции в виде аналога теоремы схем.

Основные результаты

При турнирно-рулеточной селекции случайным образом выбирается N хромосом N - количество участников турнира) и наиболее приспособленная хромосома проходит в родительский пул с некоторой заданной вероятностью. Этот способ селекции предполагает попадание в родительский пул на первых этапах и не самых приспособленных хромосом, что способствует поиску оптимального решения во всем пространстве потенциальных решений.

Случай N = 2. Будем считать, что из двух участвующих в турнире хромосом а и Ь наиболее приспособленная хромосома, т.е. хромосома, для которой ц(а) > ц(6), проходит в родительский пул

_ ц(а) ц(й) Р с вероятностью —-, а другая с вероятностью

ц(а) + ц(й) ц(а) + ц(й)

Хромосомы популяции, соответствующие схеме 5, обозначим а,а, У <М, а не соответствующие схеме 5 - Ь, Ь ,—Ьм-у • Определим вероятность того, что хромосома, соответствующая

схеме 5, пройдёт в родительский пул Р.

Если в турнир отобраны две хромосомы, соответствующие схеме 5, то с вероятностью равной 1 в родительский пул пройдёт хромосома, соответствующие схеме 5.

Если в турнир отобрана одна хромосома а,., 1 < ' < у, соответствующая схеме 5, а другая

, , 2 у(М - у) ц(а.) Ь ,1 < ] < М - у, не соответствующая схеме 5, то искомая вероятность равна -—--'-,

7 М2 ц(а,) + )

и средняя вероятность того, что хромосома а,, 1 < ' < у, соответствующая схеме 5, пройдёт в родительский пул будет равной —^ V -^(а')-.

М2 1<<у ц(а,) + ц(Ь])

1< ]<М-у

Количество хромосом родительского пула Р соответствующее схеме 5 на шаге t, обозначим у(у г) • Тогда математическое ожидание количества хромосом родительского пула на следующем

шаге будет равно

Е(у(у г +1)) = у(у г)

( \

у2 (у, г) | у ц(а,-)

М2 М2 к") ц(а,) + ц(Ь, )

^ 1<]<М-уО,г) у

(1)

Уравнение (1) назовём уравнением репродуктивного роста схемы 5 в рассматриваемом случае N = 2 турнирно-рулеточной селекции.

Таким образом, при выполнении неравенства

у2(А,г) | 2 у ц(а,) М2 М2 1 Ц(а,) + рф)

1< ]<М - у(у,г)

схема получает увеличенное число хромосом в следующую генерацию О. В частности, из уравнения (1) следует неравенство

Е(Ж, г +1)) > у(у, г(+ 2у(у г)(М - у(*, г)). |, (2)

^ " у \ М2 М3 Е(г) 1

1 у(у,г)

где Щу, г) =- Хм-(а ) - средняя приспособленность хромосом, соответствующих схеме 5, в мо-

у(у г) 1=1 '

_ 1 (у(у,г) М-у(у,г) Л

мент t, Е (г) = — Хка)+ Х^Ь )| - средняя приспособленность хромосом всей популяции в

М ^ ,=1 ]=1 )

момент t.

Как следует из неравенства (2), число строк в популяции, отвечающих схеме 5, растёт, если

Щ.М) М (М + у (у, г))

Е(г) > 2у(у, г) ■ (3)

Следовательно, выполнение неравенства (3) является простым достаточным условием роста числа хромосом в следующую генерацию О.

Оценка математического ожидания Е(у(у г +1)), получаемая из уравнения (1) репродуктивного роста схемы 5 с учётом генетических операторов скрещивания и мутации для турнирно-рулеточной селекции выводится как и в классическом случае (см. [1 - 4]) и имеет вид

E(y(s,t + i))> y(s,t)

( \ У2 (s, t ) y И(а, )

2 J /2 ^

M2 M2 ) И(а, ) + И(Ь. )

1< j<M - y (s,t )

1 - Р^И - P^" (4)

да-1 )

где o(s) и d(s) соответственно порядок и определяющая длина схемы s, pc, pm - вероятности скрещивания и мутации хромосом из родительского пула P.

Неравенство (4) определяет ожидаемое число сходных со схемой хромосом в последующих генерациях как функцию числа таких хромосом в текущей популяции y (s, t ), относительной пригодности схемы, её определяющей длины d(s) и порядка o(s).

Случай N = 3. Будем считать, что три участвующие в турнире хромосомы a, b и c, для которых и(а) > и(Ь) > ц(с), проходят в родительский пул P соответственно с вероятностями

Иа) и(Ь) ц(с)

Иа) + И(Ь) + и(с) ' и(а) + и(Ь) + и(с) ' и(а) + и(Ь) + и(с) ' Определим вероятность того, что хромосома, соответствующая схеме s, пройдёт в родительский пул. Если в турнир отобраны три хромосомы, соответствующие схеме s, то с вероятностью равной 1 в родительский пул пройдёт хромосома, соответствующие схеме s.

Если в турнир отобраны две хромосомы а., а , 1 <,, j < У, соответствующие схеме s, а третья

b, 1 < k < M - y, не соответствующая схеме s, то искомая вероятность равна

3y 2(M - y) И(а,) + и(а. ) M3 и(а, ) + и(а. ) + и(Ък )'

и средняя вероятность того, что хромосома а,., 1 <, < y, соответствующая схеме s, пройдёт в родия ~ 3 ^ И(а, ) + и(а. ) тельский пул будет равной —- ^ '

М ^у ц(а,) + ц(а, ) + фк )

1<к <М-у

Если в турнир отобрана одна хромосома а,., 1 <, < у, соответствующая схеме 5, а две другие Ь, Ък, 1 < ,, к < М - у, не соответствующие схеме 5, то искомая вероятность равна

3у(М - у)2 ц(а,)

М3 ц(а,) + ц(6,) + ц(Ьк)'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и средняя вероятность того, что хромосома а,., 1 <, < у, соответствующая схеме 5, пройдет в родительский пул Р будет равной —— V -^(а')-.

М3 ^ ц(а,) + ц(Ь,) + ц(йк)

1< ,,к<М - у

Следовательно, математическое ожидание количества хромосом родительского пула соответствующих схеме 5 на следующем шаге будет равно

E(y(s, t +1)) = y (s, t )

^ Л

y3 (s, t ) y И(а,) + И(а..) y _И(а, )_

M3 M3 И(а,) + И(а..) + и(Ьк) M3 к,^) и(а,) + и(Ь..) + и(Ьк )

^ 1<k<M - y(s,t) 1< j,k<M - y (s,t ) )

(5)

Уравнение (5) назовем уравнением репродуктивного роста схемы 5 в рассматриваемом случае N = 3 турнирно-рулеточной селекции.

Таким образом, при выполнении неравенства

у3(у,г) | у ц(а,) + ц(а]) ц(а,) >1

М3 М3 1](у,г) м-(а,) + щ(а.) + ^(Ьк) М3 у" ц(а,) + ц(Ь,) + ц(Ь^)

1<к<М - у(*,г) 1< ],к<М - у(*,г)

схема получает увеличенное число хромосом в следующую генерацию О. В частности, из уравнения (5) следует неравенство

Е(у(у г +1))> у(* + 6у2гХМ -уС^г)) Щ*г) + Зу^г)(М -у(*г))2 Щ*г)

у , " у , \ М3 М4 Е (г) М4 Е (г)

(6)

где г) - средняя приспособленность хромосом, соответствующих схеме 5, в момент t, Е (г) -средняя приспособленность хромосом всей популяции в момент t.

Как следует из формулы (6), число строк в популяции, отвечающих схеме 5, растёт, если

Щ*, г) . М (М2 + Му(у, г)+у2 (у, г))

Е (г) 6 у2 (*, г)+Зу(*, г )(м - у(*, г)) ■ (7)

Следовательно, выполнение неравенства (7) является простым достаточным условием роста числа хромосом, соответствующих схеме 5, в следующую генерацию О.

Оценка математического ожидания Е(у(*, г +1)), получаемая из уравнения (5) репродуктивного роста схемы 5 с учётом генетических операторов скрещивания и мутации для турнирно-рулеточной селекции в случае N = 3 имеет вид

Е(у(*, г +1))> у(*, г ).(1 - 1.(1 - рт )

, ' X

Л | \ -1т/

т -1 у

( \

у3 (*, г) у Щ(а,) + Щ(а] ) ^ _щ(а.)

г3 д {3 Х \ , \ , ../г. \ д ,г3 Х

М М 1<',]<у(*,г) щ(а,) + щ(а]) + щ(Ьк) М ш<у(*,г) щ(а,) + ц(Ь, ) + м.(Ь)

1<к<М - у(*,г) 1< ],к <М - у(*,г)

(8)

где 0(5) и й(5) соответственно порядок и определяющая длина схемы 5, рс, рт - вероятности скрещивания и мутации хромосом из родительского пула Р.

Случай произвольного N < М. В общем случае турнирно-рулеточной селекции аналогичный предыдущим вычислениям подсчёт вероятностей приводит к оценке математического ожидания количества хромосом родительского пула Р на следующем шаге Е(у(*, г +1)):

Е(у(*, г +1))> у(А, г ).(1 - ).(1 - рт )

,,, ,т Г X

т-1.

N-1 / \ N-2

N ( ) cN-1 \ ) CN-2

у (*,г) , Ч^ V к=1 У к У , V к =1

м11 м1 ^ Ал N-1 Г Л. Л Л м1 - Х

1<'к<у(*,г), V Щ а1 | + Щ Ь. | М 1<'кV Щ а, | + Ь ■ | + Щ Ь..

1<к<N-1, к=1 У 'к.. У ]1 У 1<к<1-2, к=7 У 'к У У ]1 У У ]2

1<]1<М-у(*,г) 1<]1,]2<М - у(*,г)

у ЩУ а'1У+Ч а'2У ЩУа'1

М^ Х Г \ Г \ N-2 Г ч »^ . Х

к^у^х щУа 1 + ЩУа У +ХУь У М1 1<'1<у(*,г), ЩУа У+V ь

1<]к<М-у(*,г), У '1У У '2 У У ]к У 1<]к<М-у(*,г),рУ '1 у ]к 1<к<1-2, 1<к<1 -1,

X

X

где C" =-—-, o(s) и d(s) соответственно порядок и определяющая длина схемы s, pc, pm -

n m!(— — m)! c "

вероятности скрещивания и мутации хромосом из родительского пула P.

Из оценки (9) соответственно при N = 2 и N = 3 получаются неравенства (4) и (8).

Работа выполнена при поддержке Российского фонда фундаментальных исследований, грант № 16-29-12911.

Список литературы

1. Рутковская Д., Пилиньский М., Рутковский Л. 2013. Нейронные сети, генетические алгоритмы и нечёткие системы. М.:Горячая линия-Телеком.

Rutkovska D., Pilinsky M., Rutkowski L. 2013. Neural networks, genetic algorithms and fuzzy systems. M: Hotline-Telecom.

2. Кричевский М.Л. 2005. Интеллектуальные методы в менеджменте. СПб.: Питер. Krichevsky M.L. 2005. Intelligent methods in management. SPb .: Peter.

3. Гладков Л.А., Курейчик В.В., Курейчик В.М. 2006. Генетические алгоритмы. М.: Физматлит. Gladkov L.A., Kureichik V.V., Kureichik V.M. 2006. Genetic algorithms. M.: Fizmatlit. 2006.

4. Holland J. 1975. Adaptation in natural and artificial systems. Ann Arbor, MI: University of Michigan.

5. Petrosov D.A., Lomazov V.A., Dobrunova A.I., Matorin S.I., Lomazova V.I. 2015. Evolutionary synthesis of large discrete systems with dynamic structure. Biosciences Biotechnology Research Asia, V. 12, № 3: 2971-2981.

6. Petrosov DA., Lomazov V.A., Dobrunova A.I., Matorin S.I., Lomazova V.I. 2015. Large discrete systems evolutionary synthesis procedure. Biosciences Biotechnology Research Asia, V. 12, № 3. : 1767-1775.

i Надоели баннеры? Вы всегда можете отключить рекламу.