Научная статья на тему 'Использование генетического алгоритма в задаче оптимизации структуры брэгговского волоконного световода'

Использование генетического алгоритма в задаче оптимизации структуры брэгговского волоконного световода Текст научной статьи по специальности «Физика»

CC BY
100
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук

Аннотация научной статьи по физике, автор научной работы — Богданович Д. В.

С использованием генетического алгоритма оптимизирована структура брэгговского световода с полой сердцевиной на максимальное отражение света от многослойной оболочки. Представлено краткое описание метода и основные результаты.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование генетического алгоритма в задаче оптимизации структуры брэгговского волоконного световода»

ИСПОЛЬЗОВАНИЕ ГЕНЕТИЧЕСКОГО АЛГОРИТМА В ЗАДАЧЕ ОПТИМИЗАЦИИ СТРУКТУРЫ БРЭГГОВСКОГО ВОЛОКОННОГО СВЕТОВОДА

Д.В. Богданович

Московский инженерно-физический институт (государственный университет)

Аннотация

С использованием генетического алгоритма оптимизирована структура брэгговского световода с полой сердцевиной на максимальное отражение света от многослойной оболочки. Представлено краткое описание метода и основные результаты.

Очень часто при исследовании различных физических явлений возникают ситуации, когда необходимо численно получить корень системы уравнений, найти глобальный экстремум функции многих переменных. Задачами такого рода являются задачи оптимизации, для решения которых, к сожалению, среди интегро-дифференциальных методов нет универсального алгоритма. Для каждого отдельного случая приходится подбирать свой метод или даже комбинировать несколько. Общими недостатками для этих алгоритмов являются необходимость знания «рельефа» исследуемой поверхности и точного ограничения положения глобального экстремума функции, неспособность выходить из возможных локальных экстремумов.

Наиболее подходящим для решения такого рода задач, на наш взгляд, является генетический алгоритм (ГА), впервые предложенный J. H. Holland (1975) [1]. Методологическая основа ГА базируется на прямой аналогии гипотез селекции, существующих в природе. ГА оперирует популяциями потенциальных решений, применяя принцип выживания и участия в формировании потомства наиболее приспособленных из них. Приспособленность каждого потенциального решения определяется значением его целевой функции, насколько данное решение отличается от желаемого результата. Чем выше приспособленность решения, тем выше вероятность того, что в потомстве, полученном с его участием, «полезные» признаки, определяющие приспособленность, будут выражены еще сильнее. Практикуемый в ГА способ описания математических моделей подразумевает символьное кодирование информации о них. «Вектор переменных» играет здесь ту же роль, что и категория «генотип» в биологии. Группировка ключевых параметров в вектор переменных, по существу, придает им статус генетической информации. ГА не требует знания рельефа поверхности, на которой происходит поиск экстремума, способен выходить из точек локальных экстремумов, прост в реализации и не нуждается в больших вычислительных мощностях.

В волоконной оптике ГА может быть применен в задаче оптимизации брэгговского волоконного световода для достижения максимального отражения света от многослойной оболочки. Брэгговский волоконный световод представляет собой одномерный фотонный кристалл, свет в котором распространяется, в основном, в полой сердцевине или сердцевине

из материала с меньшим, чем у оболочки, показателем преломления (рис. 1). Это оказывается возможным, поскольку оболочка служит многослойным диэлектрическим зеркалом, работающим по принципу брэгговских резонансов [2]. Благодаря этому, ряд свойств брэгговского световода значительно отличается от стандартных двухслойных световодов. В частности: высокий порог возникновения нелинейных явлений, одномодовость и возможность возбуждения поляризационно-невырожденных мод в широком спектральном диапазоне, возможность варьирования дисперсионных свойств, - делают брэггов-ские волоконные световоды перспективными во многих приложениях, где обычные волоконные световоды имеют существенные ограничения или не

применимы вовсе.

®

показателя преломления п в зависимости от радиальной координаты г для обычного кварцевого (а) и брэгговского световодов (б)

Несмотря на то, что методы анализа свойств многослойных цилиндрических световодов были предложены Р. УеИ, А. Уапу (1978) [2] достаточно давно, и на сегодняшний день также существует большое количество теоретических работ, посвященных данной проблеме, полного понимания поставленной задачи пока нет [3]. В частности, авторы, по аналогии с плоскопараллельным случаем, исследуют структуры с оптическими толщинами слоев равными четверти длины волны, не учитывая специфики задачи, обусловленной ее цилиндрической симметрией. Дело в том, что при цилиндрической геометрии компоненты электромагнитного поля выражаются цилиндрическими функциями с меняющимся пространственным периодом, что приводит к зависимости толщины слоев оболочки от радиаль-

ной координаты г. По мере увеличения г, толщины слоев оболочки уменьшаются и только асимптотически, при сравнительно больших г, когда цилиндрические функции с хорошей точностью аппроксимируются тригонометрическими, коаксиальная структура многослойного диэлектрического зеркала становится периодической. В работе [4], было обращено на это внимание и проведена попытка оптимизации световедущей структуры по максимуму отражения света от оболочки. Однако авторы проводили оптимизацию структуры световода последовательно добавляя слой за слоем, что не корректно. Дело в том, что волноводные характеристики брэг-говского световода для фиксированной моды зависят от величин действительной и мнимой частей ее постоянной распространения р. Действительная часть в отвечает за дисперсионные характеристики моды, мнимая часть в - за ее потери. Величины мнимой и действительной частей в зависят от конструкции многослойной оболочки световода, любое изменение которой, например добавление дополнительного слоя, приводит к изменению в, что сказывается на распределении полей во всей структуре в целом. Таким образом, следует оптимизировать структуру световода уже с фиксированным числом слоев оболочки. Кроме того, авторы [4] рассматривали только поперечные моды и не проводили анализа потерь и дисперсионных характеристик модо-вой структуры брэгговского световода. В этом смысле попытка оптимизации брэгговского световода не была доведена ими до конца.

Компоненты полей направляемых мод в слоях оболочки брэгговского световода связаны между собой посредством матрицы перехода, которая определяется из условий непрерывности полей мод на границах раздела слоев оболочки. Определитель матрицы перехода является дисперсионным уравнением, которое при известных координатах границ слоев оболочки г,-, дает связь постоянной распространения моды в с длиной волны X. Таким образом, задача оптимизации структуры брэгговского волоконного световода представляет собой обратную электродинамическую задачу. Необходимо при заданных начальных параметрах - рабочей длине волны X, контрасте показателей преломления слоев оболочки Дп, числе слоев N и радиусе сердцевины гь найти такую структуру световода, которая для выбранной нами моды удовлетворяет дисперсионному уравнению и соответствует постоянной распространения в с наименьшей возможной мнимой частью.

Несомненным достоинством ГА при решении такого рода задач, является способность быстрого обнаружения глобального экстремума на исследуемом пространстве. Однако доведение найденного значения до заданной точности, может занимать у ГА гораздо более продолжительное время, нежели у традиционных методов. Для устранения этого не-

достатка, ГА использовался совместно с безградиентным методом многомерной минимизации [5].

Реализация использованного нами метода состояла в следующем. Изначально, случайным образом генерировалась популяция из М особей - возможных решений дисперсионного уравнения, представляющих собой цепочки чисел, из которых две первые позиции занимают значения действительной и мнимой постоянной распространения в, а все остальные значения координат границ слоев - всего N+2 позиции (рис. 2).

Рис.2. Способ кодирования информации, описывающей модель брэгговского световода

Для всех переменных, исходя из физических соображений, определялась заранее область возможных значений. Каждая мода обладает определенным значением эффективного показателя преломления пед = вХ/2п, характеризующим ее фазовую скорость. Поскольку рассматриваемые моды являются «несобственными» модами брэгговского световода, то для них должны выполняться условия

Яе р < 2лп0/X (или пе// < п0),

1т р> 0, (1)

где п0 - показатель преломления материала сердцевины [6]. Таким образом, для в выбирались области, соответствующие наибольшим допустимым значениям действительной части и наименьшим возможным значениям мнимой части (рис. 3). В плоскопараллельном случае слой диэлектрика с показателем преломления п максимально отражает свет с длиной волны X, если толщина слоя оказывается кратной нечетному числу величин Х/4п [7]. Чтобы учесть коррективы, вносимые цилиндрической симметрией, центры областей изменения значений координат соседних слоев г- отличались друг от друга на величины Л/ , которые варьировались в пределах от одного до нескольких Х/4п, ширины областей Д < Л/ (/ = 1;2 для нечетных слоев и четных слоев соответственно) (рис. 4). Радиус сердцевины г1 был фиксированной величиной.

Затем для каждой особи вычислялась целевая функция

= 1/Р (X,), (2)

где р(х,) - значение дисперсионного уравнения для х, . В данном случае, чем выше было значение целевой функции, тем больше было шансов у особи в дальнейшем участвовать в формировании потомст-

ва. Вычислялась средняя приспособленность популяции.

f =-

If

м

(3)

Imp

2пп„ X

j^JmP^Rep,.)

0

?Шо Rep

А,

Рис.3. Область допустимых значений для Яе@ и 1тв Г1 . ^2±А1

V

■Н

гъ± Д2

А, '

Рис.4. Область допустимых значений для координат границ слоев оболочки г1

Далее осуществлялся отбор кандидатов на роль родительских особей. Случайным образом равновероятно выбирались две особи и производилось сравнение их целевых функций. Особь с большим значением целевой функции участвовала в формировании потомков. Повторным испытанием подбиралась вторая родительская особь. Над генотипами родителей производилась операция скрещивания -кроссинговер, а затем равновероятно выбирался один из полученных потомков. Кроссинговер, описывающий механизм формирования хромосомы потомка, приводит к тому, что она включает в себя фрагменты родительских хромосом. Именно благодаря наличию кроссинговерных обменов особи популяции обмениваются между собой генетической информацией, таким образом, поиск приобретает коллективный характер. Поскольку ГА имеют дело с популяциями постоянной численности, особую актуальность здесь наравне с отбором в родители приобретает отбор кандидатов на выбывание из популяции.

Поскольку каждый участок хромосомы любой особи из популяции несет определенную функциональную нагрузку, желательно создание такой комбинации участков хромосом, которая составляла бы наилучшее из решений, возможных при исходном генетическом материале. Целью рекомбинации является накопление в конечном решении всех лучших функциональных признаков, какие имелись в наборе исходных решений. В основном, эффективность ГА определяется структурой оператора крос-синговера, поэтому при скрещивании генотипов родителей и заменой потомком одной особи из популяции, над оператором кроссинговера в четыре этапа проводилась процедура модификации. На первых двух этапах генотип потомка формировался при помощи одноточечного кроссинговера двух родитель-

ских особей. Разница заключалась в том, что на первом этапе особь на элиминирование выбиралась произвольным образом, а на втором этапе на элиминирование выбиралась особь с наименьшим значением целевой функции в популяции. Простой одноточечный оператор кроссинговера производил преобразование двух хромосом и частичный обмен информацией между ними, используя точку разрыва, выбранную случайно. Более эффективным по сравнению с одноточечным, является двухточечный оператор кроссинговера, в котором точки разрыва так же выбираются случайно. На третьем этапе, над генотипами родителей производился двухточечный кроссинговер и потомок заменял особь с наименьшим значением целевой функции. Отличие четвертого этапа заключалось в том, что в формировании потомков участвовали уже три родительские особи, над которыми производилась процедура двухточечного кроссинговера и генотипы потомков формировались так, как это показано на рис. 5. Развитием двухточечного оператора кроссинговера является многоточечный оператор кроссинговера, который выполняется аналогично двухточечному, однако в работе он не использовался, так как большое число точек разрыва может привести к потере хороших родительских свойств [8].

V V

Rep, Imp, Г14 r2A Г1А ....

Repa 1шря rl* Гц, ....

RePc Impc rUC Г2,С гг,с ....

/ \ 0 ' \

Rep, Imp, ru> rijs .... rN,C

Repc Impc r24 ....

Reps Impa ri,c ГХс .... rNA

Рис.5. Формирование генотипов потомков, полученных путем двухточечного кроссинговера трех родительских особей

На рис. 6 представлено сравнение эффективности разных вариантов генетического алгоритма при одинаковом числе потомков п. Так как формирование первичных популяций особей носит вероятностный характер, то их начальная средняя приспособленность / может отличаться друг от друга. Кривая ОЛ I показывает, что произвольный выбор особи на элиминирование, может приводить к случаям, когда «плохой» потомок заменяет «хорошую»

особь и значение функции / уменьшается. Однако, несмотря на это, с увеличением числа потомков п наблюдается рост / . Из ОЛ II видно, что отбор на элиминирование наименее приспособленных особей

i= 1

привел к тому, что среднее значение целевой функции / с увеличением числа поколений потомков постоянно росло. Применение двухточечного крос-синговера GA III существенно повышало эффективность метода, а ввод третьего родителя в GA IV позволил ускорить накопление «полезных» признаков,

что привело в итоге к значительному росту / .

7 100

10

0,1

0,01

1- GAI

2- GAII

3- GAIII

4- GAIV

—I—

50

100 150 200

Рис.6. Сравнение эффективности различных вариантов оператора кроссинговера

Применение начальных популяций большой численности увеличивало вероятность нахождения области глобального минимума, модифицированный оператор кроссинговера в свою очередь способствовал накоплению «полезных» признаков и позволял эффективно конструировать из исходного генетического материала наилучшее возможное решение. Дальнейшее улучшение решения потребовало бы применения оператора мутации, который, вероятностным образом, генерировал особи с новыми фенотипическими признаками. Но такое доведение решения до заданной точности потребовало бы много времени. Для того чтобы этого избежать, на данном этапе применялся безградиентный метод многомерной минимизации, в котором особь с наибольшим значением целевой функции использовалась в качестве начальной точки. В методе многомерной минимизации функция F последовательно минимизировалась по каждой координате в отдельности и по истечении некоторого количества итераций, решение доводилось до требуемой точности.

Для проверки работоспособности описанного метода решалась задача оптимизации структуры брэг-говского световода для низших поперечных ТЕ01, ТМ01 и гибридной НЕ11 мод при X = 1,65 мкм. Структура обладала радиусом сердцевины г1 = 7,5мкм, показателями преломления сердцевины n0 = 1,0, оптически более плотных слоев n1 = 3,5 и менее плотных n2 = 2,0 и числом слоев N = 8. На рис. 7 и рис. 8 приводятся зависимости потерь а и эффективных показателей преломления nef от длины волны X для ТЕ01, ТМ01 и НЕ11 мод. Индексом X/4 помечены моды структуры с толщинами слоев равными четверти

длины волны, индексами Opt обозначены моды оптимизированных структур. На рис. 9 представлены распределения координат границ слоев r для четвертьволновой и оптимизированных структур. Координаты границ слоев для структур, оптимизированных на ТЕ01 и НЕц моду, совпали. a,dB/m

705;

1&Л 1(?\ 1&

10

1,20 1,35 1,50 1,65 1,80 1,95 X, цт

Рис. 7. Зависимость потерь а от длины волны X для ТЕ01, ТМ01 и НЕ11 мод четвертьволновой и оптимизированных структур

"eff 1,000

0,9950,9900,9850,9800,975

1 - ТЕ™

2 -яС

3 -НЕ™

4 TP Opt - 1с,т

5 - TM°f

6 - HE°f

X, \хт

1,50 1,65 1,80 1,95

Рис.8. Зависимость эффективного показателя преломления neff от длины волны X для мод четвертьволновой и оптимизированных структур

г, \ш

9,50 9,259,00 8,758,50 8,258,00 7,75 7,50-

1-Х/4

2 - ТМ°?

3 - теТ <& НЕТ

01 23 456789Ы

Рис.9. Распределения координат границ слоев ri четвертьволновой и оптимизированных структур

Таким образом, соединив гибкость, простоту и универсальность ГА с точностью метода многомер-

ной минимизации, удалось создать метод, который быстро и эффективно решает задачу оптимизации брэгговского световода.

В заключение автор выражает признательность профессору А.Н. Малову за проявленный к работе интерес и плодотворные дискуссии.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Holland J.H. Adaptation in Natural and Artificial Systems // Cambridge, MA: The M.I.T. Press, 1975.

2. Yeh P., Yariv A., Marom E. Theory of Bragg fiber // J. Opt. Soc. Am., 1978. Vol. 68. P. 1196-1201.

3. Бирюков А.С., Богданович Д.В., Дианов Е.М. Брэгговские волоконные световоды: основные методы исследования // Фотон-Экспресс, 2005. №6. С. 72-76.

4. Николаев В.В., Соколовский Г.С., Калитеевский М.А. Брэгговские отражатели для цилиндрических волн // Физика и техника полупроводников, 1999. Т. 33. В. 2. С. 174-179.

5. Press W.H. et al. Numerical recipes in Fortran 77: the art of scientific computing // 2nd ed., Cambridge University Press, 1997. P. 406-413.

6. Xu Y., Yariv A., Fleming J.G., Lin S.Y. Asymptotic analysis of silicon based Bragg fibers // Opt. Express 2003. Vol. 11. P. 1039-1049.

7. Борн М., Вольф Э. Основы оптики // М.: Наука, 1970. С. 95.

8. Гладков Л.А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы // под ред. Курейчика В.М. -2-е изд., испр. и доп. - М.: Физматлит, 2006.

i Надоели баннеры? Вы всегда можете отключить рекламу.