УДК 533.9.082.5
РЕГУЛЯРИЗАЦИЯ И ОГРАНИЧЕНИЕ ОБЛАСТИ РЕШЕНИЙ В ОБРАТНЫХ ЗАДАЧАХ КОЛЕБАТЕЛЬНО-ВРАЩАТЕЛЬНОЙ СПЕКТРОСКОПИИ
А.В. Петраков, А.П. Щербаков
Институт оптики атмосферы СО РАН, г. Томск E-mail:[email protected]
Рассмотрен подход к решению задачи подгонки гамильтониана молекулы типа асимметричного волчка, основанный на применении метода регуляризации. В отличие от ранее известных подходов, применены специальные методы для обеспечения устойчивости процесса решения и для ограничения области решений. Ограничение области решений обеспечивает получение решения, имеющего физический смысл.
Ключевые слова:
Колебательно-вращательная спектроскопия, гамильтониан молекулы, аппроксиманты Паде-Бореля, обратные задачи спектроскопии.
Введение
Спектры молекул содержат уникальную информацию как о структуре и свойствах молекул, так и о внутримолекулярных и межмолекулярных процессах. Извлечение этой информации и её понимание требуют построения моделей изучаемых молекул и процессов. Создаваемые модели, если они правильные, должны хорошо согласовываться с экспериментальными данными или, по крайней мере, отражать изучаемые тенденции и зависимости. Кроме этого, многие модели используются для интерполяции или предсказания поведения изучаемой системы. Для осуществления вышеперечисленных возможностей в том или ином виде решается задача корректировки модели с помощью данных, полученных из эксперимента. Задачи такого класса принято называть обратными.
В настоящей статье рассмотрим задачу определения параметров модели энергетического спектра молекул типа асимметричного волчка. Мы будем работать с эффективным колебательно-вращательным гамильтонианом Уотсона (Watson) [1], дополненным методами суммирования расходящихся рядов [2]. Обычно обратные задачи принято решать в смысле минимума среднеквадратичного отклонения, применяя для этого различные алгоритмы метода наименьших квадратов [3].
Большинство нетривиальных обратных задач, к каковым относится и наша задача, являются плохо обусловленными по Адамару [4], что означает возможность не единственного решения и высокую чувствительность к входным данным, что усугубляется особенностями модели [1]. Задачи, обладающие перечисленными свойствами, в литературе часто называют некорректными. Для их решения применяют различные дополнительные методы, в том числе методы регуляризации [4], которые в дальнейшем часто будут в центре нашего внимания.
Из предыдущих работ в направлении решения некорректных задач подгонки колебательно-вращательных гамильтонианов молекул к экспериментальным данным, можно отметить работы [5, 6].
Однако описанные методы требуют напряженного внимания и длительного времени при решении задачи и не обеспечивают автоматического, на каждом этапе, получения результата, имеющего физический смысл, поскольку неспособны контролировать как знаки параметров, получаемых из подгонки, так и их допустимые значения.
Задача подгонки параметров эффективного вращательного гамильтониана молекул типа асимметричного волчка
Рассмотрим следующую задачу. Пусть нам даны полученные из эксперимента уровни энергии молекулы
Е = {Е1, Е2,.., Ем }, (1)
где N - общее число уровней. Уровни (1) соответствуют состояниям
5 = ^ 52,..., ^ }. (2)
Пусть у нас есть модель в виде функции
У (5|в), (3)
которая позволяет вычислять соответствующие состояниям (2) уровни энергии, и которая зависит от параметров
в = {01 Д,...,0м }
где М - общее число параметров. В качестве модели (3), в случае жестких молекул типа Н28, берется гамильтониан Уотсона [1]. В случаях высоковозбужденных вращательных состояний менее жестких молекул, таких как Н2О, происходит сильная центробежная деформация. Рост значений центробежных постоянных ряда Уотсона ведет к уменьшению его радиуса сходимости. В таких случаях часто применяют методы суммирования расходящихся рядов, такие как аппроксиманты Паде-Бореля [2]. Более подробное описание использования аппрок-симантов Паде-Бореля для вычисления собственных значений эффективного вращательного гамильтониана молекул типа асимметричного волчка можно найти в [5, 6].
Известия Томского политехнического университета. 2008. Т. 313. № 2
В традиционном виде обратная задача ставится как задача нахождения минимума функционала
1 в) = Е"!"^ (s¡\в) - Е, }2
¡=1 N & 4
(4)
где & - ошибка измерения величины Е. Наиболее широко применяемый для минимизации (4) метод, основан на сведении данной задачи к задаче решения системы линейных уравнений. Условия экстремума функционала (4) есть равенство нулю первых производных этого функционала по параметрам в.. Можно показать, что если модель 7(^0) не линейна по параметрам, как в случае [1], то задача может быть решена только итерационно. Возникают две главные проблемы при решении задачи минимизации (4). Первая состоит в наличии локальных минимумов, что приводит к зависимости решения от начального приближения. Вторая проблема - это малое по величине число обусловленности матрицы нормальной системы (определяется как абсолютная величина отношения наибольшего по модулю собственного значения матрицы к наименьшему). Это вызвано малым количеством информации для определения некоторых из компонент вектора параметров в. Методы регуляризации основаны на использовании дополнительной информации об искомых величинах. Согласно схеме, описанной в [4], вместо (4) перейдем к минимизации функционала вида
м (а а V
1
1 (в) = (х>\в) - Е }2 + а£
г &
1=1
(5)
где вj априорно известные приближенные значения для параметров в, нормировочные множители, определяющие масштабы для компонент меры в пространстве параметров, равные ошибкам определения величин в. М - общее число параметров. В книге [4] содержится вся необходимая информация об условиях применимости сглаживающего функционала (5). Согласно [4], в процессе решения обратной задачи используется любой итерационный метод поиска параметра а, при котором схема
в*: 1 (в)~-
>Ш1И,
(6)
Для привлечения информации об интервалах, в нашу обратную задачу, можно предложить следующий метод. Запишем новый функционал вместо (5)
1м
1 (в) = Е (х\в)-Е}2 + ЕЯ(в-,в~;,в~;), (7)
где
-=1
Яв- ,д+) =
вj <д- : а1 в- >в)+ : а1
V 1 1 У
V 1 1 У
+ящ вв в +
+Я(в, в ,в;+,
иначе:
К(в- в в)
Я(в1 в
,в+) =а2
в1 - в
+ в+ )/2
в +-в -
(8)
(9)
Под в-, в+ обозначены, соответственно, левая и правая границы интервала для параметров в .
Вышеописанный подход полностью вписывается в теорию регуляризации, изложенную в [4], что обеспечивает его работоспособность. При стремлении параметров регуляризации а1 и а2 к нулю, результат минимизации функционала (6) стремится к псевдорешению (решению, не учитывающему априорную информацию).
В качестве оценки точности компонент вектора в берется доверительный интервал, оценка которого записывается в виде
Г = Т(МХ-а Х (А )
где & =
N ехр
Е (у ($\в) - е, )2
=1
т
(Щ) 1 - элемент ма-
обеспечивает среднеквадратичную ошибку по уровням энергии, примерно (в заданных пределах) равную ошибке измерения экспериментальных данных.
В некоторых случаях дополнительные ограничения области решений в* исследователь может указать, исходя из теоретических предпосылок, в виде интервалов допустимых значений параметров в, за пределами которых значения параметров перестают иметь физический смысл. В литературе такая задача известна как задача нелинейного программирования с ограничениями в виде неравенств [7], стандартного метода, решения которой нет. В книге [7] отмечено, что способ решения такой задачи выбирается исследователем, исходя из ее особенностей для каждого конкретного случая.
трицы, обратной матрице нормальной системы Щ, т. е. матрице Грамма (см. [3]), формируемой при решении задачи (6) для функционала (7); Т(т)1-а -квантиль распределения Стьюдента для вероятности ошибки а, которую при т=Ы-Мможно найти из таблицы [8].
Заключение
Предложенный метод подгонки несложен для программной реализации. По сравнению с предложенными ранее (например, в [7]), он может использоваться в качестве общей схемы для решения широкого разнообразия задач нелинейного программирования с «нежёсткими» ограничениями в виде неравенств. Метод полностью включает возможности алгоритмов, описанных в [3, 4], но в дополнение, благодаря необычному виду сглаживающего функционала (7)-(9), позволяет контролировать знаки и интервалы искомых параметров модели, значительно повышая вероятность получения
в
набора параметров, имеющих физический смысл. Следующая серия статей будет посвящена использованию данного подхода для оценки параметров эффективного вращательного гамильтониана групп колебательных состояний молекулы Н20.
Авторы выражают благодарность заведующему лабораторией молекулярной спектроскопии Института оптики атмосферы СО РАН, д.ф.-м.н. Л.Н. Синице и г.н.с. Института оптики атмосферы, д.ф.-м.н. АД. Быкову за организационную помощь и консультирование по вопросам колебательно-вращательной спектроскопии.
СПИСОК ЛИТЕРАТУРЫ
1. Watson J.K.G. Simplification of the Molecular Vibration-Rotation Hamiltonian // Molecular Physics - 1968. - V. 15. - № 5. -P. 479-490.
2. Polyansky O.L. One-Dimensional Approximation of the Effective Rotational Hamiltonian of the Ground State of the Water Molecule // Journal of Molecular Spectroscopy - 1985. - V. 112. - № 1. -P. 79-87.
3. Мудров А.Е. Численные методы для ПЭВМ на языках Бейсик, Фортран, Паскаль. - Томск: МП «Раско», 1991. - 270 с.
4. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. - М.: Наука, 1979. - 284 с.
5. Emelyanov D.S., Stroinova V.N. Relaxationparameters of H20-N2 spectral lines using Pade-Borel transformation // Proceedings of SPIE. - 2008. - V. 6936. - 693603 (6 pages).
6. Стройнова В.Н., Емельянов Д.С. Применение преобразования Паде-Бореля для расчётов релаксационных параметров линий молекулы // Известия Томского политехнического университета. - 2008. - Т. 312. - № 2. - С. 48-53.
7. Нурминский Е.А. Нелинейное программирование. - Владивосток: ДВГУ, 2003. - 24 с.
8. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. - М.: Наука, 1984. - 831 с.
Поступила 15.05.2008 г.
УДК 539.194:535.621
МОДЕЛЬ РЕЛАКСАЦИОННЫХ ПАРАМЕТРОВ СПЕКТРАЛЬНЫХ ЛИНИЙ ДВУХАТОМНЫХ МОЛЕКУЛ ПРИ СИЛЬНОМ КОЛЕБАТЕЛЬНОМ ВОЗБУЖДЕНИИ
А.Д. Быков, Д.С. Емельянов, В.Н. Стройнова*
Институт оптики атмосферы СО РАН, г. Томск *Томский политехнический университет E-mail: [email protected]
Представлена теоретическая модель, позволяющая получить расчетные значения полуширины и сдвига центров линий двухатомных молекул для спектральных баз данных и лазерной физики. Достоверность модели подтверждена сравнением с экспериментальными данными для линий полосы 0-3 молекулы СО. Показана хорошая предсказательная способность модели для переходов на высокие колебательные состояния.
Ключевые слова:
Физика лазеров, высоковозбужденные колебательные состояния, внутримолекулярная динамика, вариационный метод, сдвиг центра линии, полуширина линии.
Введение
В настоящее время большое внимание уделяется разработке молекулярных газовых лазеров, способных служить стандартами частоты. Например, в современных СО-лазерах с каскадным механизмом генерации используются переходы на высоковозбужденные колебательные состояния вплоть до у=41 [1], у=36, 38 [2, 3]. Для построения кинетических моделей лазеров, генерирующих на высоких колебательно-вращательных (КВ) переходах, необходимо знание релаксационных параметров контура линий колебательно возбужденного рабочего вещества. Особую важность приобретает исследование колебательной зависимости полуширины и сдвига центров линий молекул рабочего вещества (СО, N0, НД НС1, Н2, HD) в лазерах с оп-
тической накачкой и каскадным механизмом генерации [4, 5]. В [4] исследовались свойства плазмы, содержащей смесь СО с азотом, кислородом или аргоном, накачиваемой излучением СО-лазера. Было установлено, что вычисленная в рамках кинетической модели заселенность высоких колебательных состояний не согласуется с измеренной величиной (расхождение почти в 1,5 раза). По-видимому, существенное отличие расчета от эксперимента обусловлено некорректными значениями релаксационных параметров высоких колебательных состояний молекулы СО.
В [6, 7] нами было исследовано влияние внутримолекулярной динамики высоковозбужденных КВ состояний на релаксационные параметры контура линий двухатомных молекул. Было показано,