УДК 519.7
Вестник СПбГУ. Сер. 1. 2011. Вып. 4
ДИНАМИКА ПРОЦЕССОВ МАКСИМИЗАЦИИ КВАНТОВОЙ ЭНТРОПИИ В КОНЕЧНОУРОВНЕВЫХ СИСТЕМАХ*
А. А. Селиванов
С.-Петербургский государственный университет, студент, antonselivanov@gmail.com
1. Введение. Важную роль в поиске и изучении закономерностей в естественных науках играют вариационные и экстремальные принципы. Они помогают не только наглядно представить физический смысл явления, но и взглянуть на него по-новому, давая толчок к новому пониманию природы. В физических науках широко применяются такие вариационные принципы как принцип наименьшего (стационарного) действия, принцип наименьшего принуждения и т.д. [1]. Математическим аппаратом для вывода уравнений динамики систем из вариационных принципов является вариационное исчисление. В более общих ситуациях могут применяться получившие развитие в кибернетике методы оптимального управления: принцип максимума Понтря-гина и динамическое программирование [2, 3]. Одним из так называемых локальных экстремальных принципов является принцип скоростного градиента [4, 5], предписывающий переменным системы изменяться в направлении градиента от скорости изменения некоторого «целевого» функционала, убывание которого характеризует естественную тенденцию динамики системы.
В последние десятилетия значительный интерес в задачах статистической физики и механики вызывает принцип максимума энтропии, основы которого закладывались еще У. Гиббсом, получивший существенное развитие в работах Э. Джейнса [6, 7]. В соответствии с принципом максимума энтропии, энтропия системы в равновесном состоянии достигает максимального значения при ограничениях, возникающих из других физических законов. Принцип максимума энтропии нашел также применение для нахождения решений широкого класса задач прикладной математики и техники. Однако этот принцип ничего не говорит о переходных режимах, о том, как, по какой траектории стремится состояние системы к состоянию с максимальной энтропией.
В работах [8, 9] принцип скоростного градиента был применен к построению уравнений динамики переходных процессов в системах, подчиняющихся принципу максимума энтропии. Были построены уравнения статистической динамики конечных систем частиц, при соблюдении законов сохранения массы (числа частиц) и сохранения энергии. В [10] проведена экспериментальная проверка применимости принципа скоростного градиента на примере системы частиц, моделируемой методом молекулярной динамики на основе уравнений классической механики. Однако вопрос о распространении полученных результатов на квантово-механические модели остается открытым.
Настоящая работа посвящена построению и исследованию уравнений статистической динамики квантово-механических систем, подчиненных принципу максимума
* Работа выполнена при поддержке ФЦП «Кадры» (госконтракт 16.740.11.0042). Кроме того, автор благодарит своего научного руководителя профессора А. Л. Фрадкова за постановку задачи и внимание к работе.
© А. А. Селиванов, 2011
квантовой энтропии. Дается вывод уравнений динамики и анализ их асимптотических свойств.
2. Предварительные сведения. 2.1. Метод скоростного градиента. Рассмотрим класс открытых физических систем, модели динамики которых описываются системой дифференциальных уравнений
х = /(х, и, Ь), (1)
где х € С п —вектор состояния системы, и — вектор входных (свободных) переменных, Ь > 0. Задача моделирования (построения модели) системы может быть поставлена как нахождение закона изменения (эволюции) и(Ь), удовлетворяющего некоторому критерию «естественности» ее поведения и придающего создаваемой модели свойства, наблюдаемые у реальной физической системы.
Построение такого критерия на основе экстремальных и вариационных принципов обычно предполагает задание некоторого интегрального функционала (например, функционал действия в принципе наименьшего действия [1]), характеризующего поведение системы. Минимизация функционала определяет реально возможные траектории системы {х(Ь),и(Ь)} как точки в соответствующем функциональном пространстве.
Кроме интегральных, были предложены дифференциальные (локальные по времени) принципы, такие как принцип наименьшего принуждения Гаусса, принцип минимальной диссипации энергии и др. Как отмечал М. Планк [11], локальные принципы имеют некоторое преимущество перед интегральными, поскольку они не ставят текущее состояние и движение системы в зависимость от ее позднейших состояний и движений. Следуя [4, 5], сформулируем еще один локальный вариационный принцип, основанный на методе скоростного градиента.
Принцип скоростного градиента: среди всех возможных движений в системе реализуются лишь те, для которых входные переменные изменяются пропорционально скоростному градиенту от некоторого «целевого» функционала
Принцип скоростного градиента предлагает исследователю на выбор два типа моделей динамики систем:
• модели, следующие из алгоритмов скоростного градиента в дифференциальной форме:
и = -ГУи<С (2)
• модели, следующие из алгоритмов скоростного градиента в конечной форме:
и = -ГУиСС г- (3)
Здесь Сг — скорость изменения целевого функционала вдоль траектории системы (1). Опишем схему применения принципа в простейшем (но и важнейшем) случае, когда класс моделей динамики (1) задан соотношением
х = и. (4)
Соотношение (4) означает всего лишь, что мы ищем закон изменения скоростей переменных состояния системы. В соответствии с принципом скоростного градиента прежде всего нужно ввести целевой функционал (функцию) С(х). Выбор С(х) должен быть основан на физике реальной системы и отражать наличие в ней тенденции
к уменьшению текущего значения Q(x(t)). После этого закон динамики может быть немедленно выписан в виде (2) или (3).
При этом задание закона динамики в виде (2) порождает дифференциальные уравнения движения второго порядка, которые инвариантны относительно замены времени г на (-г), т. е. соответствуют обратимым процессам. Напротив, выбор конечной формы (3) соответствует, как правило, необратимым процессам.
2.2. Теорема Ла-Салля. Рассмотрим автономную систему
X = I (х), (5)
где I: В ^ М" — локально липшицево отображение области В С М" в М".
Множество М называется инвариантным, если
х(0) € М ^ х(г) е М, Уг е М,
т. е. если решение принадлежит М в некоторый момент времени, то оно принадлежит этому множеству во все будущие и прошлые моменты времени. Множество М называется положительно инвариантным, если
х(0) е М ^ х(г) е М, Уг > 0.
Мы также будем говорить, что х(г) стремится к М при г, стремящемся к бесконечности, если для любой константы е > 0 существует момент времени Т > 0, такой что
^(х(г),М) <е, Уг>Т,
где (^^р, М) —расстояние от точки р до множества М, т. е. наименьшее из расстояний между точками р и точками множества М:
^(р, М) = М \\р - х\\.
хЕМ
Теорема (Ла-Салля). Пусть О С В —компактное множество, которое является положительно инвариантным для системы (5). Пусть V: В ^ М — непрерывно дифференцируемая функция, такая что У(х) < 0 в О. Предположим,что N — множество всех точек из О, в которых У(х) = 0, и М — наибольшее инвариантное множество, содержащееся в N. Тогда каждое решение, начинающееся в О, стремится к М при г ^ж.
Доказательство данной теоремы можно найти в [12], § 3.2, с. 115.
3. Основные определения. Пусть Н — конечномерное гильбертово пространство над полем комплексных чисел С, ё1ш(Н) = п. Если А — оператор из Н в Н, то сопряжённый к нему оператор будем обозначать А*. Под неотрицательной определённостью самосопряжённого оператора А > 0 понимаем неотрицательную определённость соответствующей квадратичной формы: Ух е Н : (х, Ах) > 0, где {■, ■) — скалярное произведение в Н. Следом оператора будем называть сумму его собственных чисел с учётом их кратностей: Тг(А) = ^"=1 АДА), где А^(А) —собственные числа А.
Оператором плотности будем называть линейный оператор р: Н ^ Н, такой что р = р* > 0 и Тг(р) = 1. Если мы рассматриваем систему на протяжении некоторого времени, то оператор плотности будет зависеть от времени. При этом в любой момент времени будут выполняться два физических закона:
1) закон сохранения массы: Тг(р) = 1;
2) закон сохранения энергии: Тг(рЕ) = Е,
где Е — некоторое постоянное вещественное число, Е: Н ^ Н такой, что Е = Е*. Оператор Е называется оператором энергии, и он не зависит от времени ([13], Гл. III, §17). Как известно, состояние квантовой системы может быть описано оператором плотности р. Зная, как изменяется оператор р(Ь), можно вычислить среднее значение любой величины, характеризующей систему ([13], Гл.11, § 14).
Следующее понятие, которое нам понадобится, это квантовая энтропия, или энтропия фон Неймана. Квантовая энтропия была введена в 1932 г. Джоном фон Нейманом [14] и является мерой статистической неопределенности в квантово-механических системах. Энтропия фон Неймана может быть выражена как в терминах собственных значений р, так и в терминах следа и логарифма оператора плотности р:
3 = Лг Лг = - Тг(р ^ р).
г
Если Лг = 0, то, продолжая по непрерывности Л Л, будем считать, что г-е слагаемое равно нулю. Через 3тах обозначим условный максимум функции 3 при условиях 1, 2. Заметим, что из условий р > 0 и Тг(р) = 1 следует, что 3тах < то.
4. Максимизация квантовой энтропии методом скоростного градиента.
Рассмотрим следующую систему:
р = и. (6)
Задача заключается в том, чтобы найти оператор и такой, что в любой момент времени Ь выполняются оба закона сохранения и выполнено целевое условие
Иш^то3(р(Ь)) = 3тах-
Для решения этой задачи воспользуемся методом скоростного градиента. В качестве целевой функции возьмём
С(р) = Зтах - 3 + Л[(ТГ(рЕ) - Е) + Л2(Тг(р) - 1),
где Л[ и Л2 — множители Лагранжа, которые будут определены ниже.
Для использования формул (2), (3) необходимо, чтобы было осмысленным понятие градиента, а для этого нужно ввести скалярное произведение на пространстве самосопряжённых операторов. Итак, пусть 3(Н) —пространство всех самосопряжённых операторов на Н. Определим скалярное произведение (•, •): 3(Н) х 3(Н) ^ М, которое паре самосопряжённых операторов сопоставляет след их произведения:
уи,у € 3(Н):(и,У) = Тг(иУ). (7)
Тогда согласно методу скоростного градиента оператор и нужно брать в виде
и = -1>ЧиС(р,и,Ь).
Для этого вычислим производную целевой функции по времени: С = (УрС,р) = (У РС, и). Взяв градиент по и, получим УиС = 1 /1п21пр + Л[Е + (Л'2 + 1/1п 2)1, где I — тождественный оператор. Итак,
и = -71п р + Л1Е + Л21, (8)
где 7 = 7'1/1п2, Л1 = -7'Л1, Л2 = -^'(Л2 + 1/1п2).
Теперь найдём множители Лагранжа А1 и А2. Из условия Тг(р) = 1 заключаем, что Тг(и) = Тг р = 0. Учитывая, что Тг(I) = ё1ш(Н) = п, получаем
-7 Тг(1п р) + А1 Тг( Е ) + А2 п = 0. (9)
Из условия Тг(рЕ) = Е следует, что Тг(иЕ) = Тг(рЕ) = 0. Таким образом находим второе уравнение:
-7 Тг(Е 1п р) + А1 Тг(Е2) + А2 Тг(Е) = 0. (10)
Решая систему (9), (10), получаем
= пЩЕЫр) -ЩЫР)ЩЕ) 1 7 пТг(£2) - (Тг(Е))2 ' 1 ;
= Ъ(1пр)Ъ(Д2)-Тг(Д1пр)Тг(Д)
2 7 пТг(£2) - (Тг(£))2 ' 1 ;
Замечание 1. Далее будет показано, что знаменатель дробей в формулах (11), (12) обращается в ноль тогда и только тогда, когда существует константа р, такая что Е = р1. Данный случай является вырожденным и здесь рассматриваться не будет.
Подставляя выражение (8) в уравнение (6), с учётом (11), (12) получаем уравнение квантовой системы в следующем виде:
пТт{Е\пр) - Тг(Ыр)Тг(Е) Тг(1п,о)Тг(£2) - Тг(ЕЫр)Тг(Е) р--7пр + 7 пТг(£2) _ (Тг(£))2 +7 пТг(£2) - (Тг(£))2 '
(13)
Замечание 2. Заметим, что уравнение (13) содержит неопределённый параметр 7. Выбор конкретного 7 определяет масштаб времени и подбирается из условия соответствия динамики модели экспериментальным данным.
5. Устойчивость положений равновесия. Далее исследуем состояния равновесия полученного уравнения (13) на устойчивость. Для этого рассмотрим функцию
V(р) = й^х - 5(р) > 0. (14)
Вычислим производную функции (14) в силу системы (13):
V = Тг(/з1п р) = Тг((-71п р + А1Е + А21 )1пр) = = -7 Тг(1п р)2 + А1 Тг(Е 1п р) + А2 Тг(1п р) =
= —7Тг(1пр)2 + Ах Тг(£^ 1пр) + —(Тг(1пр))2 - — Тг(Е) ТгПпр) =
п п
7 ((Шпо)2 -пТтЦпр)2) + ^(ЕЫр)-Тг(Е)ТгЫр)^
Условие V < 0 равносильно условию
7 Л,™, ч2 ч^ (п Тг( Е 1п р) - Тг( Е) Тг1п р)2 N , ч
п -^р)2) + ) < О- (15)
75
Для доказательства неравенства (15) рассмотрим 3(Н) —пространство всех самосопряжённых операторов на Н. Очевидно, что 3(Н) является векторным пространством над полем вещественных чисел. Далее введём функцию {•, •): 3(Н) х 3(Н) ^ М, т. ч. У А, В € 3(Н)
{А, В) = пТг(АВ) - Тг(А) Тг(В).
Нетрудно проверить, что результатом данной функции является вещественное число. Действительно: У А, В € 3 (Н)
{А, В) = п Тг(АВ) - Тг(А)Тг(В) = п Тг(А*В*) - Тг(А*)Тг(В*) =
= пТг((ВА)*) -Тг(А*)Тг(В*) = пТг(АВ) - Тг(А) Тг(В) = (Д В). (16)
Введённая функция обладает несколькими важными свойствами.
1. Линейность по первому аргументу:
У А, В, С € 3 (Н), У Л € М : {ЛА + В, С) = Л{А,С) + {В, С). Доказательство. Пользуясь линейностью следа, получаем
{ЛА + В, С) = п Тг((ЛА + В)С) - Тг(ЛА + В) Тг(С) =
= (Лп Тг(АС) - Л Тг(А) Тг(С)) + (п Тг(ВС) - Тг(В) Тг(С)) = = Л{А,С) + {В, С). □
2. Симметричность:
У А, В € 3 (Н) : {А, В) = {В, А).
Доказательство. Пользуясь цикличностью следа, получаем {А, В) = пТг(АВ) - Тг(А)Тг(В) = пТг(ВА) - Тг(В)Тг(А) = {В, А). □
3. Неотрицательная определённость и условие равенства нулю: У А € 3 (Н) : {А,А)>0 и {А, А) =0 ^Зц € М : А = ц1.
Доказательство. Рассмотрим скалярное произведение (7). Аналогично (16) можно показать, что результатом данного скалярного произведения является вещественное число. Кроме того, верно неравенство Коши—Буняковского: \(и,У)|2 < (и, и)(У, У) и \(и, У)\2 = (и, и)(У,У) ^Зц € М : и = цУ. Подставляя и = А, У = I, получаем
\ Тг(А)\2 < (А, А)(1, I) = Тг(А2) Тг(1) = пТг(А2). Таким образом, верно неравенство
{А, А) = п Тг(А2) - Тг(А)2 > 0.
Кроме того, {А, А) =0 ^ Тг( А)\2 = (А, А)(1, I) ^Зц € М : А = ц1. □
Теперь, пользуясь свойствами 1-3, докажем неравенство (15). Возьмём два самосопряжённых оператора А, В € 3(Н) и произвольное число Л € М. Очевидно, что А - ЛВ € 3(Н), а значит, для этого оператора выполнено свойство 3: {А - ЛВ, А - ЛВ) > 0. Пользуясь свойствами 1, 2, получаем
0 < {А - ЛВ, А - ЛВ) = Л2{В,В) - 2Л{А, В) + {А, А).
Поскольку данное неравенство выполнено при любых вещественных Л, дискриминант не может быть положительным, т. е.
{А, В)2 < {В, В){А, А). (17)
Кроме того, если в (17) имеет место равенство, то существует единственное Л G R решение уравнения {A — ЛВ, A — ЛВ) = 0. Но тогда в силу свойства 3 Эр G R : A — ЛВ = pI. Подставляя A = lnр, В = Е, получаем требуемое неравенство (15). При этом в (15) имеет место равенство тогда и только тогда, когда ЭЛ, р G R : ln р = ЛЕ + pI.
Теперь воспользуемся теоремой Ла-Салля. Рассмотрим множество M = {p\Y ln р = Л\Е+Л2!}, где коэффициенты Л1, Л2 определяются из условий 1, 2. Множество M является инвариантным множеством, поскольку если траектория лежит в M, то u в силу (8) равно нулю, а значит р = 0. То есть, попав в множество M, траектория его никогда не покинет. Далее будет показано, что M = N = {p\V(p) = 0}.
1. M С N.
Пусть peM^p = 0^S=-TV(plog2 р) - ^ Tr(p) = - TV(plog2 р) = 0 ^ V = —S = 0 ^ р G Е
2. N С M.
Пусть р G N. Тогда V(p) = 0, а это, как было показано ранее, выполнено только тогда, когда ЭЛ, р G R : ln р = ЛЕ + pI. Заметим, что уравнение (13) было выведено так, чтобы выполнялись два закона сохранения, а значит и для р из N эти два закона выполнены. Но именно они определяют значения коэффициентов Л, p, поэтому Л = Л1/7, р = Л2/7, а это и означает, что р G M.
Таким образом, множество M является наибольшим инвариантным подмножеством Е, а значит по теореме Ла-Салля решение p(t) стремится к множеству M. Заметим, однако, что мы доказали лишь стремление p(t) к множеству M, а достигнет ли оно его или нет мы не знаем.
Всякий элемент множества M может быть представлен в виде
р = C exp (— рЕ),
где C = exp (Л2/y)I, р = —Л1/y. Как видно, состояние равновесия соответствует распределению Гиббса, что согласуется с результатами классической термодинамики.
6. Частный случай. В качестве примера рассмотрим систему, состоящую из N одинаковых частиц, распределённых по n энергетическим уровням. Пусть на г-м энергетическом уровне находятся N2 частиц, обладающих энергией Еi. Тогда вероятность найти частицу в клетке г равна Ni/N. Матрица плотности имеет вид р = diag(Ni/N,..., Nn/N), а матрица энергии Е = diag(E1,. ..,Еп). Теперь запишем законы сохранения:
1) Tr(р) = J2П=1 Ni /N = 1, что равносильно условию £П=1 N = N;
2) Tr(рЕ) = J2П=1 Ni/NEi = Е, что равносильно условию J2П=1 NiEi = NЕ5.
Уравнение (13) примет вид
Ni = —y ln Ni + ЛЕ + Л2, (18)
где
Л1 = y
Л2 = y
n Еn=1 Ei ln Ni — £n=1 ln Ni £П=1 Е
in
n 1 Е? — (£ П=1 Ei )2 n E22 — J2n
>t=l
Ei ln N^n=1 Ei
(19)
n£ n=1 е22 — (£ n=1 Ei)
2
Состояние равновесия соответствует распределению Гиббса:
N = Се-, % = 1,...,т.
Уравнения динамики (18), (19) другими способами были получены в [9, 10].
7. Результаты моделирования. Уравнение (13) было смоделировано для случая р е М3х3. На рис. 1 изображен график изменения энтропии. Как видно, энтропия достигает максимального значения.
На графике 2, а изображен фазовый портрет внедиагональных элементов. На графике 2, Ь видно, что фазовый портрет диагональных элементов является прямой. Это связано с тем, что в любой момент времени выполнено условие Тг(р) = 1.
8. Заключение. Метод скоростного градиента предоставляет данные, дополняющие классические результаты статистической механики. В то время как классические результаты позволяют ответить на вопрос «Куда стремится величина?», метод скоростного градиента даёт ответ на вопрос «Как она туда стремится?» Принцип скоростного градиента предлагает законы, потенциальные по отношению к скорости роста некоторой целевой функции. Рассматривая энтропию как эту целевую функцию, мы вывели уравнение изменения оператора плотности и доказали, что существует единственное устойчивое распределение, соответствующее максимальному значению энтропии. Отметим, что работа не претендует на физическое обоснование того, что полученное уравнение (13) описывает динамику реальной физической системы. Можно предложить и другие методы, которые обеспечивают сходимость к равновесному состоянию, удовлетворяющему принципу максимума энтропии при соблюдении двух законов сохранения (например, непрерывные версии известных методов поиска экстремума при наличии ограничений [15]). В пользу метода скоростного градиента
14 я ял
£> 0.09
"л 0.08
со 0.08
0.07 0.2
0.7
Рис.2. Проекция решения системы (13): а — на подпространство (pii, Р22, Р33 ); b— на подпространство (pi2 ,Р13,Р23).
говорит то, что в ряде других задач этот метод приводит к хорошо известным физическим законам [5], [16]. Вопрос выбора значения параметра y (означающего выбор масштаба времени) в работе не рассматривается. В прикладных задачах этот выбор, по-видимому, должен проводиться по результатам экспериментов.
Литература
1. Ланцош К. Вариационные принципы механики. М.: Физматлит, 1965.
2. Дрейфус С., Беллман Р. Прикладные методы динамического программирования. М.: Физматлит, 1965.
3. Rosenbrock H. H. Doing quantum mechanics with control theory // IEEE Trans. Autom. Contr. 2000. Vol. 45(1). P. 73-77.
4. Фрадков А. Л. Адаптивное управление в сложных системах. М.: Наука, 1990.
5. Фрадков А. Л. Кибернетическая физика: Принципы и примеры. СПб.: Наука, 2003.
6. Jaynes E. T. Information theory and statistical mechanics // Phys. Rev. 1957. Vol. 106(4).
7. Jaynes E. T. Information theory and statistical mechanics II // Phys. Rev. 1957. Vol. 108(2). P. 171-190.
8. Fradkov A. L. Cybernetical physics: from control of chaos to quantum control. Berlin; Heidelberg: Springer-Verlag, 2007.
9. Fradkov A. L. Speed-gradient entropy principle for nonstationary processes // Entropy. 2008. Vol. 10(4). P. 757-764.
10. Фрадков А. Л., Кривцов А. М. Принцип скоростного градиента в описании динамики систем, подчиняющихся принципу максимума энтропии // Нелинейные проблемы теории колебаний и теории управления. Вибрационная механика / под ред. В. В. Белецкого, Д. А. Индейцева, А. Л. Фрадкова. СПб.: Наука, 2009.
11. Планк М. Принцип наименьшего действия // Единство физической картины мира. М.: Наука, 1966.
12. Khalil H. K. Nonlinear systems. Prentice-Hall, Inc., 1996.
13. Лифшиц Е. М, Ландау Л. Д. Курс теоретической физики: Учеб. пособ.: Для вузов. В 10 т. Т. III. Квантовая механика (нерелятивистская теория). 6-е изд., испр. М.: Физматлит,
14. фон Нейман Дж. Математические основы квантовой механики. М.: Наука, 1964.
15. Поляк Б. Т. Введение в оптимизацию. М.: Наука, 1983.
16. Фрадков А. Л. О применении кибернетических методов в физике. УФН. 2005.
P. 620-630.
2004.