ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
143
ЭКСТЕНСИВНОЕ УМНОЖЕНИЕ
Евтихов М. Г.
Институт радиотехники и электроники им. В.А. Котельникова, Фрязинский филиал, Российская академия наук, http://fire.relarn.ru
141190 г. Фрязино, Московская область, Российская Федерация
Поступила в редакцию 05.04.2013
Представлена чл.-корр. РАЕН В.И. Грачевым 12.04.2013
Рассматривается обобщение операции умножения матриц на тензорные (геометрические) объекты. При использовании экстенсивного умножения нет необходимости явно указывать индексы объектов. Программная реализация операций сложения и экстенсивного произведения допускает алгоритмы, аналогичные алгоритмам для разреженных матриц. Анализируется использование экстенсивного умножения предельно разреженных объектов для вывода сложных формул, как вручную, так и в системах символьных вычислений. Обсуждается использование экстенсивного произведения для постановки задач с бесконечными матрицами, уравнениями Максвелла, общими уравнениями оптики однородных анизотропных сред.
Ключевые слова,: тензорное исчисление, геометрические объекты, разреженные матрицы, уравнения Максвелла, оптика анизотропных сред. * 1
УДК 512.642, 530.171_______________________
содержание
1. Введение (143)
2. Структура экстенсивов. Теорема о структурах (145)
3. Экстенсивное умножение предельно разреженных экстенсивов (146)
4. Задачи с бесконечными матрицами.
Уравнения максвелла (147)
5. Заключение (150)
Литература (150)
1. ВВЕДЕНИЕ
В 70-е годы были разработаны и успешно применяются алгоритмы для операций с разреженными матрицами общего вида [1], т.е. с матрицами у которых большое количество коэффициентов нулевые.
Допущение разреженности позволяет предложить более компактные способы хранения матриц и более эффективные алгоритмы их преобразования.
Проблема разреженности стоит для тензорных объектов еще более остро и актуально, чем для матриц. В данной работе предлагается подход к реализации разреженных тензорных объектов, связанный с введением особого вида умножения.
В работе рассматриваются не тензоры в их более точном и узком понимании, а тензорные (геометрические) объекты как системы с верхним и нижним набором индексов, описывающие линейные преобразования. В [2, 3, 4] тензорные объекты называются геометрическими объектами; в известном курсе по тензорному анализу Б.Е. Победри [4] для этих объектов использован термин “экстенсивы”.
В последнее время широкое распространение
численных методов сопровождается тенденцией рассматривать векторы как упорядоченные наборы чисел без их прямой связи с геометрическим смыслом. Эта же тенденция имеется и в отношении матриц, она связана с возможностью на этапе формализации задачи отложить введение метрических свойств геометрических объектов, перенести рассмотрение метрических свойств на более поздние этапы исследования. Поэтому термин “экстенсив” представляется привлекательным в качестве синонима тензорным и геометрическим объектам. Операции с экстенсивами: сложение, тензорное произведение, свертка — лежат в основе теории тензоров и описаны в [4], они не отличаются от операции с геометрическими объектами, описанными в [2, 3]. В качестве примера экстенсива, который не является тензором, приводят символы Кристоффеля [2-4]. Данная работа ориентирована на приложения в области физики, поэтому в ней речь идет о тензорных объектах над полем комплексных чисел.
В настоящее время существует большое количество библиотек программ и даже систем программирования, предназначенных для работы с комплексными матрицами, содержащие средства решения линейных уравнений, обращения матриц, решения задач на собственные значения, в том числе и полиномиальных. По-видимому, было бы вполне достаточно, если бы появились программные реализации экстенсивов, которые дополняли бы средства работы с матрицами, позволяли бы теоретику приводить тензорные описания сложных явлений к стандартным матричным математическим
РЭНСИТ | 2013 | ТОМ 5 | НОМЕР 1
144
ЕВТИХОВ М. Г.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
задачам. Интересен тензорный и матричный взгляд на оптику, развивавшийся в работах [5, 6]. В настоящее время актуальные задачи значительно усложнились. Зависимость необходимых ресурсов вычислительной системы от валентности тензоров можно оценить как экспоненциальную. С точки зрения необходимых вычислительных ресурсов решение многих тензорных задач стало бы приемлемым, если бы появились методы выполнения алгебраических операций над разреженными экстенсивами.
Выберем и рассмотрим некоторый экстенсив: вектор, матрицу или более сложный тензорный объект. В координатном представлении он характеризуется упорядоченным набором своих коэффициентов. Построим для каждого коэффициента особый экстенсив со структурой исходного экстенсива. Пусть у строящегося экстенсива все коэффициенты нулевые, кроме одного единственного и равного единице. Причем, единица стоит на том же месте, где и выбранный в начале построения коэффициент. Далее уменьшать количество ненулевых коэффициентов у этого экстенсива уже нельзя, остался один единственный коэффициент, поэтому назовем построенный экстенсив предельно разреженным. Будем рассматривать множество предельно разреженных экстенсивов как базисные векторы в некотором векторном пространстве, а соответствующие им коэффициенты как координаты. Если задать другой набор координат, то получится экстенсив того же типа, но с другими коэффициентами. Например:
* ) = a f1 V (° 1V c f° °! + d f° °1
У c d) у 0 0) у ° °) у 1 °) у ° 1)
Возможность определить произведение предельно разреженных экстенсивов (см. раздел 3) приводит к алгебраическим структурам, не всегда являющимся алгебраическими кольцами и представляющим самостоятельный интерес. Последнее обстоятельство было замечено и использовано в [7]. Было введено понятие предельно разреженной матрицы и установлены алгебраические соотношения между предельно разреженными матрицами и предельно разреженными векторами. Введенные понятия позволили найти эффективный алгоритм вычисления матрицы Якоби для выражения специального вида. Этот опыт лежит в основе убеждения автора, что понятия предельно разреженных векторов и матриц полезно обобщить на тензорные объекты и использовать не только для реализации численных методов, но и в теоретической работе, при поиске эффективных алгоритмов, а так же и в работе физиков-теоретиков при преобразованиях сложных формул.
Различные виды умножений экстенсивов реализуются с помощью тензорного произведения и 1
сверток [2, 3, 4]. Рассмотрим два тензорных объекта (два экстенсива) общего вида A = Л*1’"’*1' и В = ви""’щ . Под тензорным произведением понимается произведение
RZU">ZS = A*,’"’ XN BU1’"’UP /1 1\
RWi’."’WT ЛУі’""УмВѴі’."’Ѵе ’ (1.1)
где индексы при A и В считаются независимыми, z....
Д = xr..XN ufup и WfWT = V1-VQ Тензорное
произведение определено не только для тензоров, но и для любых экстенсивов. Определим экстенсивное произведение также как (1.1), но, в отличие от тензорного произведения, оно предполагает свертки по индексам^.... yM и u....up, причем, идущие в “расходящемся” порядке. Расходящийся порядок выбора индексов для сверток оправдан формулами, которые рассматриваются ниже в разделе 3. При “расходящемся” выборе индексов для сверток yM считается совпадающим с и., и по ним идет свертка. уМ1 считается совпадающим с и, уМ2 сворачивается с и3 и т.д. Если пределы изменения таких пар “индексов для сверток” не совпадают, то экстенсивное произведение считается недопустимым. (Подобным образом умножение матриц считается недопустимым, если число столбцов первой матрицы не совпадает с числом строк второй). Если M = P, то z.... Zj = x....xN и w....wT = v....Vq, S = N; T = Q В случаях, когда M > P, “несвернутые” индексы первого сомножителя приписываются справа к нижним индексам результата; S = N + M—P При M < P “несвернутые” индексы второго сомножителя приписываются слева к верхним индексам результата; T = Q + P — M. Если M или P равно нулю, то экстенсивное произведение вырождается в тензорное произведение. При таком определении экстенсивного умножения структура сомножителей однозначно определяет структуру результата, что позволяет не использовать индексы при записи экстенсивов, писать R = AB. Сложение экстенсивов также позволяет не использовать индексы, оно возможно, только если структуры сомножителей совпадают. Поэтому возможно записывать формулы с экстенсивами также как и с элементами алгебраических колец, но необходима тщательная проверка допустимости операций. Эту проверку и выполнение самих операций естественно перепоручить математическому обеспечению, при этом полезно уметь осуществлять эту проверку до фактического выполнения экстенсивного умножения.
Преимущества экстенсивного произведения проявляются при использовании разреженных тензорных объектов, у которых большое число коэффициентов нулевые. Разреженные экстенсивы удобно представлять как суммы предельно разреженных экстенсивов. Экстенсивные произведения предельно разреженных экстенсивов близки к логическим операциям.
Целью данной работы является более подробное рассмотрение свойств экстенсивного произведения, а также демонстрация его использования на известных примерах.
1 НОМЕР | ТОМ 5 | 2013 | РЭНСИТ
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
ЭКСТЕНСИВНОЕ УМНОЖЕНИЕ
145
Для достижения этой цели, формализуется понятие “структура” экстенсива. Далее поясняется принцип учета разреженности экстенсивов, для этого уточняется связь структуры и предельно разреженных экстенсивов. Операции с экстенсивами отделяются от операций с их структурами.
2. СТРУКТУРА ЭКСТЕНСИВОВ. ТЕОРЕМА О СТРУКТУРАХ
Рассмотрим экстенсив общего вида A = A^X . Для того чтобы определить экстенсив, следует задать его “валентности”, т.е. число верхних (N) и нижних индексов (M). Далее, следует определить, в каких пределах меняются целочисленные индексы x1, ..., xN иy1, ...,yM Без потери общности можно считать, что индексы меняются от 1 до некоторого целого числа. Указав эти предельные целые числа {[п1, ..., nN],[m1, ..., mM]}, мы задаем структуру экстенсива. Наконец, завершающий этап определения экстенсива состоит в указании коэффициентов для всех возможных сочетаний индексов. Последняя операция значительно сокращается, если договориться, что указываются только ненулевые коэффициенты. Структура экстенсива определяет класс однотипных экстенсивов, различающихся только своими коэффициентами.
Рассмотрим класс экстенсивов, заданный структурой {[n1, ..., n1N],[m1, ..., mM]}. Каждому допустимому набору целочисленных индексов ставится в соответствие особый экстенсив, у которого все коэффициенты нулевые, кроме одного единственного коэффициента, равного единице и соответствующего заданному набору индексов. Такой экстенсив назван во введении предельно разреженным. Обозначим Е(Т, [П1,...пж ],[m 1,...mM ]) функцию,
ставящую в соответствие структуре T и набору индексов предельно разреженный экстенсив. В этой записи предполагается, что каждый натуральный индекс, входящий в наборы [п1,...пж],[m1,...mM], не выходит за границы, описанные структурой T={[n1, ..., nN],[m1,..., mM]}. Экстенсив записывается как сумма следующего вида по всем возможным индексам:
A = X А*:%Е(Т ,[nl,..AN Um^.MM ]) (2.1)
[щ,...пж ],[mu...mM ]
Это выражение соответствует точной и компактной записи разреженных экстенсивов. Допустим, речь идет о квадратной матрице М десятого порядка, у которой на главной диагонали стоят числа от 1 до 10, а все остальные коэффициенты нулевые. Тогда можно записать:
T = {[10], [10]},
10
M = X nE (T ,[п],[п]).
п=1
Т.е. в выражении для экстенсива описываются только ненулевые члены, а регулярность, существующая между коэффициентами, задается в виде частичных сумм. Этот способ можно рассматривать как альтернативу блочному описанию матриц. Кроме компактности такая запись представляет экстенсивы, являющиеся многомерными таблицами чисел, в виде формулы, записанной в одной строке. Запись (2.1) следует интерпретировать как разложение вектора по базису, заданному функциями E, а сам класс экстенсивов — как векторное пространство. Экстенсивное произведение предельно разреженных экстенсивов выводит за рамки класса экстенсивов с заданной структурой, поэтому такие классы не являются алгебраическими кольцами, но их изучение представляет самостоятельный интерес. В качестве еще одного простого примера приведем описание с помощью координат вектора H со структурой T={[3],[ ]}:
H = HE(T,[1],[ ]) + HE (T,[2],[ ]) +
+ HE (T,[3],[ ]) = X HnE(T ,[n],[]).
В принципе, возможны классы тензорных объектов, у которых один или несколько индексов могут принимать значение от 1 до бесконечности. В этом случае требуется определенная осторожность. Дирак утверждал [8], что возможны бесконечные матрицы, умножение которых неассоциативно. Рассмотрим классы тензорных объектов с конечными валентностями, у которых все индексы могут пробегать значения от 1 до бесконечности. Структура таких объектов задается валентностями, т.е. числом верхних и нижних индексов. Валентности оказываются заданными при записи второго и третьего аргументов функций E, и специально описывать структуру нет необходимости. Для таких объектов будем записывать предельно разреженные экстенсивы как
E ..., ..., «у).
При вычислении экстенсивного произведения таких объектов не возникает несоответствия множеств индексов при вычислении сверток, поэтому произведения всегда допустимы; если пополнить такое множество нулем, то получится полугруппа. Структуры тензорных объектов с конечными индексами {[n1, ..., nNj,[m1, ..., mM]} целесообразно ассоциировать с E (<»,[п ..., nN],[m1,..., тм]),что позволяет ввести экстенсивное произведение структур как произведение предельно разреженных экстенсивов. Далее обсуждается следующая теорема.
Теорема о структурах экстенсивов: если экстенсивное произведение структур двух классов экстенсивов равно нулю, то экстенсивное произведение элементов этих классов недопустимо. Если же экстенсивное произведение структур двух классов не нуль, то оно соответствует структуре класса результата экстенсивного произведения.
РЭНСИТ | 2013 | ТОМ 5 | НОМЕР 1
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
146
ЕВТИХОВ М. Г.
Эта теорема позволяет при синтаксической проверке формул выяснять допустимость экстенсивных произведений до их фактического выполнения с помощью экстенсивного произведения структур. Следующий раздел посвящен обсуждению этой теоремы и экстенсивному произведению предельно разреженных экстенсивов.
3. ЭКСТЕНСИВНОЕ УМНОЖЕНИЕ ПРЕДЕЛЬНО РАЗРЕЖЕННЫХ ЭКСТЕНСИВОВ
Предельно разреженный экстенсив кажется предельно простым, у него только один единственный ненулевой коэффициент (который равен единице). Однако предельно разреженный экстенсив сводится алгебраически к еще более простым объектам, к экстенсивному произведению предельно разреженных векторов с теми же индексами, идущими в том же порядке, как в исходном экстенсиве. В этом произведении в начале идут контравариантные векторы, а затем ковариантные. По индукции доказываются формулы разложения:
N M
Е(■»,[«!..%Umv mM]) = /,Е(ю,[щ],[])І Е(<»,[],К]). (3.1)
k=1 k=1
Справедлива формула
Е К[],[и])Е К[т],[]) = ё"т, (3.2)
Sm — символ Кронекера, он равен 1 при n = m, и равен 0, если m и n не совпадают. В (3.2) умножается строка на столбец, получается выражение типа скалярного произведения. В строке все коэффициенты равны нулю, кроме n-го. Соответственно, в столбце — все коэффициенты нулевые, кроме m-го. Только если n и m совпадут, тогда получится ненулевой результат (единица).
Рассмотрим произведение Е («,[«,,..., nt] ],[т„..., тм])Е K[ki,..., kN МД.., lM ]) =
N M N M (3.3)
= І, Е KK ],[]) l Е KUK ]) І, Е (»,[k, ],[]) IЕ K[],[4 ]).
Если mM ф k1, то
EK[Mmм])EK[klM]) (3.4)
равно нулю и все произведение равно нулю. Если mM = k1, то (3.4) равно 1, выражение (3.4) можно удалить из (3.3) и перейти к рассмотрению произведения Е KQ,[mM-,]) Е K[k2],[]) . Оно вновь будет либо нулем, либо единицей. Повторяя рассуждения, приходим к выводу, что произведение (3.3) либо равно нулю, либо является предельно разреженным экстенством типа (3.1). Если встретятся несовпадающие индексы, то (3.3) окажется нулем. Если же все m (или все k) окажутся исчерпанными, то остаток k (остаток m) припишется к множеству n (к множеству 1).
Пусть струкгуры Ту ТР ..., Tn ..., Su
устанавливают одни и те же предельные значения для верхних и нижних индексов, 1 < П < n, 1 < m < m,
Т = {[«],[]},J=1,..., N, Sp = {[ ],[m]}; v = 1,..., M,
T0 = {[nC - N [m1, ..., mM]}.
Тогда одновременно с (3.1) справедливо разложение:
N M
Е (адп ],[m,...mM ]) = І, Е (Гк ,[Пк ],[]) Іі E(Sк ,[],[mk ]). (3.5) Аналог формулы (3.2) принимает вид утверждения:
Пусть T = {[],[kl]};T2 = {[k2],[])};l < n < Д1< m < k2, тогда
E(Tl,[],[n])E(T1,[m],[])
8nm при k1 = k2 недопустимо при k1 Ф k2
(3.6)
E(^,[],[kl\)E(^,[k1],[]) =
1 при k1 = k2
0 при k1 Ф k2
Если k1 ф k2, то свертка в (3.6) невозможна и экстенсивное произведение неопределенно, недопустимо. При тех же условиях, если k1 ф k, произведение
E(«, [ ], ^])Е(«>, [k2], [ ]) (3.7)
определено, но равно нулю. (Если k1 = k, то (3.7) равно 1). То есть для этого случая доказана теорема о структурах из предыдущего раздела.
Как при использовании формул (3.1), (3.2) получаются формулы для экстенсивного умножения бесконечных предельно разреженных объектов, так же и с помощью формул (3.5), (3.6) получаются формулы для экстенсивного умножения конечных предельно разреженных структур. Ковариантные векторы первого сомножителя умножаются на контравариантные векторы второго сомножителя и дают единицу до тех пор, пока либо не получится нуль, либо векторы одного из наборов не исчерпаются. Недопустимость операции возникает, если нельзя выполнить умножение горизонтального и вертикального вектора из-за их различной длины. В последнем случае, соответствующее экстенсивное произведение бесконечных векторов оказывается равным нулю. Поэтому теорема о структурах справедлива в общем виде.
В разложениях (3.1) и (3.5) экстенсивное и тензорное умножения совпадают, поэтому при умножении структур с целью проверки допустимости экстенсивного умножения можно пользоваться ассоциативностью. В случае конечных индексов допустимое экстенсивное произведение есть сумма ассоциативных слагаемых и само ассоциативно. В случае бесконечных индексов ассоциативность гарантировать нельзя и это свойство необходимо анализировать дополнительно.
При выводе формул вручную для экстенсивного умножения предельно-разреженных экстенсивов удобно пользоваться сходством этого умножения с логическими операциями (с конъюнкцией). В первую очередь следует определить, не равен ли результат нулю. Для этого следует сравнивать правые
1 НОМЕР | ТОМ 5 | 2013 | РЭНСИТ
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
ЭКСТЕНСИВНОЕ УМНОЖЕНИЕ
147
индексы первого сомножителя и левые индексы второго сомножителя в “расходящемся” порядке. Начинать целесообразно с крайнего правого в первом сомножителе и крайнего левого во втором сомножителе. Если встретятся несовпадающие индексы, то произведение равно нулю, дальше сравнивать не нужно. Если же окажется, что все индексы самого короткого набора совпали с индексами второго сомножителя, то следует отметить в длинном наборе остаток индексов. Результат будет вновь предельно-разреженным экстенсивом, в него следует перенести индексы, не участвующие в свертках и дописать остаток. Остаток индексов второго сомножителя пишется справа в левую часть, остаток индексов первого сомножителя — слева в правую часть.
4. ЗАДАЧИ С БЕСКОНЕЧНЫМИ МАТРИЦАМИ. УРАВНЕНИЯ МАКСВЕЛЛА
Рассмотрим следующую задачу-упражнение, предложенную в матричном виде в [9, стр.157]. Дано:
Требуется проверить, что qp — pq = ih.
С помощью предельно разреженных матриц задача решается путем алгебраических преобразований:
Обозначим:
fa да да fa да да
qp = i-£4n£4кА; pq = i-£Vn£4kB;
2 n = 1 к=1 2 n = 1 к=1
A = (Е(да,[п + 1],[n]) + Е(да,[[п], [n + 1]))( E (да, [к + 1], [к ]) - E (да, [к ], [к + 1])) = = Е (<»,[[n + 1],[n])E (да, [к + 1],[к ]) + Е (<»,[n],[n + 1])Е(да,[к + 1],[к ]) --Е (да, [n + 1], [n])E (да, [к ],[к + 1]) - Е (да, [n],[n + 1])Е (да, [к ],[к + 1]).
B = (Е (сю,[п + 1], [n]) - Е (да, [n], [n + 1]))( Е (да, [к + 1],[к ]) + Е (да, [к ], [к + 1])) =
= Е (да, [n + 1], [n])E (да, [к + 1], к) - Е (да, [n],[n + 1])Е (да, [к + 1], [к ]) +
+Е (да, [n + 1],М)Е(да,[к ],[к + 1]) - Е (<»,[n],[n + 1])Е(да,[к ],[к + 1]).
А - B = 2Е(да, [n],[n + 1])Е(да,[к + 1],[к]) - 2Е(да, [n + 1],[n])E(да,[к],[к + 1]) =
= 28к (Е (да, [n], [к ]) - Е (да, [n + 1],[к + 1]));
да да
qp - pq = ih££n£ Ѵк(А - B)/ 2 =
n=1 к=1
да да
= ih££n£4к8пк (Е(да,[n], [к]) -Е(да,[n +1],[к +1])) =
n=1 к=1
да
= ih£ n (E (да, [n], [n]) - E (да, [n +1], [n +1])) =
n=1
да да
= ih£ nE (да, [n], [n]) - ih£ (n -1) E (да, [n], [n]) =
n=1 n=2
да да
= /ЙЕ(да,[1],[1]) + ih£ E (да,[n],[n]) = ih£ E (да, [n],[n]) = ih!
n=2 n=1
То есть p и q являются представлением квантово сопряженных переменных; q - эрмитов оператор, поскольку он симметричен и имеет действительные коэффициенты; p — антисимметричен и все его коэффициенты мнимые, поэтому он также эрмитов.
Приведенные в [9] операторы рождения уничтожения представим в виде:
a =
1
2hmw
p=
£pfnE (да, [n], [n +1]);
n=1
+
a
1
2hmw
p=
£ yfnE(x, [n +1], [n]).
n=1
и
да да да да
aa + = £pfn£р/кА'; a+a = ££n££hB';
n=1 к=1 n=1 к=1
A' - B' = E (да, [n], [n +1]) E (да, [к +1], [к ]) -- E (да, [n +1], [n]) E (да, [к ], [к +1]) =
= (Е (да, [n], [к ]) - Е (да, [n +1], [к +1]));
aa+ - a+a = ££n'££к (А'- B') =
n=1 к=1
да да
= £л/n£(Е(да,[n], [к]) -Е(да, [n +1],[к +1])) =
n=1 к=1
= Е (1,1) + £ nE(t», [n], [n]) -
n=2
да да
-£ (n - 1)Е (да, [n], [n]) = £ Е (да, [n], [n]) = 1.
n=2 n=1
Приведенные примеры показывают, что экстенсивное произведение предельно разреженных матриц полезно использовать для решения задач, связанных с преобразованием бесконечных матриц.
В качестве еще одного полезного примера рассмотрим три тензорных объекта с ограниченными структурами: “к” с ковариантной структурой Tt = {[ ], [3]}, “х” со структурой Т2 = {[3,3],[3]} и “H” с контравариантной структурой £ = {[3],[ ]}. Проверим, что экстенсивное умножение кхН допустимо, для этого вычислим экстенсивное произведения структур:
Е(да,[ ],[3])-Е(да,[3,3],[3]) = Е(да,[3],[3]). Т.е. структура “кх” есть Т4 = {[3],[3]}.
Е(да,[3],[3])Е(да,[3],[ ]) = Е(да>,[3],[ ]). Т.е. структура “кхН” есть Т5 = {[3],[ ]}.
Если бы произведение было недопустимо, то одно из произведений структур оказалось бы нулем, но результат имеет вполне определенную структуру, поэтому делается вывод о допустимости экстенсивного произведения.
Запишем к и Нчерез координаты, кп и n = 1, 2, 3:
к = £ кЕТЛШ]);
n=3 (4.1)
H = £I nE(73,[n],[]);
n=1
РЭНСИТ | 2013 | ТОМ 5 | НОМЕР 1
148
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
ЕВТИХОВ М. Г.
Рассмотрим экстенсив х, полученный из символа Леви-Чивиты [2-4]:
х = E(T,[1,3],[2]) + E(T2, [2,1],[3]) + E(T,[3,2],[1]) - ^ - E (T, [1,2],[3]) - E (Г,, [2,3],[1]) - E (Г,, [3,1],[2]).
При вычислении k1E(T1,[ ],[1])х выбираем из х только те члены, верхние (левые) индексы которых начинаются с 1 и удаляем эти индексы. kiE(Tp[],[1])х = kiE(T4,[3],[2]) - kiE{T4,[2],[3]). (4.3)
Аналогично получим:
kE(T,,[ ],[2])х = kECWP]) - k2E(T4,[3],[1]), (4.4)
k£(Tp[],[3])х = k^E(T4,[2],[1]) - ^{Т4,Щ,Щ). (4.5)
kx равно сумме (4.3), (4.4) и(4.5).
Для того, чтобы найти kxHE(TjX[n],[ ]) следует в kx выбирать члены с п в нижнем (правом) наборе индексов:
kxHxE (T3,[1],[]) = -k2HxE (T5,[3],[]) + k3HxE (T5,[2],[]);
kxH 2 E (T3,[2],[]) = kxH2E (T5,[3],[]) - k3H2E (T5,[1],[]); (4.6)
kxH 3E (T3,[3],[]) = -kxH 3E (T5,[2],[]) + k2 H 3E (T5,[1],[]).
Складывая и перегруппируя (4.6) получим:
kxH = (k2H3 -k3H2)E(T5,[1],[]) +
+(k3 Hx - kx H 3) E (T5,[2],[]) + (k H2 - k2 Hx) E(T5,[3],[]).
Выкладки доказывают, что экстенсив х реализует операцию векторного умножения объектов k и H, когда первый сомножитель представлен как вектор, {[];[3]}, а второй как вектор {[3],[]}. Произведением является вектор со структурой {[3],[]}. Заметим, что аналог скалярного произведения получается как экстенсивное произведение kH. Приведенный пример показывает, что векторы, матрицы и тензорные объекты достаточно удобно задавать формулами, используя предельно разреженные экстенсивы. Принципиальное значение имеет то, что описание матриц и более сложных тензорных объектов задается формулой в виде одной, пусть и длинной строки. Преобразовывать такие строки вручную возможно, но утомительно. Их удобно преобразовывать с помощью систем символьных вычислений.
Запишем с помощью экстенсивного произведения уравнения Максвелла. Опишем экстенсивами со структурой {[3],[ ]}, (будем помечать стрелкой вправо) электрическое( E ), магнитное H поля, электрическую D, магнитную B индукцию, вектор внешних электрических токов j и радиус вектор r . Плотность электрических зарядов р - скаляр, т.е. имеет структуру {[ ],[ ]}. Диэлектрическая и магнитная проницаемости е и Д, S - проводимость имеют структуру {[3],[3]}(т.е. матрицы). Вектор градиента (у), норм аль к поверхности (n), волновые векторы (k) будем задавать структурой {[ ],[3]} и помечать стрелкой влево (ковариантные векторы).
Для простоты (не усложняя задачу метрическим тензором) будем полагать, что система координат декартова. Выше рассматривался экстенсив (X) со структурой {[3,3],[3]}, эквивалентный векторному произведению.
Закон Гаусса перепишется в форме:
VD-р = 0.
Отсутствие магнитных зарядов
VB = о.
Закон индукции Фарадея
VxE + — = 0.
dt
Теорема о циркуляции магнитного поля
VxH - j-— = 0.
dt
Условия на границе раздела сред запишутся в виде:
nx(Ej - E2) = 0;
nx(Hx -H2) + js = 0;
n(4 -D2) + ps = 0;
n(Bj - B2) = 0.
Уравнения Максвелла и условия на границе раздела сред получаются визуально довольно близкими к обычной записи в векторной форме, но следует подчеркнуть, что в этой записи нет никаких скалярных и векторных произведений, а используется исключительно экстенсивное умножение и все переменные рассматриваются как экстенсивы.
Рассмотрим однородные плоские
электромагнитные волны в однородной анизотропной среде, т.е. пусть электрическое и магнитное поле имеют, как и выше, тип {[3],0}, но умножаются на exp(iwt — ikr ). i — мнимая единица, } — радиус вектор, он имеет структуру {[3],0}. k — волновой вектор с о структурой {0,[3]}. Экстенсивное произведение kr эквивалентно скалярному произведению. Экспонента является скаляром, поэтому она коммутирует с операторами, не содержащими дифференцирования по временным или по пространственным переменным.
V exp(iwt - ikr) = -ik exp(iwt - ikr),
д с} c}
—exp(iwt - ikr) = iw exp(iwt - ikr).
dt
Пусть выполняется условия нормального скин-эффекта и j = ffE, где d - проводимость, имеющая структуру {[3],[3]}. Получим для среды без локализованных зарядов:
kE = 0;
kB = 0;
kXE - wB = 0;
kxH + (we - id)E = 0. (4.7)
1 НОМЕР | ТОМ 5 | 2013 | РЭНСИТ
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
ЭКСТЕНСИВНОЕ УМНОЖЕНИЕ
149
Условия kE = 0; и кВ = 0; означают поперечность электромагнитных волн, представленных через электрическое поле и магнитную индукцию.
Следуя [5, 6], из уравнений (4.7) исключим магнитное или электрическое поле и получим различные варианты общего уравнения оптики однородных анизотропных сред. После исключения магнитного поля получается однородное линейное уравнение:
(w2s - iwff + кх/л'кх)E = 0. (4.8)
Строго говоря, в является не матрицей, а экстенсивом и запись вл требует пояснений. Будем использовать минус первую степень только для экстенсивов со структурой {[ж],[ж]}. Им соответствуют квадратные матрицы с теми же коэффициентами, а обратным матрицам (если они существуют) ставится в соответствие экстенсив, обозначаемый минус первой степенью с той же структурой. В случае программной реализации, экстенсив преобразуется в формат матрицы стандартной библиотеки программ, там вычисляется обратная матрица и вновь преобразуется в экстенсив.
Другой вариант однородного линейного уравнения получается при исключении электрического поля.
(wjil + kx(ws - iff)-1 kx)H = 0. (4.9)
Возможны также варианты:
(-kx(ws - iff)-1 kXju-1)В = wB. (4.10)
(w2 - iwffs-1 + kxfi~lkx£-1) D = 0. (4.11)
Уравнения плоских волн в анизотропных средах были получены в [5,6] в несколько иной форме и подробно обсуждались. Каждое из уравнений (4.8)-(4.11) должно давать в качестве решений не только дисперсионные соотношения, но описывать линейные поляризационные явления. Кажется удивительным, что относительно простые уравнения содержат в себе большую часть оптики анизотропных сред. Но не так уж и просты эти уравнения. Если уравнения простые, а решения сложные, то неизбежно, что сложным должен оказаться метод решения. Сложности уже заключены в том, что kx (тензор рефракции по терминологии [5, 6]) не имеет обратного. Для того чтобы использовать одно из уравнений (4.8)-(4.11) необходимо, чтобы уравнения Максвелла можно было бы записать в локальной форме и соответствующие матрицы оказались бы обратимыми. Далее необходимо, решить задачу на собственные значения и интерпретировать ее решение. Возникает очень непростой и неочевидный вопрос: что из скрытых сложностей при решении подобных задач может взять на себя компьютер?
Рассмотрим самый простой случай: волны в изотропнойсреде,когдао, еи р - скаляры.Ответхорошо известен: должны получиться поляризованные
волны, точнее, две линейно поляризованные волны с компонентами полей, ортогональными волновому вектору. Но как этот результат получается математически? Нижеприведенный разбор этого известного простого случая представляет собой эксперимент, выявляющий характер ограниченности возможностей современных вычислительных средств и возникающих трудностей, с учетом того, что со времени написания [5, 6] возможности вычислительных средств расширились. Эти же трудности в усложненном варианте появятся, например, при попытках решить задачу на собственные значения, если s , в и ff - матрицы.
Из (4.8) получим задачу на собственные значения относительно электрического поля E (не путать с функцией Е).
wb(ws - iff)E = -(kX)2 E. (4.12)
Представим волновой вектор в следующем виде к = kg и , где kg - скаляр, величина вектора; и
— вектор единичной длины типа {[ ],[3]}, он задает направление распространения волны. Тогда
k02wb(ws - iff)E = -(их)2 E. (4.13)
Оператор ((их)) имеет три собственных значения:
0, (г) и (—г). Собственному значению 0 соответствует собственный вектор, совпадающий с и. Собственному значению (г) соответствует собственный вектор
2 -іы2 - и1и3'
iUi W2W3 .
ѵ 1 - из у
Собственному значению (-г) соответствует
собственный вектор ^ іи2 - и1и3 ' іи1 и^и^ .
ѵ 1 - и3 у
Собственные векторы оператора (их) должны быть собственными векторами ((их) )2. Квадраты собственных чисел (их) — собственные числа
(их)2. Перейдем в систему координат, в которой волна распространяется вдоль оси х. То есть и=
1, и = и3 = 0. Собственные векторы приобретают вид (0, г, 1)т и (0, -г, 1)т. Электрическое поле имеет две компоненты, ортогональные направлению распространения; jz-компонента в одной волне опережает ^-компоненту по фазе, во второй волне
— отстает от ^-компоненты по фазе на п/2. Обе волны имеют круговую поляризацию. Квадраты обоих собственных чисел (их) совпадают и равны “-1”. Поэтому (их)2 имеет лишь одно, вырожденное,
РЭНСИТ | 2013 | ТОМ 5 | НОМЕР 1
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
150
ЕВТИХОВ М. Г.
собственное значение, равное “-1”; из этого факта следуют два вывода. Во-первых kQ-1w^(we - id) = 1. Во-вторых, любая линейная комбинация собственных векторов (их) будет собственным вектором (их)2. Линейно поляризованные волны с ортогональными компонентами полей получаются как полусумма (0, 0, 1)т и полуразность (0, i, 0)T волн с круговой поляризацией. Формула к0 = ^w2/us - iw^u позволяет
( 2л)
оценить длину I I волны и характерную длину
V Re(k0)) ( )
ее затухания в среде с проводимостью I т (п ) I при заданной частоте w. Заметим, что если і ~ 1 и d >> we, то в формуле для krj появляется квадратный корень из мнимого числа, поэтому длина затухания оказывается равной длине волны и волновое решение отсутствует.
Из разбора этого самого простого случая сделаем следующие выводы. Во-первых, уравнения (4.8)-(4.11) действительно описывают факты из оптики, включая линейные поляризационные явления. Во-вторых, извлечение этих фактов из уравнений является нетривиальной задачей. Подобно тому, как попытки формально применять численные методы с исследовательскими целями дают либо известные, либо довольно бессмысленные картинки (если нет неочевидных комментариев программиста и квалифицированного теоретика), еще в большей степени формальное применение символьных вычислений дает трудно интерпретируемые формулы. Попытка чисто формально решить уравнение (4.12) в системе символьных вычислений окончилась неудачей, стандартные программы не смогли решить задачу на собственные значения. После преобразования уравнения к виду (4.13) собственные значения и собственные векторы оператора (их) были получены и на их основе были сделаны дальнейшие заключения. Решения приобрели ясный вид только после перехода в удобную систему координат. Можно предполагать, что при решении нетривиальных задач аналогичные трудности, требующие для их разрешения понимания физического смысла задач, должны значительно возрастать.
5. ЗАКЛЮЧЕНИЕ
Ценность экстенсивного произведения в том, что оно позволяет относительно просто сформулировать и записать сложные тензорные задачи, свести их к известным типам задач, автоматизировать получение соответствующих матриц. Развитый в настоящей работе подход к реализации умножения и сложения разреженных тензорных объектов исчисления может быть полезен:
1) для обобщения полученных ранее физических
результатов,
2) для построения новых численных методов,
3) для вывода и анализа сложных формул с использованием современных стандартных вычислительных средств.
Экстенсивное произведение — одно из возможных сочетаний тензорного произведения и сверток. При реализации экстенсивов имеет смысл предусмотреть методы для тензорного произведения и сверток, их применение будет менее эффективным, чем применение экстенсивного умножения, но будут сохранены выразительные свойства исходного языка экстенсивов.
ЛИТЕРАТУРА
1. Тюарсон Р. Разреженные матрицы. M., Мир, 1977, 172 с.
2. Дмитриенко ЮИ. Тензорное исчисление. М., Высшая школа, 2001, 575 с.
3. Схоутен ЯА. Тензорный анализ для физиков. М., Наука, 1965, 456 с.
4. Победря БЕ. Лекции по тензорному анализу (3 изд.). М., Изд-во Моск. ун-та, 1986, 264 с.
5. Федоров ФИ. Теория гиротропии. Минск, Наука и техника, 1976, 456 с.
6. Федоров ФИ. Оптика анизотропных сред. Минск, Изд-во АН БССР, 1957, 379 с.
7. Евтихов МГ. Предельно разреженные матрицы. РЭНСИТ, 2011, 3(1):97-101.
8. Дирак ПАМ. Лекции по квантовой теории поля.. М., Мир, 1971, 243 с.
9. Ферми Э. Квантовая механика. М., Мир, 1965, 367 с.
Евтихов Михаил Георгиевич
k. ф.-м.н, с.н.с.
ФИРЭ им. В.А.Котельникова,Российская академия наук,
l, пл. Введенского, 141120 г. Фрязино, Моск. обл. +7 975 215-7143, [email protected]
1 НОМЕР | ТОМ 5 | 2013 | РЭНСИТ
INFORMATION TECHNOLOGIES
151
EXTENSIVE PRODUCT
Evtikhov M. G.
Kotel’nikov Institute of Radio Engineering and Electronics, Branch in Fryazino, Russian Academy of Sciences, http://fire.relarn.ru
1, Vvedensky sq., 141120 Fryazino, Moscow region, Russian Federation [email protected]
Considered extensive product, generalization of the matrix multiplication on tensor geometric objects. When using extensive product is not necessary to explicitly specify the indexes of geometric objects. Software implementation of the operations of addition and multiplication allow sparse algorithms, similar algorithms for sparse matrices. Examines the use of extensive multiplication extremely sparse objects to transform complex formulas, both manually and in symbolic computation system. Discusses the use of the extensive work to set targets with infinite matrices, Maxwell’s equations, the general equations of optics homogeneous anisotropic media.
Keywords: tensor, geometric objects, sparse matrices, the Maxwell’s equations, the optics of anisotropic media. UDC 512.642, 530.171
Bibliography - 9 references Received 05.04.2013
RENSIT, 2013, 5(1):143-151______________________________________________________________________________
REFERENCES
1. Tewarson RP. Sparse Matrices. NY, Acad. Press, 1973.
2. Dmitrienko YI. Tensor calculus. Moscow, High School Publ., 2001, 575 p.
3. Schouten JA. Tensor analysis for physicists. Oxford,
Clarendon Press, 1951, 456 p.
4. Pobedrya BE. Lektsiipo tenyornomu analiyu [Lectures on Tensor Analysis]. M., Moscow University Publ.,
1976, 264 p.
5. Fedorov FI. Teoriya girotropii [Theory gyrotropy].
Minsk, Nauka i tekhnika Publ., 1976, 456 p.
6. Fedorov FI. Optika aniyotropnykh sred [Optics of anisotropic media]. Minsk, AN BSSR Publ., 1957,
379 p.
7. Evtikhov MG. Predel'no rezrezhennye matritsy [Extremely sparse matrix]. RENSIT, 2011, 3(1):97-101 (in Russ.).
8. Dirac PAM. Lectures on Quantum Field Theory. NY,
Acad. Press, 1966.
9. Fermi E. Notes on Quantum Mechanics. Chicago,
University Press, 1960, 180 p.
РЭНСИТ | 2013 | ТОМ 5 | НОМЕР 1