ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ
НЕЙРО-ИТЕРАЦИОННЫЙ АЛГОРИТМ ТОМОГРАФИЧЕСКОЙ РЕКОНСТРУКЦИИ
РАСПРЕДЕЛЕННЫХ ФИЗИЧЕСКИХ ПОЛЕЙ В ВОЛОКОННО-ОПТИЧЕСКИХ
ИЗМЕРИТЕЛЬНЫХ СИСТЕМАХ
Юрий Николаевич Кульчин1 (директор ИАПУДВО РАН, е-mail: director@iacp.dvo.ru), Борис Сергеевич Ноткин1 (научный сотрудник, е-mail: boris_notkin@mail.ru), Виктор Александрович Седов2 (старший преподаватель, е-mail: sedov@msun.ru) 1 Институт автоматики и процессов управления ДВО РАН, 2 Морской государственный университет им. адм. Г.И.Невельского
Аннотация
На примере волоконно-оптической измерительной сети томографического типа выполнено исследование алгебраических и нейросетевых методов реконструкции распределенных физических полей. Выявлены преимущества и недостатки нейросетевого подхода. Предложен нейро-итерационный алгоритм, сочетающий в себе преимущества нейросетевых и алгебраических методов реконструктивной томографии.
Ключевые слова: волоконно-оптическая томография, вычислительная томография, распределенные физические поля, искусственные нейронные сети.
Введение
Измерительные устройства являются неотъемлемой частью многих современных технических систем, обеспечивая качество их функционирования и надежность. Наряду с развитием методов измерения сосредоточенных физических параметров в последнее время возрастает интерес к системам регистрации распределенных физических полей (температурных, деформационных и др.). Один из перспективных подходов к решению этой задачи связан с применением методов волоконно-оптической томографии, где восстановление информации о параметрах физических полей выполняется по данным, снимаемым с волоконно-оптических измерительных линий, уложенных в соответствии с выбранной схемой сканирования [1].
В традиционной постановке задача реконструктивной вычислительной томографии сводится к восстановлению функции х(1\,...,Нг) нескольких переменных (2 < г < 3) по известным интегралам от неё вдоль некоторых траекторий ф в пространстве (к,..., кг) (как правило, вдоль прямых) [2]:
Ы
y (i) = j Xf (L))dL ; i = 1,
(1)
где т - число интегральных проекций, ф( (Ь) и | ф(| - путь и длина траектории сканирования соответственно, представляющие /-ю проекцию.
Одна из основных сложностей практического решения задач реконструктивной томографии состоит в ограниченном числе проекций т, недостаточном для однозначной реконструкции функции пространственного распределения исследуемой величины х( ). В случае оптоволоконной томографии, где каждая проекция у(/) требует физической реализации в виде соответствующим образом уложен-
ной волоконно-оптической линии, эта проблема стоит особенно остро.
В таких условиях эффективно применение вычислительных методов, позволяющих учитывать априорные знания о характере реконструируемой функции пространственного распределения физического поля. Один из таких подходов базируется на мощных аппроксимирующих способностях аппарата искусственных нейронных сетей. Настоящая работа посвящена экспериментальному исследованию этого подхода, а также разработке приемов, устраняющих основные недостатки, связанные с его применением.
1. Краткий обзор методов вычислительной томографии
Методы реконструкции, применяемые в вычислительной томографии, можно разделить на интегральные и алгебраические. В интегральных методах реконструируемая функция пространственного распределения рассматривается в непрерывном виде. При этом основным математическим инструментом является аппарат преобразований Радона [2, 3].
В алгебраических методах реконструируемое пространственное распределение рассматривается как дискретная функция, т.е. функция, представленная конечным набором точек, в которых осуществляется реконструкция. Это семейство методов имеет более широкие возможности для использования априорной информации [2], поэтому остановимся на нем подробней.
В классической постановке дискретная форма записи задачи реконструкции сводится к решению системы линейных алгебраических уравнений (СЛАУ) [2]:
Ах = у , (2)
где хт = (х1, х2, ..., хп) - вектор-столбец, состоящий из п точек искомого пространственного распределения, ут = (у1, у2, ..., ут) - вектор-столбец результатов измерений (показания с т измеритель-
m
о
ных линий), A = (ai j; i = 1, m; j = 1, n) - матрица, элемент aij которой описывает вклад j-й компоненты xj в i-e измерение yi.
Для решения получаемых СЛАУ используются итерационные алгоритмы как известные в вычислительной математике, например, метод простой итерации или скорейшего спуска [4], так и специально разработанные для целей вычислительной томографии [5-7], в которых учитывается специфика получения проекционных данных.
Среди алгоритмов второй группы одним из наиболее популярных является метод ART (Algebraic Reconstruction Technique), для которого разработано много модификаций [6]. В первоначальном варианте метода ART на каждой итерации последовательно для каждого проекционного значения yi вычисления проводят по формуле
T (k) _
x(k+1) = x(k) + y a x a,.; i _ 1, m. a,. a,.
(3)
где x(k) и x(k+1) - k-e и (k+1 )-e приближение к решению СЛАУ соответственно, aT = [(ai)1, (ai)2, ..., (ai)n] - i-я строка матрицы A, записанная в виде вектора-столбца.
Таким образом, для каждого проекционного зна-
т (k)
чения yi соразмерно невязке yi - ai x и элементам вектора ai корректируются только те компоненты вектора x, которые участвовали в образовании этого значения yi. Поскольку матрица А является сильно разреженной, просмотр только линии проецирования значительно сокращает количество выполняемых операций. Ограничения, накладываемые на максимальные и минимальные значения компонентов вектора х, приводят к методу ART2.
Среди других модификаций метода ART интересен мультипликативный вариант - MART [7]. В этом методе все компоненты начального приближения x(0) > 0, а итерации имеют следующий вид:
( „ Y
„(k+1) _ Xj
y¡
aT x(k)
v aix y
(k)
i _ 1,m; j _ 1, n ,
(4)
где g _ 1, если j-я компонента xj входит в i-e измерение y,, и g _ 0 в противном случае.
На вариант метода MART с ограничениями будем ссылаться как на MART2 (по аналогии с ART2).
В качестве сигнала к завершению процедуры оптимизации может использоваться условие:
(y(k) - Ax(k)),(y(k) - Ax(k)) < e
JkК T . (k)
(k)
(5)
учитывающее квадратичную величину невязки е.
При реконструкции функций пространственного распределения по неполным проекционным данным получаемая СЛАУ оказывается недоопределенной. С практической точки зрения, это означает, что од-
ному и тому же вектору проекционных данных у в общем случае соответствует бесконечное число функций пространственного распределения х:
А*! = Ах2 =... = Ах„ = у, где х! Ф х 2 Ф ... Ф х„ .
Однако если известно, что все функции х принадлежат одному классу, ограниченному множеством X так, что для "х е X существует единственное обратное преобразование
х = О(у), (6)
то однозначная реконструкция функций этого класса теоретически возможна с любой заданной точностью. В таких условиях важную роль играет возможность учета на этапе реконструкции априорных знаний о характере функции х, выраженных в виде признаков, ограничивающих множество решений X. В рамках традиционных методов вычислительной томографии выявление и аналитическая формализация этих признаков может представлять нетривиальную задачу.
В существенной степени лишены отмеченного недостатка нейросетевые методы реконструкции, получившие распространение в последнее время [8-10]. Этот подход подразумевает прямую реализацию преобразования (6), получаемую путем обучения искусственной нейронной сети (ИНС) на примерах функций х, ограниченных классом X, и соответствующих им проекций у, снимаемых с реальной измерительной системы.
С нейросетевым подходом связаны три принципиальных недостатка.
• Потребность в большом числе обучающих примеров, необходимых для плотного покрытия всего множества функций класса X. Выполнение этого требования на практике может оказаться затруднительным по причинам существенных трудозатрат на эксперимент, отсутствия возможности осуществления контролируемого активного воздействия на диагностируемую конструкцию, недопустимостью ее вывода в аварийные режимы функционирования и т.д.
• Необходимость обучения ИНС для каждой отдельно взятой измерительной системы, обусловленная слабой переносимостью синтезированных ней-росетевых алгоритмов реконструкции с одной аппаратной платформы на другую.
• Отсутствие гарантий удовлетворительного качества при реконструкции функций, не принадлежащих классу X. Причем в этом случае результат реконструкции не только может отличаться существенными ошибками, но и, как правило, не удовлетворяет исходной системе уравнений (2), по -скольку это требование в явном виде в нейросете-вом решении отсутствует.
2. Нейро-итерационный алгоритм реконструкции
Предлагаемый в настоящей работе алгоритм реконструкции направлен на устранение отмеченных недостатков нейросетевого подхода. Он основан на широком использовании математической модели
измерительной системы и совместном применении нейросетевого и алгебраического подходов, где первый учитывает априорные знания, используется для выбора начального приближения решения, а второй обеспечивает соответствие решения исходной системе алгебраических уравнений. Схему предлагаемого нейро-итерационного алгоритма реконструкции (НИАР) иллюстрирует рис. 1.
Рис. 1. Блок-схема нейро-итерационного алгоритма реконструкции
Алгоритм реконструкции в представленной схеме рассматривается как инверсная реализация математической модели измерительной системы (информация распространяется в обратном направлении). Здесь функции /п (•), /оШ (•) и их инверсные
реализации /-'(•), /„^(О учитывают передаточные характеристики отдельных измерительных преобразователей (функции с индексом "/п") и измерительных каналов целиком (функции с индексом "ом/"). Кроме того, с помощью этих функций выполняется нормирование данных х и у, относительно которых в НИАР выполняется основная часть вычислений. Обучение ИНС на модельных данных снимает необходимость проведения большого числа натурных экспериментов, а его выполнение на примерах нормированных данных снижает зависимость ней-росетевого решения от аппаратной платформы, на которой эти данные были получены. Дополнительную эффективность этот прием приобретает в случае нелинейности функций /п (•), /ш (•), поскольку в этом случае дополнительно достигается упрощение используемых структур ИНС и сокращение вычислительных затрат итерационного алгоритма.
В качестве итерационной части в предлагаемом решении может применяться любой итерационный алгоритм, допускающий возможность использования начального приближения. Здесь необходимо отметить, что активизация итерационной части НИАР может выполняться только в том случае, если результат нейросетевой реконструкции оказывается неудовлетворительным, т.е. не выполняется условие (5), что может произойти в случае реконструкции функций, чей класс отличается от используемого при обучении ИНС.
3. Распространение метода MART на случай мультипликативного типа нелинейности
системы алгебраических уравнений В оптоволоконной томографии могут встречаться задачи, где воздействия на измерительную линию не суммируются (непрерывно интегрируются), а дискретно перемножаются. В частности, такая ситуация возникает при установке на оптоволоконной линии измерительных преобразователей с амплитудной модуляцией [11]. В этом случае система уравнений, описывающая задачу реконструкции, принимает нелинейный вид:
П xa'J = y; i = 1, m, j=i
(7)
где A = (ai ; i = 1, m; j = 1, n) - матрица, элемент a, j = 1, еслиj-я компонента xj входит в i-e измерение y, и a, j = 0 в противном случае. Для удобства дальнейшего изложения введем оператор H{ }, реализующий нелинейное отображение y = H{x}.
Распространение метода MART на случай решения систем нелинейных алгебраических уравнений вида(7) приводит к формуле:
( Y
„(*+i) =
Уг
H {x(k)},
Jk) • ; -
i = 1, m; j = 1, n ,
(8)
где yt - i-й элемент вектора измерений y, H{x }i -расчетное значение yi относительно текущего решения x(k), g = 1/ h , если at j = 1, в противном случае g = 0, h - число компонент x, участвующих в формировании i-го измерения yt.
Таким образом, если в линейном варианте MART (4) все компоненты вектора x, аддитивно участвующие в образовании проекции yi , корректируются кратно относительной ошибке, то в нелинейном варианте (8), имеющем мультипликативную форму, корректировка выполняется пропорционально корню степени h из этой ошибки. В обоих случаях после каждой i-й корректировки достигается равенство фактически измеренной проекции yt и ее расчетного значения H {x(k+1)}..
4. Описание лабораторной установки
Экспериментальная часть работы выполнена на примере лабораторного макета оптоволоконной системы измерения распределенного температурного поля. Его внешний вид представлен на рис. 2. Лабораторная установка содержит 16 оптоволоконных измерительных преобразователей, совмещенных на общих стойках с контрольными термометрами и нагревательными элементами, имитирующими матрицу распределения температурного поля размером 4х 4 . В качестве нагревательных элементов в установке использованы лампы накаливания, потребляемая мощность кото-
рых регулируется задающим устройством, управляемым с помощью персонального компьютера [12].
Рис. 2. Внешний вид макета измерительной системы Конструкция используемых в работе оптоволоконных измерительных преобразователей изображена на рис. 3. В ее основу положен эффект преобразования давления, вызванного температурным увеличением объема рабочей жидкости (вода) в герметичной камере, в механическую деформацию оптоволокна.
Регулировочный винт Крышка
Верхний поршень Оптоволокно
Нижний поршень ^ Мембрана Камера
Рабочая жидкость Рис. 3. Конструкция измерительного преобразователя
Прохождение светом участков оптоволокна с малым радиусом изгиба связано с нарушением эффекта полного отражения, что приводит к потере мощности оптического излучения и уменьшению амплитуды оптического сигнала, регистрируемого на выходе [13]. В рассматриваемой конструкции эти потери прямо пропорциональны температуре рабочей жидкости (рис. 4). ;а
1,00 0,98 0,96 0,94 0,92 0,9
-1-1- 1 1 —1— ЛЧЧ1 —1— 1 -1— —1- 1 -1— 1 —1- 1 -1— 1 -1- 1 1 -1- I -Т-I -1-1— 1 1 -Т---п 1 1
---1—-г4 1 1 1 г 1 г 1 1 г 1 I т I 1 1 т т 1 1
1 1 г г 1 1 Г г ч] 1Ч 1 г I г I 1 1 1" -г 1 1
1 1 ---1---1— 1 1 -1— -1— 1 -1— I 1 I 1 1 --Г---1-1 1
1 1 ---1---]— 1 1 -1— -1— I -г- I 1 —1— I --г- 1 ^ 1 1 V—1— \ 1
1 1 ---1---]— 1 1 -1— 1 -1— 1 I —\— I I —I— I 1 1 1 \ 1 —1—Х^и 1 1
30 35 40 45 50 55 60 65 70 75
Температура, °С
Рис. 4. Пример передаточной характеристики
Экспериментальный образец измерительного преобразователя позволяет регистрировать температуру в диапазоне от 32 до 74,5°С. Подробней озна-
комиться с его характеристиками можно по материалам работы [14].
На рис. 5 изображена исследуемая в работе схема объединения оптоволоконных преобразователей в измерительную сеть, содержащую три направления сканирования. В представленной схеме каждая из 15 оптоволоконных измерительных линий последовательно охватывает от одного до четырех измерительных преобразователей.
5 6 7 8
Рис. 5. Схема измерительной сети
Математическое описание измерительной системы представляется системой нелинейных алгебраических уравнений (9) [11]
'Р = к • /¡(71)• /2(72)• /2(72)• /4(74);
Р = к2 • /5 (75) • /6 (76) • /7 (77) • /8(78);
Р = к • /9(79)• /о(71о) • МГц) • /12(712);
(9)
к • /3(73) • /6(76) • /9(79); :*14 • /2(72) • /5(75);
, 5 = ¿15 ^ /1(71),
где Р/ - значение мощности оптического сигнала, регистрируемое на выходе /-й измерительной линии, к/ - коэффициент усиления /-й измерительной линии, учитывающий исходно введенную в оптоволокно интенсивность оптического излучения и коэффициент усиления измерительного канала, 7 и /j (•) - температура и передаточная характеристика
у-го измерительного преобразователя соответственно.
В терминах вычислительной томографии решение системы уравнений (9) относительно входящих в нее температур Г1_Г16 представляет задачу реконструкции функции пространственного распределения температурного поля по неполным проекционным данным [2]. Сложность аналитического решения этой задачи обусловлена тем, что число неизвестных системы (9) больше числа уравнений, что переводит ее в разряд некорректных [15].
5. Модели измерительной системы
Нелинейная модель. На рис. 6 представлена структурная схема математической модели измерительной системы, построенная в соответствии с ее
аналитическим описанием (9), расширенным введением шума и добавлением блоков квантования по уровню, учитывающих наличие на выходе реальной системы 12-ти разрядных аналого-цифровых преобразователей. Коэффициенты усиления к1...к15 и индивидуальные передаточные характеристики измерительных преобразователей /.../16 выявлены экспериментально (последние аппроксимированы степенными полиномами четвертого порядка).
измерительной системы
Закон распределения шума получен путем обобщения данных по всем измерительным линиям при одновременном воздействии на все измерительные преобразователи. На рис. 7 представлены экспериментальные данные и результат их аппроксимации. По оси абсцисс на этом графике отложена разница между фактическими и модельными результатами, оцениваемыми в дискретах аналогово-цифрового преобразователя (1 диск. » 0,12 °С). Аппроксимированный закон распределения получен как сумма шумов с нормальным (дисперсия о2 = 2,34) и равномерным (о2 = 22,4) законами распределения при математическом ожидании т = 0 .
Линеаризованная модель. Для возможности применения классических алгебраических методов реконструкции в отношении нелинейной задачи (9) выполним ее линеаризацию. Перепишем систему уравнений (9) относительно линеаризованных потерь мощности оптического излучения, возникающих при прохождении светом отдельных измерительных преобразователей, полагая, что эти потери суммируются:
с - Ах = у , (10)
где хт = (Т„ Тг,... ,Г16), ут = (Р, Рг, ..., Ри), А-матрица коэффициентов потерь,
ст = (^ с2, ..., ст) - вектор-столбец смещений, элементы которого найдем из условия:
с = у + Ах т , (11)
•' I х=(32, 32, 32)т 4 7
где 32° С - нижняя граница диапазона чувствительности используемых конструкций измерительных преобразователей (рис. 4), обширно представленная в исследуемых далее распределениях. | 0,08 % 0.07 | 0,06 а,0,05
щ1
2 0.04 1 0,03 1 0,02 I ом 4 о
6. Исследуемые функции пространственного распределения температурного поля
В работе исследуются четыре класса функций распределений температурного поля, которые условно обозначены как точечное, полиномиальное, радиальное и конусное. Их краткое описание и характеристики представлены в табл. 1. По критерию дифференцируемости эти распределения принадлежат к различным классам, что и обусловило их выбор.
Таблица 1. Исследуемые распределения
Обозначение Краткое описание функции пространственного распределения температурного поля Отличительная особенность
Точечное П_п_ Произвольное температурное воздействие на заданном числе измерительных преобразователей Дискретная, не диффе-ренцируе-мая функция
Полино-миаль-ное Г^ Основу функции составляют два степенных полинома пятого порядка, регламентирующих ее развитие в двух взаимно перпендикулярных направлениях Функция дифференцируется пять раз, после чего обращается в нуль
Радиальное У\ В основу функции пространственного распределения положена радиально- „2 базисная функция Т = е , где К - евклидово расстояние от текущей координаты до центра функции (К = 0) Бесконечно дифференцируемая функция
Конусное То же, что радиальное, но в основу положена функция 10, -1 > К > 1 т(К) = \ , , [1 -К , -1 < К < 1 Функция терпит разрыв по первой производной
Отклонение, диск. Рис. 7. Закон распределения шума
7. Экспериментальное исследование методов реконструкции распределенных температурных полей: предварительные замечания
Во всех последующих экспериментах в качестве нейросетевой части НИАР используются линейные сети, параметризуемые аналитически с помощью метода наименьших квадратов. Этот выбор позволяет снять недостатки, связанные с обучением нелинейных ИНС.
Итерационная часть НИАР построена на основе метода (8), предложенного в разделе 3 настоящей работы. Необходимые в НИАР функции обратных передаточных характеристик измерительных преобразователей /"'(•) получены путем аппроксимации соответствующих закономерностей степенными полиномами шестого порядка.
Обучение нелинейных ИНС (персептроны), представляющих традиционный нейросетевой подход к задаче реконструктивной томографии, выполнено с помощью алгоритма Левенберга-Марквардта. Отличительной особенностью нейро-сетевой реконструкции является то, что она, в отличие от алгебраических методов, может быть выполнена независимо для отдельных значений функции распределения. С целью упрощения численные эксперименты выполнены на примере реконструкции единственного значения функции распределения - Т10 (рис. 4).
Это упрощение не оказывает принципиального влияния на объективность проведенного исследования, позволяя при этом существенно сократить его время. Для объективности сравнения различных методов реконструкции, рассматриваемых в работе, этот способ оценки качества применялся во всех численных экспериментах. Для обозначения структур ИНС будем использовать следующий формат: [ку- к2 -... - кп -1], где к ■■■ кп - число нейронов в каждом из п скрытых слоев (активационная функция: гиперболический тангенс), 1 - неизменно один нейрон с линейной функцией активации на выходе ИНС.
Для оценки качества реконструкции в исследовании используется среднее (абсолютное) и максимальное отклонение температуры по независимой тестовой выборке, записанные через дробь в форме: среднее / максимальное. Такая комплексная мера,
кроме всего прочего, позволяет косвенно оценить картину распределения отклонений.
На первом этапе исследования как обучающие, так и тестовые выборки формируются с помощью нелинейной модели измерительной системы, из которой для чистоты сравнительного эксперимента исключен шум. Все тестовые выборки содержат 5000 примеров функций пространственного распределения. Эксперименты с введением шума, а также эксперименты с тестированием на реальных данных будут отмечены отдельно.
8. Реконструкция точечных пространственных распределений температурного поля
Результаты реконструкции функций точечных распределений представлены в табл. 2. Тип точечного распределения устанавливает число точек, на которые одновременно оказывается воздействие. Для возможности сравнения в этой таблице также отражены результаты реконструкции, полученные с помощью алгебраического метода МАЯ12, наилучшим образом проявившего себя на рассматриваемом классе функций пространственного распределения.
Из представленной таблицы видно, как скачкообразно усложняется топология ИНС и возрастают объемы обучающих выборок уже при переходе от одной до двух точек одновременного воздействия. При этом получаемые результаты оказываются хуже теоретически ожидаемых (в обоих случаях система уравнений (9) имеет аналитическое решение [16]) и уступают не только результатам НИАР, но и в большинстве рассмотренных случаев не превосходят результаты классического метода МАЯ12, полученные на основе линеаризованной модели измерительной системы. Возникшие трудности обучения ИНС можно объяснить тем, что реализуемый ими класс функций слабо пересекается с классом функций, необходимым для представления решения задачи реконструкции функции точечных распределений. Полученные результаты позволяют делать вывод о том, что практическое применение нейросетевого аппарата для целей томографической реконструкции этого класса функций пространственного распределения физических полей неэффективно, ввиду критических трудозатрат на обучение ИНС.
Таблица 2. Результаты реконструкции точечных пространственных распределений температурного поля
Тип точечного распределения ИНС НИАР [1] / 5000 МАКТ2
Погрешность реконструкции Структура / Выборка
1 0,0025 / 0,22 [5-1-1] / 5000 0,012 / 0,11 0,12 / 3,03
2 0,11 / 2,24 [20-1-1] / 20000 0,019 / 0,16 0,27 / 3,53
3 0,35 / 20,27 [20-1-1] / 20000 0,1 / 16,97 0,51 / 16,18
4 0,87 / 28,12 [15-1-1] / 20000 0,29 / 24,49 0,84 / 22,84
5 1,61 / 31,82 [15-1-1] / 15000 0,82 / 23,18 1,45 / 23,56
7 3,43 / 29,75 [15-1] / 10000 2,09 / 27,56 2,81 / 24,27
10 5,32 / 29,35 [10-1] / 5000 4,39 / 30,79 4,93 / 27,84
Таблица 3. Результаты реконструкции гладких пространственных распределений температурного поля
Про странств енно е распределение ИНС НИАР [1] / 5000 ЫАЯТ2
Погрешность реконструкции Структура / Выборка
Полиномиальное 0,025 / 0,27 [10-1] / 5000 0,19 / 2,31 2,63 / 5,25
Радиальное 0,034 / 0,67 [15-1] / 5000 0,95 / 4,59 2,15 / 6,18
Конусное 0,078 / 0,97 [15-1] / 5000 0,49 / 3,27 2,83 / 5,27
9. Реконструкция гладких пространственных
распределений температурного поля Представленные в табл. 3 результаты реконструкции гладких функций пространственного распределения как с точки зрения качества, так и с точки зрения сложности обучения ИНС принципиально отличается от результатов реконструкции функций точечных распределений. Здесь реализуемый ИНС тип нелинейности позволяет более эффективно учесть априорные признаки реконструируемого класса функций, чем это достигается при использовании линейных сетей, применяемых в НИАР. Обратим внимание, что точность реконструкции НИАР в случае использования в его структуре нелинейных ИНС оказывается соизмеримой с достигаемой в рассматриваемых экспериментах с помощью традиционного нейросетевого подхода.
10. Обобщающие свойства исследуемых решений До настоящего момента в работе рассматривались случаи, где качество реконструкции обучаемых алгоритмов (ИНС и НИАР) исследовалось на примерах функций пространственного распределения температурного поля того же типа, что использовался при их обучении. В табл. 4 представлены результаты тестирования ранее синтезированных решений на примерах различных типов функций распределения (ячейки таблицы, отмеченные серым цветом, дублируют результаты табл. 2 и 3). По представленным данным видно, что при тестировании рассматриваемых решений на типах функций пространственного распределения, отличных от используемых при их обучении, снижение качества реконструкции регистрируется в обоих случаях. Однако в случае НИАР это снижение оказывается ниже, а итоговое качество реконструкции - выше, чем достигаемое при использовании исключительно нелинейных ИНС.
Недостаток информации при решении исходно не-доопределенной задачи реконструкции компенсируется априорными знаниями о классе реконструируемых функций пространственного распределения физического поля. Чем больше объем этих знаний, тем меньше неопределенность и выше качество реконструкции. В случае нейросетевой реконструкции эти знания «впитываются» ИНС в процессе ее обучения. Их распространение на другие классы функций пространственного распределения, для которых эти знания ложны, наоборот, может привести к появлению дополни-
тельных ошибок. Наличие в НИАР итерационной части, приводящей в случае необходимости реализуемое нейронной сетью начальное приближение решения к его соответствию исходной системе алгебраических уравнений (в данном случае (9)), существенно снижает этот недостаток. Не вошедшие в настоящее изложение эксперименты показали, что на примерах гладких функций пространственного распределения, представленных в табл. 4, итерационная часть НИАР в среднем снижает среднее и максимальное отклонение на 37% и 44% соответственно. Таким образом, в режиме обобщения НИАР на базе линейных нейросетей превосходит результаты, получаемые в этих же условиях с помощью исключительно нелинейных ИНС.
11. Влияние шума на качество реконструкции
В табл. 5 представлены результаты реконструкции зашумленных функций пространственного распределения температурного поля, полученные с помощью различных методов. Характеристики шума и способ его введения в модель рассмотрены в разделе 5 настоящей работы. Для методов, содержащих этап обучения, эксперименты выполнены как для случая обучения на зашумленных данных, так и для случая обучения на примерах без шума. По представленным результатам экспериментов видно, что шум не оказывает критического влияния на качество реконструкции, однако для нейросетевых методов его учет необходим на этапе обучения.
12. Натурные эксперименты
В заключительной части исследования рассмотрим результаты реконструкции, полученные в реальной измерительной системе (табл. 6). Ввиду того, что формирование тестовых пространственных распределений в реальных условиях требует значительных временных затрат, ограничим их число 20-ю представительными примерами. При этом оценку качества реконструкции выполним по всем 16-ти элементам функции распределения. Это требует обучения 16-ти ИНС для каждого рассматриваемого класса функций пространственных распределений. Обучение выполнено на модельных данных с шумом. Параметры ИНС (топология, объем обучающей выборки) приняты аналогичными выявленным ранее в ходе численных экспериментов для соответствующих классов функций (табл. 2 и 3). В НИАР используются линейные сети, обученные на тех же выборках.
Таблица 4. Обобщающие свойства исследуемых решений
" '—^естирование Обучение '— Точечное 1 Точечное 3 Полиномиальное Радиальное Конусное
Точечное 1 ИНС 0,002 / 0,22 3,54 / 42,37 21,3 / 42,5 14,1 / 41,8 19,4 / 40,6
НИАР 0,012 / 0,11 0,11 / 17,88 2,12 / 13,68 1,52 / 8,02 0,87 / 7,87
Точечное 3 ИНС 0,068 / 1,56 0,35 / 20,27 18,2 / 40,63 6,76 / 30,96 14,8 / 39,76
НИАР 0,011 / 0,10 0,10 / 17,07 1,02 / 4,96 1,36 / 5,04 0,91 / 4,33
Полиномиальное ИНС 2,91 / 15,8 5,39 / 24,96 0,025 / 0,27 1,62 / 8,23 0,7 / 4,2
НИАР 0,012 / 0,11 0,11 / 18,99 0,19 / 2,31 1,37 / 5,06 0,72 / 3,86
Радиальное ИНС 1,35 / 5,7 3,45 / 25,64 1,29 / 6,98 0,034 / 0,67 0,67 / 5,1
НИАР 0,010 / 0,12 0,11 / 19,48 1,04 / 6,88 0,95 / 4,48 0,53 / 4,55
Конусное ИНС 2,66 / 13,3 5,39 / 35,11 1,77 / 12,7 0,55 / 4,49 0,078 / 0,97
НИАР 0,011 / 0,11 0,11 / 17,38 0,94 / 6,63 1,01 / 4,54 0,49 / 3,27
Таблица 5. Результаты реконструкции в условиях шума
Метод реконструкции Тестовое распределение (5000 модельных примеров с шумом)
Точечное 1 Точечное 2 Полиномиальное Радиальное
Обучение без шума ИНС 4,16 / 60,58 0,68 / 16,31 0,39 / 1,16 0,56 / 2,41
НИАР 0,26 / 1,52 0,29 / 1,85 0,46 / 2,66 1,13 / 4,89
Обучение с шумом ИНС 0,19 / 1,77 0,31 / 3,36 0,33 / 0,94 0,39 / 1,41
НИАР 0,25 / 1,44 0,29 / 1,79 0,47 / 2,62 1,11 / 4,97
АЯт 2,73 / 11,44 3,86 / 19,09 2,72 / 5,63 2,74 / 8,25
АЯт2 0,41 / 4,14 0,55 / 4,56 2,76 / 6,09 2,42 / 7,41
МАЯт2 0,4 / 3,96 0,53 / 4,32 2,78 / 5,82 2,3 / 6,79
Таблица 6. Результаты натурных экспериментов
Метод реконструкции Тестовое распределение (20 реальных примеров)
Точечное 1 Полиномиальное Радиальное
ИНС 0,54 / 2,63 0,49 / 1,51 0,67 / 2,18
НИАР 0,36 / 1,78 0,62 / 2,93 1,34 / 4,76
МАЯт2 0,51 / 4,26 3,02 / 6,32 2.,49 / 6,98
Результаты натурных экспериментов подтверждают возможность использования математической модели измерительной системы для обучения ИНС. Несколько более высокий уровень регистрируемых отклонений можно объяснить более сложной природой шума в реальной системе, который в существенной степени связан с эффектом остаточных деформаций оптоволокна.
Заключение Результаты работы показывают, что качественная реконструкция функций пространственного распределения физических полей по неполным проекционным данным требует учета априорных знаний. Нейросете-вой аппарат, благодаря обучению на примерах реальных пространственных распределений, является эффективным и во многом универсальным средством учета этих знаний. Наряду с преимуществами, прове-
денное исследование выявило недостатки нейросете-вого подхода. К ним можно отнести потребность в большом числе обучающих примеров; высокие трудозатраты на обучение ИНС; низкую способность к реконструкции некоторых классов функций пространственного распределения (в частности, точечных); отсутствие гарантий удовлетворительного качества реконструкции тех классов функций распределения, которые не учитывались на этапе обучения.
Результаты представленных экспериментов демонстрируют, что наиболее эффективно потенциал классического нейросетевого подхода реализуется на примерах реконструкции гладких функций пространственного распределения, имеющих стационарный базис. Если эти условия не выполняются, то точность нейросетевого решения в большинстве случаев оказывается ниже, чем точность простых классических методов реконструктивной томографии.
Предложенный в работе нейро-итерационный алгоритм реконструкции во многом лишен отмеченных недостатков. Он основан на широком использовании математической модели измерительной системы и совмещает в себе способность ИНС к учету априорных знаний с надежностью и простотой алгебраических методов.
Благодаря обучению на модельных данных, из которых исключена часть нелинейности измерительной системы, а также наличию итерационной
части решения, в предложенном подходе становится возможным использование более простых структур ИНС. При этом применение линейных ИНС, используемых в настоящей работе, не является обязательным условием. Вместе с тем именно этот класс ИНС следует рекомендовать применять при решении практических задач. Это обусловлено высокими трудозатратами на обучение нелинейных ИНС, имеющих большие размерности входных и выходных векторов, что свойственно задачам реконструктивной томографии и обостряется по мере роста размерности измерительной системы. Детальное обсуждение этой проблемы осталось за рамками настоящего изложения.
Литература
1. Кульчин, Ю.Н Распределенные волоконно-оптические измерительные системы. - М: Физматлит, 2001. - 272 с.
2. Терещенко С.А. Методы вычислительной томографии. - М.: Физматлит, 2004. - 320 с.
3. Наттерер, Ф. Математические аспекты компьютерной томографии / Ф. Наттерер; пер. с англ. - М.: Мир. 1990. - 280 с. (F. Natterer. Mathematics of Computerized Tomography / John Wiley & Sons Ltd., N. Y., 1986.).
4. Бахвалов, Н.С. Численные методы. - М.: Наука, 1973. — 632 с.
5. Herman, G.T. Three methods for reconstructing objects from X rays: A comparative study / G.T. Herman, S.W. Rowland // Computer Graphics and Image Processing. -1973. - V. 2. - P. 151-178.
6. Gordon, R.A Tutorial on ART. (Algebraic reconstruction techniques). // IEEE Tr. on Nuclear Sciences. - 1974. -V. NS-21, No. 1. - P. 78-93.
7. Herman, G.T. Iterative reconstruction algorithms / G.T. Herman, A. Lent // Computers in Biology and Medicine. - 1976. - Vol. 6. - P. 273-294.
8. Adler, A. A neural network image reconstruction technique for electrical impedance tomography / A. Adler, R. Guardo // IEEE Trans. Med. Imag. - .1994. - .Vol. 3. -P. 594-600.
9. Кульчин, Ю.Н. Нейросетевое и алгебраическое моделирование параллельного 2D проецирования в волоконно-оптической томографии при ограниченном числе направлений сканирования / Ю.Н. Кульчин, Е.В. Закасовская // Компьютерная оптика. - 2009. -Т. 33, № 3. - С. 318-324. - ISSN 0134-2452.
10. Кульчин, Ю.Н. Применение персептронов для нелинейной реконструктивной томографии / Ю.Н. Кульчин, И.В. Денисов, А.В. Панов, Н.А. Рыбальченко // Проблемы управления. - 2006. - № 4. - С. 59-63.
11. Kulchin, Yu.N. Tomography methods for vector fields study by using space-distributed fiber optic sensors with integral sensitivity / Yu.N. Kulchin, O.B. Vitrik, R.V. Romashko, Yu.S. Petrov, O.V. Kirichenko, O.T. Kamenev // Fiber and integrated optics. - 1998. - Vol. 17, No. 1. - P. 75-84.
12. Denisov, IV. Fiber-optical temperature measuring system / I.V. Denisov, V.A. Sedov // Book of abstracts 6th International Conference on "Mid-Infrared Optoelectronics Materials and Devices". - SPb, 2004. - P. 155-156.
13. Снайдер, А. Теория оптических волноводов / А. Снай-дер, Лав Дж. - М.: Радио и связь, 1987. - 656 с.
14. Денисов, И.В. Волоконно-оптический микроизгибный температурный датчик / И.В. Денисов, В.А. Седов,
Н.А. Рыбальченко // Приборы и техника эксперимента. - 2005. - № 5. - С. 131-134.
15. Тихонов АН. Методы решения некорректных задач. / А.Н. Тихонов В.Я. Арсенин - М.: Наука, 1986. - 288 с.
16. Kulchin, Yu.N. Reconstruction of Distributed Physical Fields in Integrating Measuring Systems and Systems of Direct Measuring in Rare Points of Field / Yu.N. Kulchin, B.S. Not-kin, A.Yu. Kim // Optical Memory and Neural Networks (Information Optics). - 2008. - Vol. 17, No. 2. - P. 93-100.
References
1. Kulchin, Yu.N. Distributed Optical Fiber Measuring Systems. - Moscow: Fizmatlit, 2001. - 272 p. - (in Russian).
2. Terechenko, S.A. Methods of a computing tomography. -Moscow, Fizmatlit, 2004. - 320 p. - (in Russian).
3. Natterer F. Mathematics of Computerized Tomography / John Wiley & Sons Ltd., N.-Y., 1986.
4. Bahvalov N.S. Numerical methods. - Moscow: Nauka, 1973. - 632 p. - (in Russian).
5. Herman, G.T. Three methods for reconstructing objects from X rays: A comparative study / G.T. Herman, S.W. Rowland // Computer Graphics and Image Processing. -1973. - V. 2. - P. 151-178.
6. Gordon, R.A Tutorial on ART. (Algebraic reconstruction techniques). // IEEE Tr. on Nuclear Sciences. - 1974. -V. NS-21, No. 1. - P. 78-93.
7. Herman, G.T. Iterative reconstruction algorithms / G.T. Herman, A. Lent // Computers in Biology and Medicine. - 1976. - Vol. 6. - P. 273-294.
8. Adler, A. A neural network image reconstruction technique for electrical impedance tomography / A. Adler, R. Guardo // IEEE Trans. Med. Imag. - .1994. - .Vol. 3. -P. 594-600.
9. Kulchin, Yu.N. Neural-like and algebraic modeling of projection data in parallel fiber optical tomography in limited-angle conditions / Yu.N. Kulchin, E.V. Zakasovskaya // Computer Optics. - 2009. - V. 33, N 3. - P. 318-324. -ISSN 0134-2452. - (in Russian).
10. Kulchin, Yu.N. Perceptron application in nonlinear reconstruction tomography / Yu.N. Kulchin, I.V. Denisov, A.V. Panov, N.A. Rybalchenko // Control sciences. -2006. - N 4. - P. 59-63. - (in Russian).
11. Kulchin, Yu.N. Tomography methods for vector fields study by using space-distributed fiber optic sensors with integral sensitivity. / YuN. Kulchin, O.B. Vitrik, R.V. Romashko, Yu.S. Petrov, O.V. Kirichenko, O.T. Kamenev // Fiber and integrated optics. - 1998. - Vol. 17, No. 1. - P. 75-84.
12. Denisov, I.V. Fiber-optical temperature measuring system / I.V. Denisov, V.A. Sedov // Book of abstracts 6th International Conference on "Mid-Infrared Optoelectronics Materials and Devices". - SPb, 2004. - P. 155-156.
13. Snaider, A. The theory of optical fiber / А. Snaider, G.H. Lav - Moscow, Radio i sviaz, 1987. - 656 p. - (in Russian).
14. Denisov I.V. Fiber-optical temperature sensor with microbends / I.V. Denisov, V.A. Sedov, N.A. Rybalchenko // Instruments and experimental techniques - 2005. - N 5. -P. 131-134. - (in Russian).
15. Tihonov, A.N. Method of solution ill-posed problem / A.N. Tihonov, V.Ia. Arsenin - Moscow: Nauka, 1986. -288 p. - (in Russian).
16. Kulchin, Yu.N. Reconstruction of Distributed Physical Fields in Integrating Measuring Systems and Systems of Direct Measuring in Rare Points of Field / Yu.N. Kulchin, B.S. Not-kin, A.Yu. Kim // Optical Memory and Neural Networks (Information Optics). - 2008. - Vol. 17, No. 2. P. 93-100.
NEURO-ITERATIVE ALGORITHM OF TOMOGRAPHIC RECONSTRUCTION OF THE DISTRIBUTED PHYSICAL FIELDS IN THE FIBRE-OPTIC MEASURING SYSTEMS
Yury Nikolaevich Kulchin1 (director IACP FEB RAS, е-mail: director@iacp.dvo.ru), Boris Sergeevich Notkin1 (researcher, е-mail: boris_notkin@mail.ru), Sedov Viktor Aleksandrovich2 (lecturer, е-mail: sedov@msun.ru) 1 Institute of Automation and Control Processes, FEB RAS, 2 Maritime State University after G.I. Nevelskoy
Abstract
The research of the algebraic and neuro-network reconstruction methods of the distributed physical fields for the fibre-optic measuring network of a tomographic type was carried out. Advantages and the disadvantages of a neural network approach were revealed. The neuro-iterative algorithm which combines benefits neural network with algebraic methods of the reconstructive tomography was suggested.
Key words: fibre-optic tomography, computer tomography, distributed physical fields, artificial neural networks.
В редакцию поступила 21.10.2009 г.