Научная статья на тему 'Компьютерные технологии и математика на рубеже веков: итоги и перспективы'

Компьютерные технологии и математика на рубеже веков: итоги и перспективы Текст научной статьи по специальности «Математика»

CC BY
172
21
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Прыгунов А. И.

В статье рассматриваются новые математические методы, обязанные своим появлением развитию компьютерной техники и технологий во второй половине уходящего столетия. Показан преимущественно прикладной характер развития математики в этот период, направленного в первую очередь на решение проблемы создания искусственного интеллекта. Решение этой проблемы невозможно без разработки новых математических подходов к формализации процесса субъективного распознавания образов. Примерами таких подходов могут быть теория нечётких множеств, нечёткая логика, вэйвлет-анализ образов и другие разделы современной математики, получившие преимущественное развитие на рубеже веков. В то же время в курсах математики, предусмотренных образовательными стандартами, эти новые и чрезвычайно важные с прикладной точки зрения разделы и эффективные методы не находят отражения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Компьютерные технологии и математика на рубеже веков: итоги и перспективы»

Компьютерные технологии и математика на рубеже веков: итоги и перспективы

А.И. Прыгунов

Судомеханический факультет МГТУ, кафедра технической механики

Аннотация. В статье рассматриваются новые математические методы, обязанные своим появлением развитию компьютерной техники и технологий во второй половине уходящего столетия. Показан преимущественно прикладной характер развития математики в этот период, направленного в первую очередь на решение проблемы создания искусственного интеллекта. Решение этой проблемы невозможно без разработки новых математических подходов к формализации процесса субъективного распознавания образов. Примерами таких подходов могут быть теория нечётких множеств, нечёткая логика, вэйвлет-анализ образов и другие разделы современной математики, получившие преимущественное развитие на рубеже веков. В то же время в курсах математики, предусмотренных образовательными стандартами, эти новые и чрезвычайно важные с прикладной точки зрения разделы и эффективные методы не находят отражения.

Abstract. In the paper the new mathematical methods, which are related to the progress of computer engineering and technologies in the second half of the XX century, have been considered. In the work the applied character of the mathematics development in this period has been shown. This development is directed mainly on the problem of Artificial Intelligence creation in the next century. The solution of this problem is impossible without progress of the new mathematical approaches to the processes of subjective recognition of images. The examples of such approaches are fuzzy sets, fuzzy logic, wavelets and other parts of modern mathematics. Now the latest achievements in mathematics must be presented in modern university mathematical courses.

1. Введение

Рубеж столетий, а тем более рубеж тысячелетий является несомненным поводом для осмысления основных результатов, полученных за последнее столетие в науке. Естественны и неоспоримы оценки XX века как века небывалого прогресса в науке и технике. Однако чаще всего научную революцию (релятивистская, квантовая, ядерная физика) связывают с первой половиной столетия, а технологическую революцию (ядерная энергетика, космические исследования, вычислительная техника) - со второй. Но и вторая половина века связана с не менее значимой научной революцией, вызванной созданием универсальной теории динамических систем (нелинейная динамика, нелинейная термодинамика). Особенностью научной революции второй половины XX в. является её решающая обусловленность технологическим прогрессом. Роль технологического прогресса при этом связана в первую очередь с потребностью в исследовании сложных динамических объектов (ядерная, термоядерная энергетика, космические объекты, сложные химические технологии), которое, в свою очередь, было бы невозможно без технологического прогресса в области вычислительной техники.

Несмотря на универсальный характер следствий научной революции второй половины XX в., она по сути является революцией математического моделирования и численных методов. К сожалению, пик развития приложений теории динамических систем к решению практических задач исторически совпал с периодом политических и экономических потрясений в России, что привело к почти полному отсутствию русскоязычной литературы по этому направлению. Существуют даже проблемы с русскоязычной терминологией в этой области. Поэтому любой русскоязычный анализ развития точных наук за этот период представляет несомненный интерес. Как будет показано ниже, особенностью развития математики после 50-х годов прошлого века является ярко выраженный прикладной характер этого развития.

Влияние прогресса в области вычислительной техники на математику носит двоякий характер. С одной стороны, впервые появилась возможность реализации универсальных численных алгоритмов решения задач динамики и статики (метод Монте-Карло, метод конечных элементов и др.), которые до появления достаточно производительных компьютеров считались практически не реализуемыми из-за большого объёма вычислений. С другой стороны, следует признать, что генеральным направлением развития вычислительной техники является перспектива создания систем искусственного интеллекта, поэтому прогресс в области использования компьютеров в системах управления невозможен без разработки методов распознавания образов на основе формальных алгоритмов, сравнимых по эффективности с процессом распознавания в рамках высшей нервной деятельности. При этом цифровые методы обработки сигналов от сенсоров

переводят задачу распознавания в область дискретной математики, с которой в последнее время в основном и связан прогресс в прикладной математике. Если решение первой задачи связано с применением известных численных методов и обусловлено в основном прогрессом в области программного обеспечения, связанного, в свою очередь, с разработкой универсальных высокоэффективных математических объектно-ориентированных сред программирования (MathLab, MathCAD, Mathematica и др.), то решение второй задачи связано с решением математических проблем и прогрессом собственно в математике. Поэтому основное внимание в нашем анализе будет уделено новым разделам математики, направленным на решение проблемы искусственного интеллекта.

2. Нечёткая логика

Нечеткие системы (fuzzy systems) являются своеобразной альтернативой традиционным понятиям определения принадлежности объекта к какой-либо группе, множеству, основанным на формальной логике, главные законы которой были сформулированы ещё философами Древней Греции. Несмотря на столь древнее происхождение науки логики, нечёткая логика (fuzzy logic) является относительно новым разделом математики.

Суть проблемы заключается в том, что для реального мира характерна неопределённость понятий, которая нашла наиболее яркое выражение в языковых формулировках, типа "Миша высокий" или "Сегодня очень холодно". Выражения такого типа трудно поддаются формализации без потери их семантической ценности. Например, из утверждения "Рост Миши - 192 см" не следует явно, что он высок. С другой стороны, даже утверждение типа "Миша высок потому, что его рост превышает 1.2 стандартного отклонения от среднего роста, характерного для мужчин его возраста и сложения" также несёт большую долю неопределённости. Считать ли его высоким, если отклонение 1.1999999 стандартного? Как определить возрастную группу? Каковы признаки группы сложения? Такие трудности тотчас возникают при любой серьёзной попытке формализации человеческого языка и в рамках классической логики.

Семантическая ценность человеческой речи особенно очевидна при решении задач разработки экспертных систем, основанных на обобщении опыта группы экспертов и направленных на формализацию задач распознавания в целях решения задач оценки состояния объекта деятельности экспертов. Потребность в разработке таких систем возникла в технике, медицине и экономике в связи с развитием вычислительной техники в направлении создания систем искусственного интеллекта. Поэтому разработка в начале 60-х годов американским исследователем пакистанского происхождения Лотфи Заде (Lotfi A. Zadeh) аппарата нечёткой логики была объективно обусловлена уровнем развития вычислительной техники в этот период. Неслучайно, что в то же время был разработан базовый алгоритм цифровой обработки сигналов - быстрое преобразование Фурье (Cooley, Tukey, 1965). Дадим краткий исторический экскурс в развитие нечёткой логики.

Как отмечалось выше, основные законы классической логики были сформулированы еще древнегреческими философами. Один из этих законов, "Закон исключенного третьего", утверждает, что каждое суждение должно быть либо истинно, либо ложно. Уже когда Парменид в 4 в. до н. э. предложил первую версию этого закона, ему выдвигались существенные возражения. Так, например, первый диалектик Гераклит полагал, что суждения могли бы быть одновременно истинны и не истинны. Основание нечёткой логики заложил Платон, который предположил, что для оценки суждений имеется третья область, вне истинного и ложного, где эти противоположности динамически превращаются одна в другую. Философы Нового времени, особенно Гегель и Маркс, понимали, что двузначная логика Аристотеля является рудиментом античной метафизики в логике и математике. Однако первым, кто предложил ей реальную альтернативу был польский логик Ян Лукасевич. В начале XX в. он предложил трёхзначную логику и соответствующий математический аппарат количественных логических вычислений. Третья оценка суждения может быть охарактеризована как возможное или нейтральное суждение. Если истинному суждению присвоить числовое значение 1, а ложному - 0, нейтральному суждению будет соответствовать 1/2. Таким образом, стало возможным построение трёхзначной системы логических исчислений по типу алгебры Буля. Следует отметить, что Я. Лукасевич надеялся получить на основе трёхзначной логики аксиоматическое обоснование новой математики. Таким образом, проблема нечёткой логики с самого начала относилась к области чистой математики и математической логики. В дальнейшем были предложены различные варианты многозначных логик, вплоть до бесконечнозначных логик с различными вариантами возможных числовых характеристик суждений. Тем не менее даже бесконечнозначная логика не снимала проблемы неопределённости суждений и не могла быть принята окончательно. Лишь в 1965 г. была опубликована работа (Zadeh, 1965), в которой были сформулированы законы принципиально новой нечёткой, или паранепротиворечивой, логики.

Нечёткая логика основана на понятии о функции принадлежности (membership function) объекта анализа к нечёткому множеству. Функция принадлежности на интервале от ложных до истинных суждений принимает действительные значения в интервале [0.0; 1.0]. В работе были предложены также новые

принципы логических исчислений. При этом было показано, что нечёткая логика является обобщением классической логики. Рассмотрим более подробно некоторые основные понятия нечёткой логики.

Начнём с анализа свойств функции принадлежности. Рассмотрим, например, утверждение

"Посолъно-свежъевой траулер (ПСТ) "Калачинск" — старое судно".

Возраст ПСТ "Калачинск" 21 год, поэтому с учётом нормативного срока эксплуатации судов этого типа (25 лет) можно принять истинность рассматриваемого утверждения на уровне 0.8 (значение функции принадлежности для ПСТ "Калачинск"). Если переформулировать рассматриваемое утверждение в терминах теории множеств, получим следующее утверждение

"ПСТ "Калачинск" принадлежит к множеству старых судов".

Оценка этого утверждение может быть записана в символах нечёткой логики

mOLD (ПСТ "Калачинск") = 0.8,

где m - функция принадлежности на нечётком множестве старых судов (OLD), которая может принимать значения между 0.0 и 1.0. Здесь важно указать на различие между значением функции принадлежности и вероятностью, так как на первый взгляд может показаться, что эти понятия эквивалентны. Однако, если введённую количественную меру рассматривать как вероятность, то этому соответствовало бы утверждение

"С вероятностью 80% ПСТ "Калачинск" старое судно",

что явно не соответствует смыслу первоначального утверждения. В тоже время в терминах нечёткой логики мы имеем утверждение

"Степень принадлежности ПСТ "Калачинск"множеству старых судов — 0.8".

Очевиден различный семантический смысл утверждений. В первом случае ПСТ "Калачинск" имеет шанс 80 % быть названным старым, во втором - ПСТ "Калачинск" более или менее старое судно на уровне 0.8 при максимуме 1.0. Более существенные различия между вероятностным подходом и нечёткой логикой будут рассмотрены ниже.

Известны следующие методы определения вида функции принадлежности, выбираемые в каждом конкретном случае:

1. Субъективные (экспертные) оценки. Поскольку нечеткая логика обычно используется в задачах, связанных с субъективными оценками, вид функции принадлежности на интервале [0.0; 1.0] может быть определён субъективно, обычно на основе мнения экспертов в данной прикладной области. Чаще всего эксперты изображают графически подходящий вид функции, или им предлагается сделать выбор из предложенных в графическом виде форм функции принадлежности. При анализе мнения экспертов могут использоваться стандартные методы психологии. В частности, с учётом логарифмического характера чувствительности органов чувств человека, при формировании функций принадлежности на основе субъективных оценок целесообразно применять "правило 6-ти децибел", традиционно используемое при классификации состояний в технической диагностике.

2. Выбор формы функции "ad-hoc". Хотя в принципе существует огромное число возможных функций принадлежности, оказывается, имеется небольшое число аналитических функций (линейная, гармоническая, экспонента), которые могут достаточно точно для прикладных задач интерполировать реальные функции принадлежности. В частности, чаще других используют линейную на интервале [0.0; 1.0] функцию принадлежности. Подходящую функцию разработчик системы принимает "ad-hoc".

3. Преобразование статистической информации. Если имеется достаточный объём информации о совокупности элементов нечёткого множества в виде гистограмм и кривых плотности вероятности, функция принадлежности может быть получена из этих данных стандартными методами преобразования вероятностной информации в функции принадлежности. При этом следует помнить, что функция принадлежности - это не плотность вероятности.

4. Прямые измерения. Иногда получение вида функции принадлежности возможно на основе прямых измерений параметров элементов нечёткого множества с последующей их статистической обработкой и преобразованием её результатов в функцию принадлежности.

5. Изучение и адаптация. Данный метод применяется при разработке систем на базе нечёткой логики применительно к объектам, по которым отсутствует предварительная информация, при этом может быть использована (адаптирована) имеющаяся информация по объектам, подобным данному.

Так как нечёткая логика направлена на формализацию субъективных оценок, представляет интерес рассмотреть процедуры модификации функций принадлежности в зависимости от изменения уровня оценки. Рассмотрим один из способов такой модификации на рассматривавшемся выше примере. Пусть х = ПСТ "Калачинск", OLD(x) - множество определённо старых судов, VERYOLD(x) - множество очень старых судов, ROLD(x) - множество довольно старых судов. Тогда, если mOLD(nCT "Калачинск") = 0.8,

mVERYOLD(nCT "Калачинск") = [mOLD(nCT "Калачинск")]2 = 0.64; mROLD(nCT "Калачинск") = SQRT[mOLD(nCT "Калачинск")} = 0.9.

Такие приёмы модификации параметра принадлежности не единственны, однако все они зависят от интуиции разработчика.

Для установлении полной системы нечеткой логики необходим ряд формальных определений: Определение 1: ПустьX есть некоторое множество с элементами, отмеченными как x (X = {x}). Определение 2: Нечеткое множество А формируется на X через функцию принадлежности mA(x), которая определена для каждого элемента множества X и принимает действительные значения на интервале [0.0; 1.0]. Чем ближе mA(x) к 1.0, тем выше ранг принадлежности x к A. Определение 3: Нечёткое множество А называют пустым, если для любого x mA(x) = 0.0. Определение 4: А = B, если для любого x: mA(x) = mB(x), или mA = mB. Определение 5: A' есть дополнение к А, если mA' = 1 - mA. Определение 6: A включается в B, если mA < mB.

Определение 7: C есть объединение А и B, если mC(x) = MAX(mA(x), mB(x)). Определение 8: C есть пересечение А и B, если mC(x) = MIN(mA(x), mB(x)).

Особенно важны для приложений два последних действия: объединение ("ИЛИ") и пересечение ("#"), которые определяют суть различий между теорией вероятности и нечёткой логикой. Сформулируем эти основные отличия.

Как известно, вероятность одновременного наступления двух независимых событий (логическое "И') в теории вероятности определяется как произведение вероятности наступления каждого из событий, однако это отличается от сформулированного нами для нечётких множеств определения 8. Например, если предположить, что х = Миша, является одновременно элементом нечёткого множества S - "сильные люди" и нечёткого множества Т - "высокие люди" с соответствующими значениями функций принадлежности mS(x) = 0.9 и mT(x) = 0.9, то вероятность того, что Миша силён и высок составит

mS(x) * mT(x) = 0.81,

тогда как в нечёткой логике значение функции принадлежности к пересечению составит

MIN(mS(x), mT(x)) = 0.90.

Таким образом, мы видим, что расчёты по теории вероятности в этом случае обычно приводят к заниженному по сравнению с оценкой нечёткой логики результату по пересечениям. Особенно это становится существенным при большом числе факторов. Нетрудно убедиться, что такого рода различия между вероятностным подходом и нечёткой логикой имеют место и при операции объединения, только в этом случае применение нечёткой логики приводит к занижению оценки.

Одним из важнейших применений нечёткой логики является её использование в экспертных системах. Экспертные системы предназначены для получения заключений (экспертных оценок) о состоянии объекта в автоматическом режиме. Экспертные системы на базе нечёткой логики (fuzzy expert systems) отличаются от обычных экспертных систем тем, что используют, в отличие от традиционной логики (алгебра Буля), набор функций принадлежности и правил для получения суждений об объекте. Правила в таких экспертных системах обычно формулируются в виде подобном следующему:

Ш(если) x низкое AND (логическое "И") y высокое THEN (тогда) z среднее,

где x и y являются входными переменными, значения функций принадлежности которых известны, z -выходная переменная, функция принадлежности которой должно быть определена. Не следует забывать, что здесь слова низкое, высокое и среднее по сути определяют вид соответствующей функции принадлежности для x, y и z. Очевидно, что при изменении числа переменных число правил существенно возрастает. Совокупность правил представляет собой базу правил или базу знаний, которая как правило формируется с учётом мнений экспертов, поэтому качество базы знаний зависит от квалификации экспертов.

В общем случае процесс получения суждения о неизвестной переменной осуществляется в три (или четыре) этапа:

1. Определяется вид функций принадлежности для переменных, для входных переменных определяются значения функций принадлежности, чтобы иметь возможность рассчитать степень истинности каждого из суждений (правил) относительно выходной переменной с учётом данных выше определений. Этот этап в англоязычной литературе называют "FUZZIFICATION".

2. Рассчитывается степень истинности каждого суждения (правила) из базы знаний по каждой из выходных переменных. Для каждого правила выводят функцию принадлежности (нечёткое

подмножество) для выходных переменных. С учётом того, что в основном при формулировке правил используется логическое "И", данную процедуру называют MIN-выводом (MIN-inference).

3. На основе полученных в процедуре MIN-вывода функций принадлежности для отдельных правил проводят объединение нечётких подмножеств, полученных для отдельных правил с использованием логического "ИЛИ", поэтому данную процедуру называют MAX-композиция (MAX-composition). В результате достигается главная цель исследования - нечёткое множество выходной переменной в виде функции принадлежности на области его определения.

4. Хотя полученная в ходе MAX-композиции функция принадлежности полностью характеризует нечёткое множество выходной переменной, в ряде случаев выдвигается требование найти наиболее достоверное (не путать с наиболее вероятным) значение выходной переменной при заданных значениях входных. Одним из таких способов является определение "центра тяжести" полученной функции принадлежности на области определения (centroid method). В англоязычной литературе этот этап называют "DEFUZZIFICATION".

Рассмотрим применение нечёткой логики в экспертных системах на примере системы с двумя входными переменными, одной выходной переменной с кусочно линейными функциями принадлежности.

Пусть входные переменные x, y и выходная переменная z могут принимать действительные значения на интервале [0; 10]. Функции принадлежности, соответствующие определениям низкое (low) и высокое (high), определим, соответственно, выражениями:

L (t) = 1 - ( t/ 10 ); H (t) = t/ 10,

где t - общее обозначение для переменной. Очевидно, что при двух входных переменных и двух определениях можно составить не более четырёх суждений (правил), характеризующих свойства системы:

правило 1: если x низкое и y низкое тогда z высокое; правило 2: если x низкое и y высокое тогда z низкое; правило 3: если x высокое и y низкое тогда z низкое; правило 4: если x высокое и y высокое тогда z высокое.

X y L(x) H(x) L(y) H(y) прав.1 прав.2 прав.3 прав.4

0.0 0.0 1.0 0.0 1.0 0.0 1.0 0.0 0.0 0.0

0.0 3.2 1.0 0.0 0.68 0.32 0.68 0.32 0.0 0.0

0.0 6.1 1.0 0.0 0.39 0.61 0.39 0.61 0.0 0.0

0.0 10.0 1.0 0.0 0.0 1.0 0.0 1.0 0.0 0.0

3.2 0.0 0.68 0.32 1.0 0.0 0.68 0.0 0.32 0.0

6.1 0.0 0.39 0.61 1.0 0.0 0.39 0.0 0.61 0.0

10.0 0.0 0.0 1.0 1.0 0.0 0.0 0.0 1.0 0.0

3.2 3.1 0.68 0.32 0.69 0.31 0.68 0.31 0.32 0.31

3.2 3.3 0.68 0.32 0.67 0.33 0.67 0.33 0.32 0.32

10.0 10.0 0.0 1.0 0.0 1.0 0.0 0.0 0.0 1.0

В данном примере для простоты принято, что тип функций принадлежности одинаков для всех переменных, однако это не является обязательным требованием. В таблице приведены результаты расчёта значений функции принадлежности и степени истинности всех четырёх суждений с учётом определения 8 для десяти произвольных пар входящих переменных. По данным таблицы проведём процедуру МГЫ-вывода для х = 0.0 и у = 3.2. В результате применения четырёх правил получим четыре нечётких подмножества для г:

правило 1(г) = { г / 10, если г <= 6.8;

0.68, если г >= 6.8 }; правило 2(г) = { 0.32, если г <= 6.8;

1 - г / 10, если г >= 6.8 }; правило 3(г) = 0.0; правило 4(г) = 0.0.

В результате МЛХ-композиции получим итоговое нечёткое подмножество г для х = 0.0; у = 3.2:

МЛХ(г)\х=о.о,у=з.2 = { 0.32, если г <= 3.2

г / 10, если 3.2 <= г <= 6.8 0.68, если г >= 6.8 }.

Аналогичным образом можно получить нечёткое подмножество г для любых значений х и у.

Оценку наиболее достоверного значения выходной переменной проведём двумя способами. Наиболее просто, хотя и наименее обосновано, считать таким значением значение выходной переменной, соответствующее максимальному значению функции принадлежности. Если такое значение не единственное, как в нашем случае, то за наиболее достоверное значение выходной переменной принимается среднее из соответствующих максимуму значений. В нашем случае это г = 8.4. Более обоснованной оценкой наиболее достоверного значения выходной переменной является расчёт координаты "центра тяжести" графика функции принадлежности в соответствии с выражением

¿с = [\г MAX(z) йг ] / [ I MAX(z) йг ].

Для полученной нами функции MAX(z) результат расчёта приводит к значению гс = 6.5. Очевидно, что данное значение более обоснованно, так как учитывает всю функцию принадлежности в целом, а не её отдельные фрагменты. В графическом виде все этапы нашего расчёта представлены на рис. 1.

Рис. 1. Слева направо: функции принадлежности Ь(1) и ЩИ); функции принадлежности для г в соответствии с правилом 1 (Пр.1) и правилом 2 (Пр.2); результат МАХ-композиции с указанием наиболее достоверных значений г для рассматриваемых х и у, полученных по различным методикам

Из рассмотренного примера видно, что нечёткая логика, в отличие от классической логики, является прикладным аппаратом исчисления наиболее достоверных следствий для нечётко заданных причин. С точки зрения прагматической ценности нечёткая логика подобна алгебрам Буля и теории вероятности, хотя принципиально отличается от них по сути вычислений и содержания получаемых результатов. Поэтому с нашей точки зрения нечёткая логика должна рассматриваться как важный раздел современной прикладной математики, что необходимо учитывать при формировании учебных планов для широкого круга инженерных, экономических и естественнонаучных специальностей.

з. Новейшие результаты в области цифровой обработки образов: вэйвлет-анализ

Как уже отмечалось выше, генеральным путём дальнейшего развития вычислительной техники является разработка систем искусственного интеллекта, что невозможно без создания эффективных компьютерно-ориентированных систем распознавания образов.

Существуют две принципиальные проблемы, связанные с задачей распознавания образов: во-первых, необходимость обработки значительного объёма информации при попиксельном прочтении образов

и, во-вторых, необходимость высокой чувствительности алгоритмов распознавания к малым изменениям нестационарных образов, способность выявления существенных изменений на фоне помехи. Здесь нет необходимости давать полный обзор развития методов цифровой обработки сигналов с начала 60-х годов уходящего века по настоящее время. Такую информацию можно получить в любом учебнике по цифровой обработке сигналов и образов. Однако чаще всего содержание отечественных учебных курсов ограничивается анализом стационарных сигналов, тогда как основной прогресс за последние 20 лет в данной области связан именно с анализом нестационарных сигналов с далёкой от гармонической формой (нестационарно-импульсные, глобально нерегулярные, апериодические сигналы). В итоге знания наших выпускников в данной области в лучшем случае ограничены знанием алгоритма быстрого преобразования Фурье (БПФ), эффективного только для стационарных квазигармонических сигналов, представляющих достаточно узкий круг встречающихся на практике сигналов. В тоже время представляется необходимым введение понятия об обобщении преобразования Фурье на широкий круг функций, пригодных к использованию в качестве ортогонального базиса преобразования. Кроме того, необходим обзор специфических проблем, возникающих при анализе на коротких интервалах, в частности, проблемы усредняющего окна.

К концу 90-х годов стало ясно, что различные достоинства многочисленных алгоритмов обработки нестационарных сигналов и сложно структурированных образов удачно сочетаются в алгоритмах, основанных на одной из самых изящных математических идей XX столетия - идее вэйвлета (wavelet) впервые предложенной в 1984 г. американскими учёными: математиком А. Гроссманом и геофизиком Дж. Морлетом (Grossman, Morlet, 1984). Буквальный перевод слова "wavelet" на русский язык означает "рябь на воде", что соответствует его сути в ряде простейших применений. Однако русские эквиваленты термина,

встречающиеся в литературе, такие, как "крутая волна", "короткая волна", "элементарная волна", могут соответствовать английскому термину только при условии знания, что крутой волной на воде является, как правило, короткая волна, а это знание по сути гидрологическое, а не математическое, поэтому в дальнейшем будем использовать русскую транскрипцию англоязычного термина - вэйвлет.

Сущность идеи вэйвлет-анализа сигналов наиболее просто можно продемонстрировать на примере тривиального вэйвлета известного как вэйвлет Лэйзи (Lazy wavelet). Пусть у нас имеется сигнал ft) в дискретной форме с единичным интервалом дискретизации. Определим все исходные отсчёты как множество Л0, k = f(k) для keZ, где Z - множество натуральных чисел в пределах мощности выборки. Самым простым способом сжатия исходной информации является сокращение числа дискретных отсчётов путём их простого пропускания. Так, например, мы можем сохранить только чётные отсчёты, получив при этом новое более разреженное сечение реального процесса

Л.-1, k: = A 2k для keZ.

Однако при этом возникает вопрос, какую часть информации о реальном сигнале мы потеряли при увеличении в два раза интервала дискретизации. Для оценки этих различий введём множество коэффициентов k и определим их как вэйвлет-коэффициенты. Тривиальным определением множества вэйвлет-коэффициентов является определение его как множества нечётных отсчётов на исходной выборке Х-1, k : = ^о, 2k+i Для keZ, что соответствует определению вэйвлета Лэйзи. Однако рассчитывать на сигналы, имеющие малые значения определённых таким образом коэффициентов, на практике не приходится. Поэтому ценность использования такого преобразования для сжатия информации весьма сомнительна. В тоже время на практике известен особый класс сигналов, которые можно считать внутренне линейными (Гутман, 1979; Прыгунов, 1989) на временных интервалах, сравнимых с интервалом дискретизации. Сжатие информации при этом может быть достигнуто за счёт кусочной линеаризации процесса на удвоенном интервале дискретизации. Для оценки корректности такого сжатия сигналов можно предложить следующее определение коэффициентов вэйвлета

У-1, k : = ¿0, 2k+1 - 1/2 (Л.-1, k + ^.-1, k+1 X (1)

где второе слагаемое представляет собой результат линейной интерполяции промежуточного нечётного значения, а вэйвлет-коэффициент представляет собой меру расхождения результата интерполяции с истинным значением нечётного отсчёта. Очевидно, что процесс сжатия информации может быть продолжен аналогичным образом в направлении дальнейшего увеличения интервала дискретизации с

получением новых сечений процесса Л -2, k, Л -3, k, ....Л jk и соответствующих вэйвлетов ^-2, k, Уз, k,.....У-j, k,

при этом значение индекса j соответствует уровню вэйвлета. Из выражения (1) становится ясным происхождение термина "вэйвлет", так как коэффициенты (1) в силу их малости подобны "ряби" на фоне интерполяции. Безусловно, линейная интерполяция не является единственно возможной на удвоенном интервале дискретизации, но в любом случае для достижения эффекта сжатия информации интерполяционная функция должна быть аналитической. Вторым условием достижения эффекта сжатия является внутренняя линейность в пределах допустимой погрешности исходного образа на некоторых кратных 2 j интервалах дискретизации. При этом эффект сжатия достигается обнулением значений коэффициентов вэйвлета на соответствующих уровнях. Таким образом, исходный образ может храниться в сжатом виде Л .j, k , из которого всегда может быть восстановлен на требуемом уровне при известных существенных (не обнуленных) вэйвлетах и известном аналитическом виде интерполирующей функции.

Сжатие сигналов и образов на основе вэйвлетов нашло широкое применение в компьютерных технологиях, связанных с их обработкой. Действительно, очевидно, что основные ресурсы компьютеров сегодня съедаются мультимедийным компонентом программ. Тем более проблема увеличения потока подлежащей обработке информации встаёт при разработке систем искусственного интеллекта. Очевидно, что природа на примере биологических систем справляется с этой задачей не столько путём увеличения ресурсов обработки информации, сколько путём её сортировки, выделения существенных её компонент, применения принципов распознавания по комплексу признаков-сигналов. Поэтому вэйвлет-компрессия сигналов и образов, в какой-то мере реализующая эти принципы, является примером принципиально новых подходов к разработке математического обеспечения систем искусственного интеллекта.

Последовательная математическая теория вэйвлетов построена в начале 90-х годов преимущественно в работах американской исследовательницы Ингред Даубечис (Daubechies, 1990). При этом получены следующие результаты. В общем случае вэйвлет может быть представлен как функция ^¿(х), где х принадлежит к топологической области X, W^ принадлежит к функциональному

пространству F и X принадлежит к множеству индексов Л. Например, если X - ось действительных чисел, F - гильбертово пространство L2(R), Л- Z2 двумерное множество индексов X = (j, l), где j, I -целые числа, то вэйвлет может быть представлен в виде = 2j 7 2 У(2j х - l). Отметим, что Лэйзи

вэйвлет также соответствует общему определению вэйвлета, так как осуществляет переход от сигнала (вектор v[k\ ) к прореженному сигналу и вэйвлетам (вектор v[2 - k]). Путём варьирования j и I можно сформировать базис разложения функций { ^х\х&Л }. Особый интерес представляет случай ортогонального базиса для реализации обобщённого преобразования Фурье. Важной особенностью функций, используемых для формирования базиса разложений функций, является их компактное определение (локализация в пространстве), что характеризуется быстрым спадом функций по обратному или экспоненциальному закону от максимального значения в центре области определения. Такая особенность функций ортогонального вэйвлет-базиса приводит к тому, что анализ на базе вайвлет-декомпозиции имеет высокую чувствительность к возмущениям малого амплитудного и пространственного масштаба. Такая особенность вэйвлет-анализа также незаменима при разработке систем искусственного интеллекта, так как часто именно малые изменения сигнала или образа (особенности, нюансы, оттенки и т.д.) имеют определяющее значение для решения проблемы распознавания.

В настоящее время вэйвлет-анализ является интенсивно развивающейся областью прикладной математики (см., например, поддерживаемый Bell Laboratory сервер www.wavelet.org.), при этом, в отличие от нечёткой логики, не оправдавшей надежд Я. Лукасевича на пересмотр оснований математики, вэйвлет-анализ имеет существенное значение для аналитической математики, как принципиально новый метод не только анализа данных, но и получения аналитических решений в виде свёрток. Вэйвлет-базис представляет собой не просто вариант ортогонального базиса, как, например, базис Уолша, целью которого является обеспечение лучшей сходимости разложения определённого класса функций. Вэйвлет-базис обеспечивает возможность выявления характерных особенностей объекта разложения (функции, сигнала, образа) на разных уровнях его иерархии, высокий (степенной) темп градации уровней иерархического устройства объекта при сохранении возможности выявления существенных особенностей на каждом уровне. Впервые разработан математический приём, наилучшим образом соответствующий иерархическому принципу распознавания, сочетанию детерминированного и случайного, так характерного для реальных объектов. Такие принципы распознавания ассоциируются с процессом субъективного распознавания и, в частности, с характерными для него терминами, такими, как "всматриваться", "выделять", "отмечать" и т.д.. Следует отметить также органичное сродство метода вэйвлетов с понятием о фрактальных (иерархически подобных) структурах, интерес к которым чрезвычайно высок в последнее время ввиду широкого их распространения среди природных органических и неорганических объектов. С математической точки зрения фрактальные структуры являются одним из возможных результатов реализации бесконечных последовательностей нелинейных итераций, поэтому вэйвлет-анализ образов можно рассматривать как эффективный метод исследования ячеистых (клеточных) структур с нечёткими границами, что роднит его также с рассмотренной выше концепцией нечётких множеств.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Заключение

Характерной особенностью развития математики в конце XX века является её явно выраженный прикладной характер. При этом определяющую роль в определении направлений этого развития играет прогресс в области вычислительной техники и потребности развития компьютерных технологий. Глубокое теоретическое осмысление новых прикладных математических приёмов отстаёт по времени от их применения на практике. В какой-то мере повторяется ситуация, связанная с разработкой математического анализа в эпоху первой промышленной революции. При этом наибольшие шансы не оказаться на обочине прогресса имеет тот, кто сумеет поставить прагматические соображения выше соображений пресловутой фундаментальности. Новейшие результаты прикладной математики должны рассматриваться как важнейший компонент образования инженеров XXI века, а не просто как заморская диковинка.

Литература

Cooley J.W. and Tukey J.W. An algorithm for the machine computation of complex Fourier series. Math.

Comp., v.19, p.297-301, 1965. Daubechies I. The wavelet transform, time-frequency localisation and signal analysis. IEEE Trans. Inform.

Theory, v.36, p.961-1004, 1990.

Grossmann A. and Morlet J. Decomposition of Hardy functions into square integrable wavelets of constant shape. SIAM J. Math. Anal., v.15, p.723-736, 1984.

Zadeh L.A. Fuzzy sets. Information and Control, v.8, p.338-353, 1965.

Гутман Б.А. Особенности проверки внутренней линейности периодических нестационарных технических параметров и линейности механических систем. Точность и надёжность механических систем. Риж. политехн. институт, с.93-96, 1979.

Прыгунов А.И. Нелинейные эффекты в виброакустической диагностике электрических машин. Точность и надёжность механических систем. Риж. политехн. институт, вып. 15, с.66-72, 1989.

i Надоели баннеры? Вы всегда можете отключить рекламу.