Научная статья на тему 'Аналого-дискретный преобразователь сигналов'

Аналого-дискретный преобразователь сигналов Текст научной статьи по специальности «Математика»

CC BY
2213
151
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Рой Виктор Федорович

Рассмотрена возможность повышения эффективности преобразования излучения с помощью электронных механизмов управления амплитудой электромагнитной волны. Проанализированы различные механизмы управления излучением в проводящих акустооптических кристаллах в условиях возникновения электронно-волновых электродинамических эффектов. Показано, что использование резонансных свойств электронной системы позволяет повысить эффективность преобразования электромагнитного излучения на порядок.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analog-digital signal converter

Coherent-optical methods of data processinq is perspective research ways of informatics. These methods allows to transformations 2 dimensional arrays by the larqe amount of paralel channels (up to 103-106) and another advantage is possibilies to store huqe amounts of data in small physical volume (up to 106/mm2). Application of coherent-optical converters based on acousto-optical cell of crystalline metall as key-elements allows to use different mechanismes of interactions of optical and ultrasounds waves with electronical subsystem of solid and increase functionalit y of acousto-optical devices.

Текст научной работы на тему «Аналого-дискретный преобразователь сигналов»

УДК 535.42

АНАЛОГО-ДИСКРЕТНЫЙ ПРЕОБРАЗОВАТЕЛЬ СИГНАЛОВ

РОЙ В.Ф.

Рассматриваются новые принципы преобразования когерентного излучения в аналого-дискретные сигналы посредством акустооптической ячейки, осуществляющей взаимодействие электромагнитных (световых) волн с акустическими колебаниями решетки и электронной подсистемой проводящего кристалла.

Когерентно-оптические методы преобразования, хранения и обработки сигналов являются одним из наиболее перспективных направлений развития информатики и вычислительной техники. Основное достоинство этих методов — принципиальная возможность преобразования двумерных массивов информации параллельно по большому /103-106/ числу каналов, а также способность хранения информации с плотностью до 106 бит/мм2, недостижимой в настоящее время для электронных методов. Благодаря возможности обработки различных сложных сигналов с субсветовыми скоростями при идеальной развязке между соседними каналами, эффективность оптических вычислительных систем на несколько порядков превышает существующие электронные.

Носителем информации в когерентно-оптических системах, оперирующих в динамическом режиме, является модулированный во времени и пространстве луч лазера, поэтому ключевой элемент таких систем — ячейка, где осуществляется процесс взаимодействия когерентного излучения с управляющим сигналом. Формирование и преобразование с помощью таких ячеек двумерных массивов информации, представленной в цифровой либо аналоговой форме, лежит в основе создания оптических запоминающих и периферийных устройств, когерентнооптических процессоров и других функциональных элементов информационно-вычислительных систем. Наиболее эффективным механизмом управления параметрами электромагнитного (светового) излучения, превосходящим все остальные, является упругооптический эффект, сопровождающий распространение ВЧ упругой волны в твердом теле. Он даёт возможность эффективно воздействовать на основные характеристики электромагнитного излучения: амплитуду, фазу, частоту, поляризацию, направление распространения. В совокупности с использованием реверсивных оптически прозрачных кристаллических материалов и структур это позволяет осуществлять в динамическом режиме эффективное управление параметрами внешнего электромагнитного сигнала, что обеспечивает функционирование в реальном масштабе времени оптоэлектронных систем и позволяет реализовать широкие возможности оптических методов преобразования и обработки сигналов. Дальнейшее развитие и совершенствование этих методов связано с исследованием электронных механизмов взаимодействия электромагнитных и ультразвуковых волн в проводящих кристаллах в условиях проявления электронных динамических эффектов, в частности, образования волн элек-

тронной плотности, возникающих в пьезоэлектрической среде под действием ВЧ упругой волны.

При разработке акустооптических устройств с высокой эффективностью взаимодействия необходимо использовать материалы, которые характеризуются большой добротностью [1]: M2=H6-P2/pv3 (n— показатель преломления, Р — фотоупругая константа, р — плотность среды, v — скорость ультразвуковой волны) и представляют собой материальную константу, определяющую внутреннюю эффективность взаимодействия. С точки зрения физических свойств среды это эквивалентно выбору материала с высокой фотоупругостью, большим показателем преломления и малой скоростью распространения ВЧ упругой волны. Изменение тензора диэлектрической проницаемости среды Дєу связано с величиной тензора деформации Ski соотношением: Дєіі=Рщ Ski (Pyki — константа фотоупругости). В свою очередь, деформация Ski непосредственно определяется интенсивностью W вводимой ультразвуковой волны [2]: W=1/2p г3 SS*LH (S * — величина, комплексно-сопряжённая с S; L, H — параметры акустического пучка). Поскольку тензор Дєу линейно зависит от деформации и интенсивности вводимой звуковой волны, изменяя величину последней, можно менять условия прохождения светового пучка через кристалл. В оптически прозрачных материалах со свободными носителями тока диэлектрическая проницаемость є имеет элетронную составляющую єп, обусловленную проводимостью кристалла. Вследствие этого модуляция её упругой волной приводит к появлению электронного вклада в тензор фотоупругости Рп, который может быть использован в качестве эффективного механизма воздействия на падающий электромагнитный пучок. Перспективным акустооптическим материалом, пригодным для изучения электронного механизма воздействия на электромагнитную волну, является монокристаллический n-JnSb, концентрация носителей в котором (1014см3) такова, что єп имеет заметную величину, а поглощение излучения свободными носителями относительно невелико, и кристалл остается достаточно прозрачным в ИК-области спектра. Благодаря узкой запрещенной зоне и высокой (6Ч05см2/ Вс) подвижности носителей тока, в n-JnSb уже во внешнем электрическом поле Е = 1 В/см можно наблюдать эффект электронного усиления ВЧ упругой волны дрейфом носителей заряда. Используя в качестве источника СО2-лазер, генерирующий излучение с длиной волны Х=10,6 мкм, для электронной составляющей проницаемости єп имеем: єп= 4ne2n/ ю2т* (е, n, т* — заряд, концентрация и эффективная масса электронов, ю = 1,8Ч014 с-1 — частота излучения). Ультразвуковая волна, распространявшаяся через кристалл полупроводника, модулирует концентрацию электронов проводимости, изменяя при этом и частоту плазменного минимума отражения ют , и частоту света ю, которые связаны с локальной концентрацией электронов n: юр2Айт2=1-(1/єГІ), где юр2=4те2/ тє. При этом интенсивность дифракционных порядков прошедшего светового пучка определяется как амплитудой модуляции диэлектрической проницаемости решетки Дє, так и модуляцией проводимости кристалла Дст упругой волной.

Окончание см. на стр. 132

34

РИ, 1998, № 4

ТЕЛЕКОММУНИКАЦИИ

УДК 621.372+521.91

шума на входе приемника; M — число положений фаз при фазовой манипуляции; Z — случайная величина, описывающая влияние помехи. Для помехи, связанной с соседними спутниками, эта случайная величина Z следующая (далее указания на координаты (х,у) опущены):

Z = Zkecr, cos^ j). (2)

ДИНАМИЧЕСКАЯ ВИЗУАЛИЗАЦИЯ ИНФОРМАЦИОННЫХ ХАРАКТЕРИСТИК ЭЛЕКТРОМАГНИТНОЙ ОБСТАНОВКИ В 4-СПУТНИКОВОЙ СИСТЕМЕ СВЯЗИ

КУРМАНОВА.С., МАЗМАНИШВИЛИА.С., СЛИПЧЕНКО Н.И. * 1 2

Строится программное средство расчета и визуализации региональных карт вероятности ошибок передачи бинарных символов. Приводятся примеры расчета упрощенной системы связи из 4 спутников для двух регионов на широте 0° и 30°.

1. Современное состояние сетей связи ориентировано на информационное обеспечение потребителей в регионе и базируется на использовании спутников-ретрансляторов [1-3]. Возрастание нагрузок на прием и передачу приводит к увеличению и усложнению спутниковых систем связи, что, в свою очередь, вызывает трудности при синтезе оптимальной конфигурации системы. В настоящей работе рассмотрен эффективный метод оценки вероятности ошибки в заданном регионе для выбранной конфигурации системы спутниковой связи (ССС). С помощью разработанного числового метода возможно сопоставлять различные варианты ретрансляции и приема в регионе. Рассмотрение ограничено цифровыми системами связи на геостационарной орбите (ГО), образованными из четырёх спутников—ретрансляторов. В результате расчета вероятности ошибки PeM формируется набор региональных вероятностных карт, анализ которых позволяет делать выводы об электромагнитной обстановке в системе связи.

2. Основная формула расчета вероятности ошибки при передаче одного бинарного символа в точке

региона с координатами (х, у) в условиях множественных помех имеет вид:

PeM (У У) =

= E\erfc{p( x,y)sin( п/M ) + р( x,y)Z( х,у)), ('1)

где E[.] — символ безусловного математического ожидания; erfc( х) — дополнительная функция ошибок; р(х, у) = Ps / Pn — величина отношения сигнал/ шум по мощности в точке приема; Ps — мощность сигнала на входе приемника; Pn — полная мощность

При этом каждая из величин фслучайна и

равномерно распределена на интервале (0,2л) , К— число мешающих космических станций (КС), а

набор амплитуд {Rj} вычисляется по следующему выражению:

R, =

І

G (о j G (Р j) p, ]

[Ges,max (0j )G,,max (P j )P0 ]

(3)

Здесь Gesmax = n(nD / X)2 — коэффициент усиления

мощности антенны земной станции (ЗС); Г) — коэффициент использования поверхности антенны ЗС;

D / X — отношение апертуры к длине волны ЗС; о, —топоцентрический угол разноса между “полезным” и j -м “мешающим” спутником на ГО; Ges (о, ) — соответствующий коэффициент усиления мощности антенны ЗС в направлении на j -й источник мешающего сигнала при угловом смещении о, ;

Gss,max = 44,44 - 20 lgY — максимальное усиление антенны КС в основном лепестке, dB; Y — угловой размер сечения луча антенны КС; Gss (Pj) — соответствующий коэффициент усиления мощности j -й

“мешающей” КС в направлении на ЗС под углом Р, от направления максимального излучения (точки прицеливания); P0 — мощность бортового передатчика “полезной” КС; Pj — мощность бортового передатчика j -й “мешающей” КС.

Соотношения (2) и (3) дают возможность полностью математически поставить задачу нахождения

вероятности ошибки PeM (1).

3. Искомая величина PeM (1) является безусловным математическим ожиданием относительно всех возможных реализаций случайной величины Z (2). В работе был использован метод статистических испытаний, который часто применяется при моделировании случайных явлений (см., например, [4,5]). При расчете вероятности ошибки величина

PeM (х, У) находилась путем вычисления оценки PeM относительно реализаций случайной величины PeM заданного выборочного объема N. Объем

РИ, 1998, № 4

35

выборки для любых координат (x, у) и любого значения р подбирался таким образом, чтобы относительная погрешность оценки PeM не превосходила заданной величины а , которая в этой работе составляет 5%.

Здесь рассмотрено случайное событие, заключающееся в том, что относительная погрешность оценки

PeM величины PeM не превышает а, и получена

следующая зависимость объема выборки N от физических параметров задачи:

N « 2р2Qс (sin(^/ M) + Qс')(у / а)2. (4)

ZK

Rj ; q - вероятность указанного события; у = ф1^) ; Ф(q) -функция Лапласа.

На базе статистического алгоритма расчета вероятности ошибки PeM (x, у) и распространения его на

набор пространственных узлов {(X,у)} были разработаны числовой алгоритм и программное обеспечение для расчета и визуализации информационных карт вероятности ошибок при выбранной конфигурации системы связи в заданном регионе (Украина, Россия, Западная Европа и др.).

4. Перейдем к численным результатам. На рис. 1,2 приведены две группы (из трёх информационных

вероятностных карт для PeM (x, у) каждая), отвечающие географическим регионам, которые имеют размеры в градусах (-5.0°;5.0°) по долготе и (-5.0°;5.0°) по широте. На рис. 1 четыре спутника расположены на ГО (3,0°з.д., 1,0°з.д., 3,0°в.д. и 1,0°в.д. соответственно). Первые три из них нацелены в точки (2,5°ю.ш, 3,0°з.д), (2,5°с.ш, 0,0°в.д.) и (2,5°ю.ш., 3,0°в.д.). Угол раскрыва ицдикатрис антенн этих передатчиков составляет 0,7°. Четвёртый спутник отсутствует на первой карте (рис. 1, а), а при расчете второй и третьей карт (рис. 1, б, в) имеет координаты нацеливания (1,5°ю.ш., 0,0°в.д.), при этом угол раскрыва индикатрисы антенны его передатчика увеличивается от 0,3° до 0,5°. Из рис.1 можно сделать вывод, что помеховая обстановка существенно определяется пространственной конфигурацией системы приёма/передачи. Особо отчетливо это проявляется во влиянии периферийных передатчиков на внутренний (четвертый), который, в свою очередь, искажает их информационные зоны.

На рис .2 показана та же система связи с теми же характеристиками, как и выше, но как целое смещенная на 30,0° на север. Хотя на такой широте триангуляционные искажения не столь значительны, как на более высоких широтах, вид информационных

карт PeM (x, у) заметно изменился, что связано с увеличением проекций зон облучения в широтном направлении. Видно, что во-первых, увеличены пограничные слои помехового взаимовлияния, во-вторых, это влияние более выражено у спутников с одинаковой долготой. С ростом широты это влияние

Рис.1. Информационные карты вероятности ошибки PeM (x, у) для 4-спутниковой ССС, широта региона — 0°

ещё более усиливается. На основании приведенных рисунков можно сделать вывод о том, что помеховая обстановка существенно меняется при введении в регион дополнительного спутника-ретранслятора, тем более расположенного между имеющимися.

При моделировании были использованы данные, наиболее характерные для эксплуатируемых в насто -ящее время систем. Приведем основные характеристики рассматриваемой системы:

— тип модуляции — фазовая с M =2;

36

РИ, 1998, № 4

Рис.2. Информационные карты вероятности ошибки PeM (x, у) для 4-спутниковой ССС, широта региона — 30°

— коэффициент использования поверхности антенны ЗС п =0,5;

— отношение апертуры к длине волны ЗС

D / Я = 100;

— полная мощность шума на входе приемника P = 40 dBW;

— угловой размер сечения луча антенн КС Y = 1°;

— мощность бортовых передатчиков КС P = 100 W.

Как видно из рис. 1, 2, имеется возможность надежного информационного обеспечения при передаче со спутников на ГО, что и делается на практике. Важным оказывается то обстоятельство, что между зонами уверенного приема располагаются промежуточные зоны, прием в которых всегда заведомо хуже вследствие взаимовлияния передатчиков. Уменьшить эти зоны информационной недостаточности при одночастотном режиме передачи возможно лишь путем улучшения угловой избирательности приемника, что, однако, сопряжено с техническими затруднениями [2].

Полученные численные характеристики вероятности ошибки позволяют оценить степень помехозащищенности системы при передаче и приеме сигналов потребителями в регионе. На основе таких характеристик можно решать задачу синтеза оптимальной конфигурации системы спутниковой связи.

Литература: 1.Калашников Н.И. Основы расчета электромагнитной совместимости систем связи через ИСЗ. М.: Связь, 1970. 204 с. 2. Кантор Л.Я., Тимофеев В.В. Спутниковая связь и проблема геостационарной орбиты. М.: Радио и связь, 1988. С. 29-37. 3. Jeruchim M.C. A survey of interference problems and applications to geostationary satel-lite networks// Proc. IEEE, 1977, 65, №3. Р.317-331. 4. Мазманишвили A.C., Рафалович О.Я. Численные модели помехоустойчивости для украинских региональных сетей спутниковой связи// Космическая наука и технология. 1998, 4. №1, С.92-101. 5. Бусленко Н.П., Шрейдер Ю.А. Метод статистических испытаний. М.: ФМГ, 1961. 312 с.

Поступила в редколлегию 03.12.1998 Рецензент: д-р техн. наук Поповский В.В.

Курманов Алексей Сергеевич, аспирант кафедры САУ ХГПУ. Научные интересы: теория связи, прикладная математика. Адрес: Украина, 310002, Харьков, ул. Фрунзе, 21, тел. 40-00-56.

Мазманишвили Александр Сергеевич, д-р физ.-мат. наук, профессор кафедры САУ ХГПУ. Научные интересы: теория цифровой связи, статистическая радиофизика, прикладная математика. Адрес: Украина, 310002, Харьков, ул. Фрунзе, 21, тел. 40-00-56, e-mail: [email protected].

Слипченко Николай Иванович, доцент кафедры МЭПУ ХТУРЭ. Научные интересы: разработка теории многофункциональных частотных элементов, спутниковых комплексов и систем. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. 47-01-07.

РИ, 1998, № 4

37

СИСТЕМЫ И

ПРОЦЕССЫ

УПРАВЛЕНИЯ

УДК519.853

ОСНОВНАЯ ЗАДАЧА МОДЕЛИРОВАНИЯ ОПТИМАЛЬНЫХ СОЕДИНЕНИЙ С ОГРАНИЧЕНИЯМИ НА ГЕОМЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПАРАМЕТРЫ ТРАСС

ПЛЕХОВА А.А.

Рассматриваются основные особенности моделирования задач поиска оптимальных связывающих сетей для случая, когда составляющие их трассы должны удовлетворять ограничениям на кривизну и лежать в заданной области сложной геометрической формы. Этот класс задач возникает при проектировании автомобильных дорог, железнодорожных и трамвайных линий; родственные им задачи возникают при проектировании инженерных сетей (теплосети, водопровод).

Развитие соответствующих САПР существенно затруднено из-за отсутствия эффективных методов моделирования и оптимизации соединений подобного типа. Для решения этой проблемы в работе строится модель основных типов ограничений на кривизну и поток и на ее основе формулируется основная оптимизационная задача о поиске оптимальной трассы, к решению которой и сводится общая задача оптимизации соединений с ограничениями на кривизну и поток.

1. Особенности моделирования задач соединения с ограничениями на кривизну

На концептуальном уровне под задачей соединения [1,2] понимают задачу, связанную с поиском в данной области F трасс, описываемых различного рода коммуникациями, которые связывают данный набор точек, если их более двух. Совокупность трасс называют сетью S. При этом на трассы, составляющие искомую сеть, накладываются определенные ограничения 0, характеризующие технологические требования , и требуется, чтобы эта сеть S была наиболее эффективна в смысле некоторого принципа оптимальности R(S), или функционала f(S), определяющего стоимость сооружения и эксплуатации трасс.

Так, в «простейшем» случае рассматривают евклидову задачу Штейнера [3], которая состоит в поиске кратчайшего дерева на плоскости, соединяющего заданное множество точек. Однако даже эта задача является нерешенной [3] в смысле ее NP-полноты: использование известных необходимых условий оптимальности позволяет находить точное решение лишь для числа точек, не превышающего

нескольких десятков. Вместе с тем, в плане моделирования прикладных задач, где области, допустимые для прокладки сетей, неодносвязны, а образующие сеть трассы должны удовлетворять ряду ограничений геометрического характера и минимизировать неаддитивный функционал, получаем, что даже оптимальное решение задачи Штейнера в силу своей неадекватности может оказаться хуже эвристического, но допустимого решения, поскольку составляющие сеть Штейнера отрезки должны быть модифицированы так, чтобы они лежали в данной неодносвязной области Fи представлялись гладкими кривыми. При этом основной, традиционно рассматриваемый критерий эффективности - суммарная длина трасс — уступает место фактору полноты учета ограничений Q, в связи с чем ценность оптимального дерева Штейнера, даже в качестве начального приближения, вообще становится проблематичной. При этом сметная стоимость трассы перестает определяться ее длиной, поскольку проявляются дополнительные затраты, зависящие от используемых радиусов кривых (например, на уширение дорог и сооружение виражей) занимаемой территории (препятствующей прокладке иных трасс).

Поэтому данный класс задач, связанный с моделированием и оптимизацией трасс с различными ограничениями на кривизну, как и родственный ему класс задач поиска оптимальных ломаных с ограничениями на угол поворота и подсоединения, непосредственно не сводится к известным задачам поиска кратчайших трасс [ 1]. Учитывая чрезвычайную актуальность этих классов задач для приложений, а также отсутствие эффективных моделей и методов их решения на ЭВМ, можно сделать вывод о необходимости развития моделей и методов оптимизации, которые были бы ориентированы на решение основных классов задач соединения с ограничениями на геометрические и топологические параметры трасс, возникающих в практике проектирования автомобильных дорог [4], железнодорожных и трамвайных линий [5,6], тепловых [7], газовых, водопроводных, канализационных и других видов инженерных сетей.

Наиболее эффективным подходом к решению этой проблемы можно считать тот [1,2], который основан на синтезе комбинаторных и вариационных методов и ориентирован на оптимизацию сетей на множестве допустимых трасс. Его суть состоит в рассмотрении иерархической системы моделей. Модели нижнего уровня ориентированы на решение базовых задач поиска оптимальной трассы р* на множестве Pq(A,B)MF трасс, соединяющих заданную пару точек А,В и удовлетворяющих специфическим ограничениям Q. Модели более высокого уровня ориентированы на решение задач поиска трасс с подвижным концом и связывающих сетей с помощью общих методов оптимизации. Это позволяет, с одной стороны, использовать и разрабатывать общие методы оптимизации связывающих сетей безотносительно специфики ограничений, определяемых конкретными приложениями, а с другой — учитывать все частные ограничения, разрабатывая модели и методы решения базовых задач.

38

РИ, 1998, № 4

2. Основные типы функционалов и ограничений

Рассмотрим, какие основные типы функционалов f(p) и ограничений Q(p) накладываются в указанных выше приложениях на трассы pMF и границу L=Fr F данной двумерной области F, которые соответствуют нормам проектирования коммуникаций в плане. Эти требования должны увязываться с нормами проектирования продольного профиля, особенно в случае сильно пересеченной местности (например, при проектировании серпантина). Вместе с тем, большинство территорий, на которых находятся промышленные предприятия и населенные пункты, описываемые неодносвязными областями, в первом приближении можно считать равнинными, и тогда в соответствии со Строительными Нормами и Правилами (СНиП) поправки на ландшафтное проектирование не внесут изменений в характеристики трасс в плане, а потребуют лишь доработки проекта в отношении расчета продольно -го профиля трасс.

С топологической точки зрения область F определяется диском с пі0 дырками и описывается свободной группой C(n). Геометрически область F может быть односвязной (выпуклой или невыпуклой) при п=0или неодносвязной при n>0. Граница L области F составлена из конечного числа спрямляемых линий, L={L1, L2, ... ,Lk}, причем их функциональный класс не обязательно совпадает с классом линий, на котором ищется оптимальное соединение. Например, граница L может быть составлена из ломаных, определяющих границы цехов, а искомая трасса — гладкая кривая, характеризующая ось внутризаводской железнодорожной линии.

Для определенности и в соответствии со СНиП под трассой р будем понимать линию, представляющую простую кривую ограниченной вариации поворота. Основные классы линий — гладкие и ломаные, важным частным случаем последних являются ломаные, составленные из отрезков, параллельных осям заданной декартовой системы координат. Первые, для определенности, называют евклидовыми, а вторые - манхеттеновыми [9]. Гладкие кривые составлены из отрезков, дуг окружностей и сопрягаемых кривых (кривые второго порядка и радиоидальные спирали).

Эффективность трассы р определяется функционалом f(p) или принципом оптимальности R(p), который может определять стоимостные, надежностные и иные показатели трассыр. Функционал или показатели в общем случае не аддитивны. Например, стоимость чугунного водопровода, помимо прочего, определяется не только его длиной, но и количеством вершин его ломаной, так как на каждом его повороте следует ставить бетонные упоры; стоимость автомобильной дороги и безопасность движения по ней зависят от числа поворотов и их радиусов, так как каждый поворот оборудуется уширением или виражем и, в силу ограничения обзора и других очевидных причин, понижает безопасность движения.

Вместе с тем, при моделировании допустимых соединений расчет их эффективности (в смысле значения функционалаf или принципа оптималь-

ности R) тривиален, на чем и основано использование вариационных методов поиска оптимального решения на множестве допустимых путей P(A,B) , моделирование которого и составляет суть проблемы. Поэтому для ее решения предлагается [1,2] вводить в рассмотрение базовые задачи соответственно заданной группе ограничений. Таковыми являются, к примеру, задачи поиска кратчайшего профильного соединения [9], кратчайшей квази-манхеттеновой ломаной, представленной отрезками и дугами окружностей заданного радиуса [10], и др.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В данной работе ставится задача расширить эту совокупность базовых моделей в целях покрытия ими основных типов ограничений на кривизну и изломы трасс, а также на согласование потоков, отсутствие средств моделирования для которых служит существенным препятствием на пути развития САПР коммуникаций и инженерных сетей.

2.1. Ограничения на структуру гладких (с непрерывной производной) кривых:

1) кривая составлена из отрезков и дуг окружностей фиксированного радиуса R;

2) кривая составлена из отрезков и дуг кривых второго порядка ограниченной кривизны K, Kmin<K<Km

ax;

3) кривая составлена из отрезков, дуг окружностей ограниченной кривизны К, 1/Rmax <F<l/Rmin и сопрягающих их клотоид.

При этом может иметь место ситуация, когда дуги окружностей в заданном диапазоне радиусов могут принимать лишь заданные дискретные значения.

2.2. Ограничения на ломаные:

4) ломаная с ограниченным числом вершин N;

5) ломаная с ограниченным углом поворота а в каждой вершине (как правило, -p/2<a<p/2 );

6) ломаная с фиксированными значениями допустимых углов поворота в вершинах (a=±a1, ±а2, ..., ±ап ).

2.3. Ограничение на длину и форму трассы.

Пусть на кривой lp лежит некоторая точка Т.

Назовем ее отмеченной точкой типа qk , если в соответствующем месте трассу р, определяемую линией lp , следует снабдить технологическим оборудованием типа qk (к—1,2, ..п). Например, это может быть опора, компенсатор теплового расширения, смотровой колодец и т.п. Далее, пусть имеется правило и, которое задает условие выбора пометок типа qk соответственно длине и форме линии lp . Тогда:

7) Требуется, чтобы линия lp была снабжена отмеченными точками Тц) , T(2), ... ,T(n) и признаками qn , qi2, ... ,qin , при которых удовлетворяется правило и. Например, на теплотрассе это могут быть места установки П-образных компенсаторов на прямолинейных участках длины, большей предельной; однако при меньшей длине компенсатор не требуется, так как его функцию будут выполнять изгибы.

2.4. Ограничения на ориентацию и примыкания потоков возникают, когда для трассы p(t) задана параметризация te[0,1], р(0) =А, р(1) =В, определяющая направление потока от A к В, в качестве которого может выступать жидкая или газообразная среда, либо транспортное средство в условиях, когда

РИ, 1998, № 4

39

требуется обеспечить возможность прямого, без разворота автопоезда или без перемены головы поезда, следования транспортного средства через пункты примыкания.

8) Примыкание с согласованием потоков по направлению:

— для гладких кривых — с учетом сопряжения 1 — 3;

— для ломаных — с учетом 4—6.

Например, в первом случае это может быть

примыкание подъездного пути к железнодорожной линии общей сети. Во втором случае — присоединение к канализационному коллектору в одном уровне, если потоки сходятся под острым углом, в противном случае следует сооружать колодец с перепадом в виде стояка.

9) Примыкание с обеспечением достижимости.

При построении сети, связывающей заданные

точки А1, А2, ... ,Ап , может потребоваться, чтобы между некоторыми (или всеми) из них имелась возможность прямого следования. В этом случае нужно, чтобы в сети возникали циклы и петли, а отдельные точки подсоединялись к сети не одной, а двумя или большим числом трасс.

10) примыкание по допустимым участкам.

Это означает, что подсоединение трассы р1 к сети

(т.е. к другой трассе р2) возможно лишь в отмеченной точке ТОр2 или фрагменте р*Мр2 . Например, соединение двух канализационных линий допустимо только в колодце; поэтому, если проектируемая линия рз кратчайшим образом подходит к имеющейся линии pi между ее отмеченными точками (т.е. колодцами), то необходимо либо соорудить в этом месте колодец, либо увеличить длину линии р1 и вывести ее на существующий колодец. Подсоединение на фрагменте означает, например, что пересечения и примыкания автомобильных дорог и железнодорожных линий, как правило, следует располагать на прямых участках дорог.

3. Общая задача соединения и основная оптимизационная задача

В соответствии с введенными понятиями может быть сформулирована следующая Общая задача соединения. В заданной области F задан набор точек {A}i=1,n и некоторые сети {sj}j=1,m. Требуется соединить эти точки и сети связывающей сетью S* так, чтобы для нее выполнялись заданные ограничения Q типа 1 — 10 и она была наиболее эффективна в смысле заданного принципа оптимальности R.

Учитывая рассмотренную выше возможность и целесообразность декомпозиции этой общей задачи, получаем, что ее решение, в конечном счете, сводится к решению следующей задачи оптимизации в классе эквивалентности путей [t]. Основная оптимизационная задача (ООЗ). Найти arg min R*(р), рєРш(А,В)

где R* — сужение принципа оптимальности R, заданного для сети, на путь с фиксированными концами, а Q * — соответствующее сужение ограничений. Сужение принципа оптимальности R и ограничений Q объясняется тем, что часть из них определена для сетей в дополнение к тем ограничениям Q* и критерию R*, которые заданы для трасс.

Например, в случае подсоединения труб через колодец, т.е. при выполнении граничного условия типа 10, функционал f(S) определяет затраты на прокладку трубопроводов и сооружение колодцев для сети S . Поэтому при подключении трассы р1 к трассе р2 можем получить f(piup)= f(p1)+f(p2), если подсоединение производится через существующий колодец, и f(piup2)> f(pі) +f(p2), если такой колодец придется сооружать дополнительно.

Актуальность основной оптимизационной задачи определяется еще и тем, что в общем случае векторный принцип оптимальности R лишь в общих чертах отражает цель проектирования, найти формальное представление для которой, с учетом всех факторов на практике, в настоящее время не представляется возможным. Именно в этом отношении ООЗ позволяет существенно повысить эффективность систем проектирования типа AutoCAD, так как потенциально обеспечивает автоматическое решение задачи проектирования трассы в интуитивно избираемой проектировщиком «полосе варьирования» [2], математическим аналогом которой как раз и является класс эквивалентности путей [t], т.е. в явном виде задаваемое подмножество Pq*(A,B) множества PtQ*(A,B), на которые последнее разбивается процедурой оптимизации [1,2].

Литература: 1. Смеляков С.В., Стоян Ю.Г. Моделирование пространства путей в задачах построения оптимальных траекторий // Журнал вычисл. матем. и матем. физики. 1983. Т.23, №1.С.73-82. 2. Смеляков С.В., Алисейко А.А. Общая задача поиска оптимальных пространственных соединений и особенности ее моделирования при решении прикладных задач. Харьков, 1990. 108 с. Деп. В Укр. НИИНТИ 28.07.1990. 3. Кристо-фидесН. Теория графов: Алгоритмический подход. М.: Мир. 1978. 432 с. 4. СНиП2-Д.5-72. Автомобильные дороги. М. 1973. 5. СПИЛ 2-Д.2-62. Железные дороги колеи 1524 мм промышленных предприятий. М. 1963. 6. СПИЛ 2-Д.4-62. Трамвайные пути колеи 1524 мм. М.1964. 7. СПИЛ 2-Д.4-86. Тепловые сети. М. 1986. 8. СПИЛ 2-Г. 13-67. Газоснабжение. М. 1967. 9. Смоляков С.В., Стоян Ю.Г. О сведении задачи телесной трассировки к задаче поиска оптимальной манхеттеновой трассы// Автоматизация проектирования технологических процессов. 1984. Вып.1. С.5-9. 10. Смеляков С.В., Алисейко А.А. Модель и метод решения задачи о построении пути минимальной длины при ограничении на кривизну. Харьков. 1993. 19 с. Деп. В ГЛТБ Украины 10.03.1993; №430.

Поступила в редколлегию 17.09.1998 Рецензент: д-р физ.-мат. наук Смеляков С.В.

Плехова Анна Анатольевна, аспирант института Проблем машиностроения АНУ Украины. Адрес: Украина, 310000, Харьков, ул. Калининградская, 9, тел. 10-27-82.

40

РИ, 1998, № 4

УДК 681.51.015

ПЕРЕДУМОВИ ПОБУДОВИ АСУ СИСТЕМИ

ЕЛЕКТРОХІМЗАХИСТУ

МАГІСТРАЛЬНИХ

ТРУБОПРОВОДІВ

СКЛЯРОВ с. о.

Вирішуються проблеми застосування основних принципів синтезу системі управління складними організаційно-технічними об’єктами для побудови АСУ системою протикорозійного захисту магістральних трубопроводів України. Визначаються задачі, що повинні вирішуватися на кожному рівні управління. Доводиться необхідність реструктуризації існуючої системи управління електрохімічним захистом з метою підвищення її загальної ефективності.

Автоматизація управління складними технологічними комплексами в нафтохімічному виробництві, металургії, енергетиці, гнучкому автоматизованому виробництві, а також в організаційно-технологічних системах транспортування нафти та газу обумовлюється безперервним ускладненням об’єктів управління, підвищенням відповідальності функцій, що ними виконуються, підвищенням загальної економічної ефективності систем та розширенням меж умов експлуатації.

Зростання числа функцій управління, що покладаються на автоматичні та автоматизовані управляючі системи, з одного боку, та розширення номенклатури функціонально близьких засобів автоматизації — з другого, зробили більш актуальною проблему вибору кращого варіанту структур організаційно -технологічних комплексів в умовах обмежених затрат на їх реалізацію. Вирішення цієї проблеми в значній мірі залежить від складності визначення сукупності властивостей управляючих систем, які приймаються для аналізу їх якості, а також розробки моделей розрахунку показників ефективності функціонування складних систем.

Аналіз проблеми синтезу систем управління організаційно-технологічними комплексами транспортування нафти та газу [1,5,6] показує, що разробка алгоритмічних структур систем управління, які визначають їх динамічні властивості (часові, точносні тощо), призвела до недооцінки інших властивостей систем, наприклад, надійнісних, що визначають їх працездатність та життєдіяльність на етапі експлуатації, а також ресурсних, що визначають розмір матеріальних, людських і фінансових витрат за весь період життєвого циклу об’єкта управління. Взагалі мова йде про те, що на стадії разробки та проектування повинні в однаковій мірі і узгоджено враховуватися вимоги забезпечення ефективної працездатності технічних засобів комплексу (необхідної швидкодії, точності, стійкості та ін.) та експлуатаційної (на тривалому відрізку часу в межах життеєвого циклу) працездатності при мінімальних або обмежених витратах ресурсів.

Такий розгляд проблеми вимагає необхідності забезпечити раціональний розподіл функціональних

задач між спільними частинами системи управління організаційно-технологічним комплексом на зтапі синтезу її структури. При цьому слід порівнювати вказані задачі по їх значенню, аналізувати взаємний вплив результатів вирішення одних задач на результати інших, визначати необхідну послідовність обробки інформації та способи прийняття рішень по узгодженню управляючих впливів на елементи об’єкта управління. Підсумком такого дослідження має бути формування структури системи управління, яка у більшості випадків повинна бути ієрархічною або багаторівневою з такими характерними ознаками [2]:

— наявність пріоритету задач, котрі вирішуються складовими частинами системи, та, як наслідок, визначення різних рівнів, на яких реалізується весь процес управління;

— розподілення задач, які вирішуються в процесі управління, між рівнями системи;

— наявність певних цілей, які повинні досягатися на кожному рівні управління;

— вертикальна співпідпорядкованість (ієрархія) рівнів, що полягає в можливості втручання верхніх рівнів у вирішення задач на більш низьких рівнях та залежності успішного вирішення задач на верхніх рівнях від результатів вирішення задач на більш низьких рівнях;

— математичний опис функціонування кожного рівня з використанням засобів формалізації , найбільш придатних для даного рівня ієрархії.

У більшості випадків багаторівнева ієрархічна структура характеризується складними та нерівнозначними по силі зв’язками між елементами як одного і того ж ієрархічного рівня (горизонтальні зв’язки), так і різних рівнів (вертикальні зв’язки). Слід вважати, що основним призначенням горизонтальних зв’язків є системоутворення, яке реалізує специфічну для системи єдність і цілісність, що проявляється в нових інтегральних властивостях, які з’являються у системі і не зводяться до суперпозиції властивостей у підсистемах, що її складають. Вертикальні зв’язки передбачають наявність відношень упорядкованості, що забезпечують пріоритет дій та цілей елементів (підсистем) верхнього рівня, та залежності дій цих підсистем від фактичного виконання нижніми рівнями своїх функцій. Така взаємна залежність між вертикально розташованими підсистемами відображує пріоритет усієї ієрархічної системи як єдиного цілого над її частиною та задає межі реалізації горизонтальних зв’язків, створюючи основу внутрішньої єдності системи [3].

Всі ці ознаки багаторівневих систем у більшості визначають особливості їх проектування, які виявляються у вирішенні таких взаємозв’язаних проблем [4]:

— декомпозиції загальної задачі управління на підзадачі нижніх рівнів з тією умовою, щоб рішення локальних підзадач були координованими по відношенню до задач вищих рівнів;

— синтезу елементу (задачі), який забезпечує досягнення глобальної мети шляхом узгодження локальних рішень через втручання в роботу елементів нижніх рівнів;

— розробки методів та алгоритмів координації, які забезпечують ефективне формування координуючих сигналів, здатних скоординувати декомпозова-ну систему та забезпечити її цілісність;

РИ, 1998, № 4

41

— забезпечення модифікованості задач нижніх рівнів з метою одержання такої їх форми, яка б гарантувала координованість відносно сформульованої задачі координації.

Ієрархічна організація систем управління бага-тозв’язковими організаційно-технічними комплексами забезпечує підвищення ефективності управління з багатьох технічних, економічних та експлуатаційних причин.

1. Ієрархічна структура дозволяє в деякій мірі вирішити проблему зв’язковості, приймаючи за координуючі сигнали змінні взаємозв’язку підсистем.

2. На першому рівні можливе застосування прямого цифрового управління класичного типу окремими агрегатами, а на вищих рівнях доцільно застосовувати більш складні процедури оптимізації.

3. Всі рівні управління функціонують у реальному масштабі часу, але з точки зору тривалості періоду прийняття рішень між ними існує значна різниця, що обумовлює застосування різних за швид-кодізю і точносними характеристиками алгоритмів вирішення оптимізаційних задач.

4. Реальними фізичними змінними управляє лише перший рівень.

Решта рівнів і підрівнів здійснюють підстройку узагальнених параметрів та вибір робочих точок локальних регулюючих пристроїв на основі інформації про стан окремих агрегатів, можливості досягнення ними заданих характеристик та стану загаль -них зв’язуючих матеріальних і енергетичних потоків. Таким чином, верхні рівні забезпечують перебудову і адаптацію усієї системи управління з метою досягнення найбільшої ефективності та живучості об’єкта управління.

В рамках запропонованого підходу до розробки організаційно-технологічної структури системи управління складними об’єктами розглядається комплекс протикорозійного захисту магістральних трубопроводів як об’єкт управління, який можна зобразити у вигляді ієрархічної структури, що складається з трьох рівнів. На нижньому рівні розташовані технічні засоби електрохімічного захисту з локальними регулюючими пристроями. На другому рівні вирішуються задачі лінійних експлуатаційних служб (ЛЕС). Верхнім рівнем є управління магістральних трубопроводів (УМТ).

Функції управління, що реалізуються персоналом ЛЕС стосовно електрохімічного захисту, можна згрупувати таким чином:

— управління процесом захисту трубопроводів від корозії;

— управління обслуговуванням та ремонтом засобів захисту від корозії, а також ліній електропостачання (ЛЕП), що живлять установки катодного захисту (УКЗ);

— передача інформації на верхній рівень.

До функцій УМТ належить збір та обробка інформації про загальний стан усіх підлеглих магістральних трубопроводів (МТ) та складення на основі цих даних довгострокових планів стосовно їх експлуатації надалі, а також передача узагальненої інформації на верхній рівень.

Вся інформація між рівнями передається у вигляді великої кількості оперативних планових та звітних документів, схем, інструкцій, проектно-виконавчої та технічної документації і обробляється

вручну. Очевидно, що на рівні УМТ прийняття оптимального рішення по управлінню в подібних умовах є досить складна задача, вирішення якої потребує побудови системи управління на основі комп’ютеризованої експертної системи з елементами штучного інтелекту. Ця система повинна збирати дані з підлеглих дільниць трубопроводів, обробляти їх, видавати рішення у формі порад, а також мати можливість відобразити додаткову інформацію у потрібній формі для прийняття остаточного рішення. Право остаточного рішення повинно надаватися головному інженеру УМТ.

На рівні ЛЕС проводиться збір інформації стосовно технічного стану засобів електрохімічного захисту (ЕХЗ) та джерел їх живлення, режимів УКЗ, а також розподілу захисного потенціалу вздовж трубопроводу, стану ізоляції. У зв’язку з відсутністю засобів дистанційного контролю та телемеханіки збір даних з нижнього рівня проводиться вручну інженером по ЕХЗ, що тягне за собою, по-перше, недостатню об’єктивність та своєчасність інформації, а подруге— витрати, зв’язані з доставкою вимірювального комплексу до точок контролю на трубопроводі. За результатами зібраних даних складаються звіти, які надсилаються на верхній рівень, а також приймаються рішення по зміні режимів роботи УКЗ та ремонту засобів ЕХЗ, якщо це потрібно. Інформація збирається два рази на рік під час сезонних вимірювань. Очевидно, що такої періодичності явно не достатньо для безвідказної роботи систем катодного захисту на протязі року. Для більш ефективної та надійної роботи засобів ЕХЗ вздовж трубопроводу повинні бути встановлені засоби телемеханіки, які б не тільки забезпечували накопичування та передачу інформації в ЛЕС, але й дозволяли управляти режимами УКЗ дистанційно з пункту управління ЕХЗ, що має бути розташований на ЛЕС. Для обробки зібраних даних та прийняття оптимальних рішень по встановленню режимів УКЗ на равні ЛЕС повинна бути впроваджена експертна система, яка б використовувала не тільки оперативну інформацію, а й статистичні дані, що були накопичені за весь період існування трубопроводу. За допомогою спеціалізованих математичних моделей система повинна виробляти оптимальні з точки зору мінімізації витрат та надійності протикорозійного захисту управляючі сигнали. В системі передбачається функцію контролю і остаточного прийняття рішення надати диспетчеру системи управління, який має пріоритет дії і може змінювати параметри моделей управління.

На нижньому рівні, який являє собою конт-рольновимірювальні пункти (КВП) та УКЗ з джерелами їх живлення, повинні бути розташовані датчики для отримання інформації про режими системи катодного захисту, пристрої передачі та прийому для обміну даними з ЛЕС, виконуючі механізми для реалізації управляючих команд, що поступатимуть з пункту управління ЛЕС.

Для забезпечення ефективного обміну інформацією між рівнями УМТ і ЛЕС необхідно використати комп’ютерну мережу корпоративного типу, а для обміну даними між Л ЕС та нижнім рівнем — засоби телемеханіки та дистанційного контролю. Для збереження та накопичення паспортних і статистичних даних, отриманих у процесі експлуатації об’єктів трубопроводного транспорту, передбачено розробити

42

РИ, 1998, № 4

єдину розподілену базу даних, яка б охоплювала всі рівні управління та забезпечувала інформацією функціональні задачі, що вирішуються на цих рівнях.

На сьогодні в рамках запропонованого підходу розроблено комплекс задач локального рівня, які реалізують функції контролю працездатності У КЗ, ідентифікації та оптимізації режимів електро-хімзахисту трубопроводів, розрахунку показників ефективності функціонування засобів ЕХЗ і захищеності споруд від корозії, створення та ведення локальних баз даних. Розроблені задачі впроваджені у виробництво і проходять дослідну експлуатацію на ряді ЛЕС України і за її межами.

Література: 1. Палашов В.В. Расчет полной катодной защиты. Л.: Недра, 1988. 136 с. 2. МесаровичМ., МакоД, Такахара И. Теория иерархических многоуровневых

систем. М.: Мир, 1973. 344 с. 3. Чернышев М.К., Гаджиев М.Ю. Математическое моделирование иерархических систем с приложением к биологии и экономике. М.: Наука, 1983. 192 с. 4. Месарович М, Такахара Я. Общая теория систем: математические основы. М.: Мир, 1978. 311 с. 5. Бородавкин П.П., Березин В.Л. Сооружение магистральных трубопроводов. М.: Недра, 1977. 407с. 6. Зиневич А. М., Глазков В. И., Котик В. Г. Защита трубопроводов и резервуаров от коррозии. М.: Недра, 1975. 288 с.

Надійшла до редколегії 10.11.1998 Рецензент: д-р техн. наук, проф. Левикін В. М.

Скляров Станіслав Олександрович, аспірант кафедри ПО ЕОМ ХТУРЕ. Наукові інтереси: математичне моделювання, теорія прийняття рішень. Адреса: Україна, 310726, Харків, вул. Конєва, 16, кімната 702, тел. 20-57-89, 37-49-48.

УДК 681.327

РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ ПО ПАРАМЕТРАМ ПРЕОБРАЗОВАНИЙ

ГОРОХОВАТСКИЙ В.А.

Предлагается и обосновывается алгоритм распознавания изображений по параметрам преобразований. Экспериментально обосновывается помехозащищенность предложенного алгоритма. Приводится сравнительный анализ с классическим подходом.

Теория нормализации изображений [1] обосновывает процессы распознавания для объектов, подвергающихся геометрическим преобразованиям в поле зрения. В настоящее время создаются программные приложения этой теории с учетом возможностей современных компьютеров по обработке реальных полутоновых и цветных изображений [2]. Рассмотрим метод и соответствующий алгоритм распознавания, в основе которых лежит теория построения нормализаторов. В этом подходе, как и в классическом [1], вначале определяются параметры геометрических преобразований. Затем по полученным параметрам осуществляется распознавание класса эквивалентности изображения. Предлагаемый подход к распознаванию обладает большим быстродействием, так как в нем отсутствует сравнение двумерных полей, характерное для распознавания путем предварительной нормализации.

Из основной теоремы теории нормализации [1] следует, что для одного и того же класса эквивалентности изображений Wk существует большое разнообразие конкретных представлений нормализаторов. Общий вид оператора нормализации

F(B) = ВФ(В), Ф: W ^ G (1)

(здесь В — изображение; В є W — множество изображений; G — группа преобразований) показывает, что это разнообразие обеспечивается различием

отображений Ф.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Утверждение 1. Пусть G — группа преобразований с элементами g є G ; Wk — фиксированный

класс эквивалентности Wk є W; Ф1, Ф2,..., Ф8 —

произвольные отображения Ф^W ^ G, і = 1,s, удовлетворяющие условию нормализации

giФi(B) = Фі(В0), В,В0 є Wk, (2)

g1,g2,...,gs — параметры преобразования изображе-

ния В, определяемые отображениями Ф1, Ф2,..., Ф s. Если В є Wk , то имеет место равенство

g1 = g2 =...= gs. (3)

Доказательство. Если В є Wk , то

В = Bog, g є G . Тогда из (2) для і -го элемента в равенстве (3) имеем

gi =Ф і(В0)[Ф і (В)]-1 =Ф і(В0)[ф і^)]-1 =

= Ф і(В0^-1"Ф і(В0)

-1

Применяем правило получения обратного элемента в группе, после чего

gi = Фі(В0)[Фі(В0)] 1g = g .

Доказанное не зависит от і, значит, условие (3) выполняется.

Другими словами, из утверждения 1 следует, что при использовании различных операторов нормализации для одного и того же изображения из класса

эквивалентности Wk мы получаем один и тот же параметр преобразования g.

Утверждение 2. Пусть W1, W2 — классы эквивалентности

W1 = ^0g,g є G}, W2= ^0g,g є g},

В — изображение, принадлежащее одному из классов W1, W2; Ф1, Ф2 — отображения, удовлетворяющие условию нормализации (2) относительно обоих классов W1,W2, а g1,g2 — параметры преобразования изображения В, определяемые отображениями

Фъ Ф2 .

Для того чтобы равенство g1 = g2 выполнялось

только для одного из классов ( W1 или W2 ), необходимо условие

РИ, 1998, № 4

43

Ф1(Б0)Ф1(Б0)

-1

* Ф2(Б0)Ф2(Б0)

-1

(4)

Доказательство. Предположим вначале, что Б є W1, т.е. Б = B0g. Из утверждения 1 следует, что g1 = g2 . Покажем теперь, что относительно класса W2 условие g1 = g2 не выполняется. Вычислим

g1 =Ф1(Б2)[Ф1(Б)]-1 = Ф1(Б0)[ф1(Б0^]-1 =

= Ф1(б2)[Ф1(б0)] V

Аналогично для g2 получаем

g2 = Ф2(Б0) Ф2(Б0) g.

Из соотношений для g1 и g2 при условии (4) имеем, что g1 * g2 . Аналогично доказывается и

предположение, что Б Є W2 .

Утверждение 2 допускает обобщение на случай, когда число эталонов равно q , а число отображений равно s . Условие (4) имеет вид совокупности

Ф1(Б0)Ф1(Б2) *Ф2(Б0)Ф2(Б2)

-1

Ф1(Б0) Ф1(Б0)

1 * Ф2(Б0)[ф2(Б0)

(5)

Фs-l(Б0■1)[Ф^ЗДГ * Ф8(Б0-1)[Фs(Бq)

которая включает С? • C2 условий, так как пары эталонов и отображений выбираются независимо друг от друга, cq,C2 — число комбинаций. Кажется, что

проверка условий (5) для больших значений q,s может вызвать трудности из-за больших значений

величины С? • С:?. Однако процедура проверки вы-

полняется однократно во времени настройки на определенный набор эталонов, поэтому на длительности времени распознавания не сказывается. Для того чтобы условие (3) выполнялось только для класса эквивалентности распознаваемого изображения, тре-

буется, чтобы для каждой пары эталонов Bj,Bj

выполнялось хотя бы одно из условий совокупности (5). С увеличением количества выполняемых условий для конкретной пары эталонов увеличивается расстояние между классами эквивалентности Wj, Wj, а следовательно, растет надежность различения этих классов при воздействии помех. Это же можно отметить и относительно роста величины s , при котором увеличивается число используемых признаков (отображений), а следовательно, повышается достоверность распознавания классов [ 1].

Таким образом, выбор Фj и количества членов в условии (3) определяется разнообразием различаемых классов и уровнем помех.

Схему процесса распознавания, построенного на базе доказанных утверждений, можно представить в виде алгоритма.

1. Для множества из q эталонов выбираем s отображений, удовлетворяющих условию (5).

2. Вычисляем эталонные значения отображений

Ф1(Б0), ФДБ?),...^^),...^^),..., Фs(Bq).

3. Полагаем j = 1 и выбираем эталон Bj из множества эталонов.

4. Для распознаваемого изображения Б проверяем выполнение равенства (3) в виде

Ф1(Б0)[Ф1(Б)]-1 = Ф 2(Б0)[ф aw]1 =

=...= Ф s (Б0 )[ф s(B)]-1. (6)

5. Если (6) выполняется, принимаем решение о соответствии Б i -му классу. Если (6) не выполняется, то i = i + 1 и при i < q переход к п. 4. Если

i > q — конец алгоритма.

В отличие от классического алгоритма на базе нормализации [1], связанного с определением соответствия всех точек нормализованного изображения и эталонов, данный алгоритм более прост в реализации, так как предполагает сравнение специальным образом функционалов от изображения со значениями эталонных функционалов. При наличии помех условие (6) проверяется статистическим путем.

Конкретизируем алгоритм для преобразований

смещения, когда B(x,y) = B0(x + lx,y + ly), где lx, ly — параметры смещений. В качестве отображений Ф i выберем функциональные центры тяжести

[1], обозначив их ФДБ), Фу (Б). Величины смещений находим по формулам

lx = Фx(B)- Фx(Bo), ly = Фу (Б) - Фy(Bo).

Условие (5) состоит в том, чтобы для каждой пары эталонов B0, Bjj выполнялось хотя бы одно из соотношений

Фkx(B0) - Фkx(B0) = Фlx(B0) - Фlx^jX k * l, т.е. чтобы для двух различных эталонов не были равны их функциональные центры тяжести. Приме -ром меры для проверки условия (6) может быть

R(B,B0) = 2 {|Qix - Qjxl + |Qiy - Qjy} i,j ’

^Qix = Фix(B)- Фix(Bo),Qiy = Фiy(B)- Фiy(B0).

Величина R удовлетворяет определению метрики в пространстве векторов, а при наличии естественных погрешностей в определении Ф i учитывает степень отклонения от условия (6).

Оценим быстродействие алгоритма в сравнительном аспекте с классическим алгоритмом путем подсчета количества операций для обоих подходов на примере преобразований однопараметрического сме-

44

РИ, 1998, № 4

щения изображения m х m дискретных элементов. Пусть вычисления и геометрические преобразования осуществляются на некотором абстрактном вычислителе с временем сложения tc и умножения ty . Считаем, что эталонные значения отображений вычислены до начала распознавания. Соотношение времени распознавания алгоритмов выглядит как

m2(ty +3tc +3q(ty +tc))

Y =---------------і------,

sm2(ty +2tc)+^s2qtc

или после упрощений с учетом ty = 3tc

г =

6 + 12q

5s + — s2 2

q

m

2

(7)

Из (7) следует почти линейный характер зависимости у от числа эталонов q , так как вторым слагаем в знаменателе для практических значений m и q можно пренебречь (m значительно больше q). Делаем вывод, что с увеличением числа эталонов выигрыш во времени распознавания для предлагаемого алгоритма возрастает. Так, для случая

s = 10, q = 10, m = 16 имеем у = 2,5 , а при

s = 10, q = 20, m = 16 у = 4,5 . Кроме того, значение Y уменьшается с ростом числа отображений (признаков) s .

Было проведено сравнительное компьютерное моделирование двух алгоритмов для изображений

16х16 элементов с числом градаций, равным 8, количеством эталонов q = 10, отображений s = 8 для преобразований смещения при действии аддитивного шума. Эксперимент показал, что разработанный алгоритм распознавания для выбранного класса эталонов и соответствующего набора отображений обладает помехозащищенностью не худшей, чем традиционный алгоритм, и позволяет осуществлять уверенное распознавание с вероятностью, большей 0,99 при уровне сигнал-шум, равном 5. Алгоритм распознавания с нормализацией обеспечивает эту вероятность при уровне сигнал-шум, равном 6. Достаточно высокая помехозащищенность объясняется многократным характером измерений и отсутствием нормализующих воздействий.

Выигрыш в быстродействии в эксперименте составил y = 2, что подтверждает эффективность подхода и целесообразность его применения при решении задач инвариантного распознавания изображений.

Литература: 1. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320 с. 2. Гороховатский В.А., ТрипутеньВ.В. Алгоритм параллельной нормализации аффинных преобразований для цветных изображений // Радиоэлектроника и информатика. 1997. Вып. 1. С. 97-98.

Поступила в редколлегию 22.11.1998 Рецензент: д-р техн. наук Путятин Е.П.

Гороховатский Владимир Алексеевич, канд. техн. наук, доцент кафедры применения ЭВМ ХТУРЭ. Научные интересы: обработка изображений в компьютерных системах. Адрес: Украина, 310141, Харьков, пр. Ленина, 14, тел. 40-94-19.

УДК 681.142.1.01

ПРОГНОЗИРОВАНИЕ ВОЗМОЖНЫХ СОБЫТИЙ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

ХОДАКОВ В.Е., ШЕРСТЮК В.Г.,

СТЕПАНСКИЙ К.Г., ДИДЫКА.А., КОЗУБ НА, ГРИГОРОВА А.А., РАДВАНСКАЯ Л.Н.__

Обосновывается существенная роль методов и действий, направленных на предсказание возможных ситуаций в процессе принятия решений. Анализируются текущая и целевая ситуации, определяются пути достижения последней.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Введение

В настоящее время использование технологий информационных хранилищ (Data Warehousing), переработки данных (Data Mining) и извлечения знаний (Knowledge Discovery) становится все более популярным при решении задач обработки больших массивов информации. Практически все вновь разрабатываемые системы сбора и анализа информации используют, частично или полностью, эти технологии.

В крупных организациях (как государственных, так и коммерческих) генерируется огромное количество информации в виде документов, отчетов и т.п.

Все документы фиксируются и сохраняются. Однако организации, несмотря на огромное количество информации, в большинстве случаев не могли извлечь из нее максимальную выгоду, потому что вся эта информация была разрозненна и не структурирована. Для того чтобы адекватно и своевременно проанализировать ее, необходимы большие затраты времени и средств. Но эти затраты, ввиду неразвитости механизмов извлечения информации из информационных хранилищ, не окупали себя.

Системы, построенные на основе технологии извлечения знаний, выдают пользователю уже не порции необработанной информации, которые еще нужно осмыслить, а решение или несколько альтернативных решений, которые пользователь может принять или отвергнуть. Применение таких технологий кардинально повышает производительность труда служащих, так как им уже не надо просматривать самостоятельно огромные объемы информации. В их обязанности входит анализ полученных от системы решений и принятие или непринятие их.

Можно выделить четыре основных типа операций, связанных с процессом извлечения знаний из данных.

1) Предсказание возможных ситуаций путем построения модели предметной области. Это наиболее часто используемая операция. Ее цель состоит в том, чтобы на основании упорядоченной во времени информации, находящейся в хранилище, построить некую модель, на основании которой можно предсказывать будущие ситуации. Такое прогнозирование по образцу традиционно строилось с использо-

РИ, 1998, № 4

45

ванием статистических методов. Наиболее ценным является то, что оно позволяет генерировать постижимые и объяснимые модели. В большинстве своем такие модели строятся путем формулирования множества правил “если, то ”.

2) Анализ связей. В то время, как цель предыдущей операции — построить обобщенное описание содержания информационного хранилища, цель анализа связей состоит в установлении связей между его структурными элементами. Анализ связей — относительно новая операция, ее применение стало возможным в связи с развитием технологий извлечения знаний из данных.

3) Сегментация информационного хранилища. В связи с ростом объемов информации, которую необходимо обрабатывать, часто требуется разбить информационный массив на несколько разделов (кластеров), что позволит ускорить доступ, построить модель и провести анализ связей не над всей базой, а только над ее отдельными сегментами.

4) Обнаружение отклонений. Цель этой операции состоит в обнаружении противоречий и несоответствий в информационных массивах и определении причин возникновения отклонений—из-за наличия шума, ошибок или иных причин. Эта операция обычно применяется совместно с сегментацией информационных хранилищ.

Наиболее существенную роль в процессе функционирования систем поддержки принятия решений (СППР) играют методы и операции, позволяющие прогнозировать возможные ситуации путем анализа уже имеющейся информации. Именно построение правильного прогноза позволяет принять наиболее верное и адекватное решение. Исходя из этого, остановимся на вопросе создания прогнозирующей подсистемы более подробно.

2. Система поддержки принятия решений

Так как извлечение знаний очень тесно взаимосвязано с другими элементами СППР, то имеет смысл сначала рассмотреть структуру всей системы, которая состоит из трех основных элементов:

1) информационное хранилище (ИХ);

2) система извлечения информации (СИД);

3) система принятия решения (СПР).

Кроме основных элементов, должны присутствовать подсистемы сбора информации, выборки информации из ИХ и представления результатов конечному пользователю. Рассмотрим функциональные обязанности и процессы взаимодействия этих составляющих СППР на примере работы торгового предприятия, имеющего сеть розничных торговых точек.

Важной задачей, от решения которой зависит успешное или неуспешное построение всей системы, является правильный выбор предметной области (ПО). Для сети розничных магазинов пределы ПО могут простираться далеко за рамки магазинов и торговли вообще. Это могут быть информация о районе, где находятся торговые точки, статистические данные о районе, о городе, а может быть и более обобщенная информация. Подобные предметные области следует разбивать на две подобласти.

— Контролируемая ПО — те объекты и процессы, на которые может влиять и которые может изменять пользователь. Это, например, графики поставок

товара, функционирования магазинов, номенклатура товаров, ценовая политика и т.п.

— Неконтролируемая ПО — все остальные объекты и процессы, которые для системы являются условно-постоянными. Это могут быть внешние для системы розничных магазинов объекты, например, демографическая ситуация, экономические и социальные процессы, протекающие в регионе, и многое другое.

Информационное хранилище содержит в себе большой объем информации о работе фирмы. Через подсистему сбора информации в ИХ с определенной периодичностью (например, один раз в день) поступает информация о продажах в магазинах, о поставках товара, об изменении номенклатуры, о характеристиках товаров, о покупателях и т.п. Такая информация активно используется в процессе принятия решений в торговом предприятии и накапливается в его информационных массивах (это накладные о перемещении товара, акты переоценок и списания, инвентаризационные отчеты и т.п.), однако чаще всего, однажды полученная, она редко используется в дальнейшем и не окупает своего хранения..

Можно выделить два основных источника, из которых информационное хранилище может получать информацию. Первый — это внутренний источник, о котором мы писали выше. Это информация о работе магазинов, поступающая в ИХ с определен -ной периодичностью. Информация из этого источника наиболее проста в обработке, так как ее формат заранее определен и нет необходимости проводить сложные проверки достоверности.

Второй источник — внешний. Это информация о состоянии дел на рынке, о спросе и предложении. Важный аспект — исследование и внесение данных в ИХ о состоянии дел у конкурирующих фирм. На первый взгляд, вспомогательными являются данные о демографической, экономической, экологической и социальной ситуации в регионе. Однако такая информация позволяет вскрыть глубинные корни той или иной закономерности и дает возможность более точно и адекватно управлять ситуацией. Следует заметить, что сбор и обработка такой информации довольно сложны и дорогостоящи. Информация, поступающая извне, обычно не систематизирована. Ее сложно привести в приемлемый для обработки вид. Кроме того, велика вероятность того, что полученная извне информация является недостоверной, а проверка достоверности требует поиска дополнительной релевантной информации, и только проверка на взаимную непротиворечивость может дать более или менее правильный результат.

Рассмотрение только внешней или только внутренней информации не даст положительного результата при построении модели ПО. Лишь изучение их вместе и детальный анализ взаимосвязей между ними позволяют понять процессы, протекающие в ПО.

Фирмам, занимающимся розничной торговлей, для решения их специфических задач наиболее подходит представление модели ПО в виде набора правил. Каждое правило представляет одну закономерность, которую СИД выявила в ИХ. Наиболее часто используется правило вида “если, то ”, т.е. в первой части находится некоторый набор посылок, а во второй — следствие или следствия, которые возникают в результате актуализации этих посылок.

46

РИ, 1998, № 4

Можно сказать, что такая модель представляет собой некоторую область влияния, где определено, какие последствия могут возникнуть при каких изменениях текущей ситуации. Можно привести несколько примеров таких правил.

Закономерности, отмеченные в отдельных магазинах:

МАГАЗИН №1

“С вероятностью 30% можно утверждать, что если клиент купил чипсы, то он купит еще и “Пепси-колу”;

“С вероятностью 70% можно утверждать, что если в пятницу после 17 часов в магазин зайдет женщина, то она купит на менее 1 кг мяса”;

Магазин № 2

Закономерности, свойственные всей сети магазинов:

“С вероятностью 80% можно утверждать, что если магазин посетит покупатель с месячным доходом более 1000 гривен, то он сделает покупку на сумму не менее 20 гривен”;

“С вероятность 90% можно утверждать, что если цена “Пепси-колы” в наших магазинах выше цены в магазине конкурентов более чем на 5%, то ежедневные запасы “Пепси-колы” на складе увеличатся более чем на 10%”;

Закономерности, свойственные для всего региона:

“С вероятностью 98% можно утверждать, что уровень продаж к Новому году увеличится более чем на 40%”;

“С вероятность 55% можно утверждать, что при повышении дневной температуры в летний период до 25 градусов уровень продаж мороженого увеличится на 30%”;

Понятно, что закономерности не являются абсолютными. Этим правилам можно верить, а можно и не верить; кроме того, можно верить в одни правила больше (или меньше), чем в другие. Поэтому каждое правило должно иметь соответствующую оценку, которая отражает доверие к нему системы. Областью определения этой оценки является промежуток от 0 до 1 (или как в приведенных выше примерах, может измеряться в процентах). При этом если доверие равно 0, то правило не имеет места в данной предметной области, а если равно 1, то во всех случаях возникновения посылок, указанных в правиле, обязательно актуализируются все следствия этого правила.

Модель не является стабильной структурой. В процессе функционирования системы она постоянно изменяется и пополняется все новыми и новыми правилами, причем изменения направлены на улучшение этой модели (во всяком случае с точки зрения системы). Бесконечность функционирования СИД обеспечивается двумя причинами. Первая — это постоянное обновление и добавление информации в ИХ, которая может содержать уточнение старых или новые правила. Вторая — это невозможность, ввиду ограниченности вычислительных возможностей системы, охватить весь объем информации, релевантный исследуемой закономерности. Ввиду второй причины система может проводить оценку достовер-

ности правила по уже имеющейся информации, с последующим уточнением этой оценки.

Точно так же, как мы предположили, что в ИХ уже находятся данные, предположим, что СИД на основании этих данных уже имеет некоторую модель предметной области; в нашем случае это модель функционирования сети розничных магазинов.

Наличие некоторой сформированной модели ПО принципиально важно для третьего элемента СППР— системы принятия решений (СПР). СПР тесно взаимодействует как с СИД, так и с ИХ, хотя более критичным для ее функционирования является наличие модели. К ИХ система принятия решения обращается для получения исходных данных о текущем состоянии, проверки результатов принятого решения и других, не связанных с моделью предметной области, данных. Целью функционирования СПР является определение способов решения задач, поставленных пользователем. Такими задачами могут быть, например, “Как получить максимальную прибыль в этом месяце? ” или “ Как добиться наилучшего коэффициента оборачиваемости товара?” и т.п. СПР, получив такое задание, должна на основании модели ПО и данных о текущей ситуации, взятых из ИХ, выдать пользователю одно или несколько альтернативных решений, которые могут позволить достигнуть намеченных целей с большей или меньшей степенью вероятности.

3. Роль прогнозирования в процессе принятия решений

Важнейшую роль при формировании альтернатив играет процесс прогнозирования будущих ситуаций. Можно сказать, что для СПР прогнозирование — основная задача функционирования. Прогнозирование — это предсказание ситуаций, которые могут возникнуть в будущем, на основании информации, полученной в предыдущие моменты времени.

Можно выделить два основных типа прогнозов.

— Свободные прогнозы — это те, которые не имеют перед собой цели достижения какой-либо определенной ситуации, а функционируют на основании предположения, что все процессы, протекающие в ПО, останутся неизменными в течение исследуемого промежутка времени. Например, может быть составлен такой прогноз: “К концу года ежемесячная прибыль повысится на 3% ” или “Через 2 недели, при том же графике поставок товара, его ежедневный запас возрастет на 20%” .

— Целенаправленные прогнозы, их целью является определение необходимых изменений, которые нужно произвести в ПО для того, чтобы достигнуть некоторой, заранее определенной ситуации. Такие прогнозы — это цель для систем принятия решений. Они прогнозируют не то, какая ситуация возникнет через определенный промежуток времени, а то, какова вероятность достижения целевой ситуации путем принятия того или иного решения (или нескольких решений). Например, “Для повышения прибыли на 7% вам следует снизить цену на 3% и уменьшить ежедневный запас товаров на складе на 10%” или “Для увеличения коэффициента оборачиваемости вам необходимо отказаться от закупок некоторого товара”.

РИ, 1998, № 4

47

4. Процесс построения прогнозов

Процесс построение прогноза можно разбить на несколько этапов:

1. Определение целевой ситуации.

2. Анализ текущей ситуации и выявление различий между текущей и целевой ситуациями.

3. Свободное прогнозирование, с акцентом на изменяемых характеристиках.

4. Определение путей достижения целевой ситуации.

5. Оценивание полученных альтернатив и выбор наилучшей.

Для реализации перечисленных выше этапов СПР должна иметь в своем распоряжении еще одну (описательную) модель ПО, содержащую ее структуру:

— описание текущей ситуации;

— описание всех возможностей изменения этой ситуации.

5. Описание текущей ситуации

Ситуация есть некоторое зафиксированное состояние предметной области. Под ситуацией мы понимаем описание полного множества всех объектов, находящихся в ПО, которые имеют определенные свойства и вступают друг с другом в некоторые отношения в некоторый период времени. В нашем примере объектами могут быть товары, магазины, покупатели. Каждый такой объект имеет определенный набор характеристик. Например, для Товара — это цена, вес, наценка. Для Магазина — это ежедневный объем продаж, общая площадь торгового помещения, режим работы. Для Покупателя — это возраст, месячный доход и т.д. Кроме того, все объекты могут взаимодействовать друг с другом посредством выполнения некоторых действий (изменений) в предметной области. Например, Покупатель “покупает” Товар, Товар “поступает” в Магазин, Магазин “продает” Товар и т.п. Текущей ситуацией будем называть состояние ПО, в котором она находится в настоящий момент, т.е. на основании последних данных, поступивших в ИХ. Текущую ситуацию в некотором магазине можно описать, например, так.

Магазин № 10

характеристики магазина: размер, режим работы, количество отделов, размер складских помещений, количество персонала и т.п.;

характеристики, полученные путем анализа: средняя ежедневная выручка, средняя ежедневная прибыль, среднее количество покупателей, посещающих магазин каждый день, средняя сумма, на которую покупатели делают покупки за одно посещение, и т.п.

Текущая ситуация по информации, полученной из внутренних источников:

НОМЕНКЛАТУРА (список товаров с ценами);

ВЫРУЧКА;

КОЛИЧЕСТВО ПРОДАННОГО ТОВАРА;

КОЛИЧЕСТВО ПРИХОДА ТОВАРА;

АКТЫ ПЕРЕОЦЕНКИ ЗА ДЕНЬ;

АКТЫ СПИСАНИЯ;

ВОЗВРАТ ТОВАРА НА ЦЕНТРАЛЬНЫЙ

СКЛАД;

КОЛИЧЕСТВО ПОКУПАТЕЛЕЙ;

ОСТАТКИ ТОВАРА;

Текущая ситуация по информации, полученной из внешних источников:

ИНФОРМАЦИЯ О КОНКУРЕНТАХ;

ИНФОРМАЦИЯ О СИТУАЦИИ НА РЫНКЕ;

СТАТИСТИЧЕСКАЯ ИНФОРМАЦИЯ

О РЕГИОНЕ;

ИНФОРМАЦИЯ О ПОГОДНЫХ И

ЭКОЛОГИЧЕСКИХ УСЛОВИЯХ;

Для того чтобы определить, какие изменения необходимо произвести в ПО, необходимо знать, какие вообще изменения может произвести пользователь или предприятие с объектами ПО. Таким образом, необходимо определить все возможные (важные для решения задач функционирования системы) изменения для каждого объекта предметной области, но не всей, а только контролируемой ее части. Такое изменение состоит в замене некоторой характеристики объекта. Следовательно, само изменение можно представить в виде тройки:

1) наименование изменяемого объекта;

2) характеристика, которая изменяется;

3) диапазон, в котором может изменяться эта характеристика.

Это изменение можно назвать “элементарным”, так как оно предполагает изменение только одной характеристики.

Множество может как заполняться с ИХ, так и заноситься пользователем. Автоматическое формирование таких знаний должно быть возложено на СИД. Кроме того, все возможности должны быть оценены с точки зрения сложности их актуализации. Другими словами, система должна знать, насколько много нужно затратить усилий, чтобы актуализировать ту или иную возможность. Такая оценка может принимать значения в промежутке от 0 до бесконечности. Чем больше значение этой оценки, тем менее привлекательна эта возможность для системы и тем меньше вероятность того, что она будет выбрана для достижения необходимой цели. Следовательно, к трем характеристикам изменения нужно добавить еще одну — количество затрачиваемых усилий на единицу изменения характеристики.

Приведем для примера часть множества возможных изменений:

(Сок апельсиновый, цена 50 коп. ... 1 грн,55);

(Магазине №12. Количество отделов, 1 ... 10, 2000);

(Масло сливочное, запас на центральном складе, 0 ... 5000 кг, 700);

Из множества возможностей необходимо выделить подмножество, элементы которого мы будем называть “потенциями”. Потенцией назовем ту возможность, которая может быть реализована пользователем в настоящее время в сложившейся текущей ситуации. Например, нельзя изменить цену товара, которого нет в наличии, или нельзя изменить качественные характеристики товара, если товара с такими характеристиками нет на складе, и т.п. Понятно, что в зависимости от изменений текущей ситуации изменяется и множество потенций.

Рассмотрим процесс построения прогноза по каждому этапу в отдельности.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

48

РИ, 1998, № 4

6. Определение целевой ситуации

Как было отмечено, пользователь через подсистему ввода-вывода задает СППР некоторую задачу (следуя современным тенденциям развития пользовательского интерфейса, такой запрос может быть представлен в естественно-языковой форме), в нейв неявной форме находится цель, которую хочет (или не хочет) достигнуть пользователь, например “Как достичь повышения прибыли на 5%?”. Если запрос задан на естественном языке, то он направляется в подсистему языкового анализа, где преобразовывается в формальную, понятную для компьютера форму. Далее из данного запроса выделяются целевые характеристики, в нашем примере — это “увеличить прибыль на 5%”, а после более детальной обработки получаем “целевая_прибыль = сегодняш-няя_прибыль + 5%”. Таким образом, мы получили характеристику, по которой будем сравнивать прогнозируемые ситуации. Значит, в целевой ситуации значение характеристики “прибыль” должно быть на 5% больше настоящего значения. Это не означает, что не следует обращать внимание на изменения, которые претерпевают другие характеристики ПО, и учитывать их изменения при выборе наилучшей альтернативы.

7. Анализ текущей ситуации и выявление различий между целевой и текущей ситуациями

В примере различия между текущей и целевой ситуациями указаны явно: “прибыль должна быть больше на 5%”, что означает, что целевая ситуация будет отличаться от текущей прибылью, кроме того, явно задана и величина этого различия (5%). Однако это лишь частный случай. Задача может быть задана неявно, например, “Как повысить посещаемость магазинов людьми с достатком выше среднего?” или “ Как распределить поставки товаров в магазины для уменьшения времени их нахождения на прилавках?”. Для таких запросов определить целевую ситуацию более сложно. Эта сложность в основном состоит в выделении основных характеристик, кото -рые необходимо контролировать в процессе прогнозирования, а главное — определить ту величину, на которую должны измениться значения контролируемых характеристик, чтобы удовлетворить запросы пользователя.

Для оценки различий между текущей и целевой ситуациями необходимо определить функцию, которая количественно измеряет различие (назовем ее РАЗНИЦА). Эта функция должна в качестве параметров получать две ситуации и возвращать некоторое множество, содержащее все отличающиеся характеристики этих ситуаций, выраженные количественно. Результат применения функции РАЗНИЦА к текущей и целевой ситуациям следующий:

РАЗНИЦА (целевая_ситуация, текущая_ситуа-ция)={(целевая_прибыль=текущая_прибыль + 5%)}

Для сравнения различных альтернативных решений на основании функции РАЗНИЦА необходимо построить некую оценку различия двух структур, которая бы однозначно характеризовала это различие (назовем ее РАЗЛИЧНОСТЬ). Сложность формализации такой оценки состоит в том, что некоторые изменяющиеся характеристики имеют различные

масштабы и их трудно привести к общему знаменателю. Более того, некоторые характеристики вообще трудно выразить количественно, например, цвет изделия или расположение товаров на прилавке. На этом этапе особенно активно используется описание текущей ситуации, и для построения адекватного и актуального прогноза необходимо, чтобы оно как можно точнее описывало ситуацию, сложившуюся на данный момент.

После завершения этапа мы имеем две структуры. Первая — описание текущей ситуации, а вторая - те целевые изменения, которые должны быть достигнуты согласно поставленной задаче. Кроме того, мы имеем вспомогательную функцию РАЗНИЦА для измерения различий между двумя структурами и оценку РАЗЛИЧИЕ, основанную на функции РАЗНИЦА.

8. Определение путей достижения целевой ситуации

Это основной этап процесса прогнозирования. Именно на этом этапе происходит объединение знаний о закономерностях, т.е. модели предметной области, которая строится СИД, с описательной моделью ПО.

На основании сказанного выше уточним содержание правила о закономерности, которая была извлечена из ИХ. Раньше мы говорили, что такие правила строятся в форме “если ... то ... ”. Теперь определим, что должно стоять на месте троеточий. В качестве посылок будем использовать количество событий в ПО, приводящих к изменению характеристик объектов, отличных от тех, которые являются прямым результатом изменений, указанных в посылке. Следует отметить, что важным параметром такого правила является время, через которое после актуализации событий, указанных в левой части правила, возникнут следствия, перечисленные в правой его части. Значение этого параметра должно быть представлено в каких-нибудь универсальных единицах, например секундах, часах и т.п., в зависимости от специфики задачи.

Правило можно представить в виде четверки:

1. Множество посылок, т.е. некоторое подмножество из множества возможных событий или значений характеристик объектов, актуализация которых является необходимым и достаточным условием для реализации этого правила.

2. Множество следствий, т.е. некоторое подмножество из множества изменений, возникших вследствие событий, указанных в посылках. Вместо значений диапазонов изменений указываются уже кон -кретные значения изменений, которые происходят во время реализации этого правила.

3. Оценка достоверности этого правила.

4. Время, через которое актуализируются следствия этого правила.

Введем понятие курса событий, под которым будем понимать некую последовательность изменений в предметной области. Целевым курсом событий будем называть такой курс, который текущую ситуацию преобразовывает в целевую. Построение таких целевых курсов событий и является целью процесса прогнозирования. Курс событий представляет собой цепочку вида: текущая ситуация—действия пользователя — изменения в ситуации, следствия действия-новая ситуация—действия пользователя — изменения в ситуации — ... — целевая ситуация.

РИ, 1998, № 4

49

9. Свободное прогнозирование

При построении свободного прогноза система предполагает, что все параметры предметной области не изменяются пользователем для достижения какой-либо цели, а функционируют точно так же, как в предыдущие моменты времени. Изменения в системе происходят согласно только тем закономерностям, которые были извлечены СИД из ИХ.

Целью функционирования алгоритма свободного прогнозирования в качестве этапа целенаправленного прогнозирования является определение, может ли быть достигнута целевая ситуация из текущей, не прибегая к насильственным изменениям в ПО, в разумный период времени. Если это так, то все варианты достижения целевой ситуации, полученные во время свободного прогнозирования, будут использованы на более поздних этапах в множестве альтернатив.

Альтернатива может быть выбрана в случае, когда все процессы в предметной области согласуются с целями пользователя и нет необходимости производить какие-либо манипуляции (а значит, затрачивать усилия) для достижения целей, которые и так будут достигнуты. В отдельных случаях результаты, полученные во время свободного прогнозирования, позволят системе отказаться от проведения дальнейших исследований данных, что может сэкономить немалое количество и времени, и ресурсов.

Процесс свободного прогнозирования производится следующим образом. Выбирается промежуток времени, на который делается прогноз. Дальше с помощью правил, содержащихся в модели предметной области, происходит генерация будущих ситуаций на основании текущей ситуации. Просматриваются все правила и выбираются те, которые могут быть актуализированы в настоящей ситуации. Затем на основании изменений, которые являются следствиями актуализированных правил, строится новая ситуация и так продолжается до тех пор, пока алгоритм не построит ситуацию, которая, по мнению системы, может возникнуть в заранее определенный будущий момент времени. Таким образом, свободное прогнозирование ведется от текущей ситуации к какому-то будущему моменту времени, в который будет достигнута целевая ситуация. Периодичность, с которой система должна строить будущие ситуации (в промежуточные моменты времени), должна в общем случае быть кратна тому промежутку времени, который принят в качестве единицы измерения длительности действия правила. Например, если в качестве единицы выбран день, то периодичность должна измеряться в днях (каждый день, каждую неделю, каждый месяц и т.д.).

Рассмотрим подробнее построение дерева возможных событий на примере построения одной итерации алгоритма прогнозирования.

Вначале мы имеем информацию о текущей ситуации и набор закономерностей, которые СИД извлекла из ИХ. В этом множестве закономерностей необходимо выделить подмножество правил, которые могут быть актуализированы в настоящей ситуации. Назовем правила, находящиеся в этом подмножестве, актуальными. Теперь это подмножество необходимо разбить на определенное количество альтернативных процессов. Это производится путем определения закономерностей, которые имеют одни

и те же посылки, но различные следствия. Таким образом, формируются альтернативы возможных событий. Однако альтернатив может быть довольно много, а каждая лишняя — это прежде всего большие затраты времени и усилий. Значит, необходимо выделить самые вероятные альтернативные события (это может быть реализовано путем введения пороговых значений вероятности), по которым и будет проводиться дальнейшее прогнозирование. Эти альтернативные события представляют собой первые ветви дерева возможных событий, исходящие из корня (текущей ситуации). Затем для каждой ветви строится своя ситуация, которая для этой ветви становиться текущим событием. Это событие сравнивается с целевой ситуацией с помощью описанной выше оценки РАЗЛИЧИЕ. Если это сравнение дает положительный результат, что означает достижение целевой ситуации, то прогнозирование по этой ветви прекращается, а весь путь от корня к этой конечной ситуации запоминается в списке альтернативных курсов событий. Если результат сравнения отрицательный и данная ситуация не достигла временной границы, процесс прогнозирования продолжается снова. Когда полученная на очередном шаге итерации ситуация пересечет границу прогнозирования и сравнение с целевой ситуацией даст отрицательный результат, то такой курс событий отбрасывается.

По окончанию работы алгоритма свободного прогнозирования мы имеем некоторое множество альтернативных курсов событий. В качестве примера можно привести такой курс событий, полученный путем свободного прогнозирования, для рассматриваемой нами предметной области.

Период прогнозирования 1 неделя, прогноз производиться с шагом в один день.

03.05.98 г.

ОПИСАНИЕ СИТУАЦИИ

выручка — 250 грн.

остаток чая — 20

СОБЫТИЯ

завоз партии свежего печенья

РЕЛЕВАНТНЫЕ ПРАВИЛА

к концу дня возрастет уровень продажи на 5% (вероятность 55%)

увеличится продажа освежающих напитков и чая (вероятность 45%)

04.05.98

ОПИСАНИЕ СИТУАЦИИ

выручка — 330 грн

остаток чая — 5

Для того чтобы избежать излишних вычислений, о чем мы говорили ранее, необходимо провести оценку вероятности реализации каждого курса событий. Если часть уже сформированных курсов имеет довольно неплохие шансы стать реальностью и достичь целевой ситуации, то чаще всего нет необходимости проводить дальнейшее прогнозирование.

50

РИ, 1998, № 4

10. Целенаправленное прогнозирование

После проведения свободного прогнозирования, если оно не дало положительного результата, можно приступить к целенаправленному прогнозированию. В отличие от свободного прогнозирования, процесс целенаправленного прогнозирования проводится не от текущей ситуации, а от целевой в сторону текущей. Опишем этот процесс подробнее.

Сначала с помощью описанной выше функции РАЗНИЦА определяем множество различий между целевой и текущей ситуациями. Затем в множестве всех возможных изменений ищем такие возможности, которые позволяют произвести изменения, выделенные функцией РАЗНИЦА. Полученное множество возможностей проверяют на возможность актуализации в текущей ситуации, т.е. на то, являются ли они потенциями или нет. В общем случае ключевые изменения характеристик не должны быть доступны в текущей ситуации. Если такое произошло, это означает, что задан запрос, который не нуждается в прогнозировании. Однако второстепенные характеристики могут быть изменены сразу, и отбрасывать возможность реализации этих изменений нельзя.

Если имеется прямая возможность достигнуть целевой ситуации, то она заносится в число альтернатив и на этом чаще всего алгоритм может завершить свою работу. Однако такая ситуация может возникнуть только в результате неправильно сформированного запроса. В большинстве случаев возможности изменять такую характеристику не окажется не только в числе потенций, но и вообще во всем множестве возможных изменений объектов предметной области пользователем.

Не обнаружив простого достижения целевой ситуации, система начинает поиск закономерностей из модели предметной области, которая позволит достичь целевой характеристики. Может быть два результата поиска: такой закономерности не найдено, и СПР отправляет специальный запрос СИД на целенаправленный поиск способов достижения целевой ситуации (в конце концов такая закономерность должна быть найдена, в противном случае система вынуждена будет выдать пользователю сообщение о невозможности прогнозирования событий для достижения целевой ситуации) или такая закономерность найдена. Каждая найденная закономерность становится отдельным альтернативным процессом достижения целевой ситуации. Полученная закономерность (будем рассматривать одну альтернативу) имеет посылки, при актуализации которых она реализуется. Система должна проверить, актуальны ли эти посылки в текущей ситуации. Если да, то такая альтернатива считается завершенной и заносится в множество альтернативных курсов событий. Если нет, то система пытается найти в множестве возможностей способы приведения предметной области к ситуации, в которой может реализоваться выбранная закономерность. Если такие возможности найдены, то весь этот процесс формируется как курс события и заносится в список альтернатив. Если нет, то операции повторяются снова, пока из текущей ситуации не станет возможен переход в целевую.

После работы этого алгоритма формируется список альтернативных курсов событий, которые позволяют достичь указанной в задании пользователя

цели. Приведем пример такого целенаправленного курса событий.

Цель - увеличение прибыли на 5%.

03.05.98(воскресенье)

ОПИСАНИЕ СИТУАЦИИ

прибыль за день - 500

АКТИВНЫЕ ЗАКОНОМЕРНОСТИ

в понедельник прибыль уменьшается в среднем на 7% (вероятность 90%);

цена на копченую колбасу выше, чем у конкурентов, колбаса не продается (вероятность 55%);

отсутствие достаточного запаса прохладительных напитков снижает прибыль (вероятность 70%);

в дни между 1 и 10 мая наблюдается повышение спроса на спиртные напитки (вероятность 70%);

вместе со спиртными напитками покупают обязательно колбасу (вероятность 50%);

Доступные действия (потенции)

снизить цену на колбасу, так чтобы она была ниже цены у конкурентов на 1%;

довезти прохладительные напитки; увеличить запасы спиртных напитков; ввести скидку на одновременную покупку спир -тного напитка и колбасы;

10.05.98

прибыль за день - 700

11. Оценка альтернатив

Полученные альтернативы еще нельзя представлять конечному пользователю, так как их количество может быть достаточно большим. Для того чтобы пользователь мог выбрать наилучшую альтернативу, они должны быть упорядочены по определенному принципу или их необходимо оценить. Для этого наиболее подходит оценка курсов событий по нескольким, заранее определенным критериям, затем составление обобщенной оценки, которая и позволит выделить наиболее удачные альтернативы. Основными для описанных выше альтернатив являются оценки: достоверности данного курса, количества затраченных на реализацию этого курса усилий и продолжительности его реализации во времени.

Для получения обобщенной оценки все оценки по отдельным критериям должны быть приведены в единый масштаб. Затем для каждого критерия должен быть назначен свой коэффициент, показывающий приоритетность этого критерия. Выбор коэффициентов может меняться в зависимости от конкретной реализации СППР и даже от конкретной ситуации. Обобщенная оценка формируется путем сложения всех оценок по всем критериям, умноженных на соответствующий коэффициент приоритетности.

После завершения процесса оценки из списка альтернатив выбираются несколько с наибольшей оценкой и предоставляются пользователю.

РИ, 1998, № 4

51

12. Заключение

Мы рассмотрели работу одной из подсистем СППР — прогнозирующей подсистемы. Однако для достижения хороших результатов разработчики систем поддержки принятия решений должны максимально тесно интегрировать все ее структурные элементы. Во время своего функционирования элементы СППР активно взаимодействуют друг с другом, и удаление одного из них сделает невозможным функционирование других. На самом деле подсистема принятия решений активно использует как знания, полученные системой извлечения данных, так и сами данные, напрямую обращаясь к информационному хранилищу. Точно так же СИД не только постоянно исследует данные в ИХ, но и пользуется прогнозами, полученными от СПР и позволяющими отыскать большее количество закономерностей в предметной области. А информационное хранилище пополняется не только за счет данных, поступающих извне, но и за счет результатов работы СПР и СИД. Такие данные могут постепенно заполнять белые пятна предметной области.

Указанный подход не является единственно возможным. Кроме того, все описанное выше не есть строго определенный алгоритм — это в большей степени указание направлений, в которых движется работа, для построения строгой и адекватно функционирующей системы прогнозирования.

Поступила в редколлегию 25.11.1998 Рецензент: д-р техн. наук, проф. Петров Э.Г.

Ходаков Виктор Егорович, д-р. техн. наук, профессор, зав. кафедрой программного обеспечения ЭВМ Херсонского государственного технического университета. Научные интересы: информационное обеспечение

систем автоматизации производственных процессов и управления. Адрес: Украина, Херсон 8, Бериславское шоссе, 24, тел.(0552)55-17-31.

Шерстюк Владимир Григорьевич, канд. техн. наук, доцент кафедры программного обеспечения ЭВМ Херсонского государственного технического университета. Научные интересы: интеллектуальные системы представления знаний и моделирования рассуждений, распределенные базы данных и знаний. Адрес: Украина, Херсон-8, Бериславское шоссе, 24, тел. (0552)55-17-31.

Степанский Константин Григорьевич, аспирант Херсонского государственного технического университета. Научные интересы: интеллектуальные системы представления знаний. Адрес: Украина, Киев, ул. Артема, 77, тел. (044)216-82-30.

Дидык Алексей Александрович, аспирант Херсонского государственного технического университета. Научные интересы: распределенные интеллектуальные системы. Адрес: Украина, Херсон 8, Бериславское шоссе, 24, тел. (0552)55-17-31.

Козуб Наталья Александровна, ассистент кафедры ПО ЭВМ Херсонского государственного технического университета. Научные интересы: интеллектуальные системы представления знаний. Адрес: Украина, Херсон 8, Бериславское шоссе, 24, тел.: (0552)55-17-31.

Григорова Анжела Анатольевна, ассистент кафедры ПО ЭВМ Херсонского государственного технического университета. Научные интересы: интеллектуальные системы предсавления и извлечения знаний. Адрес: Украина, Херсон 8, Бериславское шоссе, 24, тел. (0552) 55-17-31.

Радванская Людмила Николаевна, соискатель кафедры ПО ЭВМ Херсонского государственного технического университета. Научные интересы: системы поддержки принятия решений. Адрес: Украина, Херсон 8, Бериславское шоссе, 24, тел.: (0552)55-17-31.

УДК 681. 335.001.53

РЕФЛЕКТОРНАЯ СИСТЕМА ОБРАБОТКИ ЕСТЕСТВЕННОЯЗЫКОВЫХ ТЕКСТОВ В АСУ СТРОИТЕЛЬСТВОМ СЛОЖНЫХ ЭНЕРГЕТИЧЕСКИХ ОБЪЕКТОВ

ТЕСЛЯ Ю.Н.

Раскрываются особенности разработки и использования средств естественно-языкового общения в энергетическом строительстве. Излагаются принципы и метод построения систем естественно-языкового общения на основе положений и выводов теории информационного взаимодействия.

1. Задачи естественно-языкового общения в АСУС сложных энергетических объектов

Эффективность построения автоматизированных систем управления во многом зависит от языковых средств описания объектов и процессов управления [1]. Поэтому адаптивность и мобильность языков общения с “компьютером”, непроцедурный характер описаний объектов и процессов управления, использование “контекстов” и “умолчаний” — непременное условие рациональной конструкции языковых средств.

Известные отечественные и зарубежные системы обработки естественно-языковой информации имеют или экспериментальный характер, или узкую специализацию и не удовлетворяют требованиям систем автоматизированной переработки информации в управлении строительством сложных энергетических объектов. Кроме того, и затраты на создание таких систем значительны, что не позволяет широко использовать их в энергетическом строительстве [2, 3].

Но тем не менее без таких средств значительно снижается производительность автоматизированных систем при наполнении информационной базы строительства, повышаются затраты на выполнение рутинных действий, таких как кодировка информации, поиск в информационной базе и др.

Использование систем естественно-языкового общения в энергетическом строительстве связано с рядом специфических особенностей объекта управления: значительной длительностью и сложностью производственного процесса, существенными изменениями в проектно-сметной документации по ходу выполнения строительно-монтажных работ, неполнотой документации, низкой надежностью источников информации, разнообразием выходной документации, формируемой по запросам различных пользователей, трудноформализуемостью большинства входных документов [4]. В соответствии с этим требования и ограничения к системам обработки естественно-языковых текстов определяются мо-

52

РИ, 1998, № 4

бильностью, надежностью, высокой производительностью, простотой изменения информационной базы, децентрализацией процесса обработки данных.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Разрабатываемые в среде данных требований и ограничений средства обработки естественно-языковых текстов должны быть низкозатратными, носить специализированный характер, обеспечивать обработку поступающей информации с формализацией основных элементов объектов информационной среды строительства и осуществлять диалог с пользователем на языке, близком к естественному.

Основой удовлетворения этих требований может служить научно-методическая база теории информационного взаимодействия [5]. Это обусловлено тем, что разрабатываемые с использованием положений и выводов теории информационного взаимодействия системы естественно-языкового общения характеризуются:

— отсутствием блоков морфологического и семантического анализа текста, что снижает затраты на разработку систем естественно-языкового общения (ЕЯО);

— фрагментной структурой тезауруса системы, что повышает ее устойчивость к ошибкам, позволяет использовать для обработки различных по природе текстов;

— простотой реализации;

— высокой надежностью распознавания семантической составляющей текста;

— адаптивностью к различным входным текстам.

Основная идея, что лежит в основе создания таких

средств, заключается в применении методов распознавания образов [6] к идентификации алгоритма и основных параметров запроса по комбинациям фрагментов входных естественно-языковых текстов [6,7].

Средства обработки естественно-языковых текстов в энергетическом строительстве применяются:

1. При обработке входной информации:

— определение по наименованию документа его структурного адреса (очередь, объект, узел);

— определение по наименованию строки сметы (работы): вида работы (физического объема работы); исполнителя; идентификатора информационного объекта работы.

2. При обработке запросов пользователей к информационной базе:

— определение алгоритма доступа;

— идентификация узла структуры материальных объектов строительства, исполнителя, вида работ;

—установление временного интервала для выходного документа;

— формальное представление запроса с получением подтверждения на его реализацию.

С целью создать эффективную автоматизированную технологию обработки естественно-языковых текстов автором разработана программно -информационная система естественно-языкового общения с компьютером — компилятор естественно-языковых текстов (КЕТ).

2.Компилятор естественно-языковых текстов

Компилятор естественно-языковых текстов обеспечивает формирование результирующего, формального представления семантической составляющей входного текста по его изображению и работает в двух режимах:

— обучение классификации входных текстов по выходным;

— классификация входных текстов.

Схема потоков информации в КЕТ показана на рис.1.

Рис.1. Схема информационных потоков в КЕТ

По сути КЕТ реализует рефлекторную модель поведения в неоднозначно трактуемой среде функционирования и является специализированным комплексом программ, обеспечивающих интерфейс между пользователем, информационной базой, ее средствами наполнения и информационно-поисковой системой АСУС, а также анализ и преобразование исходных данных при отображении семантики предложений входной информации в рамках предметной области энергетического строительства.

Морфологическая структура компилятора формируется совокупностью взаимодействующих информационных объектов КЕТ. Под информационным объектом КЕТ будем понимать такую совокупность элементов данных или знаний, которая воздействует или воспринимает воздействие в информационной среде как единое целое.

В качестве информационных объектов КЕТ выступают:

A={a1, a2,ax,,am} — фрагменты текстов;

R={r1, Г2,Гі,,гп} — описания реакций компилятора.

Конкретные формы реакций R определяются в процессе обучения—наполнения словарной системы S и системы определяющих связей входного текста U.

В основе компилятора лежит математическая модель взаимодействия в естественно-языковых текстах. Он обеспечивает формирование результирующего, формального представления семантической составляющей входного текста по его изображению. На основе математической модели информационного взаимодействия разработан алгоритм вычисления оценки совместной условной вероятности реакций компилятора по отклонениям в частных условных вероятностях.

Шаг 1. Вычисление величины информационного воздействия фрагментов текста на каждую из реакций:

vri,ax:i(ri/ax)=0,5sign(p(ri/ax)-p(ri);

p(r,/ax)+p(r,/-ax)-2 p(rJ-aX) p(r,/ax)- ,

РИ, 1998, № 4

53

где p(rj/ax) — безусловная вероятность реакции ц; p(ri/ax) — условная вероятность реакции r при появления фрагмента ax; p(rj/-ax) — условная вероятность реакции r при не появлении фрагмента ax;

sign(x)

1 при x>0; -1 при x<0.

Шаг 2. Вычисление суммарного воздействия на каждую реакцию:

k

vrieR: i(r,/axl, aX2...aXJ...axk) = £ i(r1/aX]) +i<1-k>(r1) ;

j=l

здесь i<1-k>(ri) — величина совместности действия (связности) фрагментов текста ax1, ax2...axk.

Шаг 3. Вычисление условной информационной меры возможности реакций:

V ГіЄ R:I(ri/axbaX2...aXj...axk)=i(r1).V i(r1/axi, ax2...aXj...axk)2+1+ + 1(ri/3xi, ax2...axj...axk).V1(ri)2+1 ,

где i(ri) — безусловная информационная мера возможности реакции ri.

Шаг 4. Выбор реакции компилятора: max(I(ri/axi, ax2...axj...axk)).

i

Представленный алгоритм формирования величины воздействия в текстах на естественном языке получил экспериментальное подтверждение [8,9] и реализован в КЕТ.

Э.Применение КЕТ для обработки естественноязыковой информации

Автором разработаны и экспериментально проверены в производственных условиях схемы обработки входной естественно-языковой информации (рис.2) и естественно-языкового доступа к информационной базе (рис.3) с использованием КЕТ [4,9].

Компилятор естественно-языковых текстов был разработан и использовался в рамках АСУ строительства Южно-Украинской АЭС (ЮУ АЭС) [10]. АСУ строительства ЮУ АЭС базируется на сложной программно-информационной системе, которая включает несколько сот тысяч хранимых документов (в основном чертежи и сметы), касающихся строительства АЭС. Обслуживание этого объема информации

Рис. 2. Схема формализации естественноязыковой информации в КЕТ

Рис. 3. Схема доступа к информационной

базе АСУС на основе естественно-языковых обращений пользователей

возлагается на несколько сотен управляющих и обрабатывающих информацию программных модулей.

Программно-информационная система АСУ включает в себя около 50 рабочих мест, с которыми непосредственно работают специалисты отделов и подразделений управления строительства^ 0]. Большое количество непрофессиональных пользователей, работающих с информационной базой, значительное количество трудноформализуемой информации в информационной среде строительства потребовало создать специализированные средства формализации входной естественно-языковой информации и средства доступа к информационной базе на естественном языке.

В постановке задачи было определено, что система должна получать четыре группы выходных документов (форм): по обеспечению документацией и стоимости работ; по планируемым физическим объемам работ; по выполненным объемам работ; по материалам и ресурсам. Все формы могут быть получены в разрезе: исполнителей работ; объектов, комплексов, узлов; периодов строительства.

Первая версия КЕТ была разработана и внедрена в промышленную эксплуатацию в 1989 году. На его основе был разработан специализированный комплекс программ обработки фактографической базы данных и получения необходимых форм, исходя из естественно-языкового обращения пользователя.

Использование программных средств ЕЯО с компьютером позволило сделать ряд выводов, касающихся и теоретических основ, и практической применимости данной разработки. Эти выводы условно можно разбить на три группы: соответствие результатов функционирования системы и теоретической модели информационного взаимодействия; практическая эффективность системы; затраты на систему.

І.Соответствие результатов функционирования системы и теоретической модели информационного взаимодействия. В процессе разработки и эксплуатации системы ЕЯО было проверено ряд вариантов реализации процедур информационного взаимодействия в среде естественно-языковых текстов. Некоторые практические результаты (например, определение величины совместности (связности) действия фрагментов текста привели к корректировке теоретической модели. Эффективность и наблюдаемая “информационная правильность понимания” компьютером сути запроса в значительной степени свидетельствует о соответствии искусственно со-

54

РИ, 1998, № 4

зданного и существующего механизма информационного взаимодействия и, следовательно, о значительной вероятности того, что принятые в работе предположения и посылки правильные.

Кроме рассматриваемой системы, теоретические выводы проверялись в рамках учебно-лабораторного комплекса, выполненного на основе КЕТ. Полученные в других предметных областях результаты (моделирование логических схем ЭВМ) свидетельствуют об универсальности принятого подхода.

2. Практическая эффективность системы. Процесс доступа пользователя к информационной базе АСУС заключается в формулировке некоторой задачи, связанной с получением информации из информационной базы и контроля за правильностью «понимания» запроса.

Простота получения форм, безусловно, относится к практическим достоинствам системы. Однако имеются и недостатки:

а) для решения этих задач одновременно активизировалось до четырех модулей системы КЕТ на один запрос, реализующих все процессы его обработки в оперативной памяти компьютера. Это приводило к значительным временным задержкам в решении других задач пользователей;

б) пользователям, особенно тем, кто часто работал с ЭВМ, было неудобно вводить полное (или почти полное, допускались сокращения) наименование объекта, исполнителя и др. Поэтому в системе предусматривалось указание кода любого элемента справочников АСУС.

3. Затраты на систему. Они состоят из затрат на разработку программных средств и на обучение системы (таблица).

Программные средства Затраты времени

фор м ализации естественно-я з ы к о в ы х тесто в 0,3 чел.лет

доступа к информационной базе 2 чел.лет

На обучение системы затрачено около 50 часов. При этом была организована система информационных объектов, состоящая из: тезаурус — 4096 информационных объектов; связи — 8128; реакций системы — 200.

УДК 681.513.6

АДАПТИВНОЕ СГЛАЖИВАНИЕ ДВУМЕРНЫХ ПОЛЕЙ НАБЛЮДЕНИЙ

ПЛИСС И.П., ПОПОВ с.в.

Рассматривается сглаживание двумерных полей наблюдений, которое производится на основе оригинальной матричной модели. Ее параметры настраиваются при помощи адаптивного алгоритма оценивания.

Данная работа является естественным развитием статьи [ 1], в которой рассмотрены вопросы адаптивной фильтрации и экстраполяции полей наблюдений на основе предложенного ранее одношагового адап-

Как видно, затраты на систему значительно ниже затрат на аналогичные разработки [1,3,7]. Это можно объяснить эффективностью подходов на базе теории информационного взаимодействия по сравнению с используемыми в других системах принципами и методами организации естественно-языкового общения с компьютером.

В целом, результаты опытной эксплуатации системы показали ее значительные возможности и, по мнению автора, данный подход может быть использован в широком спектре систем искусственного интеллекта.

Литература: 1.Белогонов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. М.: Наука, 1983. 288 с. 2.Бушуев С.Д., Михайлов В.С., Лянко С.Д. Автоматизированные системы управления строительством. К.: Будівельник, 1989. 255 с. 3. Искуственный интеллект: Системы общения и экспертные системы: Справочник / Под ред. Э.В.Попова. М.: Радио и связь, 1990. 463с. 4. ТесляЮ.М., Тимченко А.А. Опыт разработки и применения в строительстве инструментальных программных средств естественно-языкового общения// К.: МГП «Тираж». С. 226-228. 5. ТесляЮ.М. Основи теорії інформаційної взаємодії. Філософсько-логічне та фізичне обгрунтування // Вісник ЧІТІ, 1998. №2. С. 62-68. 6. Тесля Ю.М. Застосування теорії інформаційної взаємодії до побудови систем класифікації образів // Праці сьомої міжнародної конференції «Укробраз 98», К., 1998. С.122-123. 7. Файн В.С. Распознавание образов и машинное понимание естественного языка. М.: Наука, 1987. 173 с. 8.Тесля Ю.М. Основи теорії інформаційної взаємодії. Експериментальне підтвердження//Вісник ЧІТІ, 1998. №2. С. 69-74. 9. Тесля Ю.М, Копил Д.В. Експериментальне підтвердження можливості застосування математичної моделі інформаційної взаемодії до задач природно-мовного спілкування// Праці 4-ї Української конференціі по автоматичному управлінню «Автоматика 97». Черкаси, 1997. Т.3. С. 77. Ю.Гриценко В.И., Тимченко А.А., Тесля Ю.Н. Подходы к информатизации объектов энергетического строительства. К., 1995. 32 с.

Поступила в редколлегию 16.12.1998 Рецензент: д-р техн. наук Тимченко А.А.

Тесля Юрий Николаевич, канд. техн. наук, доцент кафедры информатики Черкасского инженерно-технологического института. Научные интересы: автоматизированные информационные системы и технологии управления строительством сложных энергетических объектов; гипотетическая теория информационного взаимодействия. Увлечения: футбол. Адрес: Украина, 257006, Черкассы, ул. Чехова, 42, кв.428, тел. (0472)43-61-60.

тивного оптимального по быстродействию матричного алгоритма оценивания параметров поля.

Одношаговые алгоритмы, обладая хорошими следящими свойствами, тем не менее, плохо работают в условиях зашумленности наблюдений, что не позволяет использовать их в задачах сглаживания. В этих условиях целесообразно применять многошаговые процедуры типа фильтра Калмана или рекуррентного метода наименьших квадратов, обладающих выраженными сглаживающими свойствами.

Как и в предыдущей статье, для описания поля используется матричный аналог марковского дискретного случайного процесса

Xn+1 = AXnB + Wn+1, (1)

где Xn — (MxN)-матрица состояния поля в дискретный момент времени n; A и B — (MxM) и (NxN)-

РИ, 1998, № 4

55

матрицы неизвестных параметров преобразования; Wn — дискретный матричный белый шум.

В принципе, описание (1) может быть приведено к традиционному матрично-векторному виду

Xn+1 = (BT ® A)Xn + Wn+1 = CXn + Wn+1, (2)

(здесь ® — символ тензорного произведения; • —

символ столбцовой векторизации [2]), после чего для оценивания матрицы параметров C может быть использован рекуррентный метод наименьших квадратов в форме

C

n+1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= Cn +-

+ VT

Xn+1 - Cn Xn

Xn Гп

J

+T +

1 + Xn rnXn

T

г = г rn Xn Xn rn

Г n+1 = rn T

+T +

1 + Xn rnXn

(3)

где Cn — настраиваемые параметры модели

ґ

X

n+1

Л

CXn

v J +

(4)

поставленной в соответствие (1); • — символ девекторизации.

Здесь нужно отметить, что если описание поля (1)

содержит M2 + N2 параметров, то в модели (4) их уже

(MN) , что резко усложняет использование рекуррентного метода наименьших квадратов даже в простых реальных задачах.

В связи с этим возникает задача синтеза алгоритмов оценивания неизвестных параметров матриц A и B в (1), обладающих высокими сглаживающими качествами, на основе настраиваемой модели вида

Xn+1 = AnXnBn , (5)

содержащей M2 + N2 << (MN)2 параметров.

Для синтеза таких процедур рассмотрим вначале матричный объект вида

Xn+1 = GYn + Wn+1, (6)

где Yn — (МхМ)-матрица экзогенных переменных; G — (МхМ)-матрица неизвестных параметров, подлежащих определению. Введем в рассмотрение критерий идентификации

J

G

n

n-1

z| V

i=1

2

= zX+1 - GnYi XXi+1 - GnYi )T, i=1

(7)

здесь Gn — оценка матрицы G, полученная в результате обработки всех наблюдений двумерного поля; Tr — символ следа матрицы.

Решение системы уравнений

dJG n-1 T n-1 T

^ = -ZXi+1Y/ + Gn ZYiY1T

dGn i=1 i=1

= -rn + GnRn = 0

(8)

позволяет получить искомую оценку в виде

Gn = гД-1, (9)

которая в (п+1)-й момент времени может быть представлена выражением

Gn+1 = rn+1R-+1 . (10)

Введем рекуррентную процедуру уточнения матрицы оценок

Gn+1 = Gn +(rn+1 - GnRn+1 )ГП+1 =

= Gn + (Xn+1 - GnYn )YnTrnG+1, (11)

которая с учетом (9), (10) может быть переписана в форме

rn+1Rn+1 = rnRn1 +(rn+1 - rnRn1Rn+1KG+1. (12)

Несложно видеть, что (12) обращается в тождество при rnG+1 = R-+1, что позволяет переписать алгоритм идентификации в виде

Gn+1 = Gn + (Xn+1 - GnYn )YnTR-+1. (13)

Записав очевидное соотношение

Rn+1 = Rn + YnYnT (14)

и применив лемму об обращении матриц, получим

R-+1 = R + YnYnT j-1 =

= R-1 - R-1Yn (і + YnTR-1Yn Xr-1 = (l + R-1YnYnT )-1R-1 =rnG+1 =

= rG - rGYn (і + YnTrnGYn )"1YnTrG =

(15)

= (і + rGY YT XrG

\ATin 1nin / x n >

здесь I — единичная матрица соответствующей размерности.

Аналогичным образом, рассматривая объект

Xn+1 = ZnH + Wn+1, (16)

где Zn — (МхМ)-матрица входных сигналов; H — (МхМ)-матрица неизвестных параметров, можно получить матрицу оценок

Hn = Pn-1Pn , (17)

n-1 T n-1 T где Pn = ZZTZi,Pn = ZXT+1Zi . i=1 i=1

Алгоритм идентификации при этом может быть представлен в форме

I Hn+1 = Hn + (Xn+1 - ZnHn X

1^+1 =(і + Г№п )

Возвращаясь к объекту (1), который представим в

(18)

виде

Xn+1 = AXnB + Wn+1 =

= AYn + Wn+1 = ZnB + Wn+1,

56

РИ, 1998, № 4

запишем рекуррентные соотношения для идентифи- ~

кации матриц параметров A и B: xn =

An+1 = An +(n+1 - AnYn )ТГА+Ь x11, n x12,n x13,n 0 0 0 ^

x21,n x22,n x23,n 0 0 0

гА г n+1 = (і + rAY YT ) rA \1Tin in1n / x П ’ (20) 0 0 0 x11, n-1 x12,n-1 x13,n-1 .(27)

її д >н XnBn 0 V 0 0 x21,n-1 x22,n-1 x23,n-1 у

и

Bn+1 = Bn + rnB+1Zn (Xn+1 - ZnBn \

■гП+1 = (i + rnBZTZn )B

Zn = An+1Xn

или

(21)

An+1 = An +(Xn+1 - AnXnBn Жд^,

, ГпА+1 = (i +rnAXnBnBTxT),

Bn+1 = Bn +ГпВ+1ХХ+1(Хп+1 -An+1XnBn) (22)

<1 =(і +ГпВхПаП+1Ап+1Xn ).

Система соотношений (22) описывает алгоритм рекуррентного метода наименьших квадратов для настройки параметров матричной модели (5). При этом, используя полученные параметры, несложно получить сглаженную оценку поля в любой точке

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 < i < n +1:

Xs = An+1Xi-1Bn+1. (23)

Предлагаемый алгоритм может быть также использован для оценивания параметров матричных уравнений авторегрессии вида [1, 3]:

Д---------------------------*>

/ ! x11,n-1 / ' x12,n-1 / ' x13,n-1

/І /І /І

/І /І /І

/ р.-----------------------т — -р

/ / x21,n-t/ / x22,n V / x23,n-1

/ / / / / /

J •' J '' J ''

--------<?-/---------< /

' x11,n ' x12,n 'x13(n

! / і / і /

I / I / I /

if------------^------------

x21,n x22,n x23,n

Представление данных

Тогда переход от индексов в параллелепипеде i = 1, 2,..., M;j = 1, 2,..., N; h = 0, 1,..., г—1 к индексам плоской матрицы может быть задан в форме

Ik = i + hM,

[і = j + hN, (28)

k = 1, 2,..., Mr; l = 1, 2,..., Nr. Все элементы хи, индексы которых не могут быть вычислены с помощью соотношений (28), полагаются нулевыми. Заметим также, что

при этом должно быть рассчитано (m2 + N2 )r параметров, а сглаженная оценка поля имеет вид

xS = An+1Xi-1Bn+1. (29)

r-1

Xn+1 = Z Ah+1Xn-hBh+1 + Wn+1. (24)

h=0

Вводя в рассмотрение матрицы

A = (а1 : а2 i-i Ar)

можно переписать (24) в компактной форме:

Xn+1 = AXnB + Wn+1 (25)

и с помощью алгоритма (22) настраивать модель

Xn+1 = AnXnBn. (26)

Однако при этом для организации вычислительного процесса следует перейти от трехиндексной нумерации данных в (24) — (xij,n-h) к двухиндексной в

модели (26) — (хы). Этот переход рассмотрим на простейшем примере для M=2, N=3, г=2. При использовании описания (24) данные можно представить в виде параллелепипеда, изображенного на рисунке, а при использовании модели (26) — в виде плоской матрицы

В заключение отметим, что если Xn — суть скалярная стохастическая последовательность, приходим к стандартной процедуре оценивания параметров АР-уравнения с помощью рекуррентного метода наименьших квадратов [4].

Литература: 1. Плисе И.П., Попов С.В. Адаптивная фильтрация и экстраполяция полей наблюдений // Радиоэлектроника и информатика. 1997. №1. С. 60-62. 2. Гришин В.Н., Дятлов В.А., Милов Л.Т. Модели, алгоритмы и устройства идентификации сложных систем. Л.: Энергоатомиздат. 1985. 104 с. 3. Бодянский Е.В., Плисе И.П. О решении задач дискретной адаптивной идентификации, экстраполяции и управления двумерными полями. Харьков: ХИРЭ. 1993.23 с. Деп. в ГНТБ Украины 03.11.93, №2175-Ук93. 4. Льюнг Л. Идентификация систем. Теория для пользователя. М.:Наука. 1991. 432 с.

Поступила в редколлегию 07.12.1998 Рецензент: д-р техн. наук Бодянский Е.В.

Плисе Ирина Павловна, канд. техн. наук, ведущий научный сотрудник ПНИЛ АСУ ХТУРЭ. Научные интересы: адаптивные системы обработки информации и управления. Увлечения: фелинология, приготовление экзотических блюд. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. 40-98-90.

Попов Сергей Витальевич, аспирант кафедры ТК ХТУРЭ. Научные интересы: адаптивная обработка информации в многомерных системах. Увлечения: музыка, компьютеры, автомобили. Адрес: Украина, 310726, Харьков, пр. Ленина, 14.

E-mail: [email protected]

РИ, 1998, № 4

57

УДК 681.51.015

МОДИФИЦИРОВАННЫЙ АЛГОРИТМ ТЕКУЩЕГО РЕГРЕССИОННОГО АНАЛИЗА В ЗАДАЧАХ ИДЕНТИФИКАЦИИ И ПРОГНОЗИРОВАНИЯ

Как показано в работах [4,5], достаточно эффективными являются рекуррентные алгоритмы текущего регрессионного анализа (алгоритмы РМНК со скользящим окном), которые на каждом шаге итерационного процесса уточнения оценок используют ограниченное число наблюдений и имеют вид

Cn\L ={xT„\bXn\LУ1 XTn\LYn\L . (3)

Здесь Y„\l =(y„-l+1,y„-L+2,-,y„)T - матриЦаLх 1;

РУДЕНКО О.Г., ТЕРЕНКОВСКИЙИ.Д., ШТЕФАН А., ОДА Г.А.

Предлагается модификация алгоритма текущего регрессионного анализа для решения задачи оценивания нестационарных параметров модели псевдолинейной регрессии. Опредяются условия сходимости разработанного алгоритма.

1. Введение

Широко используемые в настоящее время математические методы прогнозирования требуют наличия адекватной математической модели поведения прогнозируемого процесса. При этом качество используемой модели определяет точность процесса прогнозирования. Таким образом, выбор и обоснование математической модели являются узловыми вопросами математического прогнозирования [ 1].

В свою очередь выбор и обоснование модели прогнозируемого процесса представляет собой задачу идентификации, решение которой зависит от соотношения объема априорной (о структуре и параметрах процесса) и апостериорной (измерительной) информации. Достаточно удобным является описание процесса ARMAX-моделью [2], которая может быть сведена к модели псевдолинейной регрессии

У„ = c*nTx„ + #„ . (1)

После получения информации об n последовательных измерениях векторной x„ и скалярной У переменных модель (1) приобретает вид

Y„ = X„c„+H„ , (2)

где Y„ =(yi,У2,...,У„У - вектор „ X1;

X„ =(xT, x2T,..., xT)T - матрица „ x N;

cn = (спл,c„,2,.,c„,N) - вектор искомых, в об-

щем случае нестационарных, параметров n X 1;

Н„ =[(2,...,£„) -вектор помех „ X 1; „ = 0,1,2,...-дискретное время.

Если искомые параметры с течением времени не изменяются, с„ = const, то для их оценивания успешно используется МНК, если же с„ = var, то построение модели осуществляется с помощью рекуррентных алгоритмов, основанных на МНК и содержащих некий механизм, с помощью которого вновь поступившей информации придается большее значение по сравнению с устаревшей. Наиболее распространенный среди них - рекуррентный МНК (РМНК) с экспоненциальным взвешиванием информации [3].

X„\L = (xLL + ЬХТп-L + 2,.,ХТ„ )T - матрЩа L X N ;

L = conSt > N - число используемых в алгоритме наблюдений (память алгоритма, величина окна).

В настоящей работе предлагается и исследуется модифицированный алгоритм РМНК, использующий ограниченное число наблюдений и экспоненциальное взвешивание информации. Оценка на n-м шаге, получаемая с помощью такого алгоритма, может быть представлена так:

cn\ L = (Xni\LALXn\ L) Xn\LALYn\ L , (4)

где 2L-1 - 0 0^

Al = 0 - 2 0 - (5)

V 0 - 0 1y

матрица весов L х L ; 0 < 2 < 1 - параметр взвешивания. 2. Рекуррентная форма алгоритма

При получении рекуррентной формы оценок (3), (4) необходимо учитывать следующее.

Особенностью алгоритмов с L = const является то, что используемые при построении оценок матрицы и векторы наблюдений на каждом шаге оценивания формируются таким образом: в них включается информация о вновь поступивших измерениях и исключается информация о наиболее старых. В зависимости от того, как формируются эти матрицы и векторы (добавляется ли сначала новая информация, а затем исключается устаревшая либо же сначала исключается устаревшая, а затем добавляется новая), возможны две рекуррентные формы оценки.

Получение новой информации (добавление нового измерения) приводит к вычислению оценки, которая по аналогии с (4) может быть записана следующим образом:

cn+1\ L+1 =

= (+,, г ( Ат +1X,

\-1

n+1\ L+Н1 L+ 1^ „+1 \ L+1 ^„+11 L+Н1 L+1J n+1\ L+1

X„+ii г +1 Ат +1 Y„.

где

Y„

„+1\ L+1

Y„\ L "1=1 yn - L+1 yn+ 1у V Yn+1\ L

вектор (L +1) x 1;

(6)

(7)

X„+1\ L+1 =(

V x„+1

( T )

x„-L+1

V Xn+1\ L у

(8)

58

РИ, 1998, № 4

— матрица (L +1) x N;

Al+1 -

Ml ! 0

--о": 1.

' 2L_\_ _0 ^ ч0 ! Alj

(9)

— матрица (L +1) x (L +1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Так как на каждом такте при построении оценки используется l — const, то рассмотрим случай, когда сначала добавляются новые измерения, а затем исключаются устаревшие.

Рекуррентная форма оценки (6) может быть получена стандартными способами с использованием блочного представления векторов и матриц (7)-(9), позволяющего переписать (6) так:

cn+1 | L+1 (xn\L2ALXn\L + xn+1 xn+1)

(

x X,

\ 2Al j 0" ' Jn\L_'

xn+1j _ Уп+1 _

Обозначив

Pn+1 |L+1 - Xn+1| L + 1AL + 1 Xn+1| L+1, (10)

с учетом (8), (9) имеем

Pn+1|L+1 — 2Pn\L + xn+1xn+1 . (11)

Применяя к (11) лемму об обращении матриц [6], получаем

P

n+1|L +1

2

Pn\Lxn+1 xn+1 Pn|L 2 + xn+1 Pn\Lxn+1

(12)

Подстановка (12) в (6) и несложные преобразования приводят к следующему рекуррентному соотно -шению:

Pn\Lxn+1 / T \

cn+1|L+1 — cn|L + 7 T 7 \Уп+1 — cn|Lxn+1І . (13)

2 + xn+1 Pn\Lxn+Х ' У '

Полученные соотношения (12), (13) описывают процессы вычисления матрицы и уточнения оценок при накоплении информации.

Соотношения, соответствующие сбору устаревшей информации, легко могут быть получены аналогично, если учесть, что вследствие (8), (9)

Pn+\|L —

— XT AX — P_1 — 2Ly xT (14)

X n+1|LALX n+1|L Pn+1|L+1 2 xn-L+1xn—L+1,

Pn+1|L Pn+1|L+1 '

2 Pn+1|L+1xn—L+1xn—L+1

1 — Л"^— "+1 Pn +1|L+1 xn—L+1

.(15)

Учитывая, что

cn+1|L — (Xn"+1|LALXn+1|L) Xn+1\LALYn+1|L , (16)

подстановка (14), (15) в (16) дает

2LP,

n+1|L+1 xn—L+1

cn+1|L — cn+1|L+1 , T n

1 — 2 xn—L+1 Pn+1|L+1 xn—L+1

(17)

\Уп—L+1 — cn+1|L+1 xn—L+1І-

Таким образом, рекуррентный алгоритм оценивания, полученный путем добавления новой информа-

x

ции и последующего исключения устаревшей, описывается соотношениями (12), (13), (15), (17).

3. Сходимость алгоритма

Для исследования сходимости алгоритма (12), (13), (15), (17) введем функцию Ляпунова:

vn+1|L — Qn+1\LPn+1\"Qn+1|L , (18)

где Qn+1" — cn+1" — c* — ошибка идентификации.

Вычитая из обеих частей (17) c* с учетом (1), запишем алгоритм относительно ошибок идентификации:

Q

n+1|L

і+

2 Pn+1|Lxn—L+1 xn—L—1

1— A,"^— l+1 Pn+1|Lxn—L+1J

Qn+1|L+1 ,(19)

где I — единичная матрица N x N .

Кроме того, принимая во внимание (15), соотношение (19) можно переписать следующим образом:

Qn+1|L — Pn+1|LPn+11|L+1Qn+1|L+1. (20)

Аналогично записывая (13) относительно ошибок идентификации и учитывая (12), получаем

Qn+1|

L+1

I — -

Pn\Lxn+1xn+1

Qn|L —

2 + xn+1 Pn\Lxn+Ь

— 2Pn+1|L+1 Pn\LQn\L • Подстановка (21) в (20) дает

Qn+1|L — 2Pn+1\LPn\LQn\L .

Тогда

vn+1|L — 2Qn\LPn\LPn+1|LPn|LQn|L , а приращение функции Ляпунова равно

2 Pn+1|LPn|L — 1

T —1

Xvn+1|L — vn+1|L — vn|L — Qn\LPn\L

(21)

(22)

(23)

Qn\L .(24)

Подставляя в (24) выражения для Pn+1\l и Pn|L и проводя несложные преобразования, получаем

Av,

n+1L

—2

—(2—1)vnL —

(2 2xn-L+1PnLxn—L+1^en+1 +22 xn-L+1PnLx>

-n+Hn+Hn—L+1"

2{xn+1PnLxn+1

(2 2 xn—L+1PnLxn—L+1)(xn+1PnLxn+1 +2) +2)6^-

n—L+1

+2{xr+1PnLxn+])

(25)

Здесь en+1 — yn+1 — cTLxn+1; en—L+1 — yn—L+1 — cn\Lxn—L+1.

Для сходимости алгоритма необходимо выполнения условия

Avn+1|L ^ 0 . (26)

Так как 2 < 1, то первое слагаемое в первой части (25) отрицательно. Рассмотрим второе слагаемое. Перепишем его числитель в виде

РИ, 1998, № 4

59

(L T \ 2

A-A xn-L+1 Pn\Lxn-L+1 )en +1 +

L t

+ 21 Xn - l+1 Pn\Lxn +1en+1en - L+1 -

-A (xT+1 Pn\LXn+1 +^)еи-L+1 = A«+1 +^LA, где

A = xn - L+1 Pri\ Lxn-L+1en+1 - 2xn - L+1Pn\ Lxn+1en+1en - L+1 +

T 2 2

+ xn+1Pn\Lxn+1en- L+1 + Aen-L+1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(27)

Но так как Al > 0 и

xn-L+1 Pn\Lxn-L+1en+1 - 2xn-L+1 Pn\Lxn+1en+1en-L+1 +

T 2 l \T

+ xn+1 Pn\ Lxn+1en - L+1 = \en+1xn - L+1 - en - L+1xn+1) x

x Pn\L (en+1 xn-L+1 - en-L+1 xn+1) — 0,

то A>0 (A = 0 только в случае e = 0).

Знаменатель анализируемого слагаемого можно представить так:

A + xT+1 Pn\Lxn +1 -ЛЬВ ,

где

В '<Al , (31)

где A' и В' определяются в соответствии с (27)—(29), в алгоритме (12), (13), (15), (17) Avn+1\ l < 0,

Q\+1 \LPn+11\ LQn +1\ L < Qn\LPn\LQn\L <”< Q0 P0 Q0 . (32)

Однако с ростом L величина Al уменьшается и условие (31) может нарушаться. Поэтому для обеспечения сходимости алгоритма AL должно удовлетворять условию (30). Выбор L = n приводит к РМНК с экспоненциальным взвешиванием, для которого, как нетрудно заметить, условие (30) выполняется.

Чтобы рассматриваемая функция Ляпунова была неотрицательной, необходима положительная определенность матрицы P_1. Рассмотрим пошаговое изменение этой матрицы.

Использование соотношений (11), (14) позволяет

записать ^ \ l = AL + xn+1x\+1 -Axn - l+1x\- l+1.

Если на n-м шаге матрица P-i является положительно определенной, то в случае положительной определенности матрицы xn+1x'T+1 -ALxn-L+1x\-L+1

B (Axn - L+1 Pn\Lxn-L+1 + xn+1Pn\ Lxn+1xn - L+1 Pn\Lxn - L+1

- (xn - L+1 Pn\Lxn+1)

(28)

Учитывая неравенство Коши-Шварца- Буняковс-кого [6], которое в нашем случае имеет вид

xn+1 Pn\Lxn+1xn - L+1 Pn\Lxn - L+1 —

— xn+1 Pn\ Lxn - L+1 xn+1 Pn\ Lxn - L+1 ,

получаем, что в > 0 .

Для выполнения условий сходимости алгоритма (12), (13), (15), (17) необходимо, чтобы числитель и знаменатель имели одинаковые знаки. С учетом всего сказанного выше это можно записать следующим образом:

A'-A

L

В’ -A

— 0

где

A’ =

Al+1

A

В ’ =-

A + xn+1 Pn \ Lxn+1

В

(29)

Определим разность a - В' . Подстановка выражений для A и в и несложные преобразования дают

A'-В' =

\2

|xn+1P^|Lxn+1en+1 + An-L+1 xn- L+1Pn\Lxn-L+1en+1)

AB

< 0,

B' > A' .

Таким образом, при выполнении условия

0 <Al-1 < A' , (30)

либо условия

матрица Pn+\|L также будет положительно определенной.

Умножая справа на QnT+1\L и слева на Qn+1 \l

указанное приращение матрицы и используя введенные в (25) обозначения, а также принимая во внимание (23), получаем

>

QT+1|L(xn+1xn+1 Axn-L+1xn-L+]]Qn+1L en+1 Aen-L+1 >

(en+1xn-L+1-len-L+1xn+1) PnLen+-\xn-L+1-en-L+1xn+1)en+1 (en+1xn-L+1 -en-L+\xn+\) PnL(en+1xn-L+1 -en-L+1xn+l) +Ari-L+1

>0,

в случае положительной определенности Pn\ l матрица xn+1x\+1 -ALxn- L+1 x\- L+1 будет Поёожительно определенной.

Следовательно, для рассматриваемого алгоритма функция Ляпунова (18) будет неотрицательной и

ограниченной. Ее ограничивает v0\L :

n +1

vn+1 \ L < vO\ L - ТАхг\L , i=1

а выбор положительно определенной матрицы начальных значений Po\ l обеспечивает сходимость алгоритма (12), (13), (15), (17).

Из (25) следует, что

lim-----

n^<x A + x

Ae„+1 + AlA

T P x - al n+Ц n\ Lxn +1 л

В

= 0

Здесь a и в определяются выражением (27) и (28) соответственно.

4. Моделирование

На рисунке приведены результаты моделирования работы предложенного алгоритма при оценива-

60

РИ, 1998, № 4

нии параметра c*, изменяющегося по гармоническому закону. При моделировании предполагалось N = 5, х ~ N(0,1) . Тонкая линия на графике соответствует настройке параметров по алгоритму РМНК с экспоненциальным взвешиванием при А = 0,997, жирная— по предлагаемому алгоритму с Я = 0,997 и L = 8 .

Как видно из рисунка, алгоритм (12), (13), (15), (17) обеспечивает лучшее отслеживание изменяющихся параметров.

5. Заключение

Предложенный рекуррентный алгоритм оценивания является сходящимся при выполнении условия (30), которое, как показывают результаты исследований, выполняется практически всегда. Наличие в алгоритме двух свободно выбираемых параметров я и L , оптимальные значения которых [5] зависят от

УДК 519.711

СИСТЕМОЛОГИЧЕСКИЙ АНАЛИЗ ЦЕЛЕЙ И ЗАДАЧ СИСТЕМЫ ПРЕДУПРЕЖДЕНИЯ И ЛОКАЛИЗАЦИИ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЙ

ГИРЕНКО П.И., ПЕТРОВ Э.Г._____________

Формулируется глобальная цель системы, проводится ее структуризация по затратам на функционирование и потерям из-за ЧС. Установливается взаимосвязь затрат и потерь, определяются пути достижения цели системы, синтезируются критерии оценки эффективности их достижения.

В последние десятилетия во всем мире наблюдается непрерывный рост числа техногенных и природных катастроф и чрезвычайных ситуаций (ЧС), что ведет к социальным и экономическим потерям. Указанную тенденцию для техногенных ЧС можно объяснить непрерывным усложнением технологических процессов, стремлением повысить их эффективность за счет использования критических режимов, ростом концентрации и единичной мощности оборудования, интенсификацией всех процессов. В целом это приводит к усложнению процессов управления, повышению вероятности отказов оборудова-

степени нестационарности исследуемого объекта и уровня помех, требует проведения дополнительных исследований для выработки рекомендаций по их выбору.

Литература: 1. Растригин Л.А., Понаморев Ю.П. Экстраполяционные методы проектирования и управления. М.: Машиностроение, 1986. 120 с. 2. Sin K.S., Goodwin G. C, Bitmead R.R. An adaptive d-step ahed predictor based on least squares // IEEE Trans. Autom. Control, AC-25, 1980. Р. 1161-1165. 3. Изерман Р. Цифровые системы управления. М.: Мир. 1984. 541с. 4. Перельман И.И. Оперативная идентификация объектов управления. М.: Энер-гоиздат, 1982. 272 с. 5. Ли-БерольБ.Д., Руденко О.Г. Выбор ширины окна в алгоритме текущего регрессионного анализа // Доповіді НАН України, 1996. №3. С.69-73. 6. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1967. 575 с.

Поступила в редколлегию 06.12.1998 Рецензент: д-р техн. наук Бодянский Е.В.

Руденко Олег Григорьевич, д-р техн. наук, профессор, заведующий кафедрой ЭВМ ХТУРЭ. Научные интересы: адаптивные системы, искусственные нейронные сети. Адрес: Украина. 310166, Харьков, пр. Ленина, 14, тел. 40-93-54.

Теренковский Иван Дмитриевич, аспирант кафедры ЭВМ ХТУРЭ. Научные интересы: процессы управления. Адрес: Украина, 310166, Харьков, пр. Ленина, 14, тел. 4093-54.

Штефан Андреас, доктор-инженер, руководитель фирмы “Д-р Штефан и партнеры. Программное и компьютерное обеспечение”. Научные интересы: адаптивные системы. Адрес: BRD, D-98693, Ilmenau, Grenzhammer, 8. Tel. (3677)84-10-67.

Ода Гассан Адан, аспирант кафедры ЭВМ ХТУРЭ. Научные интересы: адаптивные системы. Адрес: Украина, 310166, Харьков, пр. Ленина, 14, тел. 40-93-54.

ния и ошибок операторов. Кроме того, рост плотности населения, повышение ценности земли приводит к заселению и хозяйственному использованию рисковых зон - сейсмо, цунами, лавиноопасных, геологически и гидрологически неблагоприятных территорий. В сочетании с интенсивным демографическим и техногенным давлением на окружающую среду это приводит к росту природных ЧС [1].

В этих условиях многие страны, в том числе Украина, создают национальные системы предупреждения и локализации ЧС. Настоящая статья посвящена системологическому анализу целей такой системы, путей их достижения и задач, которые необходимо для этого решать на региональном (областном) уровне.

Глобальной целью региональной системы предупреждения и локализации ЧС является минимизация суммарных социально-экономических потерь из-за ЧС. Эти потери состоят из следующих компонент.

1. Затраты на создание и поддержание в работоспособном состоянии системы предупреждения, локализации и ликвидации последствий ЧС. Это капитальные и эксплуатационные затраты на создание региональной, территориально-распределенной организационной специализированной системы, обучение и содержание кадров, создание и хранение запасов специальных материально-технических ресурсов.

2. Затраты на предупреждение (профилактику) ЧС.

3. Социально-экономические потери, обусловленные возникновением и развитием ЧС.

4. Затраты на локализацию ЧС, т.е. на целенаправленные действия в целях ликвидации или огра-

РИ, 1998, № 4

61

ничения развития источника ЧС, уменьшения социально-экономического ущерба.

5. Затраты на ликвидацию последствий ЧС, т.е. на восстановление пострадавших объектов хозяйствен -ной деятельности и условий жизнедеятельности населения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Обозначим каждую из перечисленных компонент затрат через C;, i = 1,5 . Тогда глобальную цель системы можно записать в виде

5

C i=Z Ci ^min- (і)

i=1

Слагаемые функции (1) взаимосвязаны между собой и имеют противоречивый характер. Очевидно, что увеличение затрат на повышение эффективности системы (С1) и профилактику (С2) способствует, при условии их эффективного использования, уменьшению социально-экономических (и особенно техногенных) последствий ЧС. Качественный характер этой зависимости показан на рис. 1. Как видно из графика, в общем случае существует некоторый оптимальный уровень затрат Со, обеспечивающий минимум суммарных потерь Р. Положение глобального оптимума Со уникально для каждой области, так как связано с количеством и характеристиками источников потенциальной опасности, площадью, плотностью населения, интенсивностью техногенного и экологического давления на окружающую среду.

Рис.1. Зависимость суммарных потерь от затрат на систему

Определение Со и для регионов, и в национальном масштабе представляет большой интерес, как идеали -зированная цель развития и совершенствования системы. Поэтому разработка моделей указанного класса имеет большое практическое значение.

Обозначим суммарные затраты на систему и профилактику

С = С1 + С2, (2)

а возможные потери

Р = Сз + С4 + С5. (3)

Очевидно, что в реальных условиях для любого планового периода анализа будет существовать ограничение

C < Cn , (4)

где Сп — плановый уровень ассигнований, при этом в подавляющем большинстве случаев Сп < Со .

С учетом (4) глобальную цель (1) можно записать в виде

р = min (C3 + C4 + C5 ) . (5)

Г' s' Г' N '

Это означает, что необходимо создать такую систему, которая при любом уровне задания ограниченных финансовых и материально-технических ресурсов С обеспечит минимизацию социальноэкономических потерь вследствие ЧС. Достижение указанной цели связано, прежде всего, с созданием эффективной организационной структуры управления процессами локализации и ликвидации ЧС. Для определения ее задач рассмотрим пути достижения глобальной цели (5).

Достижение цели (5) возможно двумя путями:

— уменьшение числа ЧС всех видов;

— минимизация суммарных потерь Р в случае возникновения конкретной ЧС.

Отметим, что первый путь зависит от решения задач предупреждения (профилактики) ЧС. В каждом конкретном случае это связано с разработкой и реализацией узкоспециальных мероприятий: совер -шенствование технологий, создание систем аварийной защиты, повышение технологической дисциплины, обучение кадров и т.д. Очевидно, что квалифицированно эти мероприятия можно спланировать и реализовать только на отраслевом (ведомственном) уровне, а контроль за ними и оценку достаточности должны осуществлять функционально-специализированные органы, такие, например, как пожарная охрана, службы: метрологии, радиационной и карантинной безопасности, котлонадзора и т.д. В стране создана достаточно эффективная система таких органов, поэтому задача уменьшения числа ЧС не входит в функцию системы. В этом случае важной является функция информационного взаимодействия со специальными службами и непосредственно с объектами для получения информации об источниках потенциальной опасности различных видов, вероятности возникновения ЧС, мощности возможного воздействия, его последствий и выработка на этой основе мероприятий по локализации и ликвидации последствий ЧС в случае их возникновения. Таким образом, служба ЧС является уникальной специализированной организацией, ориентированной на разработку и реализацию технологий локализации и ликвидации последствий ЧС любого вида. В этом же плане должна проводиться и профилактическая работа, которая заключается в разработке стандартных ситуационных планов локализации различных ЧС, подготовке кадров, информировании и обучении населения и т.д. Таким образом, основным путем достижения цели (5) является минимизация суммарных потерь Р в случае возникновения ЧС.

Проведем более подробный анализ составляющих суммарных потерь Р и установим их взаимосвязь.

Рассмотрим зависимость обобщенных социальноэкономических потерь из-за ЧС в С3 от времени ее неконтролируемого развития. В общем случае, независимо от вида ЧС, функция

C3 = F(t) (6)

может быть представлена S-образной кривой (кривая А на рис. 2).

На рис.2 момент 1сл соответствует времени самолокализации (прекращения развития) ЧС, без целенаправленного вмешательства. Например, прекращение пожара в результате сгорания всех горючих материалов, естественное окончание паводка, испарение и рассеивание до безопасного уровня разлитого ядовитого вещества и т.д. Значение CM соответствует

62

РИ, 1998, № 4

ущербу, который принесет ЧС на момент самолокализации. Конкретный вид и характеристики ЧС изменяют только значения tcn и C^1, но не качественный вид зависимости.

Уменьшение потерь в результате ЧС может быть достигнуто проведением целенаправленных мероприятий по её локализации. Обозначим время локализации ЧС через ta. Очевидно, что tл < tсл и чем оно

меньше, тем однозначно меньше потери C3 . Кроме

того, целенаправленное вмешательство в развитие ЧС в целях ее локализации изменяет характер роста потерь (кривая Б на рис. 2). На этой кривой момент tm- начало мероприятий по локализации ЧС. Таким образом, одной из задач системы является минимизация времени локализации ЧС, т.е.

tкл ^ min . (7)

Уровень затрат на ликвидацию последствий ЧС однозначно определяется уровнем и структурой ущерба, нанесенного ЧС на момент локализации, т.е. уровнем

C3 . Таким образом, переменные С3 и С5 изменяются согласованно и для минимизации С5, аналогично С3, необходимо минимизировать время t^ (7).

Рис. 2. Зависимость потерь от времени неконтролируемого развития ЧС

Локализация ЧС требует некоторых затрат сил, средств, ресурсов. Величина этих затрат обозначена С4. Она зависит от двух факторов:

— времени начала локализации ЧС;

— эффективности плана локализации.

Первое объясняется тем, что в общем случае

динамика развития любой ЧС может быть описана кривой, приведенной на рис. 3.

Это означает, что с течением времени масштабы неконтролируемо развивающейся ЧС достигают некоторого максимума и затем начинают уменьшаться. Чем меньше масштабы ЧС, тем меньше ресурсов необходимо затратить на ее локализацию. Это означает, что необходимо стремиться обеспечить

Масштаб

ЧС А

t

Рис. 3. Динамика развития ЧС

tнл ^ min, (8)

где фл — момент начала локализации.

Второй фактор — эффективность плана локализации определяет количество ресурсов Rj, которое необходимо затратить на локализацию ЧС. В реальных условиях Rj всегда ограничены некоторым уровнем Rd. Тогда с учетом (7) критерий эффективности плана локализации конкретной ЧС будет иметь вид

Тл _ min (tкл — tнл ) (9)

ReRd . (9)

Рассмотрим структуру временных затрат на интервале от момента возникновения ЧС t0 до момента окончания ее локализации tra. Можно выделить следующие основные интервалы:

At 1 — время с момента возникновения ЧС до момента поступления об этом в систему;

At2 — затраты времени на классификацию ситуации, ее первичную оценку и оповещение лиц, принимающих решение (ЛПР), всех необходимых уровней как внутри системы, так и смежных функциональных систем, например, органов внутренних дел, пожарной охраны, скорой помощи и т.д.;

At3 — временные затраты на идентификацию ситуации и прогноз ее развития;

At4 — время, необходимое на подготовку плана локализации ЧС;

At5 — время реализации плана локализации ЧС.

Функциональные действия на каждом из перечисленных этапов многоаспектны, поэтому указанные интервалы могут частично перекрываться, но в целом, согласно (8), (9), необходимо минимизировать суммарные временные затраты:

Т=|At|^ S" • (10)

Эта задача связана с эффективным использованием ограниченных ресурсов Rd..

Содержательный анализ перечисленных основных этапов действий по локализации ЧС показывает, что первые четыре из них полностью состоят в получении, накоплении, передаче и обработке информации в целях оперативной выработки эффективного решения по локализации ЧС. При этом критерием оперативности является

4

Ki = min 2 ti , (11)

І = 1

а критерием эффективности

K2 = min At5 (12)

ReRd . (12)

Достижение целей (11), (12) в определяющей степени связано с эффективностью организации и реализации информационных процессов в системе. Повышение эффективности имеет два аспекта:

— создание совершенной организационно-управляющей структуры, ориентированной на максимально возможное приближение процедур принятия решений по локализации ЧС к месту событий. Это означает повышение уровня отвтственности и полномочий низовых уровней системы;

— совершенствование системы сбора, передачи и обработки информации, что связано с комплексной автоматизацией всех информационных процессов на основе современных технологий, сбора, накопления, передачи, обработки, представления информации.

Оба указанных выше аспекта повышения эффективности системы предупреждения, локализации и

РИ, 1998, № 4

63

ликвидации ЧС тесно связаны. Кардинальное решение проблемы возможно только в рамках создания региональной информационно-аналитической подсистемы (РИАЛ) ЧС, базирующейся на широком использовании ЭВМ, передовых компьютерных технологиях, средствах связи и оргтехники.

Создание РИАЛ ЧС ориентировано на совершенствование системы управления процессами предупреждения, локализации, ликвидации последствий ЧС путем:

— обеспечения органов управления всех уровней своевременной, полной, достоверной, представленной в удобной для восприятия форме информацией о возникшей ЧС, динамике ее развития, возможных угрозах и последствиях, наличных силах и средствах;

— оперативного многоальтернативного анализа возможных решений и подготовки аргументированных предложений органам управления;

— решения задач эффективного (оптимального) использования ограниченных наличных ресурсов для реализации принятых решений по обеспечению жизнедеятельности населения, локализации ЧС, функционированию инфраструктуры и т.д.;

— оперативного управления и контроля за процессом выполнения принятых решений и коррекции возникающих отклонений.

Для этого РИАЛ ЧС должна выполнять следующие функции.

В режиме нормального функционирования народного хозяйства области:

—Обеспечивать постоянный информационный мониторинг всех объектов хозяйственной деятельности (ОХД), сил и средств, которые могут быть использованы при ликвидации ЧС. Для этого по каждому объекту создается компьютерный паспорт объекта. Такой паспорт может содержать текстовую, цифровую, графическую (схемы коммуникаций, планировки территорий и т.д.) и геоинформационную (привязка к карте) информацию. Число характеристик и объемы информации можно расширять по мере надобности. В совокупности такие паспорта образуют информацион -ную компьютерную базу данных (БД) возможных источников ЧС, сил и средств, которые можно привлечь для их ликвидации. Достоверность и полнота данных, оперативный доступ к ним обеспечиваются компьютерными технологиями сбора, хранения, обновления, обработки и получения информации.

— Информационная БД организована как трехуровневая иерархия: ОХД (только свой паспорт) -район (паспорта ОХД района плюс геоинформационная система: карта, коммуникации, инфраструктура района) — областной уровень (БД области в целом плюс геоинформационная система по области и Украине в целом).

— Осуществлять постоянный мониторинг потенциально опасных объектов.

— Проводить анализ возможных ЧС, моделировать варианты их развития, разрабатывать ситуационные опорные планы их локализации, создавать компьютерные банки таких планов на уровне ОХД, района, области.

— Обеспечивать обучение кадров и подготовку населения к рациональному поведению в условиях наиболее вероятных ЧС.

В режиме угрозы возникновения ЧС:

— Выделение угрожающих объектов и осуществление более детального (более частого по времени и

более подробного по числу контролируемых факторов) их информационного мониторинга.

— Оценка состояния и прогнозирование развития ситуации. Подготовка необходимой информации для органов управления.

— Подготовка эффективных решений по предотвращению ЧС, оценка необходимых сил и средств, постановка задач, контроль за их выполнением.

— Уточнение и развитие ситуационных планов локализации возможных ЧС с учетом текущей конкретной информации.

— Разработка ситуационных планов обеспечения жизнедеятельности населения и подготовка населения к рациональному поведению.

В режиме локализации ЧС:

— Регистрация ЧС, верификация ее характеристик, организация оперативного оповещения и информирования всех заинтересованных органов и служб.

— Установление связи с источником ЧС и организация постоянного информационного мониторинга объекта.

— Классификация ситуации, оценка ее масштабов, определение возможных угроз, формирование неотложных мероприятий, оповещение в случае необходимости населения, информирование и установление связи с функциональными службами.

— Прогнозирование ситуации и оценка отдаленных последствий.

— Подготовка управляющих решений по локализации ЧС для управляющих органов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— Расчет необходимых сил и средств.

— Планирование выполнения работ по локализации ЧС, по принятым решениям управляющих органов.

— Оперативный контроль за ходом работ.

— Подготовка оперативной информации, докладов, отчетов по требованию управляющих органов.

В режиме ликвидации последствий ЧС:

— Подготовка возможных решений по ликвидации ЧС.

— Планирование выполнения работ по принятым решениям.

— Организация оперативного контроля хода работ.

— Подготовка отчетов, справок. Разработка мероприятий по предотвращению ЧС.

Обобщенная структура и функции РИАП ЧС в различные периоды функционирования приведены выше. Эффективность РИАП ЧС зависит от глуби -ныавтоматизации и совершенства программно-аппаратных комплексов (автоматизированных рабочих мест), проблемно ориентированных на решение перечисленных функциональных задач.

Литература: 1. Быченок Н.Н. Об управлении защитой региона в чрезвычайных ситуациях / Управляющие системы и машины, 1996. № 4, 5, 6. С.93-105.

Поступила в редколлегию 16.12.1998 Рецензент: д-р техн. наук, проф. Комяк В.М.

Гиренко Петр Иванович, нач. штаба ГО и ЧС Харьковской области. Научные интересы: системы управления и принятия решений. Адрес: Украина, 310045, Харьков, Салтовское Шоссе, 73, тел. 26-20-91.

Петров Эдуард Георгиевич, д-р техн. наук, профессор, зав. кафедрой системотехники ХТУРЭ. Научные интересы: математическое моделирование, теория принятия решений. Адрес: Украина, 310726, Харьков, пр. Ленина. 14, тел. 40-93-06.

64

РИ, 1998, № 4

УДК 519.81

ВЫДЕЛЕНИЕ ОДНОРОДНЫХ СОЦИАЛЬНЫХ ГРУПП В ОРГАНИЗАЦИОННЫХ СИСТЕМАХ

ОВЕЗГЕЛЬДЫЕВ А.О., ПИСКЛАКОВА В.П.

Рассматривается задача классификации социальных групп по критерию близости матриц предпочтения факторов, определяющих поведение. Предлагается универсальная функция оценки внутригруппового и межгруппового расстояния, основанная на функции обобщенного среднего Колмогорова.

Одним из условий эффективного управления организационными системами является корректный учет и управление поведением социальных групп, являющихся элементами системы. Для этого должна

быть известна усредненная матрица A ср предпочтений факторов, характеризующих поведение группы.

При разработке процедур определения усредненного значения вектора предпочтений предполагается, что A ср вычисляется на однородном множестве

векторов индивидуального предпочтения A и . Такая однородность может быть обеспечена в следующих случаях.

1. Один ЛПР многократно принимает решения на однородном множестве ситуаций. Здесь под однородностью понимается близость по содержательной и целевой установке, по структуре характеризующих факторов и т.д.

2. Одна ситуация оценивается независимо членами группы ЛПР. В этом случае однородность предусматривает близость по целевым установкам, квалификации, информированности экспертов.

3. Из множества всех идентифицированных векторов предпочтения Aи выделены однородные, т.е. близкие по значению компонент группы.

В первом случае возникает задача типизации ситуаций принятия решений, во втором и третьем -выделения типичных групп ЛПР. Примером последних двух задач является проблема структуризации множества покупателей и сегментации рынка товаров. Каждый покупатель, совершая покупку, выступает как ЛПР, осуществляющий выбор из множества однотипных (одинакового функционального назначения) товаров. Естественно, покупатели различаются по возрасту, полу, месту проживания, душевому доходу, социальному статусу и т.д. Для принятия обоснованных маркетинговых решений необходимо выделить типичные группы покупателей. Это можно сделать двумя способами:

— сгруппировать покупателей по их объективным характеристикам и затем для каждой группы по множеству индивидуальных векторов предпочтений

A и определить усредненный Aср ;

— выделить группы близких по значению векторов Aи и затем определить группу ЛПР, которая им соответствует.

Оба способа взаимосвязаны и дополняют друг друга. Особенно важны задачи группирования при анализе сложных социально-экономических систем, таких как муниципальные, региональные и т.д. Такие системы состоят из неоднородных социальных, производственных и других групп и управление ими невозможно без четкой структуризации на типичные группы.

Независимо от содержательной постановки, все описанные выше задачи являются задачами классификации множества объектов. Они формулируются следующим образом. Задано множество сравнимых между собой объектов, т.е. таких, которые характеризуются одинаковым по количеству и смыслу набором характеристик (факторов). Это не исключает, что некоторые характеристики принимают нулевое значение. Необходимо на исходном множестве выделить близкие по значению характеристик группы объектов.

Каждый объект может быть интерпретирован как точка в многомерном (факторном) пространстве характеристик. В такой интерпретации задача классификации состоит в решении одной из следующих задач:

—разбиение факторного пространства на непересекающиеся области;

— выделение групп (скоплений) точек, основанное на естественном расслоении исходного множества.

Для данного исследования интерес представляет вторая задача, при этом для определенности, но без потери общности, будем рассматривать классификацию векторов индивидуальных предпочтений A и .

Концептуальным моментом проблемы классификации является формализация понятия “близость” объектов в пространстве характеристик и метрики, в которой она измеряется. С этой точки зрения можно выделить два основных подхода к задаче классификации.

Первый основан на предположении, что более или менее точно известны статистические характеристики генеральной совокупности и классов, которые ее составляют. Это направление наиболее глубоко разработано и опирается на мощные статистические методы, например критерии максимального правдоподобия, байесовские оценки и т.д. [1, 2].

Второй подход связан с решением задачи классификации, когда априорные статистические параметры генеральной совокупности и классов неизвестны и их невозможно определить. В этом случае задача классификации решается на основе понятия расстояния между любой парой объектов или некоторой функции, характеризующей степень близости (сходства). Подобные методы получили название непараметрических, а все направление в целом — кластеранализа или таксономии [3]. В рамках этого направления и будем рассматривать задачу разбиения множества индивидуальных оценок A и на однородные группы.

Исходная информация представляет собой множество векторов индивидуального предпочтения A ^ , j = 1, m , представленных в виде матрицы. Каждый

вектор A и может быть интерпретирован как точка в n-мерном пространстве, лежащая на плоскости

РИ, 1998, № 4

65

n

2 ai =1, где a i - компоненты матрицы индивидуаль-i=l

ного предпочтения Aи ; n — ее размерность.

Основой выделения групп должна быть близость индивидуальных векторов предпочтения. Трудность решения данной задачи состоит в отсутствии априорной информации о количестве и характеристиках возможных групп, т.е. с формальной стороны это — задача классификации (кластеризации) без учителя. Ее суть заключается в том, чтобы заданное множество многомерных точек разбить на группы, представляющие собой “сгустки” точек. Основанием для группирования служат результаты анализа внутригрупповых и межгрупповых расстояний, определенных в принятой метрике [3]. Таким образом, необходимо найти рациональные, согласно принятым критериям, число и состав групп (классов) точек, т.е. решить задачу кластерного анализа.

Конкретизация критериев классификации связана с выбором метрики и уточнением вида критерия. Здесь нужно иметь в виду следующее. Формализация практически всех этапов кластеризации основана на эвристических соображениях, что адекватно выдвижению набора аксиом, выбор которых практически предопределяет решение, т.е. число и состав классов. Кроме того, решение существенно зависит от топологии точек классифицируемого множества. Поскольку классификация проводится при отсутствии информации о числе и характеристиках классов, нет уверенности в том, что принятая аксиоматика позволит выявить действительно объективные группировки точек. Таким образом, необходимо гарантировать выбор устойчивых классификационных решений, инвариантных до некоторой степени к критериям и алгоритмам кластеризации.

Одним из путей обеспечения такой устойчивости решения, наряду с глубокой аргументацией эвристики, положенной в основу формализации, является многократное решение задачи классификации при различных критериях, метриках, алгоритмах. Если несколько решений совпадает, то с большой долей уверенности можно предположить, что они отражают некоторые объективные закономерности. В противном случае у Л ПР имеется возможность проанализировать возможные варианты классификации и сознательно выбрать единственное решение. С этой точки зрения при выборе вида критерия близости необходимо стремиться к его универсальности в том смысле, чтобы он допускал при единой форме реализацию разных метрик в пространстве классификации и различных алгоритмов. В связи с этим заслуживает внимания критерий обобщенного среднего Колмогорова [3]:

P(A,B) = F-1| — 2 2 F[T(Xi,Xj)]

[ n1n2 i єА j єВ

(1)

где р(А, В) — расстояние между классами А = {хД,

i = 1,ni , B = {xj} , j = 1 n2 ;

F — некоторый оператор, определяющий конкретный вид критерия;

n1, n2 — число элементов в классах А, В;

т(хі , Xj) — расстояние между і-ми и j-ми точками. Его вид обусловлен принятой в пространстве классификации метрикой.

Проведенные А. И. Орловым [4] исследования устойчивости классификационных решений показали, что выбор вида оператора F существенно зависит от шкалы, в которой проведены измерения. Для шкалы отношений, в которой измеряются векторы предпочтений индивидуумов, целесообразно применять логарифмические или степенные операторы. В случае использования степенного оператора F критерий (1) записывается следующим образом:

Р(А, В)

1 n1 n2

-|1/c

n1n2 i=1j=1

2 2т (Xi,xj)]

(2)

Критерий вида (2) удобен и в отношении реализации различных метрик пространства. Наиболее

часто используются евклидова метрика, т1 — супремум-, инфимум-нормы и расстояние Махаланобиса. Но все эти метрики, за исключением последней,

являются частными случаями тp -нормы вида

T(Xi,Xj)

K

2 lxki - xkjlp k=1

-l1/p

(3)

Здесь k — размерность вектора х, k = 1,K . Действительно, при р= 1 получаем т1 -норму, при р=2 — евклидово расстояние т2 , при p ^ да — супремум-

норму Tsup , а при p ^ да — инфимум-норму Tinf.

С учетом выражения (3) критерий (2) в общем случае имеет вид

P(A,B) = ■

1 n1 n2

!------2 2

І ПіПо і =1 j =

1n2 i=1j=1|_k=1

- p/c

,1/c

2 |xki - xkj|p

(4)

Критерий (4) удобен при алгоритмизации, так как позволяет определять не только расстояние между кластерами, но и внутригрупповое расстояние от любой точки. Для последнего варианта критерий (4) примет вид

P(xa,xi)

1

n -1

n

в

K

2 |xka k=1

(5)

i = 1,n ; a є i.

Здесь n — число элементов в группе.

Перейдем к выбору алгоритма кластеризации. В общем случае задача классификации (кластеризации) без учителя представляет собой комбинаторную задачу, размерность которой при достаточно большом числе классифицируемых объектов такова, что ее практически невозможно реализовать на ЭВМ. Поэтому широко распространены различные эвристические алгоритмы классификации [3, 5, 6], что позволяет создать банк алгоритмов и реализовать идею многократного решения задачи классификации. Вместе с этим анализ опубликованных алгоритмов свидетельствует о серьезном недостатке, присущем всем им: отсутствует обоснование выбора числа групп. Так, в группе дендрограммных алгоритмов [5]

66

РИ, 1998, № 4

число классов определяется критерием среза, в мак-симинном алгоритме [6] использован критерий расстояния между группами, в алгоритме ФОРЭЛЬ [3] — радиус сферы. Но во всех случаях нет рекомендаций по выбору значений критериев. Поэтому желателен подход, который хотя бы на эвристическом уровне обосновывал критерий выбора числа групп.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Такой критерий, как следует из содержательной постановки задачи классификации, должен одновременно учитывать два аспекта: плотность групп, т. е. внутригрупповое расстояние и расстояние между группами. В основу синтеза критерия в данной работе положено следующее эвристическое предположение: оптимальна по числу классов и их составу такая классификация, которая минимизирует суммарное среднее расстояние на множестве классифицируемых точек, учитывающее внутри- и межгрупповые расстояния. Отметим противоречивую тенденцию: с ростом числа групп уменьшается внутригрупповое расстояние (в пределе оно нулевое при числе элементов в группе, равном единице), но возрастает суммарное межгрупповое расстояние. Это противоречие открывает путь к построению формального критерия, позволяющего найти компромисс между числом групп и их размером (составом).

Для формализации критерия примем следующие допущения. Межгрупповым является расстояние от центра группы до центра классифицируемого множества, нормированное по числу элементов в группе, а внутригрупповым—среднее расстояние от элементов группы до ее центра. Последнее определяется как суммарное расстояние от элементов до центра группы, нормированное по числу точек в ней. Таким образом, каждый і-й кластер характеризуется показателем

Si =Tlj/ni +Pij ; j = І“П7 , (6)

где j — номер элемента группы; щ — общее число элементов в группе.

Из определения ясно, что параметр рассчиты-

вается по формуле (3), а Pij — по формуле (4). При этом в качестве центров множества и группы принимаются элементы, для которых показатель (6) минимален на всем множестве элементов и подмножестве, входящем в группу, соответственно. С учетом равенства (6) критерий классификации имеет вид

N ___

S = min zsi , i = i,n . (7)

N,Ai,xi i=i

Здесь переменные оптимизации — количество групп N, их состав Ai и положение центра каждой группы Хі є Ai.

Анализ критерия (7) показывает, что в случае, когда количество классов и места расположения их центров заданы, минимум достигается, если объекты включаются в класс, до центра которого расстояние наименьшее. Это означает, что при решении задачи классификации в критерии (7) можно перейти от трех оптимизируемых переменных к двум — числу

классов N и расположению их центров Хі , а состав

классов A і определяется однозначно по минимуму расстояния элементов до центров.

Рассмотрим зависимость значения критерия (7) от местоположения центров классов при фиксирован-

ном их числе. Если центры классов совпадают с классифицируемыми объектами, зависимость (7) — многоэкстремальная решетчатая функция. Область ее существования обусловлена числом сочетаний

CN , n — общее число элементов. Поэтому выявление глобального минимума (7) при фиксированном числе N связано с перебором всех сочетаний мест размещения центров и определением для них значений функций.

Чтобы обосновать алгоритм нахождения числа классов N, рассмотрим свойства огибающей глобальных минимумов критерия (7) как функции числа

классов S* (N).

Утверждение 1. Функция S* (N) гладкая, выпуклая вниз и ее значения при N = 1, N = n совпадают и являются максимальными.

Представим S* (N) с учетом выражения (6) в виде * N Tl. N

S (N) =z+zpij, N = 12,...,n, (8)

i=1ni i=1

где первое слагаемое — нормированное по числу элементов класса расстояние от центра i-го класса до центра классифицируемого множества элементов; второе слагаемое — сумма расстояний от элементов класса до его центра, нормированных по числу элементов. Значения функции (8) при N = 1 и N = n совпадают и равны сумме расстояний от элементов классифицируемого множества до его центра. Так,

при N = 1 имеем: т11 = 0, Pij = p1i = Тj , j = i n . При

N=n (т.е. каждый элемент являете классом) Pij = 0;

Пі = 1, і = 1,n . Таким образом, в обоих случаях

S*(N = 1) = S*(N = n) =ZT1i . (9)

i=1

Это — максимальное из всех возможных значений

функции S* (N). Выпуклость функции S* (N) вытекает из того, что первое слагаемое выражения (8) с увеличением N монотонно возрастает от нуля при N= 1 до максимального значения зависимости (9) при N=n, а второе — соответственно монотонно убывает от максимального значения функции (9) до нуля. Монотонность обеспечивается по определению кривой S* (N), как огибающей глобальных экстремумов.

Таким образом, функция S* (N) одноэкстремальна и выпукла вниз, поскольку для любого N ф 1; N ф п значение функции меньше максимального.

Утверждение 2. Минимум функции S* (N) достигается при числе классов, удовлетворяющем условиям 1 < N < п/2 для четных n;

1 < N < (n -1) / 2 для нечетных n. (10)

Здесь N — число классов, содержащих более одного элемента. Это объясняется тем, что при N<n, в силу изложенного правила отнесения к классам, группы с одним элементом существовать не могут. Этот элемент обязательно относится к классу с ближайшим центром.

Из приведенного анализа вытекает, что исходную задачу оптимизации (7) можно представить в виде

РИ, 1998, № 4

67

N

S = min min У s; /ii\

N CN ;=1 ; • (11)

Cn

He касаясь пока способа определения глобального минимума на множестве сочетаний cN при фиксированном N, отметим, что характер зависимости

S* (N) как огибающей локальных экстремумов открывает возможность построить алгоритм целенаправленного перебора, основанный на последовательном вычислении функции (8) при значениях N = 1, 2, • • ., до нахождения минимума.

Рассмотрим вычислительный аспект определения центра группы. При фиксированном числе групп N зависимость критерия (7) от местоположения их центров является многоэкстремальной решетчатой функцией. Чтобы найти ее глобальный экстремум, нужно решить комбинаторную задачу, связанную с

перебором cN сочетаний и определением для каждого из них значения функции. Такая задача очень громоздка в вычислительном отношении и при больших n практически неразрешима. Поэтому необходимо разработать эвристические процедуры, которые хотя и не обеспечивают в общем случае достижения глобального экстремума, но дают решения, достаточно близкие к оптимальным, при гораздо меньших затратах времени. Здесь возможны разные подходы, в частности, основанные на различных модификациях методов последовательноодиночного размещения, случайного поиска и т.д.

В данной работе предлагается использовать аналог метода покоординатного спуска на множестве сочетаний cN .

Рассматриваемый алгоритм осуществляет поиск местоположения заданного числа центров классов, а следовательно, и разбиение на классы, т. е. определение их состава, минимизирующего выбранный критерий качества. Задача решается путем последовательного перемещения одного центра (при фиксированном положении других) в пространстве возможных точек размещения до тех пор, пока не будет вычислен локальный по данной переменной экстремум. Затем процесс повторяется для следующей переменной (центра) и т.д. до нахождения глобального экстремума. Если не наложены ограничения на число шагов или радиус сферы возможного движения каждого центра,

то алгоритм реализует полный перебор сочетаний cN

возможного размещения N центров на n допустимых точках. Но это требует больших затрат времени. Поэтому необходимо ввести эвристические процедуры, ограничивающие перебор. Возможны различные подходы к организации такой процедуры. В данной работе принято ограничение на число шагов перемещения каждого центра, не приводящих к улучшению функции цели. Кроме того, поскольку исследуемая поверхность многоэкстремальна, для поиска глобального экстремума используется традиционный подход, основанный на многократной реализации алгоритма спуска из различных начальных приближений (точек пространства).

Описываемый алгоритм спуска может быть использован самостоятельно для решения задачи классификации при заданном числе классов N и как подпрограмма алгоритма решения более общей задачи классификации, когда N — один из оптимизируемых параметров.

Литература: 1. Рао С.Р. Линейные статистические методы и их применение. М.: Наука, 1968. 240 с.2. Овезгелъдыев А.О. Взаимосвязь задач оценивания и классификации в проблеме принятия решений / / Тр. 3 Междунар. конф. “Теория и техника передачи, приема и обработки информации”. Туапсе: Харьков, ХТУРЭ. 1997. С. 271. 3. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. М.: Статистика, 1974. 240 с. 4. Орлов А.И. Устойчивость в социально-экономических моделях. М.: Наука, 1979. 296 с. 5. Болч Б., Хуанъ К. Дж. Многомерные статистические методы для экономики: Пер. с англ. М.: Статистика, 1979. 318 с. 6. Ту Дж., ГонсалесР. Принципы распознавания образов. М.: Мир, 1978. 412 с. 7. Петров Э.Г., Аннамухамедов О.Б., Овезгелъдыев А. О. и др. Синтез информационно—вычислительного обеспечения распределенных АСПИ. Ч. 1. Методологические и инструментальные основы синтеза ИВС. Ашхабад, Изд-во АН ТССР “Ылым”, 1988. 198с.

Поступила в редколлегию 19.12.1998 Рецензент: д-р техн. наук Комяк В.М.

Овезгельдыев Атагельды Оразгельдыевич, канд. техн. наук, докторант кафедры системотехники ХТУРЭ. Научные интересы: многофакторное оценивание и многокритериальная оптимизация. Адрес: Украина, 310726, Харьков, пр. Ленина. 14, тел. 40-93-06.

Писклакова Валентина Петровна, канд.техн. наук, ст. научн. сотр., директор Центра информатизации органов управления ХТУРЭ. Научные интересы: информатизация процессов управления. Адрес: Украина, 310726, Харьков, пр. Ленина. 14, тел. 30-24-29.

УДК 519.6

ВЫБОР ПОРЯДКА МОДЕЛИ РЕГРЕССИИ

ГРИЦЮК В. и._____________________________

Рассматривается задача восстановления функции по её измерениям, содержащим случайную ошибку. Приводятся выражения для среднеквадратической ошибки прогноза при различных предположениях. Предлагаются методы выбора порядка модели, уменьшающие время сходимости.

Исследуем применение метода стохастической аппроксимации к построению оценки вектора пара-

68

метров g(n, m) є Rm . Этот метод, относящийся к вероятностным итеративным методам, позволяет решать задачи, связанные с определением условия равенства нулю математического ожидания случайной функции

g(n,m) = g(n -1, m) + у n є n,

єn = Yn-Фm(xn) g(n-1,m), (1)

где єn,Yn єRp, фm(xn)єRpxm, g(n,m)єRm . Используя адаптивный вариант метода, приводящий к сокращению числа итераций, определим условия, которым должны удовлетворять коэффициенты Y n . При условии обеспечения сходимости адаптивный алгоритм становится асимптотически эффективным, если

РИ, 1998, № 4

Y n = G/n = n-1 {e[vp f(g)]}-1,

здесь Vp (•) обозначает частное дифференцирование no g , вычисляемое при g= р . Так как Р неизвестен, то матрица [1] G заменяется на каждой итерации последней располагаемой оценкой

G(g n) = { e[v gn f(g)]}-1.

Метод будет сходиться, если известно , что Р и g n принадлежат известной прямоугольной области и удовлетворяют определенным условиям.

Итак, точки X; случайны, независимы (между собой и с помехой), равномерно распределены на [a,b] и каждая из функций ф к(х) ограничена на [a, b] .Тогда адаптивный вариант алгоритма (1) принимает вид

g(n, m) = g(n -1, m) + n-1(фm (xn)) + x

(2)

x (Yn -фm(xn)g(n -1, m)). W

Будем считать m фиксированным, обозначим

Д n = g(n, m) - g*m . Тогда из (2) получим

Д n = Д n-1 + n 1(ф m(Xn)) + x

(3)

x (rm (xn ) + Z n -ф m(xn)Д n-1) , где rm(Xn) = ф N-m(Xn)g *N-m.

Поскольку

е[(фm (x))T фm (X)] = I , е[фm (x)rm (X)] = 0 , e[Z n ] = 0 Zn не зависит от Д n-1 и xn , то

2

+

l|2

ExEzl^ 4 = Ex

(I- n-1(фm(Xn))+фm(Xn))Дn-1

+ n-2E,

(фm(Xn))+ rm(Xn)

2

+ n ExEz

^m(Xn))+Z n

“I 1 - n + °(№n-Ц2 + n 2(“n + ma2),

где

e[Z i Z T ]=5i

= 5 ijo 21

Обозначая vn = ElДn II , получаем

vn < (1 - 2n 1 + o(n 1))vn-1 + n 2(an + ma2).

Из леммы Чжуна следует , что

-1 2 -1

vn = n (am + ma ) + °(n ).

Тогда средняя интегральная ошибка прогноза

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Lm = e||(F(x) - Fm(x))f =

(4)

(5)

= E

^m(x)(gm - g(n,m)) + rm(x))

-1 2 -1

= Vn + Pm = Pm + n (am + ma ) + o(n ) ,

(6)

N

где Pm = Z (gi) > E Єn 2 = Lm +ар .

i=m+1

a2, P

можно выбрать m по критерию

Если a2, pm известны, а n фиксировано, то

ma

_ ^’“m _ + рm

1<m<m n

m = arg min_Am,Am =

(7)

+

2

<

2

и для этого m выполнить итерационный процесс (1) от 1 до n . Можно уточнить критерий (7). Если неизвестная функция F(x) представляется по системе функций ф k (x; ) на отрезке [a, b]e R, а в качестве функций используются тригонометрические полиномы с

am < 2mPm (8)

или алгебраические с am < m2рm , то, например, для (8) получаем

- ( mZ ma2

Lm ~ 1 1 + — lpm +-,

I nj n

Еє

2

n

1 + — j(a2 +Pm), р 1,

. ( m Z ma2

m = arg mi^| 1 +—lp m +-----.

1<m<m^ n j n

В случае, если a2, рm неизвестны, то для оценки

II її 2 — и м2

E|Єn|| и Lm используем єn :

їй и2 1 k и и2

e(n,m) = -£ єn-d , k < n. ki=1

Более точная оценка Еєn для системы функций, восстанавливаемой по тригонометрическим полиномам:

Е є

2

n

a

n

Еє

2

n-1

a n =|1 +

1 +

m n -1

Поэтому, применяя формулы калмановской фильтрации, получаем

Є2 (n, m) = anЄ2 (n -1, m) + yn (є2 - anЄ2 (n -1, m)),

Y = Y n-1a n (9)

in- 2 '

1 + Y n -1 a n

Выполняя рекуррентный алгоритм одновременно для всех m < m < m , выбираем порядок по критерию

m* = arg mi^_ є2(п,іп) .

m<m<m

Для вычисления (ф m(x)) + применяем методы

факторизации, где в целях сокращения времени счета используется модифицированный метод Гивенса без квадратных корней [2].

Литература: 1. Фильтрация и стохастическое управление в динамических системах / Под ред. К. Т. Леондеса. М.: Мир, 1980. 408 с. 2. Грицюк В. И. Улучшенные алгоритмы для оценки методом наименьших квадратов // Радиоэлектроника и информатика.1998. № 2(3). С 64-66.

Поступила в редколлегию 07.12.1998 Рецензент: д-р техн. наук Шабанов-Кушнаренко С.Ю.

Грицюк Вера Ильинична, канд. техн. наук, докторант ХТУРЭ. Научные интересы: стохастические системы управления. Хобби: музыка, литература. Адрес: Украина, 310726, Харьков, пр. Ленина, 14. Тел. 40-93-06.

РИ, 1998, № 4

69

УДК 621.391. 01

ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ЭНЕРГЕТИЧЕСКИХ РЕСУРСОВ МНОГОПОЗИЦИОННОГО РАДИОЛ ОКАЦИОНОГО КОМПЛЕКСА В РЕЖИМЕ СОПРОВОЖДЕНИЯ ВОЗДУШНЫХ ОБЪЕКТОВ

роения и p-м типе зондирующего сигнала активной позиции; Hijr(tk) — матрица измерений;

(AZijrp(tk), tk є(10,Д , -,tL)} — гауссовская белая последовательность с нулевым средним и ковариационной матрицей Rijrp (tk).

На элементы матрицы управления налагаются ограничения:

uijrp =!°; i= 1,2,..., N; j = 1,2,..., M; r=1,2,...,K;

ijrp 11, j

ПИСКУНОВ C.H., РЕШЕТНИК B.M., КОВАЛЕНКО А.И.

Разрабатывается метод управления распределением энергетических ресурсов многопозиционного радиолокационного комплекса (МП РЛК) в режиме сопровождения воздушных объектов, который позволяет оптимальным образом организовать радиолокационные наблюдения и значительно повысить пропускную способность МП РЛК.

p = 1,2,... ,P; k = 0,1,... ,L -1; (3)

M K P

E E E uijjp(tk)< 1, i = 1,2,.,N; k = 0,1,...,L-1; (4)

j=1r=1p=1 N M K P

E E E E ^иэл. ijrpl (tk) < Pиэл.доп. l (tk); (5)

i=1 j=1r=1p=1

В отличие от однопозиционных радиолокаторов при создании многопозиционных радиолокационных комплексов возникает необходимость совместного управления разнесенными в пространстве позициями. Однако несмотря на значительное число работ, связанных с построением многопозиционных систем, вопросы управления такими комплексами требуют дальнейшего изучения [1].

Рассмотрим задачу оптимального управления распределением энергетических ресурсов пространственного некогерентного МП РЛК в составе л приемопередающих позиций при сопровождении N разрешенных объектов. Модель изменения состояния каждого объекта представляется уравнением

©i(tk+1 ) = фi(tk+1,tk)©i(tk) , i = 1,2,...,N , (1) где ©i(tk) — вектор состояния i-го объекта;

ф i(tk+1,tk) — оператор экстраполяции. Модель измерений МП РЛК имеет вид

(tk) = uijrp(tk) Hijr(tk)©i(tk)+AZijrp(tk)

Z

Hip!

r = 1,2,..,K; p = 1,2,...,p; uijrp (tk )є V. (2)

Здесь uijrp (tk) — элемент матрицы управления

U(tk) ,а V — множество допустимых управлений.

Конкретный состав управляемых параметров может быть принят следующим [1]:

вид режима работы МП РЛК (автономный, кооперативный, полный и т.д.), j = 1,2,. ..,M;

тип структуры построения МП РЛК (количество позиций в комплексе, номера передающих и приемных позиций), r = 1,2, ...,K;

тип зондирующего сигнала активной позиции МП РЛК, p = 1,2,..., P.

Остальные обозначения в (1) и (2) имеют смысл: Zijrp — вектор объединенного замера координат і-го объекта при j -м режиме работы, r-й структуре пост-

N M K P

E E E E Aruijrp(tk) < л , k = 0,1,.,L-1 (6)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i=1 j=1r=1p=1

где Pиэл.д0п.l (tk) — допустимый энергетический ресурс, выделенный l-й позиции МП РЛК в момент времени tk ; Ar — число активных позиций в r - ой структуре построения МП РЛК.

Требуется наилучшим образом организовать сопровождение N объектов посредством МП РЛК на

заданном временном интервале [to, tL ] в смысле обеспечения минимальных ошибок оценивания параметров их движения к заданному рубежу исполь -

зования информации tp ^ tL.

Известно [2], что подобные постановки приводят к задачам управления наблюдениями, где в качестве управляемых систем выступают ковариационные матрицы ошибок параметров наблюдаемых объектов

^(tk+1,tk).

В качестве критерия оптимальности выберем минимум скалярного функционала

где Bi (tp) — матрица штрафов за ошибки оценок параметров і-й цели в момент использования информации tp; ^(tp,tL) — оператор экстраполяции с

момента окончания сопровождения tL на момент использования информации tp.

В результате решения задачи должны быть сфор -мированы массивы матриц U(tk) на каждый такт работы МП РЛК с указанием режима работы, структуры построения и типа зондирующего сигнала по каждой из сопровождаемых целей, элементы которых должны удовлетворять ограничениям (3)-(6) и минимизировать функционал (7).

70

РИ, 1998, № 4

Сформулированная экстремальная задача является задачей оптимального управления со свободным правым концом, в которой элементами фазового

пространства выступают матрицы уU (t k+1, t k).

Для решения такой задачи применим принцип минимума [3], трансформированный к рассматриваемому фазовому пространству.

Чтобы упростиь запись уравнения, введем обозначения:

ф (tk+i,tk) = ФЦФi (tk+i>tk)> і = 1,2,---,N|;

* U(tk+i,tk) = diag

У U(tk+1>tk)>

i = 1,2,.,N ;

DU(tk) = diagD U(tk),

i = 1,2,..., N

B (tk) = diag[Bi (tk), i = 1,2,., N]; где

M K P ,

DJ1(tk) = 2 2 2 {Uijrp(tk)Hijr(tk) Hijr(tk)yU(tk,tk-1) j=1r=1p=1l

N M K P

+ 2 2 2 2 Uijrp(tk)xijrpj (tk)- (13)

i=1 j=1r=1p=1

Здесь X о — составляющая гамильтониана, не зависящая непосредственно от управления;

Xijrp(tk) = -Sp{фi(tk+1,tk)^iU(tk,tk- 1)H[jr(tk) x

-|—1

Hijr(tk)^iU(tk,tk—1)Hrjr (tk) + Rijrp(tk) Hijr(tk)

x

x TjU(tk,tk—1)фі(tk+1,tk)Pi(tk+1)} - производная гамильтониана X по элементу Uijrp(tk) матрицы управления U(tk).

Учитывая бинарность переменной Ujjrp(tk) и

линейность гамильтониана (13) по управлениям, окончательно имеем следующее условие минимума гамильтониана:

Hijr(tk) + Rijrp(tk)

-і—1

Hijr(tk)!

С учетом введенных обозначений задача оптимального управления принимает вид

I =

Sp[BT (tp)d4p,tL)'kU(tL,tL—1)Фт (tp,tL)

^min ; (8)

{u}

* U(tk+1,tk) = ф(tk+1,tk) * U(tk,tk—1)фТ (tk+1,tk) —

—®(tk+1,tk)^U(tk,tk—1)DU(tk)^U(tk,tk—1)фТ (tk+1,tk) ;(9)

* U(t1,t0) = Ф(tl,tо) *0ФТ (t1,t0) (10)

при ограничениях (3)-(6).

Для применения принципа минимума запишем оптимизируемую систему в разностном виде:

F[* U(tk,tk—1),U(tk)

* U(tk+1,tk) — * U(tk,tk—1) =

= ф(^+1, tk )*U(tk, tk—1)фТ (tk+1, tk) — * U(tk, tk—1) —

— ®(tk+1,tk)*U(tk,tk—1)DU(tk)*U(tk,tk—1)фТ (tk+1,tk)-

(11)

Гамильтониан X для системы (11) и функционала (8) имеет вид

X

*U(tk,tk—1),P(tk+1),U(tk)] = Sp{F[*U(tk,tk—1),U(tk)

x

x P Т (tk+1)}

(12)

где P(tk+1) = diag[Pi(tk+1),i = 1,2,.,n] - матрица

сопряженных переменных.

Легко показать, что гамильтониан X может быть представлен в виде

X[* U(tk,tk—1),P(tk+1),U(tk)

= X 0 +

N M K P

Z(tk) = 2 2 2 2 Uijrp(tk)Xijrp(tk) ^ min (14)

i=1j=1r=1p=1 {u}

при ограничениях (3)-(6).

Задача (14) решается известными методами бинарного линейного программирования [4].

Нахождение оптимальных уравнений на весь

интервал сопровождения целей [to,tL ] осуществляется методом последовательных приближений [5].

Проведенное математическое моделирование показало , что разработанный метод управления наблюдениями увеличивает пропускную способность МП РЛК на 20-40% по сравнению с существующими [1].

Литература: 1. Черняк В.С., Заславский Л.П., Осипов Л.В. Многопозиционные радиолокационные станции и системы // Зарубежная радиоэлектроника. 1987. № 1. С. 969. 2. Григорьев Ф.Н., Кузнецов Н.А., Серебровский А.П. Управление наблюдениями в автоматических системах. М: Наука, 1986. 289 с. 3. Athans M. The Matrix Minimum Principle // Information and Control. 1968. № 11. Р.592-606. 4. Зайченко Ю.П. Исследование операций. К.: Вища шк, 1988. 324 с. 5. Крылов И.А., Черноусько Ф.Л. Алгоритм метода последовательных приближений для задач оптимального управления // Журн. вычислит. матем. и ма-тем. физики. 1972. Т.12. №1.

Поступила в редколлегию 27.10.1998 Рецензент: канд. техн. наук Тарасов С.А. Пискунов Станислав Николаевич, аспирант ХВУ, научный центр ВВС и ПВО. Научные интересы: оптимизация процессов управления. Хобби: растениеводство. Адрес: Украина, 310052, Харьков, ул. М. Конева, 13, кв. 28, тел. 43-14-54.

Решетник Виктор Михайлович, канд. техн. наук, старший научный сотрудник ХВУ, научный центр ВВС и ПВО. Научные интересы: оптимизация процессов управления. Хобби: микроминиатюра. Адрес: Украина, 310036, Харьков, ул. 23 Августа, 4, кв. 31, тел. 43-14-54.

Коваленко Андрей Иванович, канд. техн. наук, старший научный сотрудник ХВУ. Научные интересы: оптимизация процессов управления. Хобби: экзотические животные. Адрес: Украина, 310036, Харьков, ул. Ахсаро-ва, 13, кв. 266, тел. 43-14-54.

РИ, 1998, № 4

71

УДК 519.21/23

ВЗАИМОДЕЙСТВУЮЩИЕ МАРКОВСКИЕ СИСТЕМЫ С ДОМИНИРУЮЩИМИ СВЯЗЯМИ

ГЕРАСИН С.Н.

Рассматривается вопрос о нахождении асимптотик решений системы уравнений Колмогорова для двух взаимодействующих марковских систем, связи между которыми значительно превышают соответствующие характеристики компонент.

Анализ различных производственных ситуаций часто приводит к рассмотрению стохастических систем, процессы в которых по своим свойствам мало отличаются от систем, описываемых марковскими процессами. При этом в таких системах зачастую можно выделить подсистемы, обладающие тем же свойством — процессы в них мало отличаются от марковских. Указанные подсистемы объединяются в единое целое посредством связей. Во многих случаях эти связи малы по сравнению с соответствующими характеристиками взаимодействующих систем. Однако довольно часто они превалируют над соответствующими характеристиками подсистем. Рассмотрению последнего случая посвящена данная статья.

Рассмотрим следующую задачу. Пусть имеется два марковских процесса с конечным числом состо -яний, поведение которых описывается системами прямых уравнений Колмогорова для вероятностей состояний [1]

Pl(t) = Рі(1)Лі, P2(t) = P2(t)Л2 .

Здесь Pi(t),P2(t) — вектор вероятностей состояний размерности n и m соответственно. Матрицы Л1 и Л 2 принято называть квазистохастическими. Элементы A j этих матриц определяются через переходные вероятности по формулам

Aij = lim ^ 0,i * j, Aii = limPll(]|) 1 ^ 0. h^0 h h^0 h

Кроме того, предполагается, что

2 A ij = A i, j*i

т.е. сумма всех элементов каждой строки равна 0. Дополнительно будем считать, что рассматриваемые процессы эргодические. Это означает, что спектры матриц Л1 и Л 2 обладают особенностями. Действительно, среди собственных значений матриц Л1 и Л 2 имеется ноль, причем он имеет простую кратность, остальные собственные значения должны иметь отрицательные действительные части. Предположим, что матрицы Л1 и Л2 зависят от переменной t так, что в каждый фиксированный момент времени отвечающие им процессы остаются эргодическими. Системы

Pi(t)=Pi(t)Ліа) , (і)

P2(t) = P2(t) Л2« , (2)

можно записать в едином виде следующим образом: P(t) = Ai(t)P(t), (3)

где P(t) — вектор размерности (n + m) вида

P(t) = (Pi(t);P2(t)) , а матрица Ai(t) имеет блочнодиагональную структуру:

Ai(t)

( T Л

Л^) 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

v 0 ,

Т — символ транспонирования.

Заметим, что Ai(t) не является матрицей эргоди-ческого процесса, поскольку имеет среди собственных значений ноль кратности два. Этот факт проверяется непосредственно. Допустим, что оба изучаемых процесса взаимодействуют между собой, причем связи между ними значительно больше, чем соответствующие связи взаимодействующих процессов. В этом случае моделью полученной взаимодействующей системы является

P(t) = (Ai(t) + raA0(t))P(t), (4)

где A0(t) — матрица, определяющая взаимодействие между процессами; ю — большой параметр. Система (4) также определяет некоторый эргодический процесс, следовательно, спектр матрицы Ai(t) + roA 0(t)

отличается от спектра матрицы Ai(t) : ноль является ее простым собственным значением.

Разделим обе части уравнения (4) на щ , в результате получим уравнение с малым параметром

-i

в = ю при производной

sP(t) = (A0(t) +Ai(t)B)P(t) . (5)

Методы решения систем типа (5) изложены в работах [2—4]. Найдём линейно-независимую систему решений (5) в предположении, что спектр матрицы A0(t) прост. Опишем процесс нахождения ВКБ — асимптотик решения системы (5). Пусть b0(t) — простое собственное значение матрицы A0(t), а

V0(t) — отвечающий ему собственный вектор. Решение системы (5) будем искать в следующем виде:

P(t, в) = exp

-1

t

J b0(s)ds t0

2 Ci(t)Bi i=0

(6)

здесь Ci(t) — неизвестные вектор-функции размерности (n + m). Решение системы (5) определяется видом этих вектор-функций. Подставим выражение (6) в уравнение (5) и соберем слагаемые при соответствующих степенях малого параметра. В результате получим следующий набор равенств ( в целях упрощения записи зависимость от времени будем опускать):

в0 (A0 - b0i)C0 = 0 , (7)

в1 ( -b0i)C0 = C0 -A1C0, (8)

в«+1 (0 -b0i)+1 = Ci -AiCn . (9)

72

РИ, 1998, № 4

Пусть Vo(t) — собственный вектор матрицы A o(t), отвечающий собственному значению bo(t). Тогда из

равенства (7) следует, что Co = 90vo , где <po(t) — скалярная функция, подлежащая определению. Поскольку Co входит и в (8), то для разрешимости (8) необходимо и достаточно, чтобы правая часть (8)

была ортогональна вектору Vo*(t) , который является собственным вектором сопряженной матрицы *

A (t) и отвечает собственному значению bo(t):

Co - AiCo±Vo*, (10)

(A* - bo1)Vo* = o.

Из (10) получаем

(Ф0' vo + Ф0v0'_A1Ф0v0, Vo*) = o .

*

Учитывая биортогональность Vo и Vo , имеем

Ф0'+Фo(vo'-A1vo. Vo*) = o . (11)

Решая уравнение (11), найдем фo(t), а вместе с

тем и Co(t), удовлетворяющие уравнениям (7), (8). Действуя по индукции, будем считать векторы Co,Ci,...,Cn _i известными. Получим теперь алгоритм для нахождения вектора Cn .

Из уравнения

(Ao _ bo1)Cn = Cn_1 _ A1Cn_1 (12)

найдем Cn , обозначим его Cno и заметим, что Cno, вообще говоря, не удовлетворяет (9). Будем искать Cn в виде

Cn = Cno +Фпvo . (13)

Вставим (13) в уравнение (8) и потребуем ортогональности правой части (8) вектору vn*:

Cn _ A1Cn^v0,

l

(Cn +Фп vo +Фпvo _ A1Cn _ МФп^ vo*) = o ,(14)

l

(Cn + A1Cno. vo*) + Фп +Фп(vo _ A1vo. vo*) = o .

Последнее слагаемое в (14) равно нулю ввиду условия (10). Таким образом, уравнение для определения фп , а значит и Cn имеет вид

I

Фп =^(A1Cn° _ Cn , vo), (15)

здесь Cno определяется индуктивно.

Описанный выше процесс нахождения асимптотики можно связать со всеми простыми собственными значениями матрицы Ao . Тогда решения

1t

Pk(t,e) = l ej bk(s)ds(Co + C1S+...),

o

k = o,n + m _ 1

образуют фундаментальную систему решений системы (4).

Опишем теперь процесс построения асимптотик для решений системы (1), соответствующих собственному значению, кратность которого в области изменения t сохраняется и больше единицы.

Итак, b(t) — собственное число кратности l >1. Решение системы (5), соответствующее этому собственному значению, будем искать в том же виде (6).Тогда уравнения (7) и (9) примут вид

(Ao _ b1)Co = o, (16)

(Ao _ b1)Cn+1 = Cn _ A1Cn , (17)

для нахождения векторов Cn(t) следует решать

систему (17). Как и ранее, будем искать Cn так, чтобы система (17) была разрешима. Сначала опишем процесс нахождения вектора Co .

Пусть

Р

Co = Z di vi , (18)

i=1

где v i(t) — собственные векторы, отвечающие собственному значению b(t), а d i (t) — неизвестные скалярные функции.

Для того чтобы система (17) имела решения при n = o, достаточно потребовать выполнения условия

((Co _ A1Co), v*) = o, i = 12,...,l. (19)

Здесь vi (x) — собственные векторы матрицы a0 , отвечающие собственному значению b(x) и биортогональные векторам vi(x) :

(v i, v j*) = 5 ij(i,j = 12,...,l).

Для определения неизвестных функций d i (t) подставим (18) в (19). В результате получим систему дифференциальных уравнений

, l

di = Zdi((vj _A1vj),vl), i = 12,...,l. (20)

j=1

Пусть (d1i, d2i,..., dli) (i = 12,..., l) линейно-не-

зависимые решения системы (20). Им соответствуют l линейно-независимых векторов Coi(t),..., Col(t) .В отличие от уравнения (11) система (20) не интегрируется в квадратурах, поэтому ее следует решать числено одним из известных методов, например, Рунге—Кутта. Заметим, что система (20) не содержит малого параметра и ее порядок меньше, чем порядок исходной системы, в противном случае матрица системы (1) скалярна .

Процесс нахождения функции Co,Cp...,Cn осуществляется по индукции. Допустим, что функции Co,Cp...,Cn _1 найдены. Тогда из (17) можно найти

Cn и учесть, что для разрешимости этого уравнения необходимо и достаточно выполнения условия

((Cn ' _A1Cn), vj*) = 0 (n = 0,1,2,..., j = 1,...,l). (21)

РИ, 1998, № 4

73

Вектор Cn будем искать в виде

l

Cn = Zn + Ефіс0і, (22)

i=1

где ф i(t) — неизвестные скалярные функции, а

Zn(t) — частное решение системы (19). Вставим (22) в уравнение (21), в результате получим

((Zn - A1ZnX vj) +

+(Е Фі c0u vji) + Ефі(С0і - а1С0Ь j = 0 .

i=1 і=1

Но последнее слагаемое ввиду (21) равно нулю. Учитывая биортогональность Соі и vj, получаем

г г

фі = (A1Zn — Zn ; vj) . (23)

Система(23) сводит нахождение векторов Cp.. .,Cn к интегрированию. Таким образом, если на всём временном интервале матрица А0 сохраняет постоянную кратность своих собственных значений, то такие асимптотические разложения можно построить для всех собственных значений.

Выводы. Построение ВКБ — асимптотик решений системы уравнений Колмогорова для взаимодействующих марковских процессов позволяют исследовать поведение вероятностей состояний Pj (t) и

переходных вероятностей Pij (t) в любые моменты времени, т.е. до выхода на стационарный режим. Кроме того, описанный подход позволяет делать качественные выводы о поведении решений при изменении связей между системами.

Литература: 1. Баруча—РидА.Т. Элементы теории марковских процессов и их приложения. М.: Наука, 1969. 512 с. 2. Базов В. Асимптотические разложения решений обыкновенных дифференциальных уравнений. М.: Наука, 1968. 464 с. 3. Герасин С.Н. Расчет вероятностей состояний при взаимодействии марковских процессов// Дифференциальные уравнения и прикладные задачи, Тула, 1995. С. 123—127. 4. Дикарев В.А. О приведении к простейшему виду системы линейных дифференциальных уравнений с малым параметром при производной // Дифференциальные уравнения, 1977. Т.13, №8. С. 1384-1389.

Поступила в редколлегию 30.11.1998 Рецензент: д-р физ.-мат. наук Яковлев С.В. Герасин Сергей Николаевич, канд. техн. наук, доцент кафедры высшей математики ХТУРЭ. Научные интересы: теория вероятностей и ее приложения, стохастический анализ, теория процессов Маркова. Адрес:Украина, 310166, Харьков, пр. Ленина, 14, тел. (0572) 40-93-72. e-mail: [email protected].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

74

РИ, 1998, № 4

КОМПЬЮТЕРНАЯ ИНЖЕНЕРИЯ И

ДИАГНОСТИКА

УДК 681.321:519.713

КОЛИЧЕСТВЕННЫЕ ОЦЕНКИ ТЕСТОПРИГОДНОСТИ ЦИФРОВЫХ УСТРОЙСТВ НА

СХЕМОТЕХНИЧЕСКОМ УРОВНЕ

КРИВУЛЯ Г. Ф, АЛЬ-МАТАРНЕХ РАМИ, ШКИЛЬ А. С.

Рассматривается выбор и вычисление оценок тестопригодности для цифрового устройства, которые характеризуют затраты на построение диагностического обеспечения (ДО) и позволяют определить участки схемы, вызывающие трудности при цифровом диагностировании детерминированными методами.

Моделью устройства при подсчете таких оценок является граф, узлы которого — простейшие элементы (ПЭ) устройства, а дуги - функциональные связи между ПЭ. Вершина графа ассоциируется не с корпусом микросхемы , а с группой функционально связанных ее выходов. Один и тот же выход может входить только в одну группу, а некоторый вход -в различные группы входов. Для каждого ПЭ задается кубическое и D - покрытие (пример покрытий для D- триггера приведен в табл. 1).

Для подсчета оценок тестопригодности цифрового устройства введем ряд коэффициентов, характеризующих ПЭ:

W- коэффициент абсолютной сложности ПЭ, который для одновыходовых ПЭ относится к самому элементу, а для многовыходовых- к его выходу; V -коэфициент сложности транспортирования сигнала через ПЭ, который определяет затраты на продвижение сигнала от внешнего входа элемента до его выходов с учетом сложности ПЭ.

Указанные коэффициенты более точно характеризуют затраты на построение ДО детерминирован -ными методами и требуют меньших затрат на подсчет, чем известные управляемость и наблюдаемость [1,2]. Это обусловлено двумя причинами. Во-первых, для многовыходовых ПЭ количество альтернативных вариантов подсчета 0 (1) управляемости становится соизмеримым со сложностью проведения прямой (обратной) импликации. При этом требуются значительные затраты памяти для хранения всех промежуточных результатов. Во-вторых, управляемость и наблюдаемость не учитывают сложность самого ПЭ, а определяются лишь минимальным или максимальным значением. Следствием этого может

быть то, что управляемость (наблюдаемость) некоторого очень сложного ПЭ окажется соизмеримой с управляемостью (наблюдаемостью) гораздо менее сложного ПЭ. Для детерминированных методов построения ДО такое соотношение не отражает истинных затрат на обработку ПЭ различной сложности. Коэффициент W для ПЭ, закон функционирования которого задан в табличном виде (кубическое покрытие), связан с количеством строк в покрытии и количеством существенных переменных в кубах. Он может быть подсчитан по формуле m

W = X PiTi . (1)

i = 1

Таблица 1

D-ТРИГГЕР Входы Выходы

Кубическое покрытие ~s D C ~R Q ~Q

1 X к 1 S S

1 X L 1 S S

1 X L 1 B B

1 X K 1 B B

1 0 F 1 0 1

1 1 F 1 1 0

1 X X 0 0 1

0 X X 1 1 0

0 X X 0 1 1

d-покрытие 0 X X 1 1 0

1 X K D D D

1 X X 0 0 1

D X к 1 D D

1 D F2 1 D2 ~D2

0 X X 1 1 0

1 0 ~D 1 D ~D

1 X X 0 0 1

1 1 ~D 1 ~D D

1 0 F 1 0 1

1 1 ~D 1 ~D D

1 1 F 1 1 0

1 0 ~D 1 D ~D

V-коэффициент ' транспортируемости 6 8 32 6 1 1

W-коэффициент сложности 1 1 1 1 26 26

В табл. 1 : X - произвольное состояние; S - сохранение состояния; L - задний фронт; F - передний фронт; B -запрещенная комбинация; K - неизменное значение на входе; ~ - инверция, где Pi - плотность i-го куба (количество входных переменных ПЭ, не равных х); T) -количество двоичных тактов, реализуемых некоторым кубом покрытия; m- количество кубов в покрытии.

Так как не все входы ПЭ одинаково влияют на его выход, введем нормирующий коэффициент R(, характеризующий весомозначность некоторого входа ПЭ: m

X LiTi

R t = —------, (2)

m

X Ti

i=1

где t = 1, n ; n - количество входов ПЭ;

РИ, 1998, № 4

75

1 при ait ф x, ait - элемент некоторого куба ;

Ll [0 при ait = x.

Для многовыходовых схем коэффициент W подсчитывается для каждого выхода по формуле (1), но суммирование производится только по тем кубам, значение выхода которых не равно X. Таким образом, для каждого ПЭ формируется вектор—строка, на координатах выходов которой располагаются Wj, а на координатах входов — нормирующие коэффициенты R(.

Перед изложением способа подсчета V для ПЭ отметим, что в общем случае существует несколько условий транспортирования от некоторой входной переменной ПЭ к его выходам. При подсчете коэффициента V для каждого условия транспортирования можно подсчитать свою сложность и соответственно иметь несколько коэффициентов V, которые в дальнейшем будем называть альтернативными.

Такой подход аналогичен подсчету управляемости схемы. Если рассматривать табличный способ задания закона функционирования ПЭ, то отображением понятия условия транспортирования (условие активизации) на языке кубических покрытий является D - куб (D - вектор). Для комбинационных схем (КС) условие транспортирования записывается в виде одного D-куба, а для последовательностных схем- в виде кратного D-куба или неразрывного сегмента (НС) [3]. В этом случае плотностью D-куба Pl назовем количество его входных координат, кроме активной, не равных х. Плотность двоичного куба, входящего в НС, аналогична предыдущему определению плотности. Под Tl в случае анализа условия транспортирования будем понимать количество двоичных тактов, деленное на 2, за которое осуществляется продвижение символа активизации от внешней входной переменной ПЭ до его выходов. Если же условие транспортирования записано в виде нескольких кубов (D-кубов), то Ti считается для

каждого куба своим, i = 1,B, где B - количество кубов в НС. Деление на 2 необходимо в связи с тем, что для простоты вычисления реализация D - вектора принята за 1 временной такт.

Определим затраты на транспортирование сигнала через ПЭ по некоторому j - му входу (j = і, n), где n - количество внешних входов схемы, по следующей формуле:

Vj = X Zfi.Pi,i.f2.Ti,i ; (3)

i=1 i=1

здесь В — количество кубов в первом условии транспортирования; G — количество условий транспортирования; f1, f2—нормирующие коэффициенты, задающие соотношения между ценой затрат машин -ного времени и оперативной памяти при реализации детерминированного алгоритма активизации путей в схеме. В простейшем случае f1 = f2=1. Для комбинационных схем Til=1. Если же рассматривать несуммарный коэффициент сложности транспортирования отдельно, то формула (3) преобразуется к следующему виду: B

Vj = Xf1.Pi.f2.Ti . (4)

i = 1

Аналогично введению коэффициента нормировки входов Rt введен коэффициент нормирования

выходов S( t = 1, k ), где k - количество выходов ПЭ. Коэффициент St указывает степень существенности по D различных выходов в каждой группе выходов. Для каждого выхода подсчитывается количество символов D на j - м входе, а затем среди всех сумм выбирается максимальная. Тогда формула вычисления St будет следующей: m

St

X l

i = 1

i,t

(5)

max

X li

i=1

i,t

L it = J 1, если ait = D или aijt= D ; [ 0 - в противном случае,

ait — значение координаты покрытия t-го столбца i-й строки. Отметим, что 0< St <t.

Таким образом, каждому D-покрытию можно поставить в соответствии вектор - строку, в которой на координатах входов ПЭ находятся коэффициенты Vj, а на координатах выходов- коэффициенты St.

Коэффициенты Wj и Vj для D - триггера приведены в табл. 1.

Существует ряд стратегий подсчета транспортируемости схемы цифрового устройства. В основе любой стратегии подсчета транспортируемости V, аналогично управляемости или наблюдаемости, лежит выбор минимальной, максимальной или усредненной суммы частотных коэффициентов на каждом простейшем элементе схемы. Если выбирается минимум, то данный расчет показывает лучший случай соотноше -ния сигналов при анализе схемы. Если выбирается максимум, то рассчитывается худший случай соотношения сигналов в схеме. При выборе усредненного значения рассматривается средний случай между минимумом и максимумом.

Здесь и в дальнейшем все подсчеты будут вестись для лучшего случая и соответственно выбираться будет минимум. Эти соотношения будут указывать на минимально возможные затраты при анализе цифрового устройства. Отметим, что Cjt - затраты на транспортирование сигнала для i-го входа ПЭ (при вычислении Cj для j-го выхода ПЭ); Vе- коэффициент транспортирования через ПЭ без учета сложности самого ПЭ;

Vie = Li Ti,

где i= 1, n; n - количество входов ПЭ; Ti -количество тактов для транспортирования по i-му внешнему входу на выход;

0, если i - й вход несущественен в некотором условии транспортирования,

Li = J

1, если i - й вход существенен в условии транспортирования.

Рассмотрим две стратегии подсчета Cj для некоторого ПЭ. Одну из них назовем альтернативной, другую - интегральной.

Альтернативная стратегия заключается в том, что каждое условие транспортирования для j - го выхода ПЭ записывается в виде отдельной альтернативы.

76

РИ, 1998, № 4

Для каждой из альтернатив вычисляются затраты на транспортирование Са :

С| = ictyf, (6)

i = 1

где k— номер альтернативы. Затем вычисляется Cj, как цена лучшей альтернативы:

Cj = min Ck, (k = 1,A) ; (7)

здесь А— общее количество альтернатив для j—го выхода.

По альтернативной стратегии вычисляются уп— равляемость и наблюдаемость в известных методах. К ее недостаткам можно отнести, во—первых, слож— ность составления отдельных альтернатив и трудно— сти автоматизации этого процесса; во—вторых, дан— ная стратегия не учитывает сложности самого ПЭ. Для очень сложного ПЭ может существовать одно простое условие транспортирования и оно будет выбрано при вычислении Cj по формуле (7). В результате функционально очень сложный участок, для которого существует много различных альтерна— тив транспортирования, по затратам Cj окажется соизмеримым с простейшим участком схемы, имею— щим только одну альтернативу. Область применения указанной стратегии — это анализы схемы для ручного построения тестов, сложных ПЭ для их функционального тестирования, участков схемы для их последующей реконфигурации.

Применение альтернативной стратегии для оцен— ки затрат на анализ схемы детерминированными методами не дает нужного результата, так как в этом случае происходит перебор всех условий транспорта— рования, на что необходимы ресурсы времени и оперативной памяти. Поэтому при анализе затрат на детерминированный метод построения ДО необхо— димо применять иную стратегию, которая бы учиты— вала все условия транспортирования, существующие для рассматриваемого ПЭ.

Сущность интегральной стратегии заключается в том, что для каждого i—го входа ПЭ подсчитывается коэффициент Уі. Подсчет может вестись по формуле (3) или по какому—либо другому методу, если закон функционирования ПЭ задан не в табличном виде. В этом случае вычисляются Cs — затраты на транс— портирование от каждого существенного входа до j — го выхода ПЭ и затем из всех

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

C = Vi + Ct (i = 1k),

где k—количество существенных входов ПЭ, выби— рается лучшая:

Cj = minCS . (8)

Понятие существенности входа связано со страте— гией подсчета Cj для всех линий схемы. Если, допустим, считается Cj для некоторой линии схемы

( относительно внешних выходов ), то на К—м ПЭ существенными окажутся те внешние входы, в соб— ственные подграфы которых входит j —я линия. Если в рассмотренном случае схема имеет древовидную структуру, то выбор min Qs производиться не будет, так как на каждом ПЭ будет только по одному существенному входу (i=1).

Рассмотрим применение интегральной стратегии для подсчета транспортируемости при табличном способе задания закона функционирования ПЭ. Для каждого ПЭ схемы вычисляются коэффициенты W и У по таблицам, отображающим з; кон функциони— рования схемы. Для каждой линии схемы вычисля— ется ее абсолютный вес по коэффициентам W для всех ПЭ. При этом веса W для линий внешних входов принимаются равными 1. Для вычисления Wj (i = 1,B, где В — количество линий схемы) справедлива следующая формула:

Wj = ZWiRi+Wf5 ; (9)

i=1 j

здесь n — количество входов ПЭ. В формуле (9) W^6— сложность выхода ПЭ, соответствующего j—й линии схемы, предварительно вычисляемая по той же фор— муле для отдельного ПЭ. Сложность транспортиро— вания для j—й линии схемы вычисляем следующим образом:

Cj = min (Ck + VkSj + Z Wi) (k=1,m), (10)

i ф k i=1

где m — число существенных входов ПЭ. Формула (9) может иметь и другой вид:

Cj = min ((Ck + Vk)Sj + ZWi) (k=1,m) . (11)

i ф k i=1

Интегральная стратегия подсчета затрат на транс— портирование Cj используется для подсчета двух характеристик транспортирования Сдр и Собр Спр характеризует затраты на транспортирование от лю— бого из внешних входов до j—й линии схемы, т. е. минимальные затраты, с помощью которых можно активизировать линию j. Эта оценка по своим свойствам аналогична управляемости. При подсчетах Сдр в начале существенными принимаются все вход— ные линии схемы. Поэтому при подсчете Спр в формуле (11) принимаем количество внешних вхо— дов ПЭ m=n. Собр показывает затраты на транспор— тирование от j—й линии схемы до любого из ее внешних выходов. Подсчитывается Собр движением по схеме также от входов к выходам, а линии перебираются в порядке, обратном уровням срабаты— вания (рангом схемы). При подсчете Собр для мень— тих рангов учитывается Собр для более высоких рангов схемы, которое уже подсчитано. По своим свойствам Собр аналогично наблюдаемости линии схемы. При подсчете Собр для j—й линии схемы при

РИ, 1998, № 4

77

анализе К—го ПЭ (более высокого ранга, чем линия j) на К—м ПЭ существенными выбираются те входы, в собственные подграфы которых входит линия j.

К недостаткам интегральной стратегии можно отнести, во—первых, то, что она дает несколько завышенную оценку сложности транспортирования сигналов в цифровых схемах (вследствие учёта пере— бора всех альтернатив на каждом ПЭ). Во—вторых, получаемые по ней оценки не применимы к рекой— фигурации схемы. Реконфигурированная по таким оценкам схема станет проще для анализа детермини— рованным методом, а сложность диагностирования схемы в целом может возрасти. С точки зрения последующей реконфигурации схемы альтернатив— ная стратегия дает более адекватные результаты.

Рассмотрим применение альтернативной страте— гии для табличного способа задания закона функци— онирования ПЭ. Предположим, что таблица, описы— вающая ПЭ в виде кубического покрытия, содержит n столбцов ( по числу внешних входов ПЭ) и m строк. Элемент ay кубического покрытия соответствует i— му столбцу (i= 1, n) и j—й строке (j=1,m). Формула (6) может быть представлена в следующем виде:

ca = £L-Ti , (12)

J i = 1

где C обозначает 0—управляемость (С0); 1 —управля— емость (С1) или транспортируемость (Ст), т.е. t={0,1,T}; Ljl — коэффициент существенности, который для различных значений t вычисляется по формулам:

L0 = Li

L1 =

Lt =

0, если j0

1, если aij = 0,

0, если j1

1, если aij = 1

0, если aij = X-

1, если j X

(13)

Значение Ti характеризует количество тактов, реа— лизуемое соответствующим символом алфавита a^.

При нахождении оптимальной стратегии выбира— ется минимум или максимум альтернативы для ПЭ:

Ca = optCa . (14)

Достоинством методики подсчета Са по формуле (14) является, во — первых, ее универсальность по вычислению управляемости, наблюдаемости или транспортируемости; во—вторых, при реализации данного подхода нет необходимости записывать специальные аналитические выражения для опре— деления Са.

Фрагмент цифровой схемы

78

РИ, 1998, № 4

Таблица 2

Н омер линии С0 С1 O W С Пр с б о б р

1 1 1 13 1 1 97

2 1 1 13 1 1 97

3 1 1 10 1 1 175

4 1 1 10 1 1 175

5 1 1 14 1 1 180

6 1 1 23 1 1 204

7 1 1 16 1 1 176

8 1 1 26 1 1 142

9 1 1 28 1 1 119

10 1 1 1 1 1 1

11 1 1 1 1 1 1

12 3 2 8 6 3 173

13 8 2 9 44 3 132

14 3 9 8 48 4 131

15 3 3 11 28 8 112

16 3 3 14 28 8 89

17 6 13 12 82 11 119

18 13 6 4 82 11 117

19 17 10 4 1 11 97 29

20 10 17 1 111 97 1

21 14 4 1 139 119 1

22 29 29 1 138 119 1

23 29 29 1 138 119 1

В табл. 2 приведены оценки 0 и 1 -управляемости (С0, С1), наблюдаемости (О), абсолютного веса W, затрат на транспортирование Спр и Собр для схемы, представленной на рисунке.

Литература: 1. Горяшко А. П. Синтез диагностируемых схем вычислительных устройств. М.: Наука, 1987. 188с. 2. Spillman R., Glaser N, Peterson D. Development of a general testability figure of merit, JEEE. International conference of computer aided design, Santa — Clara/ 1983, P. 34-35. 3. Кизуб В. А., Кривуля Г. Ф, Шкиль А. С. Еенерация тестов в системе автоматизрованного проектирования диагностического обеспечения // Управляющие системы и машины. 1987. N4. С.44—47.

Поступила в редколлегию 22.11.1998 Рецензент: д-р техн. наук, проф. Хаханов В.И.

Кривуля Геннадий Федорович, д-р техн. наук, профессор, заведующий кафедрой АПВТ ХТУРЭ. Научные интересы: техническая диагностика, системы автоматизированного проектирования цифровых устройств. Хобби: автомобилизм, туризм, рыбная ловля. Адрес: Украина, 310726 , Харьков, пр. Ленина, 14, тел. (0572) 40-93-26.

Аль-Матарнех Рами, аспирант кафедры АПВТ ХТУ-РЭ. Научные интересы: искусственный интеллект и экспертные системы. Хобби: спорт и чтение научной литературы. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. (0572) 40-93-26.

Шкиль Александр Сергеевич, канд. техн. наук, доцент кафедры АПВТ ХТУРЭ. Научные интересы: техническая диагностика, автоматизированные обучающие системы. Хобби: теннис. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. (0572) 40-93-26.

УДК 007.52;519.7

МЕТОДЫ ИНТЕГРАЦИИ СЕТЕВЫХ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ СОЧЕТАНИЯ ОБЪЕКТНООРИЕНТИРОВАННЫХ ТЕХНОЛОГИЙ И ЯЗЫКОВ РАЗМЕТКИ ТЕКСТА

ЕВСЮКОВ А.Ю.

Используются технология объектно-ориентированного программирования и Internet технологии для построения сетевых систем с гетерогенным информационным обменом.

На сегодняшний день World Wide Web (WWW) представляет собой колоссальное хранилище информации, которое основано на множестве синтаксически структурированных HTML страниц, ссылающихся друг на друга и на файлы данных самых разнообразных форматов. Быстрое развитие спецификации HTML (и WWW в целом) обусловлено правилами обработки разметки текста, позволяющими игнорировать неизвестные элементы. Целью введения такого способа работы с неизвестной разметкой было предоставить группам разработчиков и производителям программного обеспечения возможность экспериментировать с новыми языковыми элементами, обеспечивая частичную совместимость с предыдущими версиями Internet броузеров. Однако

каждое новое расширение, предложенное одним из производителей, в большинстве случаев не могло быть корректно обработано альтернативными броузерами, потому что разметка текста в HTML оторвана от его семантики и, в силу этого, из-за нечеткости в определении правил игнорирования для каждого нового элемента разметки. Таким образом, каждое новое свойство HTML может широко применяться только после утверждения его в очередной версии языкового стандарта.

Отсутствие достаточных средств для структурной организации, расширяемости, проверки правильности электронных документов приводит к тому, что инфраструктура Web всё чаще не может удовлетворить современные нужды электронного издательства, корпоративных информационных систем и систем электронной коммерции. Для удовлетворения растущих потребностей коммерческого использования Web и возможности дальнейшего расширения Web-технологий в новых областях распределений обработки документов World Wide Web Консорциум разработал Extensible Markup Language (XML) для приложений, которые требуют функциональных возможностей, выходящих за рамки Hypertext Markup Language (HTML)-формата, доминирующего в настоящее время в Internet. По-другому складывается ситуация в сфере распределенных объектных систем.

Технология объектно-ориентированного программирования (ООП) явилась первым шагом на пути разрешения проблем, связанных с созданием сложных программных систем. Использование объектноориентированной технологии было вызвано необхо-

РИ, 1998, № 4

79

димостью повысить производительность труда разработчиков путем повторного применения кода, стремлением строить системы из уже отлаженных блоков, потребностью более точного отражения предметной области в терминах, использующихся в деятельности предприятия. Однако отсутствие единой системы, позволяющей объектам, разработанным различными производителями, взаимодействовать в составе программного комплекса (работающего не только в пределах адресного пространства, но и в масштабах сети), ограничивает преимущества применения ООП. Решение этой проблемы современная программная индустрия ищет в построении систем компонентного программного обеспечения, которые призваны перевести объектную технологию на более высокий уровень. Компонентное программирование стало важным достижением объектноориентированной технологии. Оно позволило повторно использовать объектно-ориентированный код более эффективно, так как основой для этого стал выполняемый код, а не исходные тексты или библиотеки. Компоненты модели, такие как CORBA, COM, JavaBeans особенно бурно развиваются в сфере корпоративных распределенных вычислений. Такого рода системы имеют строго определенные интерфейсы, что, устраняя проблемы взаимодействия, приводит к тому, что любое расширение интерфейса требует достижения соглашения между всеми сторо -нами информационного обмена. В таких системах обе стороны, обменивающиеся информацией, обязаны “знать” структуру классов и объектов друг друга. И, соответственно, даже малые изменения на одной из сторон влекут изменения, направленные на поддержание совместимости во всей системе. Следует отметить, что существующие стандартные методы сериализации компонентов, т.е. сохранения структурно-эквивалентного представления данных приложения, обладают следующими недостатками:

— они не устойчивы к изменениям в структуре классов, породивших данный поток сериализации;

— в формате хранения отсутствует семантическая информация о структуре объектов или она жестко связана с конкретной средой разработки или языком программирования;

— организация ссылок между объектами приводит к сохранению всего, на что ссылается данный объект, или она связана с дополнительными усилиями;

— отсутствуют стандартные механизмы для фрагментации формата представления или поддержка подобной фрагментации требует дополнительного программирования.

Кроме того, интеграция разнородных объектных систем всегда связана с созданием промежуточного слоя, предназначенного для обеспечения совместимости и адаптирующего различные спецификации на уровне форматов данных, соглашений о вызовах и платформенных различий, что влечет за собой потери эффективности.

Из сказанного выше можно сделать вывод, что в настоящее время необходима более богатая базовая модель данных, которая позволяла бы совмещать развивающиеся средства структуризации информации, представленной в Internet, с последними достижениями объектно-ориентированных технологий. Но даже сейчас эти две технологии идеологически близки. Web, например, может рассматриваться как рас-

пределенная система объектов, в которой их состояния сохраняются в виде HTML страниц, идентификация основана на URL, а поведение определяется выполнением сервером HTTP запросов. Объектная технология может послужить естественным средством добавления функциональности к статическому представлению в Web. В настоящее время Web страницы уже используются для доставки исполняемого кода в виде Java апплетов или объектов ActiveX на клиентские машины. В некоторых приложениях объекты, доставленные таким образом и выполняемые на клиенте, связываются с объектами на сервере, используя один из распределенных объектных протоколов обмена (например, OMG IIOP или Java RMI). Аспекты динамического изменения (т.е. поведения) Web страниц являются основой разработки Dynamic HTML (динамического HTML), проводимой Microsoft and Netscape. Разработка Document Object Model (объектной модели документов), проводимая W3C, направлена на развитие этой идеи в целях создания объектной модели, которая бы позволяла представлять HTML и XML документы в виде коллекции программируемых объектов. При этом код, выполняемый на клиенте, манипулирует состоянием этих объектов, изменяя состояние отображаемого документа.

Сочетание достоинств современной объектно-ориентированной технологии в виде наличия четко определенных интерфейсов с возможностью представления в данных семантически значимого, расширяемого и кросс-платформенного формата на основе XML документов, по мнению автора, позволит организовать взаимодействие разнородных систем, имеющих только общий словарь предметной области. Такое сочетание видится в организации сериализации компонентов в виде XML документов. Предлагаемый подход обладает следующими достоинствами:

— XML допускает иерархические структуры любой вложенности и хорошо подходит для хранения объектно-ориентированных структур;

— документы этого формата несут в себе семантическую информацию о структуре данных, что позволяет создавать документы, ориентированные на использование терминов предметной области и не связанные с какой-либо системой (языком) программирования;

— XML представляет собой текстовый файл, что существенно облегчит отладку и стыковку систем, а также их сопровождение;

— XML является стандартом W3C и используется многими ведущими производителями, что обеспечивает поддержку как на уровне развития стандарта, так и на уровне обеспечения инструментами разработки.

Модель сохранения компонентов на основе разметки текста должна основываться на следующих принципах:

— механизм сохранения должен быть устойчив к изменению структуры классов;

— приложение должно обладать возможностью пропускать неизвестные элементы разметки или обрабатывать их специальным образом.

В настоящее время существует несколько разработок в области сериализации объектно-ориентированных данных в XML. Большинство из них в той или иной мере удовлетворяют перечисленным выше принципам. Проблема устойчивости к изменению набора свойств классов легко решается благодаря

80

РИ, 1998, № 4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

самой структуре формата, которая позволяет коду, взаимодействующему с кодом разбора XML, пропускать неизвестные элементы разметки, найденные во время прохода по файлу.

Однако явным недостатком существующих разработок является принцип построения кода формирования вывода в формате XML. Как правило, каждый сохраняемый класс имеет метод или группу методов, отвечающих за формирование представления свойств объекта в терминах разметки текста. В то же время код десериализации построен на использовании анализатора (parser), т.е. класса или группы взаимодействующих классов, ответственных за разбор XML. Подобная схема организации программы показана на рис. 1. Десериализация происходит следующим образом. Анализатор (XML Parser), разбирая документ, взаимодействует с кодом приложения (application code), который, в свою очередь, отвечает за создание (блок Factory) и конфигурацию объектов классов данных (data classes) на основе данных, полученных от анализатора. Сериализация же производится самими классами данных, объекты которых записывают своё внутреннее представление непосредственно в формат XML.

Рис. 1. Традиционная схема сериализации

Недостатками подобной схемы являются:

— необходимость внесения модификаций во многих местах программы при изменении в структуре классов предметной области;

— связь с форматом представления организована во многих местах программы, что делает ее весьма чувствительной к его изменениям, так как модификация формата влечет за собой обширное изменение кода на всех уровнях.

Кроме того, классы данных помимо своих основных функций, т.е. моделирования предметной области, несут в себе функции вывода. Такая “перегруженность” функциональности представляется не концептуальной.

Таким образом, отмечая перечисленные выше недостатки, можно сформулировать дополнительные требования к интеграции ОО П и языков разметки текста:

— код сохранения компонентов в XML должен быть локализован. В идеале не нужно требовать написания специального кода сохранения или он

должен быть минимален и предназначен для обработки специфических ситуаций;

— для обеспечения более гибкой связь между элементами разметки текста и классами ассоциации между ними должны, по возможности, устанавливаться вне программного кода, т.е. во внешних документах.

Эта задача может быть решена путем использования Run-Time Type Information или информации периода выполнения.

Современные объектно-ориентированные языки программирования предоставляют возможность получения информации о структуре объектов в период выполнения программы. Run-Time Type Information (RTTI), или информация о типах в период выполнения, позволяет определять класс объекта, перечислять его свойства, устанавливать их тип и менять значение. С помощью средств RTTI отображения объектов на разметку в формате XML можно построить обмен объектно-ориентированными данными, более устойчивый к изменениям в представлении проблемной области. Использование механизма RTTI позволит также из бавиться от написания кода сохранения. Предлагаемое решение для сериализации в XML показано на рис. 2.

Рис. 2. Схема сериализации с использованием RTTI

Центральными элементами данной схемы являются следующие модули.

Модуль сериализации (Serializer) представляет собой сеть классов, реализующих интерфейсы одной из стандартных спецификаций для работы с XML: Document Object Model или Simple API for XML (SAX). Этот модуль взаимодействует с двумя сл еду-ющими.

Модуль доступа к RTTI представляет собой сеть классов, которая инкапсулирует стандартные средства к информации времени выполнения и предоставляет дополнительные сервисные функции.

Модуль связывания RTTI информации и разметки текста (XML/RTTI Binding) включает в себя как файлы привязки (binding files), так и классы для работы с ними. Привязка осуществляется на основе внешних XML файлов, которые отображают элементы разметки на классы и их свойства. Этот модуль

РИ, 1998, № 4

81

взаимодействует с анализатором XML для получения информации о разметке.

Полная схема взаимодействия при десериализации выглядит следующим образом. Код приложения устанавливает связь между XML Parser и блоком создания и конфигурации объектов (Factory). После этого XML Parser и Factory взаимодействуют напрямую. Анализируя заданный документ, XML Parser посылает сообщения Factory. Factory, принимая обработанные элементы разметки текста, получает информацию о необходимых действиях из XML/ RTTI Binding, который хранит отображение во внутренних структурах данных, полученных при обработке Binding файла на начальном этапе инициализации системы. Получив необходимые данные для данного элемента разметки, Factory обращается к модулю RTTI Access для создания или конфигурации объекта.

При сериализации модуль Serializer получает информацию о сохраняемом объекте через модуль RTTI Access. Элементы разметки текста, соответствующие классу данного объекта, Serializer получает из блока связывания и формирует вывод в формате XML.

Как показано на рис.2, XML Parser и Serializer формируют уровень поддержки формата (Format support layer) и только эти два блока обрабатывают все операции, связанные с внутренним представлением потока сериализации. Такая структура позволяет локализовать изменения, связанные с форматом, на уровне одной подсистемы, не затрагивая остальной код программы. Кроме того, изменения в представлении предметной области вызывают только модификацию классов данных и файлов привязки. Следовательно, изменения формата или классов данных локализованы на уровне подсистем, т.е. не

УДК 681.324:519.713

МЕТОДЫ МОДЕЛИРОВАНИЯ ЦИФРОВЫХ СТРУКТУР. ТРЕХТАКТНЫЙ АВТОМАТ

ХАХАНОВ В.И., СКВОРЦОВА О.Б., ХАНЬКО В.В., БЕДРАТЫЙР.В.

Описываются методы моделирования цифровых устройств (ЦУ), ориентированные на верификацию проектов относительно существования опасных состязаний сигналов, гонок, рисков сбоев, обусловленных практической реализацией дискретных устройств в виде интегральных микросхем, плат. Показываются направления развития методов цифрового логического моделирования по пути повышения их адекватности.

1. Формализация задач логического анализа цифровых устройств

Моделирование можно рассматривать как процесс определения неизвестных компонентов тетрады <M,D,T,R> — <модель, дефекты, стимулы, реакция> на основе применения правил логического вывода. Если принять во внимание, что каждый из упомянутых компонентов тетрады может принимать значения: 0 — отсутствие; 1— наличие, то множество всех возможных значений <M,D,T,R>, заданных в двоич-

влекут за собой изменения в других подсистемах. Следует отметить, что предложенная архитектура позволяет легко менять формат сериализации. Такой переход осуществляется заменой классов в блоках XML Parser и Serializer на альтернативные, реализующие те же интерфейсы, а также заменой внешних файлов связывания на альтернативные файлы в новом формате. При наличии нескольких реализаций таких унифицированных интерфейсов и их динамическом связывании на этапе выполнения смена формата может осуществляться баз перекомпиляции системы и даже во время ее выполнения. Таким образом, предложенная модель может служить основой для построения систем с гетерогенным информационным обменом, при котором общение с различными источниками информации осуществляется в разных форматах, а ядро системы позволяет подключать обработчики новых форматов и не зависит от формата внешнего представления данных.

Литература: 1. Bosak J. XML, Java,and the Future of the Web // XML.com. XML: Principles, Tools and Techniques. Edited by. Dan Connolly and Rohit Khare, 1997. Oct 02. 2. Manola F. Towards a Web Object Model, Object Services and Consulting, Inc. (OBJS). 1998. 3. Capturing the State of Distributed Systems with XML by Rohit Khare and Adam Rifkin (XML special issue of the World Wide Web Journal, Autumn 1997. Vol. 2, № 4. P. 207-218.

Поступила в редколлегию 04.12.1998 Рецензент: д-р техн. наук Смеляков С.В.

Евсюков Александр Юрьевич, аспирант филиала кафедры ИИИС ХТУРЭ. Научные интересы: объектноориентированные технологии, компонентные модели, Internet технологии. Адрес: Украина, 310145, Харьков, ул. Новгородская, 20, кв. 54, тел. 45-51-32, e-mail: [email protected]

ном алфавите, можно представить в виде табл. 1, где столбец Y задает компоненты тетрады, которые могут быть определены в результате выполнения соответствующих алгоритмов логического анализа. Запись по табл.1 дизъюнктивной нормальной формы для вычисления каждого из компонентов формализует четыре основные проблемы логического анализа, которые дифференцируются в классические задачи технической диагностики.

1. Проектирование модели цифрового изделия при наличии или отсутствии неисправностей:

M = R v DR v TR v DTR = R(1 v vD v T v DT).

1.1. Определение модели цифрового устройства в виде совокупности всех его возможных реакций на функциональные входные наборы:

М = f* 1’1(T,D,R)b=0; t=0 .

1.2. Создание модели цифрового устройства в виде совокупности всех его возможных реакций на функциональные входные наборы при наличии неисправностей заданного класса (словарь неисправностей):

М = f12(T,D,R)|T=0 .

1.3. Построение модели цифрового устройства в виде входных набо-

Таблица 1

MDTR Y

0000 -

0001 M

0010 -

0011 M

0100 -

0101 M

0110 -

0111 M

1000 DTR

1001 TD

1010 RD

1011 D

1100 TR

1101 T

1110 R

1111 -

82

РИ, 1998, № 4

ров и соответствующих им реакций — таблица истинности (переходов):

М = f1’3(T,D,R)|o=0 .

1.4. Создание модели цифрового устройства в виде входных тестовых наборов и соответствующих им реакций при наличии заданных неисправностей— таблица функций неисправностей:

М = f14(T,D,R).

2. Определение множества потенциальных, фактических или проверяемых дефектов в цифровом изделии:

D = M v MT v MR v MTR = M(1 v T v R v TR).

2.1. Генерация списков неисправностей цифрового изделия по его модели в виде константных или функциональных дефектов:

D = f2-1(M,T,R)|T=0; r=0.

2.2. Моделирование заданных неисправностей цифрового изделия на входных тестовых наборах в целях определения качества теста:

D = f2’2(M,T,R)|R=0.

2.3. Определение фактических неисправностей цифрового изделия на функциональных наборах по экспериментальным реакциям — обратное прослеживание дефектов:

D = f2’3(M,T,R)|x=0.

2.4. Определение фактических неисправностей цифрового изделия на тестовых наборах по экспериментальным реакциям—безусловное диагностирование:

D = f24(M,T,R).

3. Построение теста верификации модели, проверка исправности, обнаружение заданных неисправностей:

T = M v MD v MR v MDR = M(1 v D v R v DR).

3.1. Проектирование теста (проверка исправности) цифрового изделия по его модели:

T = f8’1(M,D,R)|D=0; R=0.

3.2. Проектирование теста (проверяющего, диагностирования) цифрового изделия по его модели и заданным неисправностям:

T = f32(M,D,R)|R=0.

3.3. Проектирование теста (проверка исправности) цифрового изделия по его модели исправного поведения и заданным реакциям — обратная импликация:

T = f33(M,D,R)|D=0.

3.4. Проектирование теста (проверяющего, диагностирования) — определение состояний входных переменных цифрового изделия по его модели, заданным дефектам и реакциям — обратная импликация:

T = f34(M,D,R).

4. Определение реакции цифрового изделия — прямая импликация:

R = M v MD v MT v MDT = M(1 v D v T v DT).

4.1. Определение состояний невходных линий цифрового изделия как реакции модели на входные последовательности:

R = f4’1(M,D,T)|D=0; t=0 .

4.2. Определение состояний невходных линий цифрового изделия как реакции модели на входные последовательности при наличии заданных неисправностей:

R = f42(M,D,T)| t=0 .

4.3. Определение состояний невходных линий цифрового изделия как реакции модели на входные тестовые последовательности:

R = f43(M,D,T)| d=0 .

4.4. Определение состояний невходных линий цифрового изделия как реакции модели на входные тестовые последовательности при наличии заданных дефектов — моделирование неисправностей заданного класса: R = f4’4(M,D,T)| .

В формулировках проблем fO (i= 1,4; j= 1,4) есть система логических преобразований (методы и алгоритмы), предназначенная для рационального решения конкретной задачи анализа или проектирования.

Многообразие моделей цифрового изделия представлено следующей триадой компонентов [ 1]:

F = <f, t, h>;

здесь f, t, h—дискретные параметры функциональной, временной, структурной адекватности: f=(fi,...,fiv..,fk); t=(tx,...,ti,...,tm); h=(hb...,hb...,hn), где k, m, n—мощности незамкнутых множеств известных способов формализации для описания функций, времени, структур. Построение пространства соотношения адекватностей моделей есть экспериментальная работа, сопряженная со сравнением существующих способов формализации задания параметров <f,t,h>. Для анализа цифровых объектов при проектировании диагностического обеспечения интерес представляет множество всех подмножеств универсума F, задающее отображенную в табл .2 классификацию моделей цифровых объектов.

Tаблица 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Компо- ненты Определение модели цифрового устройства

{f} Функциональная синхронная модель не учитывает временных задержек и структуры объекта

{t} Временная модель учитывает время прохождения сигналов от входов к выходам без учета структуры и функций

{h} Структурная модель определяется графом, который не учитывает функций и временных параметров примитивных элементов структуры

{f,t} Функциональная асинхронная модель (формирование значений выходов связано с временными задержками элемента)

{f,h} Структурно-функциональная синхронная модель есть совокупность взаимосвязанных элементов без учета временных параметров

{h,t} Структурно-временная модель имеет структуру в виде графа элементов, для которых определены временные задержки прохождения сигналов

{f,t,h} Структурно-функциональная асинхронная модель учитывает все параметры и является наиболее адекватной объекту среди всех упомянутых

РИ, 1998, № 4

83

Компонент fотображает многообразие аналитических, табличных и графических форм представления моделей. Относительно t классификация моделей определяет синхронные (не учитывающие временные параметры объектов и примитивов), асинхронные (использующие реальные или модельные задержки элементов), дельта-троичные (учитывающие модельные задержки примитивных элементов (ПЭ) и разброс времени переключения входных сигналов объекта) и с нарастающей неопределенностью (момент переключения входных сигналов элементов учитывает разброс параметров задержки прохождения сигналов от внешних входов к выходам). Параметр h классифицирует степень подробности задания структуры и идентифицирует: функциональную или автоматную модель для представления поведения комбинационного или последовательностного ПЭ; структурно-функциональную или итеративную, а также чистую структуру, представляющую собой орграф.

Развитие методов моделирования традиционно осуществляется по двум направлениям, связанным с отсутствием и наличием дефектов в схеме [2,3]. В первом случае речь идет об анализе переходных процессов в целях выявления и последующего устранения опасных состязаний на невходных линиях схемы, которые идентифицируются символами X в фактических состояниях линий, что может быть следствием конкретной структурной реализации [4,5]. Во втором — моделирование служит инструментом для оценки качества теста относительно одиночных константных неисправностей (ОКН) [6,7]. Многообразие тех и других методов моделирования ставится в зависимость от алфавита описания технического состояния линий, форм представления моделей обьек-тов и алгоритмов их обработки [8-10].

2. Прямая импликация на кубическом покрытии

Алгоритм выполнения прямой импликации (хадцущ)^ Yt

по модели примитива определяется способом его описания. Если это аналитическая запись, в том числе и на алгоритмических языках, то для определения выходной реакции примитива на входное слово необходимо иметь универсальные или специальные решатели — трансляторы или компиляторы, дорогостоящие, но имеющие высокое быстродействие. Недостаток аналитических моделей — их высокая стоимость, определяемая сложностью написания и отладки фактических программ моделирования примитивов. Кроме того, такие модели не подлежат автоматическому анализу или синтезу в целях проектирования общих структур данных устройства или декомпозиции последнего на составные части, а также их нельзя использовать для решения других задач технической диагностики. Графовое представление поведения примитива может быть оформлено в аналитическую запись и тогда для нее будут характерны все те преимущества и недостатки, которые названы выше.

Табличная форма описания модели есть явная запись системы отношений на множестве входных (внутренних) и выходных переменных, благодаря чему имеет при одном недостатке (большой объем структур данных в сравнении с аналитическим, что требует значительных временных затрат) такие преимущества:

1. Универсальность и простота алгоритмов анализа и синтеза табличных моделей.

2. Возможность декомпозиции таблицы на элементы с генерацией для последних собственных таблиц меньшей размерности.

3. Композиция таблиц отдельных примитивов для создания единой таблицы истинности цифрового устройства.

4. Универсализм табличных моделей для решения задач прямой и обратной импликации, моделирования неисправностей и исправного поведения, генерации тестов, контроля и поиска дефектов заданного класса.

Учитывая высокую производительность современных компьютеров и практическую безграничность информационных емкостей памяти ЭВМ, недостаток табличных форм не является существенным.

Процедура анализа таблицы [1,9] заключалась в сравнении входного (выходного) слова со строками, и если такое имело место, то состояние выходов (входов) элемента определялось подстановкой значений соответствующих координат из рассматриваемой строки таблицы. D-исчисление Рота [2] также ничего не добавило к упомянутой процедуре анализа, хотя уже появилась логическая избыточность алфавита в виде символов {0,1,X}. Методы генерации тестов на основе использования кубических (вырожденных) покрытий (КП) [5] ориентированы на решение имп-ликативных задач без рассмотрения алгоритмов моде -лирования исправного поведения и неисправностей.

Введение избыточности, предложенной Ротом, в алфавит послужило развитием более сложных процедур анализа, поскольку метод подстановки в чистом виде уже не обеспечивал правильного решения из-за наличия символа X. Следующие доказательства показывают возможность построения процедур для адекватного моделирования цифровых объектов.

Определение 1. Пересечение векторов в замкнутом теоретико-множественном алфавите является непустым (непротиворечивым), если результирующий вектор не содержит символов пустого множества.

Определение 2. Объединение векторов в замкнутом теоретико-множественном алфавите будет непустым (пустым), если каждый из них не содержит символов (содержит символы) пустого множества.

Определение 3. Пересечение векторов, один из которых имеет символ пустого множества (U), равно пустому множеству.

Теорема. Непустое объединение непротиворечивых результатов пересечений входного вектора с кубами покрытия определяет состояния всех переменных объекта в замкнутом теоретико-множественном алфавите.

Если все результаты пересечения вектора E с каждым кубом покрытия C= {C1,C2, ... , Q, ... ,Cn} равны пустому множеству, то их объединение равно U. Будем считать, что исходные векторы Е и Q свободны от символов U. Отсюда следует отсутствие в n-мерном векторном пространстве общей области у покрытия С и вектора Е. Это может быть лишь в случае задания неполного кубического покрытия для описания логических функций объекта, или противоречивости определения системы отношений между входными и выходными переменными вектора Е. Например, для КП ПЭ 2И-НЕ, имеющего три куба: {0X1, X01, 110}, выполнение пересечения вектора Е=(000) с каждым кубом покрытия определяет

84

РИ, 1998, № 4

результат, равный U. Если же предположить отсутствие в упомянутом КП последнего куба, то пересечение вектора Е= 110 с каждым кубом неполного покрытия будет пустым. Это значит, что пустым будет и объединение — свидетельство некорректности задания входного вектора Е или неполноты КП.

Если же существует хотя бы одно непустое пересечение между Е и Q, то согласно определениям 1 и 2 их объединение будет непустым. Оно идентифицирует логические состояния всех линий объекта как общую область n-мерного пространства для Е и С, которая есть максимально возможный общий результат реакции объекта на входное слово Е.

Следствие 1. Для выполнения прямой импликации по КП примитивного элемента необходимо априорное определение невходных координат вектора Е символами X.

Максимальная неопределенность невходных координат позволяет получить максимально возможное множество непротиворечивых результатов пересечения между С и Е, формирующих самое общее состояние переменных. Любой другой вариант предварительного задания невходных линий лишь подтвердит существование частного решения или опровергнет его в случае получения пустого объединения результатов пересечений.

Следствие 2. Реакция комбинационного объекта на двоичный вектор не может быть троичной. Это следует из функционирования конечного автомата, когда двоичному входному слову не могут быть поставлены в соответствие две различные реакции, в противном случае он переходит в класс недетерминированных автоматов, которые здесь не рассматриваются. Следовательно, даже при наличии нескольких непустых пересечений между Е и С результат должен быть только двоичным по всем линиям ПЭ, в противном случае покрытие не принадлежит к КП комбинационного цифрового автомата.

Следствие 3. Реакция комбинационной схемы на троичный входной вектор может быть троичной.

При существовании хотя бы одного символа X в векторе Е фактически можно говорить о компактной записи двух двоичных векторов. Каждый из них может иметь собственную реакцию выходов, которые не всегда совпадают, что и формирует при их объединении троичную реакцию на невходных линиях. Если вектор Е с одним символом X определяет на выходе значение неопределенности, то данная входная переменная существенна или активна на данном векторе Е.

Избыточность однотактного алфавита кубического исчисления, определяемая двумя символами {0,U}, один из которых не значащий, привела к усложнению процедуры анализа КП посредством введения двух векторных операций пересечения и объединения. Однако компактность получаемых моделей функционально сложных комбинационных устройств можно считать результатом, превосходящим понесенные издержки [1,5].

Избыточность двухтактного алфавита кубического исчисления не изменяет сущности теоретико-множественного анализа КП, но позволяет оформить модели сложных последовательностных, а также комбинационных схем в КП приемлемых размеров. Далее предлагаются способы анализа ЦУ и их примитивов, основанные на использовании двухтактных покрытий

в общем случае, где КП комбинационных схем есть частный случай описания цифрового автомата [1,2,5].

3. Автомат описания функций примитивов

Проектирование процедур и алгоритмов анализа исправного поведения цифровых устройств на осно -ве использования двухтактного кубического исчисления предполагает исследование функциональных особенностей составляющих компонентов. Классификация разнообразия примитивов и их структур определяется следующей совокупностью качественных характеристик, которые следует учитывать при создании системы моделирования:

1. Многовыходовой комбинационный или последовательностный элемент, в котором каждый выход функционально зависим от всех входов. Для такого примитива определяется полное КП, задающее все возможные переходы на пространстве входных состояний. Примерами таких ПЭ могут служить логические элементы, сумматоры, коммутаторы, дешифраторы, преобразователи кодов, триггеры, счетчики, управляющие конечные автоматы.

2. Многовыходовой элемент, представленный КП, в котором состояние выходной переменной определяется подмножеством кубов на ограниченном множестве существенных для данного выхода линий. Значения других выходов на упомянутых кубах покрытия могут не определяться благодаря наличию на них символов Z. Примеры таких примитивов — микросхемы, составленные из нескольких, несвязанных между собой логических, комбинационных или последовательностных элементов; многофункциональные регистры, где отдельные операции не требуют участия всех переменных при их описании.

3. Многовыходовой ПЭ, имеющий двунаправленные линии, которые должны быть как входами, так и выходами при описании КП примитива. При проектировании структур данных ЦУ такие переменные должны быть отнесены ко входам.

4. Многовыходовой примитив, имеющий неполное покрытие, которое формирует отдельные функции ПЭ на векторе существенных переменных.

5. Структура элементов, имеющих полные КП, нагруженных на выходы одного потенциала — монтажная логика И (ИЛИ).

6. Совокупность элементов с неполными КП (которые формируют отдельные операции функционального элемента), имеющих выходы одного потенциала — объединение выходов для определения их значений посредством анализа всех нагруженных на них примитивов.

7. Функционалы, реализующие арифметические операции при использовании в качестве входов и выходов одних и тех же линий.

8. ПЭ, имеющие на входах и выходах многоразрядные шины и управляющие передачей информации от A к B, и наоборот.

Триггеры и КП представлены на рис. 1.

Упомянутое многообразие примитивов и схемных соединений предполагает модификацию автомата первого рода к так называемому U-автомату (Universimom) U= <X,Y,f>, ориентированному на анализ цифрового объекта и определяемому функцией выходов Y(t+ 1)=f[X(t- 1),X(t),Y(t)]

на множестве входных и выходных (невходных) состояний. Автомат может не иметь инициирующего начального состояния, но решение задачи установки

РИ, 1998, № 4

85

1

2

3

4

-t> C

D

V

C

D

<bV

1 2 3 5

T E 0 1 0

E 1 1 1

F X 1 S

X X 0 Z

5

T 1 4 3 5

E 0 0 0

E 1 0 1

F X 0 S

X X 1 Z

Рис. 1. Функциональная модель структуры

схемы по всем линиям в наперед заданное достижимое двоичное состояние за конечное число входных наборов должно иметь положительный результат. Отсутствие классификации линий на внутренние и выходные связано с необходимостью отображения логического состояния обьекта (включающего понятие состояние автомата), которое является условием для моделирования очередного перехода объекта при подаче входного набора. Однако существует необходимость выделения на множестве невходных переменных ЦУ наблюдаемых линий, которые имеют гальванические связи с контактами внешнего разъема, что нужно для реализации алгоритмов генерации тестов, моделирования неисправностей, контроля и поиска дефектов. В соответствии с предложенным автоматом можно определить структуру куба покрытия примитива:

X Y

t-1: M0 ЦІ 1 X HI III

t : M1 HI 1 0 HI HI HI HI IH lil III

t+1: M2 in 1ZI HI iui IX

Система отношений между входными и выходными переменными конечного автомата определена на трех тактах. Это позволяет создавать модели примитивов, которые смогут модифицировать не только линии Y, но, что самое важное, и значения переменных X без использования дополнительных псевдопеременных. Отсюда следуют возможности:

1. Описание входных условий в двух автоматных тактах с целью повысить адекватность и компактность моделей примитивов, что на практике эквивалентно: исключению необходимости введения дополнительных переменных, которым нельзя поставить в соответствие физическую линию; записи наличия или отсутствия переднего или заднего фронтов на синхровходах, задаваемых символами {E,F,H,L} [1]; формированию минимальных условий по отдельным входным линиям в такте t-1 или t с помощью {0,1,X,G,T,K}; заданию таких переходов на входных координатах, которые не вызывают установку автомата в непредсказуемое состояние; определению изменений входных сигналов, инициирующих опасные состязания в ПЭ.

2. Задание условий и направления устойчивого перехода автомата на физически существующих выходных (невходных) переменных в тактах t и t+1 или его установки в неопределенность.

3. Формирование отношений для функций, которые используют одни и те же физические линии в качестве входных и выходных {A=A+1, A=A-1}; {A=B, B=A}.

4. Автомат моделирования

ЦУ в виде конечного автомата, использующего структуру примитива (1), адекватно моделируется в трех автоматных тактах <t-1, t, t+1>, которым соответствуют поля M0, M1, M2:

X Y

M0 Hi li: :X: 1 HI IT +1+ 101 101 1X1

M1 1 ■il 101 101 :X 0. 111 X 101 111

M2 U U :-U- U ::U:: :U: ■U U :U- 1U:

(2)

Векторы M0X, M1X — координаты инициирующих сигналов на входах объекта; M2 — поле задания координат, состояния которых должны быть определены в процессе анализа кубических покрытий; M1Y — поле-идентификатор состояния объекта в момент t; M0Y — определяет значения невходных линий в момент t-1, которые в совокупности с полем M1Y формируют входные сигналы для моделирования внутренних примитивов схемы. Поскольку для схемы, как и для примитива, нет смысла делить невходные переменные на внутренние и выходные, определение конечного S-автомата (Simulation) имеет вид

Y(t+1)=f[X(t-1),X(t),Y(t-1),Y(t)], где Y (t+1) — поле модификации входных или выходных координат. Его основное назначение состоит в определении поведения ЦУ на множестве реальных эквипотенциальных линий схемы, которая имеет глобальные обратные связи, фронтальную синхронизацию, двунаправленные линии, элементы памяти. Для таких устройств важно знать только входные линии и то лишь в целях выставления на них инициирующих воздействий, а разделение невходных переменных на внутренние и выходные нужно, как и в случае с примитивом, лишь для идентификации последних в качестве наблюдаемых линий при работе алгоритмов проектирования диагностической информации. Отсюда следует, что U-автомату примитива в формате (2) будет соответствовать фрагмент:

X

M0 0 1 X 1 0 Y

M1 1 1 0 0 X 0 1 X 0 1

M2 U U U U U U U U U U

Здесь состояние Y(t+1) может определяться любой координатой из M2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Такая структура объясняет поведение функций, где переменные аргументов и результата представлены одними и теми же эквипотенциальными линиями. Например, КП функций {A=A+1, A=A-1}; {A=B, B=A} невозможно реализовать на основе концепции классического автомата без использования дополнительных переменных или элементов памяти.

5. Процедуры анализа цифровых объектов

Отход от классического задания конечного автомата в двух временных фреймах и введение трехтактного автомата есть результат принятия структурнофункциональной модели устройства без псевдоразрыва глобальных обратных связей и введения дополнительных псевдопеременных с целью повысить адекватность моделирования исправного поведения цифрового объекта. Для эффективной обработки такой модели следует учитывать концепции введенных U-, S-автоматов, разнообразие используемых структур ПЭ и схемных соединений, значность

86

РИ, 1998, № 4

алфавитов моделирования и описания переходов в целях задания оптимальных и технологичных операций и массивов, чтобы реализовать программные средства моделирования исправного поведения.

1. Векторы моделирования (2) предназначены для формирования входного слова в троичном алфавите и хранения состояний всех линий как результатов анализа КП элементов схемы. Текущее значение входов, для которых необходимо найти реакцию невходных линий, заносится в поле M1X, при этом поле M0 по всем координатам определяет состояния всех переменных автомата в момент t-1; M1Y — уже определенные значения линий устройства в момент t. Поле M2 есть вычисляемые состояния всех переменных автомата в момент t+1 в результате анализа кубических покрытий на заданных значениях M0, M1 по входам и M1 — по выходам. Поле M2X может быть модифицировано относительно M1X только в случае наличия в схеме функциональных элементов, имеющих входные и выходные переменные, отмеченные одинаковыми номерами линий, которые при построении структур данных относятся к входным переменным модели ЦУ.

Идентичность полей M1, M2 по невходным координатам является признаком окончания итеративного процесса при моделировании очередного входного набора. Если такого не происходит, то при достижении максимального, наперед заданного числа итераций всем изменяющимся на невходных полях M1, M2 координатам присваивается символ X, после чего цикл вычислений повторяется. Такая процедура управления простыми итерациями гарантирует сходимость алгоритма моделирования при наличии в схеме опасных состязаний или генераторных режимов. Исходное состояние трех векторов до начала моделирования должно быть равно символу U (здесь он эквивалентен значению X) по всем координатам. Далее, перед обработкой очередного активного примитива или группы ПЭ, нагруженных на одни и те же выходы, последним должны быть присвоены символы U в поле M2. Такая избирательность обусловлена событийным характером алгоритма анализа схемы, когда ПЭ будет моделироваться в случае его активности — наличия изменений на входных линиях примитива в полях M0, M1, что является условием для формирования в позиции вектора активности VA, соответствующей текущему элементу, признака 1.

2. Вектор объединенных выходов VF определяется числом линий схемы, где содержимое позиции задает количество выходов ПЭ, нагруженных на линию с данным номером:

X Y Z

0 0 1

1 1 2

1 3 1

123456789 Символ 1 в позиции 3 свидетельствует о двунаправленности линии 3, на которую нагружен один выход ПЭ; линии 6 и 8 объединяют 2 и 3 примитива соответственно. Очевидно, переменные 1 и 2 являются только входами; 4,5,7,9—выходами, соединенными со входами предшествующих элементов. Наличие символа >0 на входной координате или >1 — на внутренней или выходной служит условием для обработки по сквозному (безусловному) алгоритму всех элементов, связанных с отмеченными линиями, чтобы получить на них адекватное реальному поведению решение, поскольку только все прими-

M0

M1

тивы, нагруженные на объединенные выходы, создают полную картину их состояний.

3. Координатные операции конкатенации, пересечения, объединения [1] определяют технологию анализа КП примитивов, сочетающую свойства простоты метода и максимальных функциональных возможно -стей, которые можно выжать из синхронного метода моделирования в пятизначном алфавите {0,1 ,X,Z,U}. Операция конкатенации (*) предназначена для получения двухтактного символа кодирования состояния линии в фреймах (t-1,t) или на полях (M0,M1) с целью выполнить последующее пересечение двухтактных кубов покрытий с аналогичными состояниями координат упомянутых полей векторов моделирования. Операция (п) формирует результат пересечения куба КП с исходными для рассматриваемого ПЭ значениями соответствующих входных, выходных линий, полученных конкатенацией состояний упомянутых переменных, заданных полями M0,M 1. Для повышения быстродействия анализа КП операция пересечения формирует результат в виде состояния линии в момент t+1 по схеме, представленной на рис. 2.

Выполнение п -операции формирует символ двухтактного алфавита, в данном случае E, который может быть разложен к виду двух однотактных, а далее #-операция вычисляет однотактную составляющую в момент t, которая переносится Д-операцией во фрейм t+1. Бинарная операция пересечения заменяет собой последовательность действий: п , =, -э-, #, -^, Д (см.

рис.2) без потери адекватности моделирования. Естественно, u-операция, предназначенная для объединения непротиворечивых результатов пересечений векторов моделирования и кубов покрытия, определена на символах однотактного алфавита, что делает ее компактной. Результирующие значения в ней представлены пятью символами, которые идентифицируют: {0,1} — устойчивое двоичное состояние; X—переход линии в неопределенное значение; Z — обозначение высокого импеданса для линий, которые могут иметь три устой -чивых состояния; U—неопределяемое значение переменной, связанное с отсутствием для моделируемого входного набора системы отношений, формирующих состояние линии. Появление символа U есть следствие неполного КП или наличия в схеме номера линии, которым не отмечена ни одна переменная в множестве примитивов объекта. Чтобы повысить быстродействие выполнения упомянутых операций, символы двухтактного алфавита кодируются однобайтными десятичными числами от 0 до 22.

Отличие таблично-кодовой организации вычисления операций от варианта последовательности условных операторов заключается в реализации за один программный такт любого пересечения, объединения, конкатенации путем нахождения содержимого ячейки n-мерного массива по его индексам. Таким образом, программные средства оперируют кодами символов, но при вводе и выводе необходимо иметь преобразователи “символ-код” и “код-символ” для удобства восприятия информации пользователем.

4. Буферный вектор моделирования предназначен для формирования по выходам объединения непус-

Рис. 2. Формирование результатов пересечения

РИ, 1998, № 4

87

тых результатов пересечении конкатенации значений векторов моделирования M0,M1 с каждым кубом покрытия по линиям, соответствующим обрабатываемому ПЭ.

Рассмотрим схему анализа куба примитива и формирования выходных значений элемента в буферном векторе моделирования VB.

Каждая строка КП имеет множество входных и невходных (внутренних и выходных) координат. Чтобы она участвовала в формировании состояния выходов, необходима ее непротиворечивость по входным, а также по невходным координатам в момент t (вектор M1), которые определяют предыдущее состояние автомата. Процедура анализа куба по всем координатам:

1. Конкатенация состояний очередной входной координаты ПЭ, выбранных из векторов моделирования.

2. Выполнение операции пересечения между результатом конкатенации и входной координатой рассматриваемого куба.

3. Если пересечение пусто, выполняется переход к анализу следующего куба (i=i+1). В противном случае рассматривается следующая входная координата (j=j+1) анализируемой строки.

4. Если по всем входным координатам куба зафиксировано непустое пересечение, выполняется переход к анализу невходных координат, для чего реализуется конкатенация состояния очередной невходной линии M1j с символом пустого множества, который здесь равен X.

5. Пересечение конкатенации с очередной невходной координатой анализируемого куба покрытия. Результат непустого пересечения заносится в соответствующую позицию буфера VBj.

6. Если результат предыдущей операции пуст, осуществляется переход к анализу очередного куба по входным линиям (i=i+1). Иначе — анализ невходной координаты (j=j+1).

7. Если по всем состояниям невходных линий зафиксировано непустое пересечение, выполняется покоординатное объединение полученных в буфере значений внутренних и выходных переменных ПЭ с состояниями соответствующих линий вектора моделирования M2 с записью полученного результата в упомянутый вектор.

Иллюстрацией выполнения процедуры анализа кубов покрытия примитивов (см. рис. 1) может служить результат моделирования отдельных входных наборов, представленных в табл. 3.

В примере моделирования вектор M01 есть конкатенация двух предыдущих по всем координатам;

гг г „.буферные Іаблица3 D-

векторы Bi

(VBi) получа-

5 "ются в резуль-

Анализ КП 5

Ci 1 2 3 5 Ci 1 4 3 5

1 E 0 1 0 1 E 0 0 0

2 E 1 1 1 2 E 1 0 1

3 F X 1 S 3 F X 0 S

4 X X 0 Z 4 X X 1 Z

M0 0 0 0 1 M0 0 0 0 1

M1 1 0 0 U M1 1 0 0 U

M01 E Q Q B M01 E Q Q B

B1 U B1 1 0 0 0

B2 U B2 U

B3 U B3 U

B4 1 0 0 Z B4 U

M12 1 0 0 Z M12 1 0 0 0

ния куба Ci с вектором M01 по правилам

2 равен гору M1 по "входам и множеству M2 вычисленных истинных значе-

__ний — по вы-

0 ходам. Если на

линию нагружено несколько выходов ПЭ, результат определяется объединением состояний данной выходной переменной в векторе M2, полученных при анализе соответствующих покрытий. Объединение результатов моделирования дает:

1 0 0 Z 10 0 0 M12 10 0 0

Описанные процедуры анализа примитивов и схем ориентированы на максимальное приближение проектируемых моделей к схемотехническим особенностям микросхем и цифровых объектов в целях нахождения рынка пользователей программными средствами моделирования в среде разработчиков радиоэлектронной аппаратуры.

При моделировании неисправностей алгоритм ориентируется на наблюдаемые линии, которые могут быть как входными, так и внутренними или выходными. Идентификация наблюдаемых переменных необходима также для выполнения процедур генерации тестов, организации и проведения диагностического эксперимента. Естественно, чем больше такихлиний, тем проще процедуры анализа ЦУ, но дороже устройство из-за увеличения числа выводов на внешнем разъеме.

Литература: 1. Хаханов В.И. Техническая диагностика элементов и узлов персональных компьютеров. К.: I3MH. 1997. 308 с. 2. Основы технической диагностики / Под. ред. П.П.Пархоменко. M.: Энергия, 197б. 460с. 3. Breuer M.A., Friedman A.D. Diagnosis and reliable design of digital system. Woodlound wills, Computerscience press inc., 1976. 308p. 4. Автоматизированное проектирование цифровых устройств / С.С.Бадулин, Ю.М.Барнаулов и др./ Под ред. С.С. Баду-лина. М.: Радио и связь, 1981. 240с. 5. Баранов С.И.,Майоров С.А., Сахаров Ю.П., Селютин В.А. Автоматизация проектирования цифровых устройств. Л.: Судостроение, 1979. 264с.

6. Автоматизация диагностирования электронных устройств / Ю.В.Малышенко и др./ Под ред.В.П.Чипулиса.М.: Энергоатомиздат, 1986. 216с. 7. Беннетте Р.Д. Проектирование тестопригодных логических схем: Пер.с англ. Дербуновича Л.В. М.: Радио и связь, 1990. 176с. 8. Богомолов А.М., Сперанский Д.В. Аналитические методы в задачах контроля и анализа дискретных устройств. Саратов: Изд-во Сарат. ун-та, 1986. 240с. 9. Байда Н.П., Кузьмин И.В., Шпилевой В. Т. Микропроцессорные системы поэлементного диагностирования. М.: Радио и связь, 1987. 256c. 10. Courtois B. CAD and testing of ICs and systems. Where are we going?— TIMA, France. 1995. 250 p.

Поступила в редколлегию 12.11.1998 Рецензент: д-р техн. наук, проф. Кривуля Г.Ф.

Хаханов Владимир Иванович, д-р техн. наук, профессор кафедры АПВТ ХТУРЭ. Научные интересы: техническая диагностика вычислительных устройств, систем, сетей. Хобби: баскетбол, горные лыжи. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. (0572) 40-93-26.

Скворцова Ольга Борисовна, аспирантка кафедры АПВТ ХТУРЭ. Научные интересы: техническая диагностика вычислительных устройств. Хобби: аэробика, музыка, иностранные языки. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. (0572) 40-93-26.

Ханько Вадим Викторович, аспирант кафедры АПВТ ХТУРЭ. Научные интересы: диагностика вычислительных систем и сетей. Адрес: Украина, Донецкая обл., г. Мариуполь, ул. Новороссийская, 14, кв. 87, тел. (0629) 35-21-33, 37-70-93.

Бедратый Роман Витальевич, аспирант кафедры АПВТ ХТУРЭ. Научные интересы: техническая диагностика вычислительных устройств. Хобби: тяжелая атлетика, культуризм. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. (0572) 40-93-26.

88

РИ, 1998, № 4

КОМПЬЮТЕРНЫЕ

УДК 519.2+537.86

РАСПОЗНАВАНИЕ ХАОТИЧЕСКИХ КОЛЕБАНИЙ, ВОЗДЕЙСТВУЮЩИХ НА МАРКОВСКИЙ ПРОЦЕСС

ЗАЛЕССКАЯЕ.В., КИРИЧЕНКОЛ.О.

Рассматриваются качественные методы распознавания различных типов хаотических колебаний, возмущающих матрицу переходных вероятностей марковского процесса. Приводятся результаты численных исследований поведения предельных вероятностей для разных типов хаотических процессов.

Многие реальные процессы в технике, экономике, биологии и медицине в силу своей природы наделены так называемым марковским свойством, которое можно охарактеризовать так: будущее определяется настоящим. Важным направлением в теории марковских систем является исследование процессов, в которых имеет место стабилизация. Под стабилизацией понимается такое свойство процесса,

когда при t^t 0 (t 0 <да) основные его характеристики

принимают определенные значения. Для марковского процесса это означает, что существует набор стационарных вероятностей, к которым стремятся с течением времени соответствующие вероятности нахождения данного процесса в его состояниях. Такой процесс мы можем рассматривать как динамическую систему, имеющую устойчивую точку равновесия [1].

Пусть на матрицу P переходных вероятностей процесса с n состояниями, в общем случае зависящую от времени,

' P11(t) P12(t) • • P1n(t) '

P21(t) P22(t) • • P2n(t)

1 Pn1(t) Pn2(t) • • Pnn(tX

P(t)=

которая определяет эволюцию системы, действует возмущение D(t). Тогда на каждом временном шаге матрица P(t) будет иметь вид

P(t) =

rPll(t) + А11 (t) Р12 (t) + A12 (t)

Р21(t) + A21(t) p22 (t) + А22 (t)

Pln(t) + A1n(t)A

p2n (t) +A2n(t)

VPnl(t) +An1(t) Pn2 (t) + An2(t) ••• Pnn(t) +A nn(W

n

где V i ^ Pij(t) + Ajj (t) =1. На каждом временном j=1

шаге t k вектор безусловных вероятностей P(t) = (P1 (t), P2 (t), •••, Pn (t)) возмущенной системы определяется как P(tk) = P(tk-1)P(tk-1) для заданного начального распределения p(0) .

Пусть фактором, возмущающим марковскую систему, является одна из компонент непрерывного во времени хаотического процесса

X(t) = (X1(t),X2(t),_,Xm(t)) .

Хаос представляет особый тип поведения детермини -рованной системы в установившемся режиме. Хотя эволюция этой системы однозначно определяется динамическими законами, ее динамика является стохастической. В данной работе мы рассматриваем диссипативные хаотические системы, эволюция которых задается системой обыкновенных дифференциальных уравнений. Фазовые траектории таких систем представляются в виде бесконечной, нигде не пересекающейся линии, причем при t ^ да траектория не покидает замкнутой области. Такие системы широко распространены в гидродинамике, механике, физике плазмы и т. д. [2] .

Итак, мы наблюдаем эволюцию марковского процесса, на который воздействуют хаотические колебания, представленную в виде временной последовательности векторов:

P(tk) = (P1 (tk X P2 (tk X • • •, Pn (tk)).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На рис.1 показаны компоненты вектора P(t) марковской системы размерностью n=3, на которую воздействует хаотический процесс. Прямые линии представляют собой стационарные вероятности невозмущенного процесса.

Рис. 1. Компоненты вектора рД) марковского процесса под воздействием хаотических

колебаний

Ставится задача: определить, какой именно вид хаоса зашумляет наблюдаемый марковский процесс. В настоящей работе рассматриваются качественные методы распознавания на примерах хорошо известных хаотических аттракторов Лоренца, Ресслера и Чуа [2].

Рассмотрим одну примечательную особенность странного аттрактора, которая позволяет восстанавливать его на основе последовательности отсчетов,

РИ, 1998, № 4

89

полученных путем дискретизации во времени лишь одной компоненты его состояния..

Функция восстановления F определяется следующим образом. Рассмотрим аттрактор А, располагаемый в компактном многообразии М, имеющем размерность N. Указанная функция определяет отображение F:M^R2N+1 следующего вида:

F(x) = [фi (x), ф; (x + т),..., ф; (x + 2Nt)] ,

где ф t(x + пт) — i-я компонента траектории системы; а t>0 — период дискретизации, выбираемый произвольным образом. Тогда, в общем, отображение F представляет собой некоторое вложение [3]. Пространство r2N+1 всегда оказывается достаточным для восстановления аттрактора. Однако такое восстановление может осуществляться и в пространстве, размерность которого меньше 2N+1 [4] .

Восстанавливать аттрактор можно практически при любом значении t, однако все же существуют определенные ограничения. Если значение t слишком мало, выполняется равенство

ф i (x + кт) и ф i (x + (k +1)т), и восстановленный аттрактор оказывается ограниченным областью вблизи диагонали пространства, в котором производится восстановление. Если же значение t слишком велико,

а система является хаотической, то значения ф i (x + кт)

и ф i(x + (к + 1)т) оказываются некоррелированными (в пределах точности, определяемой производимыми вычислениями), и структура аттрактора исчезает. Если же значение t оказывается слишком близким к значению какого-либо периода системы, то та составляющая, которая характеризуется указанным периодом, при восстановлении будет представлена недостаточно полно.

На рис. 2 показан фазовый портрет аттрактора системы Чуа в плоскости переменных x(t) и y(t) (а) и восстановленный по значениям компоненты x(t) при Т=0,35 (б).

Рассмотрим временную реализацию какой-либо компоненты вектора безусловных вероятностей p(t) возмущенной системы, показанного на рис.1. Подбирая значения Т в зависимости от величины шага дискретизации системы и ее размерности, мы можем восстановить фазовый портрет возмущающего хаотического процесса.На рис.3 показан фазовый портрет аттрактора Ресслера в плоскости переменных x(t) и y(t) (а) и восстановленный по значениям

компоненты p1 (t) вектора безусловных вероятностей зашумленного марковского процесса при значе-

а б

Рис. 2. Фазовый портрет аттрактора Чуа

а б

Рис. 3. Фазовый портрет аттрактора Ресслера

нии t=0,75 (б). Портреты построены по реализации длиной 50 временных единиц.

Наглядную информацию о свойствах динамической системы дает расчет спектра мощности реализации процесса. Расчеты фурье-спектра важны также и потому, что в физических экспериментах измерение спектра, как правило, типичная, а часто и единственная информация о системе. Обычно спектры мощности вычисляются непосредственной обработкой данных реализации с помощью алгоритма быстрого преобразования Фурье [5]. Чтобы уменьшить погрешность счета, вызванную конечностью реализации, можно применить методы введения специальных окон, однако для качественного анализа вполне можно ограничиться прямоугольными окнами, но обрабатывать при этом относительно длинные реализации. Более важным является необходимость усреднения результатов расчета спектров. Эта процедура адекватна расчету спектра по некоторому наперед заданному числу различных периодограмм одинаковой длительности с последующим усреднением результатов. В данной работе проводилось усреднение по 20 периодограммам, каждая из которых была построена по реализации длиной около 10 временных единиц.

На рис.4, а показаны спектры мощности компоненты, x(t) системы Лоренца (вверху) и компоненты

p1 (t) вектора безусловных вероятностей зашумленного марковского процесса (внизу). На рис. 4, б

Рис. 4. Спектры мощности систем Лоренца и Ресслера

90

РИ, 1998, № 4

показаны соответствующие спектры для системы Ресслера.

Полную информацию о вероятностных свойствах хаотического процесса дает функция плотности рас -пределения p(X,t). Предполагая, что процесс X(t) в системе стационарный и эргодический, можно значительно упростить нахождение этой функции. Вследствие стационарности исключается зависимость установившегося распределения вероятностей от времени, а предположение эргодичности дает возможность заменить усреднение по ансамблю усреднением по времени вдоль одной реализации. Плотность распределения p(X) стационарного эргодического процесса может быть вычислена как предел относительного времени пребывания траектории системы в элементах объема фазового пространства, соответствующих некоторому дискретному разбиению [4].

На рис. 5 показана плотность распределения компоненты x(t) системы Лоренца (а) и компоненты

pj (t) вектора безусловных вероятностей возмущенного марковского процесса (б). Функция плотности распределения построена по реализациям длиной 100 временных единиц. Область изменения аргумента была разбита на 80 равных интервалов.

Подводя итоги, можно сказать, что “зашумленные хаосом” безусловные вероятности марковского процесса приобретают топологическую структуру, свойственную данному виду хаотической системы. Используя такие методы как построение фазового портрета, спектра мощности и плотности распределения, можно адекватно установить тип хаотического процесса.

Литература: 1. Розанов Ю.А. Случайные процессы. М.: Наука, 1971. 283 с. 2. Мун Ф. Хаотические колебания. М.:

Рис. 5. Плотность распределения системы Лоренца

Мир,1990.- 311 с. 3.Takens F. Detecting Strange Attractors in Turbulence// Lect. Notes in Math. Warwick: Springer-Verlag, 1980. Vol .898.P. 366-381.4. Анищенко В. С. Сложные колебания в простых системах. М.: Наука,1990. 311 с. 5. О.В. Земляний, Л. О. Кириченко Хаос в нелинейной динамической системе с V- образной переходной характеристикой // Радиоэлектроника и информатика, 1998. №2. С.66-68.

. Поступила в редколлегию 12.12.1998

Рецензент: д-р физ.-мат. наук Буц В.А. Залесская Евгения Викторовна, студентка ХТУРЭ. Научные интересы: марковские процессы. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел.44-68-07.

Кириченко Людмила Олеговна, аспирантка кафедры прикладной математики ХТУРЭ. Научные интересы: хаотическая динамика и марковские процессы. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел.44-68-07.

УДК 007.001.362; 681.327.12.001.362

РАЗЛОЖЕНИЕ МАТРИЦЫ ЦЕНТРОАФФИННОГО ПРЕОБРАЗОВАНИЯ ДЛЯ НОРМАЛИЗАЦИИ ИЗОБРАЖЕНИЙ

ПУТЯТИН ЕЛ, ЯКОВЛЕВА Е.В, ЛЮБЧЕНКО В А.

Исследуется проблема разложения матрицы центроаффинного преобразования в суперпозицию простых геометрических преобразований. Полученные разложения могут быть использованы для решения задачи нормализации изображений путем перехода к методам одномерной нормализации, что повышает ее эффективность.

Как известно, основной задачей обработки изображений является их распознавание. Но перед тем, как непосредственно заняться распознаванием, необходимо привести интересующее изображение к удобному для распознавания виду. Так, если существует вероятность того, что изображение было подвергнуто действию групп геометрических преобразований, то сразу же после сегментации следует его нормализовать. Под нормализацией понимается процедура компенсации геометрических преобразований, связывающих эталонные и реальные изображения. Множество геометрических преобразований, формирующих разницу между эталоном и реальным

изображением, как правило, образует группы преобразований [1].

Обычно при обработке реального изображения заранее не известно, каким геометрическим преобразованиям оно могло подвергаться. Поскольку все простые геометрические преобразования и их комбинации содержат в себе аффинное преобразование, то будем предполагать, что исследуемое реальное изображение находится под воздействием аффинной группы преобразований Ga. Компенсацию смещений осуществить довольно просто. Например, можно вычислить центр тяжести исследуемого изображения, а затем провести операцию центрирования, совместив центр тяжести изображения с геометрическим центром поля зрения [1]. После центрирования исследуемое изображение будет находиться под действием только центроаффинной группы G/, которая описывается вещественной квадратной матрицей

где ап а22 -а21 а12^0.

Таким образом, чтобы нормализовать исследуемое изображение, необходимо определить заранее неизвестные параметры центроаффинного преобразования, после чего процедура нормализации будет заключаться в применении обратного центроаффинного отображения, описываемого матрицей А-1.

Для нахождения параметров центроаффинной матрицы предлагается найти разложение матрицы А в

РИ, 1998, № 4

91

произведение матриц простых групп геометрических преобразований, каждая из которых является подгруппой Gac. Такое комбинированное преобразование должно удовлетворять следующим требованиям: оно должно быть группой; между параметрами комбинированного преобразования и параметрами aj, a]2, a2], а22должна существовать однозначность, т. е. параметры ajj, a]2, а2], а22должны выражаться через параметры комбинированного преобразования, и наоборот.

Как известно, любое отображение, описываемое вещественной квадратной матрицей А, представляет собой комбинацию самосопряженного (в нашем случае — симметрического) и ортогонального отображений [2,5]:

А АсАорт;

здесь Ас — матрица симметрического отображения; Аорт— матрица ортогонального отображения.

После перехода к базису из собственных векторов матрицы симметрического отображения Ас И-1АсИ=Л,

где И — ортогональная матрица, состоящая из собственных векторов матрицы Ас; Л — вещественная диагональная матрица, получим Ас=ИАИ-1,

откуда

А=ИАИ-1Аорт.

Так как матрица И ортогональна и, следовательно, И-1 тоже ортогональна, то, обозначив И=К, И-1Аорт=А, получим

А=КАЬ,

где А — вещественная диагональная матрица, а К, L — ортогональные матрицы.

Рассмотрим случай, когда К, L—матрицы чистого вращения U1 и U2 , а А — матрица неоднородного изменения масштаба. Тогда A=U2 D U1 , т. е.

f aII aI2 | f cos a sin а'\( X 0 Y cos в sin в]

^a2I a22 J ^- sin a cos aj^ 0 лХ- sin в cos pJ,(1)

где a — параметр преобразования вращения U2; в — параметр преобразования вращения U1; X , /л — параметры диагонального преобразования D.

Перейдем от матричного соотношения (1) к четырем уравнениям:

aII = X cos a cos в - л sin a sin в , aI2 = X cos a sin в + л sin a cos в, a2I = -X sin a cos в - л cos a sin в, (2)

a22 = -X sin a sin в - Л cos a cos в .

Уравнения (2) перепишем в виде

Xcosв = a11 cosa - a2I sina ,

Xsinв = a12 cosa -a22 sina ,

-Л sin в = a11sina + a2I cosa, (3)

ЛCOSв = a12 sina + a22 cosa .

Разрешая эти уравнения относительно параметров a, в, X и л , получаем

tg2a =

tg2в = X = Он

Л=

a12

-2(ana2i + ai2a22)

2 2 2 2 ’ aII + aI2 - a2I - a22

2(anaI2 + a 2^22) 2,2 2 2 ’ aII + a2I - aI2 - a22

cosa - a21 sina cos в

sina + a22 cosa cos в

(4)

Проверим, что преобразования U2 D U1 являются группой.

1. Условие ассоциативности будет выполняться на основании свойств матриц, т. е. (U21D)U1= U2(DU1).

2. Единичным преобразованием будет U2DU1 с параметрами a=0, в=0, Х=л = 1.

3. (U2DU1)-1 = U1-1D-1 U2-1 . Поскольку detU1^ 0, detD Ф 0, detU2 Ф 0, то обратный элемент существует.

4. В результате суперпозиции преобразований U2DU1 и U4DU3 должно получиться преобразование, состоящее из поворота U1*, диагонального сдвига D* и еще одного поворота U2* , т. е. преобразование U2*D*U 1*. Можно показать, что параметры результирующего преобразования a*, в*, X* и л*равны

tg2a

tg2в

X =

*

л =

у * * * *

* = -2(a na 2I + a !2а 22)

(a*n)2 + (a*n)2 -(a*2I)2 -^)2

* * * *

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

* =______2(aIIaI2 + a2Ia22)_______

= (a*I)2 + (a*2I)2 -(a*n)2 -(a*22)2

an cosa - a2I sina

cos в*

aI2 sina* + a22 cosa*

* ,

cos в

где a21 ,a12 ,a21 , a22 — параметры матрицы А , равной (U2D1U1)*(U4 D2U3), т. е. выражаются через параметры a2, в, X, л; преобразования (U2D1U1) и параметры a2; X2, л2преобразования (U4 D2U3).

Так как выполняются все условия, то U2DU1 — группа. Поскольку между параметрами a, в, X, ли параметрами центроаффинной матрицы ац, a]2, a2], а22 существует взаимная однозначность, то комбинированное преобразование U2DU1 является центроаффинной группой и, следовательно, содержит в себе все подгруппы центроаффинного преобразования, а также их комбинации.

Но разложение U2DU1 оказалось не слишком удобным на практике, так как возникают неоднозначности и неопределенности даже при некоторых простых преобразованиях. Неоднозначность, например, возникает, когда ?=л> т. е. масштаб по всем направлениям одинаковый. В этом случае нет смысла во втором повороте. Следовательно, угол одного из поворотов должен равняться нулю. Но возникает неоднозначность, заключающаяся в том, что нулю может равняться угол как первого поворота, так и второго. К тому же при преобразованиях поворота, однородного масштаба, их комбинации и некоторых других преобразованиях в первых двух формулах (4) возникают неопределенности вида 0/0. Существуют также ограничения на параметры a и в: из первых двух формул (4) a и в не должны

п п

равняться — ± — п

п

(и=0,1,2), из вторых — в ^ —п.

Поэтому применение указанного разложения для нормализации вызывает трудности.

Рассмотрим другие разложения.

Предположим, что разложением центроаффинной группы будет комбинированное преобразование DXU, где D — матрица неоднородного масштаба, X— матрица косого сдвига вдоль оси X и U — матрица поворота. Тогда А = DXU, т. е.

aII aI2 ] = fX 0Y1 hY cosa sinaj a2I a22 J ^0 лА0 1 A~sina cosaj . (5)

92

РИ, 1998, № 4

Из (5) запишем четыре уравнения: a11 — 2(cosa- h sin а), a12 =A(sina + h cos а), a2J — -иsina, (6)

a22 — /ucosa.

Разрешая эти уравнения относительно a, h, 2, /и, получаем

, a2,.

а — arctg(------),

22

a

и =

22

a

22

cosa , , , a21

cos( arctg(——))

a22

h = a21a11 + a22a12 , a11a22 - a12a21

2 —-

Ua11

a22 + a21h

ana?? aJ?a?J . a^^..

-JLJ2----12Ж cos(arctg(—21)) .

22

22

Проверив выполнение требований к группе, приходим к выводу, что комбинированное преобразование DXU также является центроаффинной группой. Следовательно, все простые группы, например, преобразования косого сдвига по оси X, по оси Y, преобразования поворота, преобразования неоднородного масштаба, а также их комбинации будут подгруппами разложения DXU, т. е. X=DXU, Y=DXU, U=DXU, D=DXU и т.д. при определенных значениях параметров а, ц, 2, /и.. Так, Y=DXU только когда параметры DXU равны:

1

и —-------------—,

cos(arctg(-h )) а — arctg (-h*), h =h*,

2 = cos(arctg(-h*)),

где h* — параметр преобразования косого сдвига вдоль оси Y, матрица преобразования которого имеет вид

1 0

h*1

Предположим далее, что A=YDX, т. е.

a11 a12 W 1 0)(2 0 Y1 hi 'і

a21 a22) Ih2 1A0 U A0 1 J . (7)

Перепишем (7) в виде

a11 = 2 ,

a12 = 2h2,

a21 = 2h1,

a22 = 2h1h2 + U .

Выразим параметры 2, h1, h2, /и через alh au, a2i, a22:

2 = a11 ,

hl — ^

a11

h2 = Hl

U =

a11

a11a22 - a12a21 a11

(8)

На основании выражений (8) и результатов проверки выполнения требований группы для разложения YDX оказалось, что YDX — тоже разложение матрицы А.

Так как разложения DXU и YDX являются центроаффинными группами, то они эквивалентны между собой, и комбинированное преобразование YDX можно разложить в DXU, и наоборот, т. е. YDX=DXU только при параметрах а, р, 2, и разложения DXU, равных

а — arctg (-

2h*

* у * у * :

2 hj h2 + и

),

U =

2=

2 h

sin а

2

cos а- sin а/г , h2 cosа-sina

h =—-----*----

cos а + h2 sin а

где 2 *,u*,hi*,h2*-параметры разложения YDX, имеющего вид

' 2 2h2 л

y2h1 2h1 h2 + /и)

А DXU=YDX только тогда, когда параметры X*,U*,h*i,h*2 разложения YDX будут иметь следующие значения:

2 — 2(cos а- h sin а),

, * sina + h cos а

h2 =-----Г~.--,

cos а- h sin а

, * /и sin а

h — ,

2(cosa- h sin а)

и =------Г~-— .

cosa-h sina

Здесь а, h, 2, и — параметры разложения DXU, имеющего вид (5).

Существуют и другие разложения центроаффинной матрицы:

A=DYU, A=XDY, A=DXY, A=DYX, A=UXD, A=UYD, A=UDY, A=UDX. (9)

Как говорилось в начале, не любая суперпозиция элементарных преобразований D, Y, X, U пригодна для разложения матрицы А. Только суперпозиция, являющаяся группой и содержащая в себе 4 параметра, имеющих взаимно-однозначное соответствие с параметрами а11, а12, а21, а22 , может являться разложением центроаффинной матрицы А. Если эти требования не выполняются, то такое комбинированное преобразование не есть разложение матрицы А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Например, комбинированные преобразования YXU, YUX не являются разложениями матрицы А .

На основе полученных разложений центроаффинной группы можно проводить как последовательную нормализацию изображений (построив соответствующую последовательность нормализаторов, например, при разложении DXU последовательность нормализаторов имеет вид FDFXFU), так и параллельную.

Основываясь на разложениях матрицы А и свойствах аффинного преобразования, можно для нахож-

РИ, 1998, № 4

93

дения параметров простых преобразований, входящих в разложение матрицы А, применить метод одномерной нормализации. Такая нормализация заключается в вычислении параметров для нормализации не всего изображения B(x,y), а только его ограничения Ъ(|) на некоторые прямые [1], что намного проще. Вычислив параметры одномерной нормализации и воспользовавшись разложением матрицы А, получим параметры для нормализации всего изображения, т. е. параметры матрицы обратного преобразования А-1.

Мы знаем, что при центроаффинном преобразовании центр тяжести изображения, находящийся в начале координат, остается неподвижным [1]. Так как аффинное преобразование переводит прямую в прямую [3,4], то любая прямая, проходящая через начало координат, при центроаффинном преобразовании переходит в (вообще говоря другую) прямую, проходящую через координаты (0;0). Таким образом, каждой прямой, проходящей через координаты (0;0), соответствует прямая реального изображения, полученного из эталонного центроаффинным преобразованием, проходящая также через точку (0;0). Соответствующие прямые эталонного и реального изображений будут отличаться углом наклона, а ограничения Ъ0(|) эталонного и Ъ(|) реального изображений на эти прямые будут различаться масштабом. Для нахождения параметров одномерной нормализации необходимо вычислить угол наклона и коэффициент масштаба между соответствующими прямыми.

Приведем пример использования методов одномерной нормализации и результатов разложений центроаффинной матрицы в суперпозицию простых преобразований для нахождения параметров нормализующей матрицы.

В качестве разложения нормализующей матрицы А выберем DXU и вычислим параметры простых преобразований, входящих в это разложение, применяя методы одномерной нормализации.

На рис.1 показано эталонное изображение, а на рис.2 — изображение, полученное путем воздействия на эталонное каким-либо центроаффинным преобразованием А.

У ▲

m

Рис. 1. Эталонное изображение

Рис.2. Изображение, искаженное центроаффинным преобразованием А

Выбрав на рис. 1 две перпендикулярные прямые l и т, например, координатные оси OX и OY, необходимо найти соответствующие им прямые на рис. 2 l и т и вычислить следующие 4 параметра: к і—коэффициент масштаба между ограничениями на прямые l и l; к2—коэффициент масштаба между ограничениями на прямые т и m; ср—угол между старым положением прямой l, в нашем случае осью OX, и l (новым положением прямой l); 9 — угол между прямой т* , перпендикулярной к прямой l , и прямой m.

Используя найденные параметры р, 9, кі, к2, определим параметры простых преобразований a, h, 2, /ив разложении DXU. Если в качестве перпендикулярных прямых l и т на эталонном изображении были выбраны координатные оси OX и OY, то

2 = 1/k1,

U = 1/(k2 cos9),

a = -р, (10)

h = -tg9 .

Подставив (10) в уравнение (6), получим параметры нормализующей матрицы А. Таким образом нормализация будет заключаться в воздействии на изображение полученной матрицей А, т. е. в одновременной компенсации всех преобразований, формирующих разницу между эталонным и реальным изображениями.

Можно также применить последовательную нормализацию, последовательно вычислив параметры 2, U, а, р и поочередно скомпенсировав преобразования U, X, D.

В заключение отметим, что все разложения (9) матрицы А эквивалентны между собой, но с точки зрения практической реализации они не равноценны. Критерием отбора наиболее подходящих могут быть: простота реализации, ограничения на допустимые значения параметров преобразований, помехозащищенность и т.д.

Литература: 1. Путятин Е.П. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320 с. 2. Мыш-кис АД. Математика для втузов. Специальные курсы. М.: Наука, 1971. 632 с. 3. Бакельман И. Я. Высшая геометрия. М.: Просвещение, 1967. 368 с. 4. ЯгломИ.М. Идеи и методы аффинной и проективной геометрии. М.: Учпедгиз, 1962. 247 с. 5. Бекмешев Д.В. Курс аналитической геометрии и линейной алгебры. М.: Наука, 1987. 320 с.

Поступила в редколлегию 10.11.98 Рецензент: д-р техн. наук Сироджа И.Б.

Путятин Евгений Петрович, д-р техн. наук, профессор, зав. кафедрой применения ЭВМ ХТУРЭ. Научные интересы: обработка и распознавание изображений. Адрес: Украина, 310726, Харьков, пр. Ленина,14, тел. 40-94-19.

Яковлева Елена Владимировна, аспирант кафедры применения ЭВМ ХТУРЭ. Научные интересы: обработка и распознавание изображений. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. 40-94-19.

Любченко Валентин Анатольевич, студент ХТУРЭ. Научные интересы: компьютерная графика, распознавание образов. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. 40-94-19.

94

РИ, 1998, № 4

УДК 519.85

ПОБУДОВА ОПУКЛОЇ ОБОЛОНКИ ЗАГАЛЬНОЇ МНОЖИНИ СПОЛУЧЕНЬ

Зазначимо, що симплексні вершини не лежать в

одній площині. Позначимо Q^jn(G) — загальний многогранник сполучень.

Якщо всі вершини Q ^n (G) симплексні, то многогранник задається системою нерівностей:

ЄМЕЦЬ О.О., РОСКЛАДКА А.А.

Пропонується метод виокремлення, що дозволяє значно зменшити кількість досліджуваних точок, необхідних для побудови опуклої оболонки загальної множини сполучень.

Проблема побудови опуклої оболонки деякої множини точок була і залишається актуальною при розв’язанні задач дискретної взагалі і комбінаторної зокрема оптимізації [1], оскільки вона визначає множину допустимих розв’язків задачі. Велика кількість робіт, наприклад [2,3], присвячена пошукууніверсального підходу до побудови опуклої оболонки скінченної множини точок. В [2] розглядається алгоритм побудови такої оболонки у вигляді множини розв’язків системи лінійних нерівностей, робиться його аналіз при наближених обчисленнях, а також дається спосіб обчислення оцінки похибки результату. В [3] в наведений вище алгоритм вводиться додаткова умова, яка значно підвищує його складність, проте у випадку точних обчислень при застосуванні цього алгоритму виключається можливість виникнення зайвих нерівностей.

Велика кількість оптимізаційних задач розв’язується на множинах сполучень [1] (задача про ранець, задача інтерполяції дискретної функції, що отримана експериментальним шляхом, та багато інших). В [4] дається аналітичний опис многогранника сполучень з повтореннями. Знайдено також розв’язок [5] для двох спеціальних класів множин сполучень.

В даній статті пропонується алгоритмічний підхід до побудови опуклої оболонки для загальної множини сполучень.

Введемо необхідні означення.

Нехай Jn — множина n перших натуральних чисел, тобто Jn ={l,...,n}. Jn = Jn u{0}, J0 = 0.

Розглянемо мультимножину G = {g 1,..., gn} ,

gi є R* 1, Vi є J n . Елементами евклідової множини k-

сполучень [4] S^jn(G) є всі упорядковані k-вибірки з мультимножини G вигляду

e = (g il,g І2,...,g ik ) (1)

при виконанні умови gц < gi2 <■. < gik , де

gij є^ ij ф it V ij, it є Jn , V j, t є Jk .

Означення 1 [5]. Симплексними точками множини s|^n(G) в Rn називаються точки

yj = (Уj1, . ,yjn) єRn Vj є j0,

yji = gi Vi є J°_j, yj(n-i+1) = gn-i+1 Vi є J°.

gi g n—n +i

x1 - g1, xn - gn xi xi +1 -

g n — n +i +1 g i+1

g n—n+i +1'g i g n—n+i'g i+1

(2)

g n—n+i+1 _ g i+1 Означення 2 [5]. Індексом n(e) довільного елемента e єЗ^ф^) вигляду (1) називається n-вимірний

-

вектор n(e) = (i 1,i2 — i1,...,in — in—1).

Означення 3 [5]. Точка e називається регулярною, якщо в індексі n(e) всі неодиничні компоненти оточені одиничними, а також у випадку, якщо

in — in — 1 + 1,то in =n.

Позначимо R Пп (G)

множину регулярних то-

чок slnn(G).

Твердження [5]. Множина вершин многогранни-k •

ка Q nn(G) є шдмножиною множини регулярних точок R nn (G).

Алгоритм, що запропонований у [2], будує опуклу

оболонку множини s точок в R n , властивості яких невідомі. Для цього складають систему

—Xі - 0, i є Js,

— ZX jv;1 + yi = 0, 1 є Jn, EX j = 1

j =1 l j =1

відносно змінних y = (y1,...,yn) єRn і

X = (X1,...,Xs) єRs . Виключивши з неї змінні

X 1,..., X n + 1, отримують систему нерівностей

Z с jX j +Z с j + syj < с 0, i є Jn + 1, j=n+2 J j=1 J

(3)

—Xі < 0, i = n + 2,...,s,

яка описує опуклу оболонку n+1 точки. Поступово

виключаючи з системи (3) змінні Xn+2,...,Xs, отримують опуклу оболонку заданої множини точок.

Введення в умову вектора змінних X пов’язано з тим, що процес створення опуклої оболонки ведеться безпосередньо (тобто не використовується приєднання точок до відомої опуклої оболонки). В тому випадку, коли відома опукла оболонка принаймні n+1 точки, приєднання решти точок до існуючої оболонки відбувається без застосування вектора змінних X . Таким чином, обертаються на нуль всі доданки, що утворюють першу суму в нерівностях системи (3), значно спрощуючи її вигляд. Такий алгоритм із спрощеною структурою назвемо модифікованим алгоритмом Черних. Застосування до знаходження аналітичного опису загального многогран-

РИ, 1998, № 4

95

ника сполучень саме модифікованого алгоритму обумовлено ТИМ, що для точок множини S^nCG) відомий аналітичний опис симплексу, який має n+1 вершину і є підмножиною загального многогранника сполучень. Модифікований алгоритм Черних застосовується до точок S^nCG), координати яких не задовільня-ють хоча б одну з нерівностей (2), тобто тих, які не лежать у симплексі, по черзі приєднуючи їх до множини симлексних вершин. Точки, які лежать всередині симплексу, а також ті, які не є регулярними, виключаються з розгляду, оскільки явно не можуть

бути вершинами многогранника Q Пщ (G).

Таким чином, алгоритм побудови опуклої оболонки точок загальної множини сполучень складається з трьох основних етапів:

1. Із точок S^n(G) виділяється множина регулярних точок R Пщ (G).

2. Із точок, що належать R^n(G), виокремлюється множина точок, які не лежать у симплексі.

3. До отриманої множини точок застосовується модифікований алгоритм Черних.

При реалізації даного алгоритму на ЕОМ було встановлено, що, наприклад, з мультимножини G, яка

з

містить 20 елементів у просторі R , загальна кількість

точок множини S^n(G) становить 1140. З них на першому етапі алгоритму виокремлюється 204 точки, а на другому — 116 точок, які тільки і використовуються при побудові Q^n(G). В результаті застосування запропонованого підходу кількість точок, які

використовуються при побудові опуклої оболонки множини S^n (G), зменшується практично у 10 разів.

Розглянутий алгоритм можна застосувати до знаходження опуклої оболонки тих евклідових комбінаторних множин, для яких відомий аналітичний опис частини многогранника.

Література: 1. Сергиенко И.В., Каспшицкая М.Ф. Модели и методы решения на ЭВМ комбинаторных задач оптимизации. К: Наук.думка, 1980. 208 с. 2. Черных О.Л. Построение выпуклой оболочки конечного множества точек при приближенных вычислениях // Журн. вычисл. математики и мат. физики. 1988. №9. С.1386-1396. 3. Черных О.Л. Построение выпуклой оболочки конечного множества точек на основе триангуляции // Журн. вычисл. математики и мат. физики. 1991. №8. С. 1231-1242. 4. Стоян Ю.Г., Ємець О. О. Теорія і методи евклідової комбінаторної оптимізації. К.: ІСДО. 1993. 188 с. 5. Пичугина О.С. Методы и алгоритмы решения некоторых задач оптимизации на множествах сочетаний и размещений: Дис. ...канд. физ.-мат. наук. Харьков: ХТУРЭ, 1996. 160 с.

Надійшла до редколегії 15.11.1998 Рецензент: д-р техн. наук Гіль М.І.

Ємець Олег Олексійович, д-р фіз.-мат. наук, доцент, завідувач кафедри прикладної математики та математичного моделювання Полтавського державного технічного університету ім. Юрія Кондратюка. Наукові інтереси: комбінаторна оптимізація та геометричне проектування. Захоплення: бадмінтон, філателія. Адреса: Україна, 314601, Полтава, Першотравневий проспект, 24, тел. 7-97-18.

Роскладка Андрій Анатолійович, аспірант кафедри прикладної математики та математичного моделювання Полтавського державного технічного університету ім. Юрія Кондратюка. Наукові інтереси: комбінаторна оптимізація.Захоплення: баскетбол і плавання. Адреса: Україна, 314601, Полтава, Першотравневий проспект, 24, тел. 3-79-84.

УДК 519.767.2

ОЦЕНКА ПОНИМАНИЯ СМЫСЛА ЕЯ КОМПАРАТОРНЫМ МЕТОДОМ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

КАЛИНОВСКИЙА.С., РУБЛИНЕЦКИЙВ.И., РЯБОВА Н.В.

Рассматривается проблема оценки понимания смысла ЕЯ различными компьютерными системами, предназначенными для обработки ЕЯ текстов. Излагается методика компараторной идентификации на основе тесттекстов (ТТ) для оценивания меры смысловой схожести текстов. Предлагаются три алгоритма, позволяющие на множестве простых ТТ надежно распознавать тексты с одинаковым смыслом.

1. Постановка проблемы

Когда Бог решил пресечь строительство вавилонской башни, он сделал так, что строители начали разговаривать на разных языках. Сегодняшняя вавилонская башня — самая трудная задача, решаемая человеческой наукой и техникой, — это проблема понимания, точнее — проблема понимания компьютером человеческого естественного языка (ЕЯ). Со времени постановки задачи прошло полстолетия, быстродействие и память машин увеличились на много порядков, во многих областях интеллектуальной деятельности машина давно обогнала человека,

а в башне проблемы понимания едва выстроен первый этаж. Причина, в основном, состоит в трудности самой задачи, но также и в том, что строители упорно говорят на разных языках.

Специальная литература предлагает много программных систем с благозвучными названиями (АИСТ, ПОЭТ, FAUSTUS, Элиза и т.п.), которые в какой-то мере понимают текст. Было бы очень удобно знать, в какой действительно мере они это делают. Тогда было бы легче ориентироваться, какие системы сильнее и какие подходы обещают больше. Не зря отец современной науки Галилей советовал: “Измеряй все измеримое и делай неизмеримое измеримым”.

Многие из разработанных в интересующей нас области систем узко направлены на решение специальных задач. Так, система Винограда [1] понимает подъязык, описывающий манипуляции с несколькими фигурами на экране компьютера; она разумно уточняет неясные и отвергает невыполнимые команды, правильно манипулирует с фигурами. Программа Элиза, созданная Вейценбаумом [2], подражает речам психотерапевта. Программа Командина [3] извлекает смысл из объявлений о купле, продаже, съеме и сдаче квартир, представляя смысл объявления точкой в многомерном пространстве признаков. Полный список таких программ спецназначения имел бы длину средней статьи. Многие из этих систем узкого назначения вполне удачны. Так, девушки, которые сами писали отдельные процедуры системы Элиза, оставались после работы, чтобы,

96

РИ, 1998, № 4

переговорив с Элизой, облегчить душу. К сожалению, непонятно, как сравнивать силу систем разной специализации.

Однако существует много систем, претендующих на универсальность. Их, казалось бы, можно натравить на один и тот же экзаменационный материал и таким образом сравнить по эффективности. Но здесь есть свои трудности: системы рассчитаны на разные языки, одни лучше понимают, другие лучше синтезируют ответ и т.д. Проблему языка, естественно, решать нам, оставляя родной и английский, как самый распространенный в такого рода исследованиях. Что касается разных стадий обработки текста, то мы остановимся на самой трудной из них — понимание текста.

Итак, мы поставили вопрос, которому посвящена эта работа: КАК СРАВНИВАТЬ ПО ЭФФЕКТИВНОСТИ (и в этом смысле измерять) РАЗНЫЕ ПРОГРАММНЫЕ СИСТЕМЫ, КОТОРЫЕ ЗАНИМАЮТСЯ (может быть, наряду с другими задачами) ПОНИМАНИЕМ ТЕКСТОВ НА РУССКОМ И/ ИЛИ АНГЛИЙСКОМ ЯЗЫКАХ?

2. Разные методы оценки понимания

Перечислим наиболее распространенные методики оценки меры понимания текста.

А. Оценка переводом на другой язык Пусть, скажем, программа машинного перевода (МП) с английского на русский правильно перевела предложение

I saw the table (1)

как

Я видел стол (2)

Хорошо ли поняла текст (1) эта программа? Такой перевод может сделать даже тривиальная программа пословного перевода с учетом частоты слов: она переведет saw как видел, а не как пила, потому что первое значение имеет большую частоту; по этой же причине она переведет table как стол, а не как таблица. Если повезло и я — мужского рода, то перевод хорош, хотя программа совсем лишена понимания.

Второй недостаток перевода как мерила понимания состоит в том, что качество перевода существенно зависит от умения синтезировать ответ, а это — преодоление трудности другой природы.

Наконец, использование перевода как мерила понимания предусматривает умение оценивать качество перевода, а это весьма трудное дело. Перевод всегда неточен. Это подтверждено блестящим экспе -риментом [4], который был устроен так. Все начиналось с текста Т0 на языке 0. Переводчик 1 переводил его в текст Т1 на языке 1. Этот текст давали переводчику 2, который переводил его в текст Т2 и так далее 30 раз. Последний раз текст переводился снова на язык 0. Все переводчики были профессионалы. В результате текст (отрывок из Гоголя):

Он хотел взглянуть на прыщик, который вчерашнего вечера вскочил у него на носу; но, к величайшему изумлению, увидел, что у него вместо носа совершенно гладкое место (3)

превратился в

Вглядываясь с маяка в даль, она выронила трубу, узнав остатки его фрегата (4)

Непонятно, как мерить смысловую погрешность перевода и, следовательно, как мерить погрешность понимания.

B. Оценка через вопросно-ответные системы

Простейшая оценка получается введением текста, после чего задаются вопросы по тексту типа “Дед репку что?” Большинство правильных ответов здесь можно получить механической рекомбинацией слов исходного текста.

Использование более сложных диалоговых систем (типа Элизы) не спасает положения. Однажды произошел курьезный случай, когда вице-президент крупной американской компании по производству ЭВМ, сам того не ведая, реализовал тест Тьюринга. Как-то ему понадобилось связаться с известным системным программистом Д. Бобровым, работающим в этой компании. Стандартная связь по телетайпу привела к следующей беседе [5, с. 131-132]:

“Вице-президент: Нельзя ли мне сейчас воспользоваться ЭВМ?

Бобров: А почему Вы спрашиваете?

Вице-президент: Может быть, мне удастся заключить сделку.

Бобров: Почему Вы в этом уверены?

Вице-президент: Мои предполагаемые покупатели никогда не видели

нашу систему в действии.

Бобров: Это имеет для Вас большое значение?

Вице-президент: Конечно.

Бобров: Вы как будто сомневаетесь в этом?

Вице-президент: Что за нелепое замечание!

Бобров: Что Вы имеете в виду, говоря о нелепом замечании?

Вице-президент: Возражаете ли Вы против того, чтобы я сейчас

воспользовался ЭВМ?

Бобров: Расскажите мне побольше о Ваших предполагаемых покупателях.

Вице-президент: Позвоните мне 491-1850!”

Недоразумение выяснилось лишь позднее, когда вице-презцдент стал отчитывать своего сотрудника. Оказалось, что телетайп соединил его не с самим Бобровым, а с ЭВМ, на которой была реализована экспериментальная диалоговая программа, осуществляющая, подобно Элизе, фатический диалог, т.е. диалог, когда следующая ремарка строится вероятностно-механическим преобразованием предыдущей.

Возможность фатического диалога делает вопросно-ответные системы негодным мерилом понимания смысла.

C. Оценка по действиям

Правильность выполнения действий в манипуля-торных системах так же мало годится для оценки понимания смысла, поскольку такие программы используют неестественно узкое подмножество ЕЯ. Кроме того, ошибки непонимания бывают разной величины, которую непонятно, как измерять.

Нужен какой-то другой подход к сравнению эффективности систем рассматриваемого вида. Мы предлагаем такой подход.

3. Сравнение понимания тест-текстов (ТТ)

Предлагаемая методика называется компараторным методом [6] и состоит в том, что оцениваемой системе предлагаются пары текстов на ЕЯ, одни из которых схожи по смыслу, а другие — нет. Эффективность системы оценивается по числу ошибок. Очевидно, ошибки бывают двух родов: первый — сходство утверждается на паре несхожих текстов и

РИ, 1998, № 4

97

второй — сходство отрицается на паре схожих текстов. Ошибки не равносильны — сделать ошибку первого рода труднее, чем второго. Поэтому оценка эффективности системы на p парах:

Р

E = ^ Cl ek(1) + С2 ek(2) , (5)

к = 1

где ci, c2 — веса ошибок первого и второго рода, а ek(1)= (0, 1) и ek(2) = (0, 1) — число ошибок первого и второго рода в k-м сравнении.

Сразу встает вопрос, какого вида должны быть ТТ, и кто и как будет определять их схожесть по значению. Нам представляется, что по виду ТТ должны быть краткими (установление схожести кратких текстов труднее, чем длинных). Далее, ТТ должны быть приблизительно одинаковыми по размеру, чтобы тривиальный признак размера не помогал в сравнении. Желательно также, чтобы ТТ были самозамкнутыми: тогда не возникают дополнительные трудности связи с объемлющим контекстом. Что касается схожести текстов по смыслу, то это должны быть группы (удобнее — пары) разных переводов одного и того же оригинала или пары оригинал-перевод.

Приведем пример набора из шести ТТ, образующих три пары схожих текстов. Это первые три (из 44) афоризма Ницше из книги “Сумерки идолов” в переводах Н.Полилова (номера без штрихов) и Г.Сне-жинской (номера со штрихами).

Праздность есть мать всей психологии. Как ?Разве психология — порок? (6)

Праздность — мать всей психологии. Да ну? Неужто психология — порок? (6’)

И самый мужественный из нас лишь редко обладает мужеством на то, что он собственно знает (7) Порой и у самых отважных не хватает отваги на то, что им известно... (7’)

Чтобы жить в одиночестве, надо быть животным или Богом, говорит Аристотель. Не хватает третьего случая: надо быть и тем, и другим — философом. (8) Чтобы пребывать в одиночестве, надо быть животным или Богом, утверждает Аристотель. Отсутствует третий случай: быть и тем, и другим — философом. (8’)

Приведенные тексты — очень легкие, их можно успешно решить простым формальным алгоритмом, который, даже не вникая в структуру предложения, выполняет подсчет общих слов. Мы имеем в виду следующий Алгоритм 1

1. Ввести очередную пару текстов Tj и Tk; удалить все союзы, частицы, междометия, предлоги как неинформативные слова, часто встречающиеся во всех текстах; привести все изменяемые слова к канонической форме.

2. Из оставшихся слов в Tj и Tk образовать соответственно два множества Mj и Mk (учитывая, однако, разные словоупотребления одного слова как разные элеметы). Пусть mj = |Mj и mk = |Mk|. Пусть mik—число элементов в пересечении Mj n Mk, а mjk— средний размер множества: mjk= (mj + mk)/2. Мера пословного совпадения rjk задается формулой:

rik = njk / mjk . (9)

{Комментарий: rik меняется от 0, когда нет ни единого общего слова в Mi и Mk, до 1, когда Mi=Mk}.

3. Если rik > h (h — некий порог, численное значение которого будет оценено позднее), то Tj=Tk (Ti сходно по значению с Tk ), иначе Tj ф Tk .

4. Если не все пары исчерпаны, перейти к п.1. Пример 1. Пропустим через Алгоритм 1 пару (6),

(6’). Получим:

M(6) = {праздность, есть, мать, весь, психология, как, психология ’, порок},

M(6) = {праздность, мать, весь, психология, как, психология ’, порок};

m (6, 6’) = 7; n (6, 6’) = 6; r (6, 6’) = 6/7 » 0,86. Конец примера.

Считая rjk для всех шести пар, получаем следующую (симметрическую) матрицу:

6 6' 7 7' 8 8'

6 1 0,86 0 0 0 0

6' 0,86 1 0 0 0 0

7 0 0 1 0,32 0,07 0,08

7' 0 0 0,32 1 0,08 0,08

8 0 0 0,07 0,08 1 0,65

8' 0 0 0,08 0,08 0,65 1

Элемент r (7, 7’), выражающий пословное совпадение схожих текстов, достаточно мал. Однако если усилить Алгоритм 1, определяя пересечение не как множество одинаковых слов, а как множество либо одинаковых слов, либо синонимов (что устанавливается формально—введением словаря синонимов), то r (7, 7’) возрастет до 0,53. Алгоритм 1, усиленный узнаванием синонимов, назовем Алгоритмом 2.

Приведенные и многие другие вычисления показывают, что для Алгоритма 1 годится значение порога h = 0,2, а для Алгоритма 2 — h = 0,4; при этих значениях порога надежно распознается смысловое сходство отрывков прозы.

Тексты для сравниваемых пар можно также подбирать из разных языков. Только здесь пересечение Mj n Mk строится не из равных слов и не их синонимов, а иначе. Например, так: пусть имеется пара текстов — оригинал (Tj) и перевод (Tk). Если слово v є Mj, а we Mk и в фиксированном двуязычном словаре (из языка текста Tj на язык текста Tk) в статье слова v найдется перевод слова w, то пара (v, w) входит в пересечение. Проиллюстрируем такой Алгоритм 3 на примере пословиц с

большим пословным совпадением.

All that glitters is not gold (10)

Не все то золото, что блестит (10’)

As sow, so shall you reap (11)

Что посеешь, то пожнешь (11’)

Better late than never (12)

Лучше поздно, чем никогда (12’)

Blood is thicker than water (13)

Кровь людская — не водица (13’)

Catch the bear before you sell its skin (14)

Не дели шкуру неубитого медведя (14’)

The devil is not so black as he is painted (15)

Не так страшен черт, как его малюют (15’)

98

РИ, 1998, № 4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пример 2. Применим Алгоритм 3 к сравнению текстов (10) и (10’):

M (10) = {all, glitter, be, gold};

M (10’) = {весь, тот, золото, блестеть}.

В известном англо-русском словаре Мюллера статья all содержит весь, статья glitter содержит блестеть, статья gold содержит золото. Итак, m (10, 10’) = 4, n (10, 10’) = 3, r (10, 10’) = 0,75.

Конец примера.

Сравнивая разноязычные тексты из (10) — (15’), получаем следующую матрицу:

10' 11' 12' 13' 14' 15'

10 0,75 0 0 0 0 0

11 0 0,4 0 0 0,15 0,27

12 0 0 1 0,22 0 0

13 0 0 0 0,5 0 0,15

14 0 0,15 0 0 0,36 0,14

15 0 0,27 0 0,15 0,14 0,43

Как видим, на диагонали стоят числа, достаточно удаленные от 1, т.е. пословная близость, задаваемая формулой (9), невелика при переводе пословиц. Это замечание относится к переводу текстов любого жанра. Как показала Н.В.Шаронова [7], сравнив переводы одного фрагмента прозы на семь языков, пословная близость колеблется возле r = 0,5 и не уменьшается при переводе на близкородственные языки. Сказанное означает, что системы МП, ориентированные на перевод, близкий к пословному, не могут обеспечить удовлетворительного качества.

Вернемся к оценке компараторным методом. Обсуждение примеров (6)-(8’) и (10)-(15’) показало, что они слишком просты для тестирования сложных систем. Алгоритмы 1 — 3 описаны, главным образом, для того, чтобы отсевать тривиальные ТТ.

4. Более трудные ТТ

Приведенные выше рассуждения отнюдь не означают, что трудно найти трудные ТТ. Например, такой жанр, как поэтические переводы одного оригинала разными переводчиками, является богатым источником трудных ТТ. Приведем для примера два перевода (О. Румером и Г. Плисецким) одного и того же рубаи Омара Хайяма:

Где высился чертог в далекие года,

И проводила дни султанов череда,

Там нынче горлица кричит среди развалин И плачет бедная: “Куда? Куда? Куда?” (16)

Здесь владыки блистали в парче и шелку,

К ним гонцы подлетали на полном скаку.

Где все это ? В зубчатых развалинах башни Сиротливо кукушка кукует: “Ку-ку!” (16’) Несмотря на явное сходство смыслов, Алгоритм 2 (полагая с натяжкой, что чертог и башня являются синонимами, и обнаружив общее слово развалина) дает пословную близость r (16, 16’) = 0,1. Еще одним богатым источником трудных ТТ являются пословицы. Некоторые, расходясь по словесному выражению, имеют общность структуры, например:

Out of sight, out of mind (17)

С глаз долой — из сердца вон (17’)

В профессиональном фольклоре бытует байка, что (17) перевели на русский, а потом обратно на английский и получили “Invisible idiot”.

Самый трудный класс ТТ—это пословицы схожего смысла, где разнятся и слова, и структура; например: Jack of all trades (18)

И швец, и жнец, и в дуду игрец (18’)

Наличие тестов для оценки эффективности программ —событие, часто встречающееся в более строгих науках. Так, в теории дискретной оптимизации новые подходы часто пробуют на задаче коммивояжера, которая принята как своеобразный пробный камень. Чтобы результаты можно было сравнивать, опубликовано несколько конкретных задач [8], на которых испытывается эффективность новых процедур.

Приведем десять ТТ типа (16) — (18).

5. Библиотека ТТ повышенной трудности

А. Переводы рубаи Омара Хайяма разными авторами

О, если б каждый день иметь краюху хлеба,

Над головою кров, и скромный угол, где бы Ничьим владыкою, ничьим рабом не быть!

Тогда благословить за счастье можно б небо. (19)

Если есть у тебя для жилья закуток —

В наше подлое время — и хлеба кусок,

Если ты никому ни слуга, ни хозяин —

Счастлив ты и воистину духом высок. (19’)

Мужи, чьей мудростью был этот мир пленен,

В ком светочей познанья видел он,

Дороги не нашли из этой ночи темной, Посуесловили и погрузились в сон. (20)

Даже самые светлые в мире умы Не смогли разогнать окружающей тьмы, Рассказали нам несколько сказочек на ночь И отправились, мудрые, спать, как и мы. (20’)

Когда бываю трезв, не мил мне белый свет, Когда бываю пьян, впадает разум в бред,

Лишь состояние меж трезвостью и хмелем Ценю я, — вне его для нас блаженства нет. (21)

Трезвый я замыкаюсь, как в панцире краб. Напиваясь, я делаюсь разумом слаб.

Есть мгновенье меж трезвостью и опьяненьем, Это высшая правда, и я — ее раб! (21’)

Я в мечеть не за праведным словом пришел,

Не стремясь приобщиться к основам пришел.

В прошлый раз утащил я молитвенный коврик, Он истерся до дыр — я за новым пришел. (22)

Вхожу в мечеть. Час поздний и глухой.

Не в жажде чуда я и не с мольбой.

Когда-то коврик я стянул отсюда,

А он истерся; надо бы другой! (22’)

Вино запрещено, но есть четыре “но”:

Смотря, кто, с кем, когда и в меру ль пьет вино.

При соблюдении сих четырех условий

Всем здравомыслящим вино разрешено. (23)

Запрет вина — закон, считающийся с тем,

Кем пьется, и когда, и много ли, и с кем.

Когда соблюдены все эти оговорки,

Пить — признак мудрости, а не порок совсем. (23’)

Общаясь с дураком, не оберешься срама, Поэтому совет ты выслушай Хайяма.

Яд, мудрецом предложенный, прими.

Из рук же дурака не принимай бальзама. (24)

РИ, 1998, № 4

99

Капля камень точит

(37’)

Знайся только с достойными дружбы людьми.

С подлецами не знайся, себя не срами.

Если подлый лекарство нальет тебе — вылей! Если мудрый подаст тебе яду — прими! (24’)

Несовместимых мы полны желаний,

В одной руке бокал, другая на Коране,

Вот так мы и живем под небом голубым, Полубезбожники и полумусульмане. (25)

Держит чашу рука, а другая — Коран,

То молюсь до упаду, то до смерти пьян.

Как лишь терпит нас мраморный свод бирюзовый— Не кафиров совсем, не совсем мусульман. (25’)

Нет благороднее растенья и милее,

Чем черный кипарис и белая лилея.

Он, сто имея рук, не тычет их вперед,

Она всегда молчит, сто языков имея. (26)

Да, лилия и кипарис — два чуда под луной,

О благородстве их твердит язык любой.

Имея десять языков, она всегда молчит,

А он, имея двести рук, не тычет ни одной. (26’)

Я — словно старый дуб, что бурею разбит;

Увял и пожелтел гранат моих ланит,

Все естество мое — колонны, стены, кровля, — Развалиною став, о смерти говорит. (27)

Старость — дерево, корень которого сгнил. Возраст алые щеки мои посинил.

Крыша, дверь и четыре стены моей жизни Обветшали и рухнуть грозят до стропил. (27’)

Мы больше в этот мир вовек не попадем,

Вовек не встретимся с друзьями за столом,

Лови же каждое летящее мгновенье —

Его не подстеречь уж никогда потом. (28)

Боюсь, что в этот мир мы вновь не попадем,

И там своих друзей — за гробом — не найдем. Давайте пировать в сей миг, пока мы живы. Быть может, миг пройдет — мы все навек уйдем.

(28’)

B. Пословицы, где слова разные, но структуры схожи

Better an egg today than a hen tomorrow (29) Лучше синица в руках, чем журавль в небе (29’)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Stretch your legs according to your coverlet (30) По одежке протягивай ножки (30’)

Do not halloo till you are out of the wood (31) Не кричи гоп, пока не перескочишь (31’)

Do not make a mountain out of a molehill (32) Не делай из мухи слона (32’)

Dog does not eat dog (33)

Ворон ворону глаз не выклюет (33’)

East or West, home is best (34)

В гостях хорошо, а дома лучше (34’)

Make hay while the sun shines (35)

Куй железо, пока горячо (35’)

If “ifs” and “cans” where pots and pans (36) Если бы да кабы во рту выросли грибы (36’)

Little strokes fell great oaks (37)

Bought a pig in a poke (38)

Купил кота в мешке (38’)

C. Пословицы, где и слова, и структуры — разные

All is fish that comes to the net (39)

На безрыбье и рак рыба (39’)

The biter is sometimes bit (40)

Вор у вора дубинку украл (40’)

Clothes do not make the men (41)

По одежке встречают — по уму провожают(41’)

Diamond cuts diamond (42)

Нашла коса на камень (42’)

Do as you would be done by (43)

Не рой другому яму (43’)

The early bird catches the worm (44)

Кто рано встает, тому Бог дает (44’)

Every cloud has its silver lining (45)

Нет худа без добра (45’)

Thefish will soon be caught that nibbles at every bait (46)

Любопытной Варваре нос оторвали (46’)

Great oaks from little acorn grow (47)

Всяк бык теленком был (47’)

Haste makes waste (48)

Поспешишь — людей насмешишь (48’)

Литература. 1. Виноград Т. Программа, понимающая естественный язык. М.: Мир. 1976. 294 с. 2. Вейценбаум Дж. Возможности вычислительных машин и человеческий разум: От суждений к вычислениям. М.: Радио и связь. 1982. 370 с. 3. Командин А.Ф. Обобщенные пространства и их применение для автоматической обработки текстов естественного языка. Дисс. канд. техн. наук, X., 1995. 134с.

4. Рогинский В.Н. Человек разговаривает с ЭВМ. М.: Знание. 1976. 64 с. 5. Поспелов ДА. Фантазия или наука: На пути к искусственному интеллекту. М.: Наука. 1982. 220 с

6. Шабанов-Кушнаренко Ю.П., Шаронова Н.В. Компараторная идентификация лингвистических объектов. К.: ИСИО, 1993. 116с. 7. Шаронова Н.В. Компараторная идентификация лингвистических объектов. Дисс. докт. техн. наук , X., 1994. 354 с. 8. Хелд М, Карп Р.М. Применение динамического программирования к задачам упорядочения / В кн.: Кибернетический сборник. Вып. 9. М.: Мир. 1964. С. 202-218.

Поступила в редколлегию 09.02.98 Рецензент: д-р техн. наук Смеляков С.В.

Калиновский Андрей Станиславович, аспирант кафедры ПОЭВМ ХТУРЭ. Научные интересы: интеллектуальные компьютерные технологии, системы обработки естественно-языковой информации, базы данных и знаний. Адрес: Украина, 310726, Харьков, пр. Ленина, 14,тел. 40-94-46.

Рублинецкий Владимир Ильич, старший научный сотрудник кафедры ПОЭВМ ХТУРЭ. Научные интересы: компьютерная лингвистика, машинное понимание естественного языка, машинный перевод. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. 40-94-46.

Рябова Наталия Владимировна, канд. техн. наук, доцент филиала кафедры ИИИС ХТУРЭ. Научные интересы: интеллектуальные компьютерные системы, обработка естественного языка, извлечение знаний из текстовых баз данных. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. 40-98-90

100

РИ, 1998, № 4

УДК 519.7

О ЛИНГВИСТИЧЕСКОЙ АЛГЕБРЕ

БАТАЛИНА.В., ДУДАРЬ З.В, СТОРОЖЕНКО А.В., ШАБАНОВ-КУШНАРЕНКО Ю.П.

Предпринимается попытка идентифицировать некоторые механизмы естественного языка в виде математической структуры, названной лингвистической алгеброй. В ней имеются два яруса — семантический и синтаксический. Первый ярус представляется одним из вариантов алгебры предикатов, второй — алгебры предикатных операций. Рассматривается метод экспериментальной проверки алгебро-логических моделей языка. Разрабатывается способ формульной записи смысла словосочетаний и предложений естественного языка.

1. Введение

Естественный язык представляет собой сложный объект. Чтобы преуспеть в математическом анализе механизма языка, необходим правильный подход к его изучению. В данной статье в качестве такового используется гипотеза, гласящая, что естественный язык — это какая-то алгебра. Последняя называется лингвистической алгеброй. Ставится задача: как можно конкретнее и детальнее описать механизм лингвистической алгебры.

Охарактеризуем общее понятие алгебры, которое затем будет использовано в качестве инструмента математического описания механизма естественного языка. Алгеброй А над А называется любая система формульной записи элементов какого-нибудь множества А. Множество А называется носителем алгебры А. Любая алгебра А над А характеризуется своими базисными операциями, используемыми в роли преобразователей ее элементов, и базисными элементами, выбираемыми из ее носителя А. Множество всех базисных операций алгебры А называется ее базисом операций, множество всех базисных элементов -базисом элементов алгебры А. Базис операций и базис элементов, взятые вместе, образуют базис алгебры А.

Формулой алгебры называется любая запись, которая выражает какую-нибудь суперпозицию базисных операций этой алгебры, примененную к ее базисным элементам. Каждая формула алгебры выражает некоторый элемент ее носителя и в этой роли может использоваться как его имя. Алгебра А называется полной, если каждый элемент ее носителя можно выразить в виде какой-нибудь формулы алгебры А. Базис алгебры называется полным, если эта алгебра полна. Он называется несократимым, если исключение любой операции или элемента из базиса делает его неполным. Любые две формулы алгебры, выражающие один и тот же элемент ее носителя, называются тождественными. Тождеством алгебры А называется любая запись, указывающая какую-нибудь пару тождественных формул алгебры А. Если алгебры А и В заданы над одним и тем же носителем А, то в этом случае допустимо говорить о тождественных формулах различных алгебр. Система тождеств алгебры А называется полной, если из нее можно вывести факт тождественности или нетождественности любых двух формул алгебры А. Система тождеств алгебры называется несократимой, если ни одно из ее тождеств невозможно логически вывести из совокупности

остальных. Схемой тождеств алгебры называется любая запись, указывающая какое-нибудь семейство тождеств этой алгебры.

Из гипотезы о том, что естественный язык есть алгебра, можно вывести много разнообразных следствий, которые допускают опытную проверку. Так, каждое предложение и образуемый из предложений текст выражают некоторую мысль, поэтому мысли следует рассматривать как элементы носителя лингвистической алгебры, а соответствующие им предложения (тексты) — как описывающие их формулы. Предложения и тексты должны строиться тем же способом, который используется при образовании формул. Предложения, выражающие одну и ту же мысль, необходимо рассматривать как тождественные формулы лингвистической алгебры.

Мысли интернациональны, каждую из них можно выразить на любом языке. Разные языки (например, русский и английский) необходимо рассматривать как различные лингвистические алгебры, заданные над одним и тем же носителем — множеством всевозможных мыслей, которыми способны оперировать люди. Предложения разных языков, выражающие одну и ту же мысль, — это тождественные формулы. Перевод текстов с одного языка на другой следует считать переходом от формул одной лингвистической алгебры к тождественным им формулам другой, заданной над тем же носителем. В роли носителя любой лингвистической алгебры выступает множество всех мыслей, которыми способны оперировать люди.

Проверяя в лингвистическом эксперименте следствия, выводимые из этой гипотезы и других допущений, формулируемых ниже, можно подтвердить или опровергнуть исходные положения (аксиомы) создаваемой таким способом теории естественного языка. Если удастся получить большое число разнообразных следствий из аксиом и при этом окажется, что ни одно из них не противоречит фактам языка и речи, то это обстоятельство можно будет расценить как подтверждение развиваемой теории. Если же некоторые из формулируемых гипотез не выдержат испытания или подтвердятся лишь частично, то ничто не помешает заменить их более совершенными, опираясь на полученные отрицательные результаты.

2. Мысли как предикаты

Важно ответить на вопрос: какова структура элементов носителя лингвистической алгебры? Иными словами, какова математическая природа мыслей, выражаемых предложениями и текстами, т.е. что представляет собой смысл (иначе — содержание) любого предложения (текста) естественного языка? На этот счет будем придерживаться следующей гипотезы: мысли — это предикаты. Если это так, тогда лингвистическую алгебру следует рассматривать как алгебру предикатов. Эта гипотеза мотивирована тем, что в математике все мысли (идеи и понятия) выражаются предикатами. Если же естественный язык — тоже математический объект (а мы предположили, что он есть алгебра), то и здесь следует ожидать того же.

Для дальнейшего изложения потре буется понятие предиката. Предикатом размерности т, определенным на множестве U, называется любая функция Р(х1, х2,..., хт)=§, отображающая множество Um в множество Е={0, 1}. Множество всех предикатов Р.итЖЕ, будем обозначать символом P. Значения

РИ, 1998, № 4

101

независимых переменных хі (i= 1, m) предиката Р

называются предметами, а сами переменные — предметными. Множество U называется универсумом предметов, множество Um — предметным пространством размерности т. Множество V={xi, х2,..., xm} называется универсумом предметных переменных. Множества U и V можно выбрать произвольно. Элементы множества Е называются логическими. Элемент 0 называется ложью, элемент 1 — истиной. Зависимая переменная § предиката Р называется истинностной, а ее значения — истинностными. Алгеброй предикатов над Р называется любая алгебра, носителем которой служит множество Р всех предикатов, определенных на универсуме предметов U.

Чтобы убедиться в том, что содержанием любого предложения действительно служит некоторый предикат, достаточно задаться вопросом, что представляет собой содержание какой-нибудь формулы. Ответ очевиден: содержанием формулы является функция, которую она выражает. Но если предложение есть формула, то его содержанием тоже должна быть какая-то функция. Какая же? Для ответа на этот вопрос заметим, что если предложение используется для характеристики какой-то вполне определенной ситуации (а предложения только для этого и нужны), то оно станет либо истинным, либо ложным. Если же предложение рассматривать вне связи с какой бы то ни было ситуацией, тогда вопрос о его истинности или ложности не возникает. Точно так же, пока в формулу не подставлены значения ее аргументов, нет повода спрашивать, каково конкретное значение функции, выраженной этой формулой. Истинностное значение каждого предложения (т.е. его истинность или ложность) однозначно определяется ситуацией, к которой оно отнесено. Аналогично, значение любой формулы однозначно определяется набором значений всех входящих в нее аргументов.

Таким образом, каждое предложение выражает некоторую функцию с двоичными значениями, иначе говоря, задает какой-то предикат P(x)=§. Независимой переменной x этой функции служит переменная ситуация, зависимой — истинностная переменная §. После подстановки вместо переменной x конкретной постоянной ситуации х=а заданное предложение становится истинным (§=1) или ложным (§=0) в зависимости от того, соответствует или нет содержание этого предложения ситуации а, к которой оно отнесено. А что такое переменная ситуация х? Она должна представлять собой, в соответствии с приведенным выше определением понятия предиката, набор х=(х1, х2,..., хт) предметных переменных х1, х2,..., хт. Любая постоянная ситуация х=а должна быть набором а=(а1, а2,..., ат) каких-то предметов

х1 а1, х2 а2і...і хт ат.

Итак, каждое предложение должно выражать некоторый предикат Р(х1, х2,..., хт)=§, представляющий зависимость истинностной переменной § от предметных переменных х1, х2,..., хт.. Однако, если обратиться к конкретным предложениям естественного языка (например, русского), то никаких предметных переменных в них обнаружить не удается. Объясняется это тем, что предложение естественного языка, в отличие от математической формулы, выражает не всю функцию Р(х1, х2,..., хт), а только ее имя Р. Каждый раз человек, преобразуя то или иное

предложение в соответствующую ему мысль, достраивает его до предиката, добавляя к нему (как к имени предиката) недостающие предметные переменные. Только после этого предложение становится доступным для понимания. И наоборот, преобразуя некоторую мысль в предложение, человек исключает из нее предметные переменные, передавая другим людям не саму мысль, а только ее имя.

Покажем, как можно дополнить предложение предметными переменными. Пусть дано какое-нибудь предложение, например:

“На столе лежит книга”. (а)

Определяем число предметов, о которых идет речь в предложении (а). Очевидно, что таких предметов — два, один из них характеризуется словом “стол”, а другой — словом “книга”. Из множества Vвыбираем какие-нибудь две предметные переменные, например х1 и х2, и вводим их в предложение (а) после указанных слов. В результате получаем следующее утверждение:

“На столе х1 лежит книга х2”. (б)

Оно выражает теперь не только имя предиката, как исходное предложение (а), но и сам предикат с аргументами х1 и х2. Используя предложение (а) как имя полученного предиката, последний можем записать в виде:

На столе лежит книга(х1, х2). (в)

Предложение, дополненное предметными переменными, будем называть высказыванием. Именно так в математической логике называется любое утверждение, выражающее какой-либо предикат. В нашем примере в роли высказывания используется запись (б). Предложение, выполняющее роль имени предиката и входящее в его состав, будем записывать жирным шрифтом, чтобы отличить его от исходного предложения, которое записывается нежирным (так сделано в записях (а) и (в)).

Добавим к предложению (а) еще одно:

“Рядом с нею стоит лампа”, (г)

образуя из них единый текст. В предложении (г) речь идет тоже о двух предметах. Первый из них указан местоимением “нею”, второй — именем существительным “лампа”. Из контекста (а контекстом для предложения (г) служит предложение (а)) явствует, что слово “нею” является заменителем слова “книгой” , относящегося к предмету х2, который фигурирует в первом предложении. Слово “лампа” вводит третий предмет, отличающийся от первых двух, что требует введения еще одной предметной переменной, в качестве которой берем х3. В результате получаем высказывание

“Рядом с книгой х2 стоит лампа х3”, (д)

которое выражает предикат

Рядом с книгой стоит лампа(х2, х3). (е)

Обратим внимание на тот важный факт, что предложение

“Рядом с книгой стоит лампа”, (ж) использованное в качестве имени предиката (е), становится двусмысленным, если его рассматривать вне контекста и без предметных переменных х2 и х3. Теперь нельзя с уверенностью определить, о какой конкретно книге в нем идет речь: о той же самой, что и в предложении (а) (т.е. о предмете х2), или о какой-либо иной (например, о предмете х4). Еще более многозначным воспринимается предложение (г). В нем слово “нею” может относиться к какому угодно

102

РИ, 1998, № 4

предмету, а не только к книге. Введением же предметных переменных подобные неоднозначности полностью устраняются. Этот факт наглядно демонстрирует необходимость дополнения предложений предметными переменными для возможности их однозначного понимания. При переходе от предложений (а) и (г) к соответствующим им высказываниям (б) и (д) мы опирались непосредственно на интуицию человека, являющегося носителем русского языка. Однако возможно и формальное выполнение такого перехода, который в этом случае должен осуществляться чисто механически только на основе анализа текста предложения и окружающего его контекста без обращения к их смыслу. Эта задача весьма сложна и, насколько нам известно, никем еще не рассматривалась, однако без ее решения невозможна автоматизация процесса понимания текстов естественного языка.

Обнаруживается следующее несоответствие принятой нами исходной теоретической схемы и фактического положения дел. Алгебраический подход к естественному языку требует, чтобы все предметные переменные х1, х2,..., хт алгебры предикатов присутствовали в каждом предикате Р(х\, х2,..., хт). А фактически это не так: в предикатах (в) и (е) присутствуют не все переменные. Так, в предикате (в) отсутствует переменная х3, а в предикате (е) — переменная хі. Однако точно такое же несоответствие наблюдается и в математике. Там тоже почти во всех используемых на практике формулах присутствует лишь небольшая часть переменных той алгебры, на языке которой они пишутся. В математике это несоответствие преодолевается введением понятия несущественной переменной. Этим понятием воспользуемся и мы для дальнейшего построения теории языка.

Аргумент хі (i = im) предиката Р(хь х2,..., х,..., хт) называется несущественным, если при любых х1, х2,..., Х-1, хі’, хі’’, х+1,..., хт є U Р(хі, х2,...,х_1, хі’, х+1,..., хт)=Р(х1, х2,..., х-1, хі’’, х+1,..., хт). Согласно этому определению, значение предиката Рне зависит от значения несущественного аргумента хі при любых фиксированных значениях остальных переменных. Если в формуле предиката Р переменная xi отсутствует, это свидетельствует о том, что она для этого предиката несущественна. В перечне аргументов предиката Р(х1, х2,..., хт) несущественные переменные можно опускать. Например, предикат Р(х1, х2,..., хт), у которого существенны лишь переменные х2 и х4, можно записать в виде Р(х2, х4). Если в формуле предиката присутствует несущественный аргумент, то ее всегда можно так тождественно преобразовать, что он в ней исчезнет. Предикат, у которого все аргументы, кроме одного, несущественны, называется унарным, двух — бинарным, трех — тернарным, n (n < т) — n-арным. Число n называется арностью предиката. От него надо отличать число т, являющееся размерностью предиката. При т=1 предикат называется одноместным, при т=2 — двухместным и т.д. При произвольном т предикат называется т-местным. При т > 2 предикат Р(х1, х2,..., хт) называется многоместным.

Каждый человек в своей речевой практике использует значительное число предметных переменных. Особенно это отчетливо ощущается при освоении больших по объему связных текстов, таких как

роман Толстого “Война и мир” или трехтомный учебник Фихтенгольца по математическому анализу, когда приходится держать в уме одновременно большое количество действующих лиц и событий или понятий. По предварительным оценкам число предметных переменных в подобных случаях достигает многих сотен и даже тысяч. Отсюда следует, что число т, характеризующее количество всех предметных переменных в множестве V лингвистической алгебры, весьма велико. Для оценки его конкретной величины необходимы дополнительные исследования. Формально приходится считать, что каждое предложение, входящее в состав таких текстов, имеет все эти аргументы. Однако существенными из них в отдельных высказываниях всегда будут лишь немногие предметные переменные (обычно не более десятка). В приведенном выше примере текст состоит из двух предложений (а) и (г), в нем незримо присутствуют три предметные переменные. Существенными же в каждом из этих предложений выступают две переменные (в первом — х1 и х2, во втором — х2 и х3). Общей для обоих предложений является одна суще -ственная переменная (х2).

3. Естественный язык как булева алгебра

Рассмотрим теперь вопрос о базисных элементах лингвистической алгебры. Предложения строятся из отдельных слов. Поэтому естественно предположить, что в роли базисных элементов в лингвистической алгебре выступают слова. Поскольку любые элементы носителя лингвистической алгебры — предикаты, то и слова, рассматриваемые в качестве базисных элементов, тоже должны быть предикатами. Попытаемся показать, что это так и есть на самом деле. С содержательной стороны любые элементы лингвистической алгебры являются мыслями, а мысли выражаются предложениями. Следовательно, отдельные слова тоже надо рассматривать как предло -жения. Но возможно ли это? Приведем соображения в пользу положительного ответа на этот вопрос.

Начнем с имен существительных. Возьмем, к примеру, слово “книга”. Его можно употребить в роли предложения. Чтобы это показать, произведем следующий мысленный эксперимент (если потребуется, его можно выполнить и в натуре). Исследователь предъявляет испытуемому слово “книга” и при этом указывает на предмет х, который выбирается им произвольно. Испытуемый должен определить, является ли предъявленный ему предмет х книгой или нет. Если испытуемый способен дать правильный ответ на предъявление любого предмета, то, тем самым, он демонстрирует знание смысла слова “книга”. И наоборот, тот, кто такой ответ дать не может, не проявляет полного знания смысла этого слова.

В описанном эксперименте испытуемый реализует предикат Р(х), выраженный высказыванием “Предмет х есть книга”. Его имя можно кратко записать одним словом Р=“книга”. В данном употреблении слово “книга” играет роль целого предложения. Выразим предикат Р(х), реализуемый испытуемым в этом эксперименте, записью книга(х). В ней слово книга используется в роли имени Р предиката Р(х), а переменная х — в роли его аргумента. Значениями переменной х служат предметы, предъявляемые испытуемому. Множество всевозможных предметов, на которые способен отреагировать испытуемый,

РИ, 1998, № 4

103

играет роль универсума предметов U. Таким образом, каждое имя существительное Р можно понимать как имя некоторого предиката Р(х), заданного на множестве всевозможных предметов U. Предикат этот реален и вполне определен, поскольку его может воспроизвести на практике любой человек, владеющий русским языком, отвечая на вопрос: “Подходит ли предмет х под понятие, выраженное именем существительным Р? ”. В приведенном выше примере этот вопрос будет выглядеть следующим образом: “Является ли предмет х книгой?”.

Аналогичные соображения применимы также и к словам, относящимся кдругим частям речи. Возьмем, к примеру, имя прилагательное “большой”. Его можно понимать как предикат большой (х), выражаемый высказыванием “Предмет х — большой” (хотя бы в одной из возможных ролей: стола, стула и т.д.). Такое расширительное понимание смысла имен прилагательных представляется неизбежным, если исходить из того, что каждое слово, взятое само по себе (т.е. вне контекста), что-то означает. Языковая же интуиция человека ясно свидетельствует, что это так и есть. Предъявляя испытуемому, владеющему русским языком, предметы из множества U и предлагая ему ответить на вопрос “Большой ли предмет х?”, можно убедиться, что слову “большой” соответствует вполне определенный предикат и именно тот, о котором говорилось выше. То же относится и к любым другим именам прилагательным. С причастиями (например, “едущий”) и порядковыми числительными (например, “второй”) поступаем аналогично.

Переходим к глаголам. Берем, к примеру, слово “лежит”. Ему ставим в соответствие предикат ле-жит(х), выражаемый предложением “Предмет х лежит”. Количественные числительные, например, “два”, выражаем предикатом два(х), где аргумент х определен теперь уже не на множестве всех предметов U а на системе имен всех подмножеств множества U. Испытуемый, реализующий предикат два(х), должен отвечать на вопрос: “ Состоит ли множество х из двух предметов?”. Обращаемся к наречиям. Слово “темно” понимаем как предложение, относящееся к ситуации х. Испытуемый, отвечающий на вопрос “Темно ли в ситуации х?”, будет реализовать предикат темно(х). Слово “очень” выражает предикат очень(х), реализуемый испытуемым, которому предложено отвечать на вопрос “Обладает ли предмет х каким-либо свойством в высокой степени?”. Например, можно ли утверждать, что предмет х очень большой или очень пушистый и т.п. (далее следует перечисление всевозможных свойств предмета, доступных для понимания испытуемым). Предлоги также можно понимать как предикаты, но не унарные, как это было до сих пор, а бинарные. Например, предлог “на” понимаем как предикат на(х, у), соответствующий предложению “Предмет х находится на предмете у”. Мы предполагаем, что любое слово (за исключением небольшого количества слов, выражающих операции над предикатами, таких как “не”, “и”, “или”) можно представить подобным способом в виде некоторого предиката. Для прочного обоснования этой гипотезы необходимы специальные исследования в области анализа смысла слов.

Рассмотрим теперь вопрос о базисных операциях лингвистической алгебры. Из любого предложения можно образовать его отрицание, поставив перед ним

частицу “не” или выражение “ложно, что”. Например, из фразы “Идет дождь” образуем ее отрицание “Не идет дождь” (“Ложно, что идет дождь”). Отрицанием можно действовать также и на отдельные слова и словосочетания, например: “не стул”, “не синий”, “не очень”, “не два”, “не едет”, “не синий платок” и т.п. Естественно предположить, что с алгебраической точки зрения отрицание предложения P — это булева операция отрицания предиката Р(х), выражающего содержание этого предложения. Обозначая операцию отрицания словом не, можем, к примеру, записать:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

не(стол(х))=(не стол)(х).

В результате ее выполнения получаем новый предикат с именем не стол. В общем случае имеем

Не(Р(хі, х2,..., хот))=(неР)(хх, х2,..., хт). (1) Здесь Р(х1, х2,..., хт) — произвольное высказывание; х1, х2,..., хт — его предметные переменные; Р — предложение, соответствующее этому высказыванию; не(Р) — предложение, получаемое из предложения Р действием на него операции отрицания не.

Аналогичным образом рассматриваем союзы “и” и “или”, с помощью которых можно соединять любые предложения, получая в результате новые предложения (в общем случае—тексты). Естественно предположить, что слова и и или соответствуют двухместным операциям конъюнкции и дизъюнкции, действующим на высказывания Р(х1, х2,..., х„) и б(х1, х2,..., х„), которые выражают смысл предложений Р и Q. Можем записать:

№, х2,..., хт))и(&хЪ х2,..., хт))=

=(Р^)(х1, х2,..., хт); (2)

(Р(х1, х2,..., хт))или(0(хь х2,..., хт))=

^F^mQ)^, х2,..., хт), (3)

где Р и Q — исходные предложения; РиQ и РйлиО— предложения, получаемые в результате соединения исходных предложений союзами “и” и “или”. Например, слова “стол” и “стул” превращаем в словосочетания “стол и стул”, “стол или стул”, предложения “Идет дождь” и “Светит солнце” — в предложения “Идет дождь и светит солнце”, “Идет дождь или светит солнце”.

Обратим внимание на возможность двоякого употребления союзов “и” и “или”. Словосочетание “стол и стул” можно понимать как предикат

(стол(х))и(стул(х)). (з)

В этом случае имеется в виду, что один и тот же предмет х используется как в роли стола, так и в роли стула. Другое понимание дается высказыванием

(стол(х))и(стул(у)), (и)

которое выражает следующую мысль: “предмет х есть стол, а предмет у — стул”. В первом случае речь шла об одном предмете, во втором — о двух. Такое же двойное понимание возможно и для словосочетания “стол или стул”. Эти примеры наглядно показывают, что в результате алгебраизации естественного языка появляется возможность легко отвечать на вопросы, представляющиеся весьма трудными для традиционного анализа языка и речи. Присвоив предикату (и) имя стол и стул, приходим к следующему равенству: (стол(х))и(стул(у))=стол и стул(х, у). Предикат (з) является производным от предиката (и), поскольку его можно получить из предиката (и), заменяя в нем переменную у на х:

стол и стул(х, х)=(стол(х))и(стул(х)).

104

РИ, 1998, № 4

Введем понятие булевой алгебры предикатов. Пусть Р(Х1, Х2,..., хт) и Q(X1, Х2,..., хт) - предикаты на U. Отрицанием —Р, конъюнкцией PvQ и дизъюнкцией PaQ предикатов Р и Q называются такие операции над предикатами, которые для любых х1, х2,..., xmeUопределяются равенствами:

(—Р)(хъ Х2,..., Хт) =—(Р(Х1, Х2,..., Хт));

(PaQ)(Xi, Х2,..., Хт) =Р(Х1, Х2,..., Xm^Q(xb Х2,..., Хт);

(PvQ)(Xi, Х2,..., Хт)=Р(Хі, Х2,..., Xm)vQ(Xl, Х2,..., Хт). Этими равенствами операции—, a и v над предикатами сводятся к операциям —, а и v над их значениями, т.е. к операциям над логическими элементами 0 и 1. Последние называются отрицанием, дизъюнкцией и конъюнкцией логическиХэлементов и определяются следующим образом: —0=1, —1=0; 0а0=0а1=1а0=0, 1а1=1; 0а0=0, 0v1=1v0=1v1=1. Булевой алгеброй предикатов называется любая алгебра предикатов с базисом операций, состоящим из отрицания, конъюнкции и дизъюнкции предикатов.

Операции отрицания, конъюнкции и дизъюнкции называются булевыми. Выше мы определили булевы операции конструктивно, но их можно задать и абстрактно (т.е. системой свойств) с помощью понятия булевой алгебры. Булевой алгеброй называется любое множество M вместе с заданными на нем одноместной операцией — и двухместными операциями а и v. По определению эти операции обладают следующими свойствами [1]: для любых х, y,ze M хах=х, xvx=x;

ХАУ=УАХ, xvy=yvx; (ХAy)AZ=ХA(yAZ),(xvy)vZ=Хv(yvz);

(xvy)АZ=(ХАZ)v(yАZ), ^Ay^Z^fazNy^z); Хv(yА—у)=х, ха(^—у)=х; — (—х)=х, — (хуу)=—ха—у, —(ха у)=—х>з—у. Эти свойства называются аксиомами булевой алгебры. При заданном M булевы операции в абстрактном смысле (т.е. с точностью до обозначений элементов множества M) определяются единственным образом. Важно отметить, что указанная система аксиом избыточна. В ней все аксиомы, кроме одной, — парные. В каждой паре одну из аксиом можно исключить (либо все левые, либо все правые) без ущерба для полноты системы. Таким образом, для исчерпывающей характеристики понятия булевой алгебры достаточно указать всего семь аксиом.

Вводим еще одну гипотезу: лингвистическая алгебра есть булева алгебра. В роли булевых операций —, а и v в ней выступают операции над словами и словосочетаниями, предложениями и текстами, выраженные словами не, и и или. Не всегда используются именно эти слова для выражения указанных операций. Два предложения, на которые действует операция и, могут соединяться запятой или точкой, например: “Идет дождь, светит солнце”, “Идет дождь. Светит солнце”. Вместо союза “и” в роли конъюнкции могут использоваться соединительные слова “а”, “однако”, “тем не менее” и т.п., например: “Идет дождь, однако светит солнце”. Но слова “не”, “и” и “или” не всегда выражают операции отрицания, конъюнкции и дизъюнкции. Например, в предложении “Подождем, пока не пройдет дождь” частица “не” означает не отрицание, а утверждение. В предложении “Дождь идет и идет” союз “и” (вместе со вторым вхождением слова “идет”) выражает вовсе не операцию конъюнкции, а смысл слова “долго”, так что ту же мысль можно выразить фразой “Дождь идет долго”. Союз “или” может использоваться в разделительном смысле “или—или”, например: “Выбирай: он или я”. Как дизъюнкция союз “или” используется в объединительном смысле “или также”.

Обобщая, можно сказать, что в естественном языке тексты и соответствующие им смыслы не связаны взаимно-однозначно. Смысл одного и того же текста может меняться в зависимости от выбора предметных переменных и от контекста. Важно заметить, что один и тотже смысл можно выразить различными текстами. Смыслы можно изучать и формально описывать вне связи с соответствующими им текстами, а тексты—вне связи с их смыслами. Кроме того, можно формально описывать связь между текстами и их смыслами. Смыслы можно записывать на языке высказываний, тексты же проще всего выражать непосредственно в их естественно-языковой форме. Для описания связи между текстами и смыслами по-видимому необходим специальный математический язык.

Имеются случаи, когда слова “не”, “и” и “или” выражают булевы операции над текстами, но при этом используются по-разному или же с дополнительным смыслом. Например, словосочетание “не яркое солнце” можно понимать двояко: как “(не яркое) солнце” в смысле “предмет Х есть солнце, и он неярок” и как “не (яркое солнце)” в смысле “ложно, что предмет Х есть яркое солнце”. Ясно, что указанные смыслы этого словосочетания различны. Далее, союз “и”, употребленный в роли конъюнкции, может выражать еще и противопоставление событий, как например, в предложении “Дождь идет и солнце светит”. Следующий пример заимствован из книги [2, с. 82]. Рассмотрим два предложения: “Джейн вышла замуж и родила ребенка” и “Джейн родила ребенка и вышла замуж”. По законам булевой алгебры конъюнкция коммутативна, а следовательно, оба предложения должны иметь один и тот же смысл. Но очевидно, что это не так. Объясняется это противоречие тем, что в данном случае союз “и” выражает не только конъюнкцию высказываний, но еще и последовательность двух событий во времени, описываемых этими высказываниями.

4. Предложения как формулы

Из принятых выше гипотез следует, что предложения естественного языка должны быть формулами алгебры предикатов. Сопоставим этот вывод с фактами языка. Чтобы это сделать, вначале придется обратиться к языку математики. Любая формула имеет вполне определенную структуру, которую можно выразить в виде некоторой схемы. Возьмем, к примеру, формулу алгебры булевых функций

Х1Х2 v Х3Х4 . Ее можно выразить графически схемой, изображенной на рис. 1. Кружки со знаками булевых операций —, а и v изображают преобразователи формул. Схема синтезирует формулу

Х1Х2 v Х3Х4 из ее аргументов Х\, Х2, Х3, Х4. Так, проходя через крайний справа блок дизъюнкции, формулы Х1Х2 и Х3Х4 преобразуются в формулу

РИ, 1998, № 4

105

ХхХ2 v Х3Х4 . Та часть формулы, на которую бинарная операция (л или v) действует первой, поступает на преобразующий блок по горизонтальному входу, второй — по вертикальному. Схема формулы представляет собой древовидный граф.

Попытаемся подойти к разработке метода построения подобных графов для предложений естественного языка. В грамматике для наглядного представления структуры предложений используются деревья синтаксического подчинения [3, с. 41]. Их мы и примем в качестве отправного пункта при решении поставленной задачи. Пример дерева синтаксического подчинения изображен на рис. 2. Слова предло-

і і і гі і------------------ц

Детали поступают на заводской склад Рис. 2

жения соединяются в пары стрелками, называемыми дугами. Результат такого соединения называется словосочетанием. Слово, из которого дуга исходит, называется главным, а слово, в которое она входит — зависимым. Корнем предложения называется слово, в которое не входит ни одна из дуг. Подразумевается, что человек, понимающий смысл предъявленного ему предложения, способен построить для него дерево синтаксического подчинения. В основе этой способности лежит ощущение того, что зависимое слово каждой пары в процессе порождения предложения возникает в уме непосредственно за главным.

Построение деревьев синтаксического подчинения для большого числа предложений показало, что связи между словами всегда образуют древовидную структуру, аналогичную той, которая изображена на рис. 2. Этот факт свидетельствует о том, что в предложении, кроме линейного порядка слов, существуют еще и направленные связи между словами. Для подавляющего большинства предложений, используемых на практике, деревья синтаксического подчинения характеризуются тем, что дуги в них не пересекаются, а корень не лежит ни под одной из дуг. Такие деревья, как и соответствующие им предложения, называются проективными. В отличие от них, непроективные предложения воспринимаются как неестественные. Предложение, представленное на рис. 2, является проективным. На рис. 3 изображена структура непроективного предложения. Дляделовой прозы непроективные предложения обычно неприемлемы стилистически. Однако в поэтических текстах они встречаются часто.

"I М і її

Новая найдется дура — верить в волчью седину Рис. 3

Ниже описывается метод построения схемы формулы предложения. Начнем с конкретного предложения, представленного на рис. 2. Схема его формулы изображена на рис. 4. Значениями аргументов Х1^Х5 формулы служат слова “Детали”^“склад” (точнее — их словоформы). Кружки, помеченные номерами, изображают преобразователи слов и словосочетаний. Они выполняют операции соединения слов и словосочетаний. Схема синтезирует предложение из отдельных слов. Так, проходя через блок 1, слова “Детали” и “поступают” преобразуются в словосочетание “Детали поступают”. Блок 3 формирует слово -

сочетание “на заводской склад”. На выходе схемы (после блока 4) получаем готовое предложение “Детали поступают на заводской склад”. Номера блоков указывают последовательность выполнения операций преобразователями схемы.

Эта последовательность определяется по следующему алгоритму. Движемся отдельными шагами вдоль предложения слева направо, перебирая слова и выполняя на каждом шаге одну за другой все возможные операции. При этом отступаем от слова, рассматриваемого на данном шаге (первичном), двигаясь по шагам (вторичным) назад и устанавливая каждый раз, соединяется ли слово, стоящее впереди, с тем, которое находится сзади него. В результате выполнения каждой операции должна получиться некая связная законченная последовательность слов (словосочетание). Некоторые из получаемых словосочетаний будут иметь вид предложений. Последние формируются операци -ей, расположенной на уровне корня предложения, в роли которого выступает сказуемое (в случае, когда оно имеется в наличии; если же его нет, то корнем предложения становится подлежащее). Главное слово в каждой паре считается первым вне зависимости от того, расположено оно впереди зависимого слова или позади него. Следует оговориться, что приведенный выше алгоритм несовершенен. Он не учитывает всех возможных вариантов предложений и поэтому его нельзя применить к любому из них. Кроме того, в нем не достигнута полная формализация действий, поскольку при выполнении алгоритма существенно используется интуиция человека — носителя языка. Необходимо проведение дополнительных исследований для доводки данного алгоритма до такого вида, чтобы с его помощью ЭВМ сама смогла строить схему формулы произвольного предложения.

Применяем только что приведенный алгоритм к рассматриваемому примеру. На первом шаге обращаемся к слову “Детали”, здесь никакой операции выполнить не удается. На втором шаге обращаемся к слову “поступают”. С помощью операции 1 образуем предложение “Детали поступают”. Операцию 1 помещаем на линии сказуемого “поступают”. Слово “поступают” считаем первым аргументом операции, а слово “детали” — вторым. На третьем шаге обращаемся к слову “на”, которое никуда присоединить не удается. То же происходит и на четвертом шаге со словом “заводской”. На пятом шаге к слову “склад” присоединяем слово “заводской” с помощью операции 2, образуя словосочетание “заводской склад”. Далее, с помощью операции 3 присоединяем слово “на” к словосочетанию “заводской склад”, в результате получаем словосочетание “на заводской склад”. Наконец, посредством операции 4 присоединяем полученное словосочетание к предложению “Детали поступают”. Результатом будет искомое предложение “Детали поступают на заводской склад”.

106

РИ, 1998, № 4

Схема формулы предложения построена по его дереву синтаксического подчинения, так что, при желании, всегда можно возвратиться от схемы к дереву (т.е. перейти от рис. 4 к рис. 2). Однако схема содержит в себе и нечто новое, а именно: блоки, синтезирующие текст предложения из его отдельных элементов; полюсы, на которых появляются предложения и словосочетания; очередность выполнения синтеза формулы предложения блоками схемы. По схеме можно построить формулу предложения. В рассматриваемом примере она будет иметь следующий вид:

(Детали1(поступают))4 (на3(заводской2(склад))). (к)

Номера выполняют в формуле роль имен операций, скобки указывают очередность их выполнения и последовательность применения каждой операции к словам, а формы слов представляют собой значения аргументов формулы. Перейдем к аргументам формулы от их значений, заменяя слово “Детали” на переменную Х1, слово “поступают” — на Х2, “на” — Х3, “заводской” — Х4, “склад” — Х5. В результате формула запишется в виде: (Хі1(Х2))4(Хз3(Х42(Х5))). (л)

В развиваемой здесь теории естественного языка принято, что отдельные слова выражают предикаты. Отсюда следует, что символы Х1^Х5 выражают предикатные переменные, номера П4 — предикатные операции, а само выражение (л) — формулу алгебры предикатных операций. Формула же (к) выражает имя предиката предложения. Важно отметить, что любое непроективное предложение в математическом плане характеризуется тем, что его формулу невозможно записать без перестановки слов. Для проективного же предложения это сделать всегда возможно. Например, записывая формулу непроективного предложения, представленного на рис. 3, придется предварительно переставить некоторые из его слов:

(Найдется2(новая1(дура)))6

(верить5(в4(волчью3(седину)))).

После дополнения предложения предметными переменными по методике, описанной выше, оно превращается в формулу алгебры предикатов. Итак, мы видим, что естественный язык имеет двухъярусное строение. Первый ярус представлен некоторой алгеброй предикатов, второй — алгеброй предикатных операций. Семантика предложения, т.е. его содержание, формально описывается на языке алгебры предикатов, синтаксис, т.е. строение предложения, — на языке алгебры предикатных операций. Формула (л) показывает, в какой последовательности и из каких слов (не важно—каких) образуется предложение типа “Детали поступают на заводской склад”.

Более сложный пример схемы формулы предложения представлен на рис. 5. Переходя от схемы к формуле, получаем следующую формулу алгебры предикатов, выражающую смысл предложения: ((Я2(быстро 1(пишу)))4(тупым3(карандашом)))10 (требование9((прислать5немедленно)8 ((вооруженный6(отряд))7милиции))). (м)

Заменяя в выражении (м) слова “Я”^“милиции” соответствующими им предикатными переменными Хх^Хц, приходим к формуле алгебры предикатных операций

((Х12(Х21(Х3)))4(Х43(Х5)))10(Хб9((Х75Х8)8

((Х,6(Х1о))7Хп)))), (н)

выражающей синтаксическую структуру рассматриваемого предложения.

Только что при рассмотрении синтаксической структуры предложения нам пришлось обратиться к понятию алгебры предикатных операций. Дадим его формальное определение. Пусть U— универсум предметов; х1, х2, ..., хт — предметные переменные; Р — множество всех предикатов Р(х\, х2, ..., хт) на предметном пространстве Um. Множество Р называется универсумом предикатов. Переменные Хі, Х2, ..., Хк, определенные на множестве Р, называются предикатными. Их значениями служат предикаты, заданные на Um. Множество Ркназывается предикатным пространством размерности к над предметным пространством Um. Элементы множества Рк (к-компонентные наборы предикатов) называются предикатными векторами. Предикатное пространство представляет собой двухэтажную конструкцию: на ее первом этаже находятся предметы, на втором — предикаты. Любая функция F(X, X2, ..., Xk)=Y, отображающая множество Рк в множество Р, называется предикатной операцией. Образуем множество R всех предикатных операций. Алгеброй предикатных операций над R называется любая алгебра, заданная на носителе R.

Пусть F(X1, X2,...,X)=Y— предикатная операция, отображающая множество Рк в множество Р. Здесь X1, X2,...,X — предикатные переменные, выступающие в роли аргументов операции F; Y — предикатная переменная, являющаяся значением операции F. От -рицанием —F=F предикатной операции F называется такая предикатная операция, значения которой определяются по правилу

(—F)(X1, X2, ..., X)=—F(X1, X2, ..., X)

для любых X1, X2,...,XkєР. Пусть F и G — предикатные операции, отображающие Рк в Р. Дизъюнкцией FvG предикатных операций F и G называется предикатная операция, значения которой определяются по правилу (FvG)(X, X2,..., X)=F(X, X2,..., X)vG(X, X2,..., X) для любых X1, X2,..., XeM. Конъюнкцией FaG предикатных операций F и G называется предикатная операция, значения которой определяются по правилу (FaG)(X, X2,..., X)=F(X, X2,..., X)aG(X, X2,..., X) для любых X1, X2, ..., XeM. В последних трех равенствах слева от знака равенства фигурируют операции —, v, а над предикатными операциями; справа знаки —, v, а обозначают операции над предикатами. Булевой алгеброй предикатных операций называется любая алгебра предикатных операций с базисом операций, состоящим из отрицания, конъюнкции и дизъюнкции.

РИ, 1998, № 4

107

5. Словосочетания как формулы

Выше было выяснено, что предложения строятся из отдельных слов с помощью булевых операций и операций соединения слов и словосочетаний. Последние были лишь обозначены номерами, а о существе этих операций еще ничего не было сказано. Рассмотрим теперь вопрос о том, что конкретно представляют собой операции соединения слов и словосочетаний.

Принимая в роли сказуемого глагол, представим его как некий предикат, для чего дополним его предметными переменными. Предметные переменные эффективно выявляются с помощью вопросов, которые порождаются сказуемым. Например, в предложении “Детали поступают на заводской склад” слово “поступают” порождает вопросы: 1) Что поступает? — Детали; 2) Куда поступают? — На заводской склад. В предложении “Я быстро пишу тупым карандашом требование прислать немедленно вооруженный отряд милиции” слово “пишу” порождает вопросы: 1) Кто пишет? — Я; 2) Как пишет? — Быстро; 3) Чем пишет? — Тупым карандашом; 4) Что пишет? — Требование прислать немедленно вооруженный отряд милиции. В соответствии с этим заключаем, что слово “поступают” в первом предложении представляет собой имя предиката поступают^, х2) с двумя предметными переменными, слово “пишу” — имя предиката пишу(у1, у2, у3, у4) с четырьмя предметными переменными. Таким образом, вопросы характеризуют собой отдельные предметные переменные предиката, выраженного сказуемым данного предложения.

Глагол в роли сказуемого предложения характеризуется, как никакая другая часть речи, большим числом предметных переменных. Вследствие этого он выполняет роль соединителя отдельных частей предложения в единое целое. Каждое предложение выражает некую мысль, которую можно выразить вполне определенным многоместным предикатом Р(х1, х2,..., хп). Механизм образования предложения представляем следующим образом. Переменные х1, х2,..., хп предложения сначала связываются сказуемым, реализующим предикат Дхі, х2,..., хп), где п — число предметных перемен -ных при глаголе S. Этот предикат можно образно представить в виде глыбы мрамора, из которой ваятель намеревается изготовить скульптуру. Дополняя предложение теми или иными словосочетаниями, отвечающими на вопросы, соответствующие предметным переменным х1, х2,..., хп, лицо, формирующее предложение, как бы отсекает от исходной глыбы мрамора очередной лишний кусок. Этим достигается постепенное приближение смысла текста предложения к требуемому. При этом бесформенный вначале кусок камня шаг за шагом превращается в совершенную скульптуру, в которой обнаруживается замысел ваятеля.

Аналогично этому, расширением текста предложения достигается сужение (уточнение) его смысла и доведение его до того содержания, которое намеревался передать человек своей фразой. Может создаться впечатление, что с расширением текста предложения расширяется и его содержание, но это не так. На самом же деле, после присоединения к предложению каждого последующего слова его содержание всегда сужается, например: “Детали поступают” ^ “ Детали поступают на склад” ^ “Детали поступают на заводской склад”. Если же двигаться в обратном направлении, отсоединяя одно за другим слова от готового предложения, то мы получим цепочку вложенных друг в друга предложе-

ний с расширяющимся содержанием, например: “Я быстро пишу тупым карандашом требование прислать немедленно вооруженный отряд милиции” с “Я быстро пишу тупым карандашом требование прислать отряд милиции” с “Я пишу требование прислать отряд” с “Я пишу требование” с “Я пишу”.

Из этого свойства логически следует, что соединение слов выражается операцией конъюнкции. Действительно, если известно, что предикаты Р и Q находятся в отношении Рс Q, то всегда найдется такой предикат R, что P=QR. Присоединяемое к предложению Q слово или словосочетание R выполняет, таким образом, роль конъюнктивного множителя. Наоборот, в результате выполнения операции QR =Р присоединения слова или словосочетания R к предложению Q получаем предложение Р, удовлетворяющее условию Рс Q.

Пусть Ti(Х1п , Хі21 ^ хіаЛ X Т2(х1и , Xi22 v., хіаг2 ^

..., Tr(хЧг, Xi2r,..., XWr ) - предикаты, выражаемые

словами (или словосочетаниями) предложения, которые присоединяются к его сказуемому. Здесь Г— число всех слов (или словосочетаний), присоединяемых к сказуемому предложения. Аргументами каждого из предикатов Tj (j= 1, r ) служат некоторые из аргументов предиката ^(х1, х2,..., хп) сказуемого S. Символом Sj обозначено число существенных переменных предиката Tj. Тогда предикат предложения выразится в виде:

Р(хі,х2,...,Xn)=S(хhх2,...,хп)Ті(ХіП , хі2і ,..., Xs1i )л

ЛТ2(хіі2 , хі22 V.V хЧ2 )...ТГ(хі1г , хі2г v- Чгг ). (4)

Равенство (4) показывает, как содержание предложения Р образуется из содержания сказуемого S путем ограничения его содержанием словосочетаний Ті, Т2,...,ТГ. Расчленяя мысль Рна части S, T1, T2,..., ТГ в соответствии с формулой (4), говорящий, по существу, производит конъюнктивную декомпозицию предиката Р. А слушающий осуществляет композицию предиката Риз предикатов S, Ti, T2,..., Tr, выполняя операцию их конъюнкции. Для примера возьмем предикат (в) предложения “ На столе лежит книга”. В соответствии с равенством (4) его можно представить следующей формулой:

На столе лежит книга(х1, х2)=

=На(х1, х2)лстоле(х1)ллежит(х1, х2)лкнига(х2). (о) Ее содержание можно выразить высказыванием: “На предмете х1 располагается предмет х2, и предмет х1 есть стол, и предмет х2 находится в лежачем положении относительно предмета х1, и предмет х2 есть книга”. Конъюнктивной декомпозицией предиката Р называется его представление в виде P=Q1л 02л...л Q/, где Qi, Q2,..., Qi — некоторые предикаты; l — число предикатов, получаемых в результате декомпозиции.

Обратим внимание на следующее важное обстоятельство. В предложении, каким бы обширным оно ни было, обычно даются ответы далеко не на все те вопросы, которые потенциально содержатся в сказуемом. Например, восприняв предложение “Детали поступают на заводской склад”, человек может задать множество вопросов, на которые он не получил ответа из данного предложения. К ним относятся: “Откуда поступают детали?”, “Когда они поступают?”, “С какой целью?” и т.п. Вернее, ответы на

108

РИ, 1998, № 4

поставленные вопросы в предложении имеются, но они неинформативны (бессодержательны): “Откуда угодно”, “Когда угодно”, “С любой целью”. Это означает, что предметные переменные, соответствующие указанным вопросам, в данном предложении несущественны. В языке всегда имеются возможности для конкретизации этих ответов посредством расширения текста предложения. Управление этим расширением осуществляется постановкой соответствующих вопросов. После формирования конкретных ответов на поставленные вопросы соответствующие им предметные переменные в расширенном предложении превращаются из несущественных в существенные.

Выше мы рассмотрели, как из словосочетаний образуется предложение. Теперь рассмотрим конкретные способы образования словосочетаний из отдельных слов. Тема эта обширна и требует специального исследования. Здесь мы ограничимся лишь несколькими характерными примерами. Подлежащее Т соединяется со сказуемым S обычно по схеме P(x)=T(x)aS(x), (5)

в результате получается предложение Р. Например, книга лежит(х)=книга(х)ллежит(х). (п)

Формула, стоящая справа от знака равенства в выражении (п), означает: “Предмет х есть книга, и этот предмет лежит”. Согласование имени прилагательного Ті с именем существительным Т2 осуществляется по аналогичной схеме:

ТХ)=Ті(х)лТ2(х). (6)

В результате получаем словосочетание Т. Например, толстая книга(х)=толстая(х)лкнига(х). (р) Формула, стоящая справа от знака равенства в выражении (р), означает: “Предмет х — толстый, и этот предмет есть книга”.

Управление одного имени существительного Т2 другим именем существительным Т1 часто осуществляется по схеме:

Т(х)=ТДх)лЗу( Т2(у)лдеталь(х, у)). (7)

В результате получаем словосочетание Т. Предикат деталь(х, у) имеет следующее содержание: “Предмет х является деталью (составной частью) предмета у”. К примеру, по этой схеме получаем: страница книги(х)=

=страница(х)лЗу(книга(у)лдеталь(х, у)). (с) Смысл правой части равенства (с) выражается высказыванием: “Предмет х есть страница, и существует предмет у, являющийся книгой, такой что предмет х служит его деталью”. Управление имени существительного Т2 количественным числительным Ті может осуществляться по схеме:

Т(х)=Ті(х)л v у(уєхз Т2(у)). (8)

Например,

две книги(х)=два(х)л v у (уєх з книга(у)). (т)

Содержание правой части равенства (т) можно передать следующим высказыванием: “Множество х состоит из двух предметов, и каждый из предметов у, если он принадлежит множеству х, есть книга”.

6. Заключение

Выполненный выше анализ естественного языка как некоторой алгебры, называемой нами лингвистической, свидетельствует о том, что такой подход предоставляет исследователю определенные возможности для формального описания механизма интеллекта. Обнаруживается, что смысл текста можно

представить в виде формулы алгебры предикатов, а его синтаксическую структуру — в виде формулы алгебры предикатных операций. Открываются перспективы для дальнейшего проникновения в механизм естественного языка. В частности, представляются перспективными исследования по выявлению различных видов предметных переменных предложения (например, временного и пространственного характера) и изучению способов их практического использования в языке. Нуждаются в изучении механизмы выражения смысла отдельных слов сочетаниями слов и сочетаниями морфов. Есть основания предположить, что и эти механизмы подчиняются зависимости (4). Важно установить, как изменяется смысл слова при переходе к той или иной его словоформе (например, “стул” — “стула”), а также при образовании из него нового слова (например, “синий” — “синева”). Особую задачу составляет изучение смысла отдельных морфов слова.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Важными объектами формального описания в языке являются анафора, эллипсис, омонимия и синонимия. При алгебраическом подходе к языку смысл этих, во многом пока загадочных, явлений становится достаточно ясным. Требует формального описания связь текста с его смыслом, смысловое взаимодействие текста и контекста, аксиоматическое выражение смысла первичных слов (категорий), механизм смысловой декомпозиции предложения на составные части при синтезе и его композиции из морфов, слов и словосочетаний при анализе предложений. Интересна задача выявления тождеств и схем тождеств (законов) лингвистической алгебры. Важно понять, каков механизм участия естественного языка при узнавании (зрительном, слуховом, осязательном и т.п.) предметов внешнего мира. Путь к формальному описанию механизмов естественного языка открыт, объект исследования интересен и обширен. Работы здесь хватит для всех желающих. Представляется, что нет другой такой области знания, которая в большей степени, чем эта, могла бы способствовать выяснению природы человека как сознательного существа и повышению темпов информатизации общества.

Литература: і. Мальцев А.И. Алгебраические системы. М.: Наука, і970. 392 с. 2. Клини С.К. Математическая логика. М.: Мир, і973. 478 с. 3. БондаренкоМ.Ф., Осыка А.Ф. Автоматическая обработка информации на естественном языке. К.: УМК ВО, і99і. і40 с.

Поступила в редколлегию 20.06.98 Рецензент: д-р техн. наук, проф. Левыкин В. М.

Баталин Антон Викторович, аспирант кафедры программного обеспечения ЭВМ ХТУРЭ. Научные интересы: лингвистическая алгебра. Адрес: Украина, 3і0726, Харьков, пр. Ленина, і4, тел. 40-94-46.

Дударь Зоя Владимировна, канд. техн. наук, профессор кафедры программного обеспечения ЭВМ ХТУРЭ. Научные интересы: алгебраическая логика, модели языка. Адрес: Украина, 3і0726, Харьков, пр. Ленина, і4, тел. 40-94-46.

Стороженко Александра Владимировна, аспирант кафедры программного обеспечения ЭВМ ХТУРЭ. Научные интересы: математические модели естественного языка. Адрес: Украина, 3і0726, Харьков, пр. Ленина, і4, тел. 40-94-46.

Шабанов-Кушнаренко Юрий Петрович, д-р техн. наук, профессор кафедры программного обеспечения ЭВМ ХТУРЭ. Научные интересы: логическая математика, теория интеллекта. Адрес: Украина, 310726, Харьков, пр. Ленина, і4, тел. 40-94-46.

РИ, і998, № 4

і09

УДК 519.7

ТЕОРИЯ ЦВЕТОВОГО ЗРЕНИЯ. II1

БОНДАРЕНКОМ. Ф.ЩАБАНОВ-КУШНАРЕНКО С.Ю.

Рассматривается теория цветового зрения человека. Изучаются и формулируются экспериментально проверяемые условия линейности предикатной модели цветового зрения.

2.1. Координатные формулировки

В приложениях особенно важным является случай, когда оператор Р конечномерен, т.е. его образ имеет конечную размерность. Будем называть линейный предикат n-мерным, если ранг (рангом линейного оператора В называется размерность его образа; будем обозначать ранг оператора В через rgB ) отвечающего ему ортопроектора Р равен n . Заметим, что это определение корректно, если аффинная оболочка выпуклого множества V, на квадрате которого определен предикат Ф, совпадает со всем пространством. В противном случае ортопроектор Р не определен равенством (1.10) однозначно (формулы, разделы и утверждения, имеющие номер, который начинается единицей, относятся к работе [1]). Из первого равенства (1.13) видно, что для любого линейного оператора В, связанного с предикатом ф равенством (1.11), rgB = rgP . Таким образом, если предикат ф является n-мерным, то для любого такого оператора В будет rgB = n . В частности, так будет для любого оператора А, присоединенного к предикату Ф. В этой части, используя предыдущие результаты, мы разовьем координатную теорию линейных предикатов.

Лемма 2.1. Для того чтобы предикат ф, определенный на квадрате выпуклого множества V с

affV = -2[0, 1], был линейным, необходимо и достаточно, чтобы существовала линейно-независимая система линейных функционалов (в силу теоремы Рисса в гильбертовом пространстве существует канонический изоморфизм между векторами и линейными функционалами. Мы, однако, не всегда будем отождествлять векторы и функционалы в формулировках результатов, имея в виду удобство приложений) {аг }n=1 такая, что для любых х, у є V равенство

Ф(х, у) = 1 (2.1)

выполняется тогда и только тогда, когда

аг (х) = а, (у), і = 1,2,..., n. (2.2)

Достаточность. Пусть {аі }n=1 — линейно-независимая система линейных функционалов, для которой равенства (2.1) и (2.2) эквивалентны. Выберем любую линейно-независимую систему векторов

{еі }n=1 и рассмотрим оператор В, определенный равенством

1 Ч. I см. в журнале “Радиоэлектроника и инфор-

матика”,1998. №1. С. 106-117

Вх = Еаг (х)ег ■ (2.3)

і

Тогда равенства (2.2) означают, что Вх = Ву . Таким образом, для любых х, у єV равенства

ф(х, у) = 1 и Вх = Ву выполняются или не выполняются одновременно. Другими словами, имеет место равенство (1.12). Согласно лемме 1.1, предикат ф является линейным. Из линейной независимости систем {аг }n=1, и {ег }n=1 следует, что rgB = n . Ho тогда, как было замечено выше, и rgP = n . Значит,

предикат Ф является n -мерным. Достаточность доказана.

Необходимость. Пусть Ф — n -мерный линейный предикат. Выберем любой линейный оператор в ,

связанный с предикатом Ф равенством (1.12). Тогда rgB = n . Пусть {ег }n=1 — любой базис в подпространстве ImB . Тогда для оператора В найдется такая линейно-независимая система линейных функционалов {аг }n= , аг (х) = (Вх, ег), что при всех

х є 1}[0,1] справедливо равенство (2.3). Очевидно, для любых х, у є L [0,1] Вх = Ву тогда и только

тогда, когда аг(х) = аг(у), і = 1, 2,..., n . Комбинируя этот факт с формулой (1.12), получаем, что равенства (2.1) и (2.2) эквивалентны.

Лемма 2.1 доказана.

Если Ф — линейный предикат, р — соответствующий ортопроектор, то оператор В удовлетворяет равенству (1.12) тогда и только тогда, когда ImB* = ImP . Нас будет интересовать координатная формулировка этого утверждения. Если оператор В представлен в виде (2.3), то для оператора В * имеет место равенство

B * у = Е (ег, У) аг ■ (2.4)

i=1

Это значит, что

ImB* = -{аь а2,-, аД . (2.5)

Следствие 2.1. Для того чтобы две линейнонезависимые системы функционалов {аг }n=1 и {иг }n=1 определяли в смысле леммы 2.1 на квадрате выпуклого множества V с affV = -2[0, 1] один и тот же n -мерный линейный предикат, необходимо и достаточно, чтобы

-Цаь а2,-, аn} = -К,и2,-,Un} . (2.6)

Доказательство. Пусть система {аг }n=1 определяет

в смысле леммы 2.1 предикат Ф, а система {иг}”= — предикат A . Обозначим через р и Q ортопроекторы, отвечающие предикатам Фи T соответственно. Тогда

110

РИ, 1998, № 4

ImP = L{ab a2,..., a„}, ImQ = L{ul, u2,...,un}. (2.7) Поэтому (2.6) означает, что ImP = ImQ . Поскольку Р и Q — ортопроекторы, последнее равенство

эквивалентно Р = Q . Но в случае affV = L2[0, 1] равенство Р = Q выполняется тогда и только тогда,

когда Ф = T .

Следствие 2.1 доказано.

Для получения координатных аналогов результатов из разделов 1.5^1.7 мы, как и ранее, раздельно

рассмотрим различные случаи множеств V .

Лемма 2.2. Для того чтобы предикат Ф, определенный на квадрате пространства Ц2[0, 1], был n -мерным линейным, необходимо и достаточно, чтобы существовали системы линейно-независимых векторов {ek }n=1 и линейно-независимых функционалов {ak }n=1 такие, что для любого x є L2[0,1]

Ф(х ,^єі +... + ^пеп) = 1 (2.8)

тогда и только тогда, когда

\ k = a k (x), k = 1,2,..., n. (2.9)

Достаточность. Пусть системы {ek }п=1 и {ak }J!=1 с указанными свойствами существуют.

Рассмотрим оператор A, определенный равенством

Ах = £a k (x)ek. (2.10)

k=1

Пусть векторы x и у таковы, что Ф(х, Ау) = 1, т.е.

Ф(Х, a1( у)е1 +... + a п (У)е п ) = 1. (2.11)

Тогда по условию леммы

ak(У) = ak(x), k = 1,2,...,n , т.е. Ax = Ay .

Пусть, обратно, для векторов х, у є L2[1, 2] имеет

место равенство Ax = Ay . Поскольку {ek }JLj —

линейно-независимы, то тогда ak (x) = ak (у). Поэтому из условия леммы вытекает равенство (2.11) или, что то же самое, равенство Ф(х, Ау) = 1. Итак,

Ф(х, Ау) = 1 тогда и только тогда, когда Ax = Ay . Согласно лемме 1.2 отсюда следует, что предикат ф линейный. То, что этот предикат является n -мерным, следует из тех же соображений, что и в лемме

2.1. Достаточность доказана.

Необходимость. Пусть ф — n -мерный линейный предикат. Согласно лемме 1.2 существует такой

линейный оператор A , что равенство Ф(х, Ау) = 1 тогда и только тогда, когда Ax = Ay. Как было отмечено в начале настоящего раздела, rgA = rgP. По

условию rgP = n. Значит, и rgA = n . Тогда существуют такие линейно-независимые системы векторов

{ek }n=j и функционалов {a k }'n=1, что имеет место равенство (2.10). Легко видеть, что (2.11) выполняется тогда и только тогда, когда

ak(x) = ak(y), k = 1,2,..., n .

Но это значит, что равенства (2.8) и (2.9) эквивалентны. Лемма 2.2 доказана.

Будем говорить, что пара систем {ek}J! = и {ak }JLj присоединена к n -мерному линейному предикату ф,

определенному на квадрате пространства L2[0, 1], если она удовлетворяет условиям леммы 2.2.

Следствие 2.2. Для того чтобы пара линейнонезависимых векторов и функционалов {ek }п= и

{ak }n=j была присоединена к n -мерному линейному предикату ф, определенному на квадрате пространства L2[0, 1], необходимо и достаточно, чтобы равенство (2.1) было эквивалентно равенству (2.2) и

a, (ek) = Sik, i, k = 1,2,..., n , (2.12)

где Sik — символ Кронекера: Sik =1 тогда и только тогда, когда i = k .

Доказательство. Пусть системы {ek ^ и {a k ^ таковы, что равенства (2.1) и (2.2) для них эквивалентны и выполняется (2.12). Определим оператор А уравнением (2.10). Как и при доказательстве леммы 2.1, можно проверить, что выполняется

равенство Ф(х, у) = D(Ах, Ау). Далее, используя (2.12), получаем

( n \ n

aj(Ax) = 1 a j, £ak(х^к |=£a .(ek)ak(х) = a}.(х).

V k=1 J k=1

Поэтому

n n

А2 х = ^a j (Ах)є}- = j ( х)є}- = Ax.

j=1 j=1

Таким образом, А — проектор. Эквивалентность равенств (2.1) и (2.2) означает справедливость формулы (1.16). Из следствия 1.3 вытекает, что оператор А присоединен к предикату ф. Отсюда вытекает, что (2.8) эквивалентно (2.9).

Проверим необходимость. Пусть системы {ek}n=j и {ak }n=j присоединены к n -мерному линейному

предикату ф . Определим оператор А равенством

(2.10) . При доказательстве леммы 2.2 в сторону достаточности было показано, что так определенный

оператор А является присоединенным к предикату Ф . Тогда согласно следствию 1.3 оператор А присоединен к предикату ф . Отсюда вытекает, что (2.8) эквивалентно (2.9).

Проверим необходимость. Пусть системы {ek}n=j

и {ak }n=j присоединены к n -мерному линейному

предикату ф . Определим оператор А равенством

(2.10) . При доказательстве леммы 2.2 в сторону достаточности было показано, что так определенный оператор А является присоединенным к предикату Ф . Тогда согласно следствию (2.14)

РИ, 1998, № 4

111

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поскольку предикат ф является n -мерным, то

rgA = n . Отсюда следует, что система {ak }Ч=1 линейно-независима. Но тогда (2.14) может выполняться лишь при условии (2.12).

Следствие 2.2 доказано.

Перейдем теперь к случаю конуса.

Лемма 2.3. Для того чтобы предикат, определенный на квадрате воспроизводящего конуса К , был n -мерным линейным, необходимо и достаточно, чтобы существовали системы линейно-независимых

векторов {ek}>п=1 с К и линейно-независимых функционалов {a k }пк=1 такие, что

gi = g'i - g"i, i =1> 2,...> n . Система {gi '}n=i U {gi "}n=i

полна в подпространстве ImP . Пусть {р* }n=1 — базис, отобранный из элементов этой системы. Таким образом, в Imp существует базис {р* }n=1 с Р (К). Пусть {ak }>n=1 — двойственный базис в ImP . (Базисы

{a k }пк=1 и {р* }n=1 в одном и том же евклидовом пространстве называются взаимно двойственными (дуальными, биортогональными), если для каждого базиса существует единственный двойственный ему базис). Тогда ортопроектор р может быть представлен в виде

ф| * + IU, IU

Dг г ’ Z-i ІЄl ІЄl

1; І-* > 0; - > 0, І є І (2.15)

тогда и только тогда, когда

І = {|ai (x) < 0} , - = a* (i) при і £ І, -при * є І; равенство

(

Ф

х -

V

Е ai(хК, у

ієі (х)

Ea(x)e

iєl(х) )

a (0

(2.16)

выполняется тогда и только тогда, когда ф(х, у ) = 1.

Достаточность. Пусть системы {ek}Ч=1 и {ak}£= с указанными свойствами существуют. Определим, как и ранее, оператор А равенством (2.10). Далее,

определим на ImA отображения f1 и f2 равенствами f (Ах) = - Eai(х)є*, f,(Ах) = £a*(х)є*. (2.17)

iєl (х) Ш (х)

Легко видеть, что f (ImA) с К и f2 — f1 является

тождественным отображением на ImA . В замечании к лемме 1.4 было отмечено, что для применения этой

леммы достаточно, чтобы отображения f и f2 были

определены только на ImA. Легко видеть, что условия леммы 1.4 выполняются. Из этой леммы следует, что предикат ф является линейным. Поскольку системы {ek }J!=1 и {ak }£= линейно-независимы, то и, следовательно, rgA = n . Достаточность доказана.

Необходимость. Пусть предикат ф является n -мерным линейным, р — соответствующий ортопроектор. Множество Р (К) , очевидно, является конусом. Проверим, что этот конус воспроизводящий в подпространстве ImP . Действительно, пусть у є Im P . Тогда существует х є L2[0, 1] такой, что у = рх . Поскольку К — воспроизводящий конус, найдутся х1, х2 є К, при которых х = х1 - х2. Положим у1 = Рх 1, у2 = Рх 2. Тогда у = У1-У2, Уi є Р(К).

Пусть {g* }n=1 — произвольный базис в ImP . Поскольку Р (К) — воспроизводящий конус в ImP , существуют g\, g"i є P(K) такие, что

Px = E at (х)Р(. (2.18)

*=1

Выберем произвольным образом элементы et є K такие, что Ре t = р j, и положим

n

Ах = Ea(x)el. (2.19)

i =1

Заметим теперь, что

(ai, e2) = (Рai, e2) = (a*, P j) = 5y-.

Поэтому

Ae{ = e{, i = l,2,..., n . (2.20)

Положим І(х) = {| a*(х) <0} . Из (2.19), (2.20) и

линейной независимости векторов {ek }пк=1 следует, что равенство

А|х + J = А^Е—e ); - > 0; - > 0, * є І (2.21)

выполняется тогда и только тогда, когда І = І(х), - = a* (х) при ЫІ, — = -a* (х) при * є І.

Сравнивая равенства (2.18), (2.19) и Реt =рj, находим, что БДх, Py) = D(Ах, Ay) при всех

х,у є L2[0,1] . Поэтому из определения (1.11) вытекает равенство

(х, у ) = D(Лх, Ay), х, у є K , (2.22)

которое позволяет переписать (2.21) в виде (2.15). Тем самым доказано выполнение первого из условий леммы 2.3. Выполнимость второго очевидна. Лемма 2.3 доказана.

Будем говорить, что пара систем {ek }£= и {a k }£=

присоединена к n -мерному линейному предикату ф, определенному на квадрате воспроизводящего конуса К , если она удовлетворяет условиям леммы 2.3.

Следствие 2.3. Пусть К — воспроизводящий конус в L2[0,1]. Для того чтобы пара линейно-независимых

систем векторов и функционалов {ek }n=1 и {a k }£= была присоединена к n -мерному линейному предикату ф, определенному на квадрате конуса К, необходимо и достаточно, чтобы равенство (2.1) было эквивалентно (2.2) и имело место (2.12).

Это утверждение проверяется аналогично следствию 2.2.

112

РИ, 1998, № 4

Рассмотрим случай выпуклого множества V . Нам понадобятся некоторые определения из выпуклого анализа [2, 3]. Функция Р(х), х eV называется аффинной, если для любых х1, x2 eV

Р(А,!X! + X2Х2) = ^lP(Xj) + X2Р(Х2), Xi + X2 = 1.

Если V = L [0,1], то непрерывная аффинная функция Р однозначно представима в виде

Р(х) = (b, х) + с, (2.23)

где b e L2[0,1], с — число. Система точек {ek(^=1 называется аффинно-независимой, если равенства

n+1 n+1

Tjkek = 0, Ey k = 0

k=1 k=1

могут выполняться лишь при y k = 0, k = 1,2,..., n +1. В любом n -мерном аффинном многообразии существуют аффинно-независимые системы из n +1 точек и не существуют такие системы из большего числа точек [3, с. 211 (теорема Каратеодори)]. Таким

образом, если система {e, }n=11 аффинно-независима,

то rg aff{e}n=+11 = n. Любой вектор х e afffe }”+/ представим в виде

n+1 n+1

х=ЕРiei, ЕР,-=1. (2.24)

i=1 i=1

Если система {e, }n+11 аффинно-независима (и только в этом случае), представление (2.24) единственно. В этом случае р, (х) — непрерывные аффинные функции, удовлетворяющие тому условию, что система линейных уравнений

Р, (х) = s,, i = 1,2,..., n + 1, (2.25)

разрешимых при любых правых частях таких, что s1 +... + sn+1 = 1. Эти функции называются барицентрическими координатами. Полагая в (2.24)

I(x) = {i | р, (х) < 0}, а0(х)

С у1

ЕР, (х)

v (х)

а, (х) = а0 в, (х),

(2.26)

приходим к представлению (здесь и далее сумму по пустому множеству индексов считаем равной нулю):

а 0х + Еа ,ei = Еа ,ei, (2.27)

Ш Ш

а, > 0; а 0 > 0; а, > 0 при i e I;

а0 +Еа, =1; Еа, =1 (228)

ieI Ш ■ 4 ■ '

Обратно, если для точки х имеет место представление (2.27), (2.28), то, полагая

Р, (х)

а, (х)/а0 (х), i ШI(х),

-а, (х)/а о (х), i e I (х), (2.29)

приходим к представлению (2.24). Представление (2.27), (2.28) для каждой точки х e aff{e, }n=11 является единственным тогда и только тогда, когда система {e, }n=11 аффинно-независима.

РИ, 1998, № 4

Пусть {а, ( х)}п=01 — некоторая система функций в L2[0, 1] и I(х) — некоторое отображение L2[0, 1] ^ {1, 2,..., n +1} , удовлетворяющее при всех х e L2[0, 1] условию (2.28). Введем систему функций {Р,(х^у1 равенствами (2.29). Будем называть {а, (х)}П+01 I(х) системой однородных координат, если функции р,- (х) являются аффинными и система

(2.25) при условии s1 +... + sn!1 = 1 разрешима.

Лемма 2.4. Для того чтобы предикат ф, определенный на квадрате выпуклого множества V c

affV = L2[0, 1], был n -мерным линейным, необходимо и достаточно, чтобы существовали системы аффинно-независимых точек {e, }n=11 с V и однородных координат {а, (х)}”+(1 , I(х) такие, что

Фу 0х +Е^ ,e,, Е^ ,e, 1 =1; (2.30)

iei ІШІ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Z 0 > 0, Z, > 0, i e I; Z, > 0, i ШI,

Z0 + EZ, = 1, EZ, = 1 (2.31)

ieI ІШІ

тогда и только тогда, когда у =а, (х), I = I(х); равенство

Ф

а0(х)х + Еа,■(х)є,, а0(х)у + Еа,(Ф,

V ieI(х) ieI(х) J

= 1

(2.32)

выполняется тогда и только тогда, когда фх, у) = 1. Достаточность. Пусть системы {e,}”+/ и

{а, (х)}П=0 , I(х) с указанными свойствами существуют. Рассмотрим пару точек х, у , удовлетворяющих

условию Ф(х, у) = 1. Тогда имеет место равенство (2.32). Кроме того, по условию

f

\

Ф а 0(х)х + Е а, (х)є, , Е а, (х)є,

v ieI(х) Ш (х) у

Из (2.31) и (2.33) получаем

1 .(2.33)

(

Ф

Л

а 0(х)у + Е а,(х)є, , Е а,(х)є,

= 1.

(2.34)

ieI (х) Ш (х)

Поэтому из первого условия леммы следует, что I(у) = I(х); аi (у) = а, (х), i = 0, 1,..., n +1. (2.35) Но тогда и

Р,(х) = Р, (у), i = 1,2,..., n + 1. (2.36)

Пусть выполняется (2.36) и, следовательно, (2.35). Тогда имеет место равенство (2.34). Комбинируя его с (2.33), получаем (2.32). Тогда по условию леммы

фх,у) = 1.

Исходя из (2.23), можно переписать равенство (2.36) в виде Ах = Ау , где

113

n+1

Ax = Е Ф,, x)ei ,{bi, x) = p i (x)- Ct. (2.37)

i =1

Таким образом, Ф(х, у) = 1 тогда и только тогда,

когда Ах = Ау . Из леммы 1.1 следует, что предикат ф линеен. Осталось показать, что rgA = n . Рассмотрим аффинное отображение

n +1

C (х) = ЕРг(х)еi. (2.38)

i =1

Тот факт, что система (2.25) разрешима при любых [si}n+1, сумма которых равна 1, означает, что

JmC=aff {Єі }f=+/ . Но нетрудно видеть, что C(х) =

= Ах + d , где d = c1e1 +... + cn+1en+1 и, следовательно, ImA = ImC-d . Поэтому размерность линейного оператора А совпадает с размерностью аффинного оператора С , т.е. размерностью aff{ei}"+ . Последняя равна n, так как векторы {ei }n=11 аффиннонезависимы. Достаточность доказана.

Необходимость. Пусть предикат Ф является n -

мерным линейным, P — соответствующий ортопроектор. Проверим, что

affP(V) = ImP. (2.39)

Действительно, P(V) с ImP. Поскольку ImP — линейное, а следовательно, аффинное многообразие, отсюда вытекает включение affP(V) = ImP. Пусть

у є ImP . Тогда существует х є L2[0, 1] такой, что у = Рх . Поскольку affV = L2[0, 1], то, согласно (1.29), существуют такие точки х, у єV и числа Xb X 2, сумма которых равна 1, что х = X1x1 + X2х2. Поэтому y = X1 y1 + X2у2, где yi = Pxi є P(V). Отсюда видно, что у є affP(V). Равенство (2.39) доказано.

По условию rgP = n . Поэтому существуют такие векторы gi є ImP, i = 1, 2,..., n +1, что

aff{gi}n+11 = ImP . (2.40)

Согласно (2.39) и формуле (1.29) найдутся такие

системы {ui }”=11,{vi }n=11 є P(V) и числа X1i, X2i, что

gi =КЩ +X 2iVi, Xh + X 2i = 1, i = 1, 2,..., n +1. П°-

этому aff{gi}”=+/ C aff{{ui}n=11 u {vi}n=11} = ImP . Вместе с (2.40) это дает

aff{{ui}n=11 u {vi}n=+/} = ImP . (2.41)

Выберем из системы {ui}in=11 u {vi }n=+11 аффинно-независимую подсистему. Из (2.41) и равенства rgP = n

вытекает, что эта подсистема состоит из (n +1) -й точки и ее аффинная оболочка совпадает с образом P . Таким образом, существует аффинно-независимая система {єД+Д с P(V) такая, что

aff{ei'}”+/ = ImP . (2.42)

Отсюда следует, что для любого элемента х є L2 [0,1] существует единственное представление

n+1 n+1

Px = ЕР ЕР і = 1, (2.43)

i =1 i =1

причем барицентрические координаты pi (х) являются аффинными функциями. Пользуясь формулой (2.29) перехода от представления (2.24) к представлению (2.27), можно заключить, что существует

такая система однородных координат {ai (x)}”+], I (х), что равенство

% 0Px + Е% ' = Е%іЄі' (2 44)

при условии (2.31) выполняется тогда и только тогда, когда %г = aг (х), I = I(х). Пусть {ei}"=/ с V — любые

точки, для которых et = Pei. Равенство (2.44) может быть переписано в виде

p\% 0 х + Е% іЄі J = P\E%er J

или, учитывая формулу (1.11), в виде (2.30). Таким образом, первое условие леммы 2.4 проверено. Выполнение второго условия очевидно.

Лемма 2.4 доказана.

Будем говорить, что системы точек {ek }J!+1 и

однородных координат {ak(х)}+0 , I(х) присоединены к n -мерному линейному предикату ф, определенному на квадрате выпуклого множества V c

affV = L2 [0,1], если они удовлетворяют условиям леммы 2.4.

Следствие 2.4. Пусть V — выпуклое множество affV = L2[0,1] . Для того чтобы пара аффинно-независимой системы точек {ek }n+i с V и системы однородных координат {a k (х)}П+10 , I(х) была присоединена к n -мерному линейному предикату ф, определенному на V х V , необходимо и достаточно, чтобы равенство Ф( х, у) = 1 было эквивалентно (2.35) и были справедливы соотношения

а 0 (ey) = 1, а 0 (ey) = 8 ц, I (e;) = 0,

(i, j = 1, 2,..., n +1). (2.45)

Доказательство. Пусть пара {ek }n=10 и {a k (х)}^+1, I (х) присоединена к n -мерному линейному предикату ф . Тогда, как было показано при доказательстве леммы 2.4 в сторону достаточности, равенство

Ф(х, у) = 1 эквивалентно (2.35). Далее Ф(еj, еj) = 1. Это означает, что выполняется (2.30) с %0 = 1, % j = 1, %г = 0, при i Ф j, I = 0. В силу первого условия леммы 2.4 отсюда вытекает (2.45).

114

РИ, 1998, № 4

Пусть для пары [вк}n=0 и {ак(х)}П+|, I(х)

равенство Ф(х, у) = 1 эквивалентно (2.35) и выполняется (2.45). Заметим, что в силу соотношений (2.26) и (2.29) равенство (2.35) выполняется тогда и только тогда, когда выполняется (2.36), а (2.45) может быть переписано в виде

i,j = 1, 2,..., n +1. (2.46)

В частности, (2.30) выполняется тогда и только тогда, когда

Р j [$ о х+ Е$ ів j Є) J = P j |J$ e J .

Поскольку в j — аффинные функции и имеют место (2.31), то последнее равенство может быть переписано в виде

$ов j (х) + Е$ів j (e-) = Е$-в j (e-)

ієі iel

или, с учетом (2.46),

ві (х)

$ і 1 $ о, - е I, $ і1 $ о, - є 1.

Сравнивая это равенство с (2.29), находим, что первое условие леммы 2.4 выполняется. Выполнимость второго условия очевидна.

Следствие 2.4 доказано.

2.2. Предикаты, определенные на квадрате открытого выпуклого множества

Пусть V — выпуклое множество в L2 [0,1],

множество affV замкнуто и множество V открыто в affV . Это значит, что для каждой точки х є V

существует такая окрестность W , что W n aff V . Будем для краткости говорить при выполнении этих условий, что множество V относительно открыто.

В частности, если V — открытое множество, то оно, очевидно, относительно открыто. Всюду на протяжении этой статьи ф — обозначение для предиката, удовлетворяющего условиям 1^3 из раздела 1.4 [1].

Теорема 2.1. Для того чтобы предикат ф, определенный на декартовом квадрате относительно открытого выпуклого множества V , был линейным, необходимо и достаточно, чтобы он удовлетворял следующим условиям:

4) еслиФ(х, у) = 1 и Ф(х', у') = 1, то

х + х' у + у' 2 ’ 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= 1-

5) существует такое подмножество и с V, откры-

тое в affV, что если последовательность {хк }/= схо-

дится к х є U , последовательность {ук }/= сходится

к у єи и Ф(Хк, Ук) = 1, то Ф(х, у) = 1.

Доказательство. Необходимость очевидна. Докажем достаточность. Напомним, что двоично-рациональными называются числа вида m2~n, где m — целое число, n — натуральное. Проверим прежде

всего, что если Ф(х, у) = 1, Ф(х', у') = 1, у — двоично-рациональное число из отрезка [1, 0], то

РИ, 1998, № 4

Ф((1 — y)х + ух', (1-у)у + уу') = 1. (2.47)

Доказательство проведем индукцией по n. При n =1 двоично-рациональными числами из отрезка [0, 1] являются 0, 1/2 и 1. Для чисел у , равных 0 или 1, равенство (2.47) выполняется по условию 4, для у =1/2 этот факт эквивалентен условию 5. Предположим, что (2.47) доказано при данном n. Рассмотрим

число у вида к2_(n+1). Если к — четное, то у — число

вида m2-n и, следовательно, выполнимость (2.47) вытекает из предположения индукции. Пусть у — нечетное число. Тогда у =2 m +1, где m — некоторое натуральное число. Положим, у і = m2-n ,

у 2=(m +1)2-n . Очевидно, у =1/2(у 1+у 2). По предположению индукции

ф((1 —У1) х + У\х\(1 —У1) у + Y1 у') = 1,

Ф((1 —У 2 ) х + У 2 < (1—У 2 ) у + У 2 у') = 1 . Применив к двум последним равенствам условие 4, получим (2.47). Таким образом, (2.47) доказано.

Обозначим через S множество всех элементов $ из L2 [0,1], представимых в виде

$ = в(х — у); х,у є V; Ф(х, у) = 1; в> 0. (2.48)

Пусть для некоторой точки $ є S имеет место равенство

$ = в'(х' — у'); х',у'є V; в' > 0. (2.49) Покажем, что тогда

Ф( х', у') = 1. (2.50)

Согласно определению множества S для точки $ существует представление (2.48). Рассмотрим вначале частный случай, когда в (2.48) х, у єи . Без ограничения общности можем считать, что множество U выпукло (если это не так, можно взять в качестве нового множества U любой открытый шар в aff V, являющийся частью U). Заметим, что для точек х, у єU из равенства Ф(х, у) = 1 вытекает, что Ф(и, v) = 1, и, v є [х, у]. (2.51)

Действительно, пусть z(y) = (1 — у)х + уу, у є [0,1]. Если у — двоично-рациональное число, то в силу (2.47) из равенств Ф(х, у) = 1 и Ф(у, у') = 1 получаем Ф( z(y), у) = 1. (2.52)

Если у не является двоично-рациональным, то найдется последовательность двоично-рациональных чисел {ук }“= , сходящаяся к у . Тогда, очевидно, последовательность {Дук )}£= сходится к точке z(у). Но в силу (2.52) Ф(z(ук), у) = 1. Поскольку z(yк), у єU , из условия 5 следует (2.52). В частности, из (2.52) получаем Ф(и, у) = 1, Ф^, у) = 1. Отсюда

вытекает (2.51). Зададим числа8Ь 52 є [—1,1] и положим (рис. 1)

115

x + у

u =----—

2

+ 5ЧУ - x),

x + y

V =----—

2

f( y- x).

Так как u, v є [x, y], то в силу (2.51) Ф(и, у) = 1.

Пусть z — произвольная точка отрезка [х', у']. Зафиксируем двоично-рациональное число у є (0,1), достаточно близкое к 1. Тогда точка W , определенная равенством

W = \ 1 --Y

х + у 2

1

+— z Y ’

(2.53)

достаточно близка к z и поскольку V — относительно открытое множество, отсюда следует, что w єV . Из равенств Ф(и, V) = 1, Ф(w, w) = 1 с помощью (2.47) находим

Ф((1- у)и +yw, (1- y)v + yw) = 1. (2.54)

Имеем

(1 - y )u + yw = (1 - y)u + (y - 1)(x + y) / 2 + z =

= z + (1 - Y)(u - (x + у)/2)) = z + (1 - y)(§1 / 2)(у - x) . Но из равенств (2.48) и (2.49) следует, что у-x = (в'/в)(у'-х') .Поэтому

(1 - y)u + yw = z + 5js(у' - x'), где s = в'(1 - y) / 2y . Аналогично

(1-y)v + yw = z + 52s(у1 - x').

Но 5j, 52 — произвольные числа отрезка [-1, 1]. Поэтому (2.54) означает, что для любой точки z є [x',у'] существует такая окрестность на отрезке

[x',у'], для любых точек которой будет Ф(u',v') = 1 . Поскольку отрезок является компактным множеством, из покрытия отрезка [x',у'] этими окрестностями можно выбрать конечное подпокрытие [4]. Отбросим те из оставшихся отрезков, которые являются частью какого-либо другого отрезка покрытия.

Пусть {[uj, vi ]}i=j — получившееся покрытие. Тогда

Щ = x',VN = у', ui < ui+1 < у- < Vi+1 .Поэтому

Ф(ui, ui+1) = 1, а следовательно, Ф(x', uN) = 1. Кроме

того, Ф(uN, у') = 1. Из двух последних равенств вытекает (3.50).

Рассмотрим теперь другой частный случай, когда в (2.49) x',у' є U . Для произвольной точки z є [x',у']

введем точку w равенством (2.53), где у є (0,1) — какое-либо двоично-рациональное число, при котором w є U . Из равенств Ф(x, у) = 1, Ф^, w) = 1 с помощью (2.47) находим

Ф((1- y)x + yw, (1- y)v + yw) = 1. (2.55)

Имеем (1-y)x + yw = z-s(у'- x'),

(1- Y)у + Yw = z + s(у'-x'), где s = в'(1 - Y)/2e . Поэтому из (2.55) и свойства (2.51) вытекает, что для каждой точки z є[x',у'] существует такая окрестность на этом отрезке, для любых точек u',v' которой будет Ф(u',v') = 1. Как и в предыдущем

случае, отсюда вытекает, что Ф(x', у') = 1.

Перейдем теперь к общему случаю. Зафиксируем произвольную точку х" є U . Подберем такое положительное число в" , чтобы точка

у" = x + в(в ")-1 (x - у) принадлежала множеству U . Тогда

§ =в " (у" - x"); x", у" єU; в " > 0. (2.56) Это второй из рассмотренных ранее частных случаев. Поэтому Ф( х", у") = 1. При сравнении § представления в виде (2.49) и (2.56) мы находимся в условиях первого частного случая. Это позволяет заключить,

что Ф( х', у') = 1. Равенство (2.50) полностью доказано.

Заметим теперь, что для любых точек x, у є V соотношения

Ф(х, у) = 1 и x-у є S (2.57)

эквивалентны. Действительно, из равенства Ф(х, у) = 1 по определению множества S следует,

что x-у є S . Обратное утверждение справедливо, поскольку (2.49) имплицирует (2.50).

Множество S замкнуто. Действительно, пусть

последовательность {§n}“=1 с S сходится к некоторой точке §. Зафиксируем произвольную точку а єU . Как видно из определения (2.47), множества S и формулы (1.30), при любом числе s точки вида а + s§n є affV . По условию affV — замкнутое множество. Поэтому и точка а + s§є affV . Но множество U является открытым в affV . Поэтому если s — достаточно мало, то отсюда следует, что а + s§ є U . Имеем

§ „ =1[(a + s§n) - a]

s

Поскольку из (2.49) вытекает (2.50), то Ф(а + s§„, a) = 1. В силу условия 5 тогда и Ф(а + s§, a) = 1. Отсюда и из равенства

§ = -[(a + s§) - a] s

следует, что § є S . Итак, S — замкнутое множество. Пусть Ф( х, у) = 1, Ф( х', у') = 1. Покажем, что тогда

РИ, 1998, № 4

116

равенство (2.47) справедливо при всех (не обязательно двоично-рациональных) числах у є [0,1]. Положим £ = х - у , £ = х' - y', £(у) = (1 -у)^ + у^'. Очевидно,

^(У) = ((1 - Y)х + ух’) - ((1 - у)у + у/). (2.58) Поэтому (2.47) означает, что в случае двоичнорационального числа у точка ^(у) принадлежит S. Аппроксимируя произвольное число у сходящейся к нему последовательностью двоично-рациональных чисел и используя замкнутость множества S, получаем, что при любом у є [0,1] точка ^(у) принадлежит S. Таким образом, из (2.58) и свойства (2.50) вытекает (2.47).

Покажем теперь, что множество S является линейным многообразием. Пусть ^є S, у — произвольное число. Если у > 0 , то из (2.48) следует, что у^ = (уР)(х - у), Ф(х, у) = 1, уР> 0.

Поэтому у^є S . Если у < 0 , то из (2.48) получаем = (-УР)(у - х), Ф(у, х) = 1, - уР > 0. Следовательно, у^є S . Наконец, если у = 0 , то у£, = 0 и, значит, у£, = х - х, Ф(х, х) = 1, так что у^є S . Далее, для любых точек ^, £,' є S из соотношений ^ = Р( х - у), %' = Р' (х' - у') , Ф( х, х) = 1 ,

Ф(х', х') = 1, р> 0,Р' > 0 при у = Р'(Р + Р')-1 вытекают равенства

^'= (Р + Р' )(((1 - у)х + ух') - ((1 - у)у + уу ')) и (2.47). Это означает, что ^ + ^' є S .

Итак, S — линейное подпространство в L2 [0,1]. Пусть р — ортопроектор на ортогональное дополнение S1 к S. Равенство Рх = Ру выполняется тогда

и только тогда, когда х - у = S . Поэтому из эквивалентности соотношений (2.57) вытекает (2.47).

Теорема 2.1 доказана.

В приложениях для проверки выполнимости условий 4 и 5 в каждой конкретной ситуации следует проводить экспериментальное исследование. При этом имеющиеся средства исследования могут быть различными в различных ситуациях. Для проверки выполнения условия 4 экспериментатор должен иметь возможность для любых физических сигналов х и у формировать средний между ними сигнал

(х + у) / 2 . В случае, когда этими сигналами являются излучения, сумма имеет естественную физическую интерпретацию — смешение излучений, а умножение на положительное число X интерпретируется как увеличение интенсивности излучения в X раз при сохранении спектрального состава. Таким образом, сигнал (х + у) / 2 может быть сформирован в два этапа — сложение и умножение на 1/2. Для удобства приложений теоремы мы укажем различные варианты формулировки условий 4 и 5.

Условие 4 может быть заменено совокупностью двух условий:

4а) если Ф(х, у) = 1 и Ф(х\ у’) = 1, то

Ф( х + х', у + у’ ) = 1 ,

4б) если Ф(х, у) = 1, то ф^х, у j = 1.

Действительно, из 4а, 4б, очевидно, вытекает условие 4, и поэтому теорема 2.1 останется справедливой в сторону достаточности, если заменить 4 на 4а и 4б. Справедливость теоремы в сторону необходимости при такой замене также очевидна.

Легко увидеть также, что условие 4 может быть

заменено условием: если Ф(х, у) = 1 и Ф(х', у') = 1, то

при любом у є [0,1] имеет место равенство (2.47).

Еще один вариант: если Ф(х, у) = 1, Ф(х', у') = 1,

то при любых а и Р, для которых ах + Рх'єУ ,

ау + Ру' є У , имеет место равенство

Ф(ах + Рх', ау + Ру’) = 1.

Условие 4, однако, не может быть заменено одним лишь условием 4а. Это видно из следующего примера. Пусть У = L2 [0,1], e — произвольный ненулевой вектор в L2 [0,1] . Рассмотрим предикат Ф на У х У ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

равный 1 тогда и только тогда, когда (е, х - у) — целое число. Очевидно, для этого предиката выполняются условия 1, 2, 3, 4а, 5, но не существует ортопроектор Р , для которого условия Pz = 0 и (е, z) — целое число эквивалентны при всех z .

Аналогично, условие 4 не может быть заменено следующим более слабым условием:

Ф(ху) = 1„ Ф(х'.у') = ЬТО Ф(^, у) = 1

В качестве примера рассмотрим предикат Ф, определенный на L2[0,1] х L2[0,1] условием: Ф(х, у) = 1 тогда и только тогда, когда х = у или

(х, е) = 0 и (у, е) = 0 , где e — произвольно фиксированный ненулевой вектор. Этот же пример показывает, что условие 4 не может быть заменено условием:

( х + х j

если Ф(х, у) = 1 , то Ф1 2 , у I = 1.

Условие 5 может быть заменено условием 5а: существует такая точка и такая окрестность u с У

этой точки, что если последовательность {х* }/=! сходится к х єи и Ф(хк, у) = 1, то Ф(х, у) = 1.

Тот факт, что теорема 2.1 остается справедливой при замене 5 на 5а в сторону достаточности, виден из доказательства теоремы. Справедливость в сторону необходимости вытекает из того, что условие 5а, очевидно, слабее условия 5.

РИ, 1998, № 4

117

2.3. Предикаты, определенные на квадрате произвольного выпуклого множества

Множества, фигурирующие в частных случаях, описанных выше, не являются открытыми в своих аффинных оболочках. Например, положительный

конус в пространстве LL [0,1] является воспроизводящим, т.е. его линейная оболочка совпадает со всем пространством, однако он не является открытым множеством. Условия 1-3 из [1] и 4, 5 теоремы 2.1 не обеспечивают линейность предиката, если множество V не является относительно открытым. Это видно из следующего примера. Пусть предикат ф определен на квадрате положительного конуса К в

L2 [0,1] условием Ф(х, у) = 1 тогда и только тогда, когда х и у одновременно равны или одновременно не равны нулю. Условия 1-3 из [1] и 4 для этого предиката, очевидно, выполняются. Для любого открытого множества U , не содержащего 0, верно,

Доказательство. Наличие представления (2.59) вытекает из формулы (1.30). Покажем теперь, что среди представлений (2.59) существуют такие, которые удовлетворяют дополнительным условиям (2.60).

Зафиксируем произвольную точку х0 є V . Рассмотрим линейное пространство T (V) х R , элементами которого являются упорядоченные пары (x; t), где ^є T(V), t — действительное число. Введем в нем норму, полагая

life t) = д/И 2 + t2 .

Поскольку aff V — замкнутое множество, то T(V) — подпространство пространства L2 [0,1].

Поэтому T (V) х P с введенной таким образом нормой — гильбертово пространство. Определим множество К0 в пространстве T (V) х R равенством k0 = {(t(х - х0); t) | х є V, tє R}

что если последовательность {хк }£= с К сходится

к хє U , последовательность {yk }^=1 с К сходится к

у є U и Ф(хк, yk) = 1, то Ф(х, у) = 1. Тем не менее, этот предикат не является линейным. Действительно, если бы он был линейным, то, очевидно, условие 5 выполнялось бы при U = К . Это, однако, не так:

пусть хк ^ х, хк Ф 0 , yk ^ у , х = 0 , у Ф 0 . Тогда

Ф(хк, yk) = 1, но Ф(х, у) = 0 . Этот пример показывает, как следует усилить формулировку теоремы 2.1, чтобы она оставалась справедливой и для множеств, не являющихся относительно открытыми. А именно, следует потребовать, чтобы условие непрерывности было глобальным.

Теорема 2.2. Для того чтобы предикат Ф, определенный на декартовом квадрате выпуклого множества V с замкнутой аффинной оболочкой, был линейным, необходимо и достаточно, чтобы он удовлетворял следующим условиям:

4) если Ф(х, у) = 1 и Ф(х', у') = 1 то

(рис. 2). Множество К0 является конусом.

Действительно, если (t(х - х0); t) є К0 и Х> 0 , то X(t(х - х0); t) = (Xt(х - х0); Xt) є К0 . Пусть (ti (х,-х0); ti) є К0, i = 1,2 . Тогда

(t1 (XГX0), t1) + (t2 (х2-х0Х t2 ) = (t(x-x0), t) ,

где t = t1 +t2, х =—х1 +—х2 єV.

12 t 1 t

х + х' у + у' 2 ’ 2

= 1 •

Покажем теперь, что конус К0 является воспроизводящим в пространстве T (V) х R . Рассмотрим

5) если последовательность ^ }^=1 сходится к

х єV, последовательность {yk }£= сходится к у є V

и Ф(хь Уk) = 1, то Ф(x, у) = 1.

Для доказательства теоремы нам понадобятся некоторые вспомогательные утверждения.

Лемма 2.5. Пусть аффинная оболочка выпуклого множества V замкнута. Тогда для произвольной

точки х0 є V существует такая константа C , что любая точка ^є T (V) представима в виде

^=Р(х - у) Р> 0; х, у єV, (2.59)

где

Р = С N |; ||х - х^| ^ 1; ||у - х^| < 1. (2.60)

вначале точки пространства T(V) х R вида (N; 0).

Так как ^є T (V), то в силу указанного выше имеет место представление (2.59). Равенство (2.59) можно переписать в виде N = Р((х - х0) - (у - у0)). Поэтому

(N 0) = (Р(х - х0); Р) - (Р(у - у0); Р).

Очевидно, каждый из элементов, фигурирующих в правой части этого равенства, принадлежит конусу.

Теперь рассмотрим точки пространства T (V) х R

вида (0; t). Для них имеет место очевидное равенство

(0; t)= (/(х0 - х0), t)- (0 • (х0 - х0), о). Следовательно, такие точки также содержатся в

линейной оболочке конуса К0. Осталось заметить,

что любая точка (N; t) пространства представима в виде

118

РИ, 1998, № 4

Имеем

(Е t) = (Е; 0)+(0; t).

Поскольку каждая из точек, фигурирующая в правой части этого равенства, принадлежит L(K0), отсюда вытекает, что (Е; t) є L(K0).

Поскольку конус K0 является воспроизводящим в гильбертовом пространстве T (V) х R, то существует такая константа С , что для каждого элемента рє T (V) х R имеется представление

П = П -П2, (Пі, П2 є К0), (2.61)

при котором

ЦпЦ < С||п||, ||п21| - С|HI. (2.62)

Пусть Е — произвольная точка пространства T(V).

Тогда точка п = (Е; 0) є T (V) х R . В рассматриваемом случае представление (2.61), (2.62) примет вид

(Е 0) = (Р'( х'-Х0); Р') - (у'(у'-х 0); у'), (2.63)

21Ы12

р '2| х 1 -х0\\ +Р'2 < С2||Е Y'2||У '-xj2 +Y'2 < С||Е||

(2.64)

2

где р', у' — некоторые положительные числа; х',у' — некоторые точки множества V. Но из равенства (2.63) с очевидностью следует, что р' = у'. Таким образом,

для точки Е справедливо равенство Е = Р' (х' - у'), причем из (2.64) вытекают неравенства

в-с||е||, р'||х'-х0І|<с||Е||; Р'||у'-у01 <с||е|

Пусть C1 = max{|| х-х0 ||, || у-х0 ||} . Если С1 < 1, то

лемма уже доказана. Предположим, что С1 > 1. Положим

х =

-1 - -С С1

1 ,

х0 + сх , у =

(

1 —

С

1 У

У0 + С-у, Р = QP'. С1

Тогда, очевидно, выполняются соотношения (2.59), (2.60).

Лемма 2.5 доказана.

Лемма 2.6. Пусть аффинная оболочка выпуклого множества V замкнута. Тогда для любой последова-

тельности {Е k }“= с T(V), сходящейся к некоторой

точке Е = Р(х - у) (Р > 0, х, у є V), существует представление

Е k =Pk (хк - у k )(Р к > 0, хк, у к є V) (2.65)

такое,что

limp к =Р; lim хк = х; lim ук = у . (2.66)

к ^W

Доказательство. Зафиксируем произвольную точку х0 є V . Согласно лемме 2.1 при любом К имеет место равенство

Ек -Е = tk(ик -vк), (2.67)

где

Ч > 0; ик, ^ ^; Ч < С\\Ек-Е1; ||ик- х0| <1 llvt- х0| <1

Ек = Р( х - у)+У (ик- ^) = Рк(хк- ук);

здесь

_ Р

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

tk

_ Р, tk

Рк =Р + tk, хк =в- х + вГик, ук = П+пГ^.

Рк Рк Рк Рк

Точки хк,ук являются выпуклыми комбинациями точек множества V и, следовательно, сами принадлежат V . Легко видеть, что

хк - х = в^ ((ик - х0) + (Х0 - х)),

ук -у = ТГ((vk -х0) + (У0 -у)). Рк

Из (2.67) видно, что последовательность {tk }к=1 сходится к нулю. Тогда выполняется первое равенство (2.66). Поскольку Р > 0, то из последних двух равенств и неравенств (2.67) вытекает второе и третье равенства (2.66).

Лемма 2.6 доказана.

Доказательство теоремы 2.2. Необходимость очевидна. Докажем достаточность. Заметим, что условие 4 можно переписать в следующем виде. Если

Ф(х, у) = 1 и Ф(х', у') = 1, то при любом ує [0,1]

Ф((1-у) х + ух', (1-у) у + уу') = 1. (2.68)

В случае двоично-рационального у равенство (2.65) доказывается так же, как и равенство (2.47). В случае произвольного у производится аппроксимация числа у последовательностью двоично-рациональных чисел {у к}^=1. Положим

ик =(1- Y к) х + Y кх', vk =(1- Y к) У + Y к У', и = (1- y)х + ух', v = (1- y)у + уу'. Очевидно, lim ик = и, lim vk = v.

k^W к

Поскольку для двоично-рациональных чисел (2.65) уже доказано, то Ф(ик, vk) = 1. Тогда по условию 5

и фи, v) = 1. Этим заканчивается доказательство (2.68).

Так же, как и в теореме 2.1, из равенства Ф(a, b) = 1 следует, что

фи' + v') = 1, и', v'є [a, b]. (2.69)

Обозначим через S множество всех элементов Еє L2 [0,1], представимых в виде

Е = Р(х - у); х, у є V; Ф(х, у) = 1; р> 0. (2.70) Покажем, что соотношения

Еє S; Е = Р'(х' - у'); х', у' є V; Р' > 0 (2.71) влекут равенство

фх, у) = 1. (2.72)

В рассматриваемой ситуации нельзя пользоваться конструкцией, используемой с аналогичной целью при доказательстве теоремы 2.1, так как точка W, определенная равенством (2.53), может не принадле-

РИ, 1998, № 4

119

жать множеству V, поскольку Vне является относительно открытым.

Зададим у є [0,1] и положим

и= (1 - у) х + ух', v= (1 - у) у + у у'

(рис. 3). Пусть W — произвольная точка отрезка [и, v] . Тогда W = (1-t)u + v, 0 < t < 1. Положим

z = (1-1)x' + ty'. Из равенств фx, у) = 1 и фz, z) = 1 и свойства (2.68) заключаем, что

Ф((1 -у)х + yz, (1 -у)у + yz) = 1. (2.73)

Имеют место равенства

(1 - у)х + yz = W - Sj(v - u), (1 - y)x + yz = W + S2(v - u),

(2.74)

где S! = -

t (1 ~Y)P'

S 2 =

(1 -1 )(1 -y)P'

(1 -Y)P' + YP ’ ~2 (1 -Y)P' + YP

Проверим это. Из (2.70) и (2.71) следует, что Р(х - у) = Р(х' - у'). Поэтому

и - v = (1 -Y)(x - у) + y(х'- у')

(1 -Y) p“ + Y

(х'- у'),

откуда

х'~ у'= (u - v) •

Далее

(1 - y)х + yz - w = u - Yx'+Y[(1 -1)х'+(у'] - [(1 - t)u + tv] =

=t(u - v) - Yt(х'-у') = - (|/-lY)(Y)PYp(v - u) = -S1(v - u).

Второе равенство (2.74) проверяется аналогично. Таким образом, можно переписать (2.73) в виде

Фф - Sj (v - u), w + s2 (v - u)) = 1.

Отсюда и из свойства (2.69) следует, что для каждой точки w є [u, v] существует такая окрестность на отрезке [u, v], для любых точек u', v' которой

фи, v) = 1. Так же, как и в теореме 2.1, это позволяет заключить, что фи, v) = 1. Переходя в (2.47) к пределу при y^1 , с помощью условия 5 заключаем,

что ф( х', у' ) = 1.

Докажем теперь, что множество S замкнуто. Пусть последовательность (£, к }£= с S сходится к некоторой точке £, . Поскольку S с T(V) и множе-

ство T(V) замкнуто, то ^є T(V). Представим точку £, в виде (2.59). Согласно лемме 2.6, последовательность (£, k }'U=1 может быть представлена в виде (2.65), (2.66). Поскольку из (2.61) вытекает (2.62), то из

(2.65) вытекает равенство ф(хк, ук ) = 1. Тогда из

(2.66) и условия 5 можно заключить, что Ф(х, у) = 1. Отсюда и из определения (2.70) следует, что ^є S . Замкнутость множества S доказана.

Окончание доказательства данной теоремы совпадает с окончанием доказательства теоремы 2.1. Теорема 2.2 доказана.

2.4. Координатная формулировка для предикатов, определенных на декартовом квадрате всего пространства

Теоремы 2.1 и 2.2 носят “безразмерный” характер— в их посылках нет каких бы то ни было указаний на размерность ортопроектора р, соответственно, их нет и в заключении. В частности, это означает, что ортопроектор р может быть как бесконечномерным, так и конечномерным. Для конечномерного случая можно получить также другую систему необходимых и достаточных условий линейности предиката Ф, носящую координатный характер. Мы начнем со случая, когда предикат определен на декартовом

квадрате всего пространства L2 [0,1]. При этом формулировка соответствующего результата имеет простой вид и доказательство также не является сложным.

Теорема 2.3. Для того чтобы предикат ф, определенный на декартовом квадрате пространства L2 [0,1], был n -мерным линейным, необходимо и достаточно, чтобы он удовлетворял следующим условиям:

4) если Ф( х, у ) = 1 и Ф( х', у' ) = 1, то

Ф( х + х', у + у' ) = 1;

5) существует такой набор векторов (ek }n=1, что для каждого х є L2[0, 1] есть единственный набор чисел (a k (х)}’п=1, удовлетворяющий условию

П

Ф( х, Ea kek) = 1; (2.75)

к=1

6) функции ак (х) непрерывны.

Доказательство. Установим сначала достаточность

условий теоремы. Покажем, что векторы е1 +... + ек линейно-независимы. В самом деле, пусть

Y 1е1 +... + Ynen = 0 . Тогда

ф(0, Y1e1 +... + Ynen) = 1

Согласно условию 5 это равенство может выполняться лишь при y1 = Y2 = .. = Yп = 0 . Линейная независимость системы (ek}n=1 доказана.

Имеем из условия 5

n n

ф(x, EakСФк) =1, ^, Eak(у)ek) =1, (2.76)

к=1 к=1

120

РИ, 1998, № 4

Ф(х + y,Tak (x + y)ek) = 1. (2.77)

k=1

Комбинируя равенства (2.76), с помощью условия 4 получаем

Ф( x + У, E (а k (x) + ak (У))ек) = 1.

k=1

Сравнивая последнее равенство с (2.77) и учитывая единственность коэффициентов {ak}’1=1, находим ak(x + У) = ak(x) + ak(y), k = 1,2,..., n .

Таким образом, функционалы a k являются аддитивными и, согласно условию 6, непрерывными. Поэтому a k — линейные функционалы [5, с. 143].

Проверим линейную независимость системы {ak }’l=1.

Для любых чисел уь у2,...,уn вектор

x = Y1e1 +... + у nen является решением системы линейных уравнений

a k (x) = Y k, k = 1,2,..., n. (2J8)

Это видно из того, что по условию 1 [1] имеет место равенство

Ф(x, EYkek) = 1,

k=1

так что из 5 следует, что yk = ak (x). Следовательно, система (2.78) разрешима при любых правых частях. Это и означает линейную независимость функционалов a1,..., an . Для окончания доказательства осталось сослаться на лемму 2.2.

Пусть, обратно, предикат Ф является n -мерным линейным. Тогда выполнимость условия 4 очевидна. Выполнимость 5 и 6 вытекает из леммы 2.2. Теорема 2.3 доказана.

2.5. Координатная формулировка для случая воспроизводящего конуса

Теорема 2.4. Для того чтобы предикат ф, определенный на квадрате воспроизводящего конуса K , был n -мерным линейным, необходимо и достаточно, чтобы он удовлетворял следующим условиям:

4) если ф( x, У ) = 1 и Ф( x', у' ) = 1, то

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ф x + x', у + у' ) = 1;

5) существует такой набор векторов {ek }J!=1 с K, что для каждого x є K есть единственный набор неотрицательных чисел {a , (x)}n=1 и единственное

подмножество I(x) с {1, 2,..., n} , такие что (сумма по пустому множеству индексов предполагается равной нулю)

Ф(x + EaіЄі, Eaу,) = 1; a, >0, ієі; (2.79)

ієі i&I

6) если x,у є K, y> 0 и при некотором i

Ф x + Ye, У + Ye, ) = 1, то Ф( x, у ) = 1;

7) функции a, (x) непрерывны на K .

Для доказательства этого утверждения нам понадобится следующая

РИ, 1998, № 4

Лемма 2.7. Пусть f — аддитивный функционал на воспроизводящем конусе K пространства Z2[0, 1] и функция | f (x) | непрерывна на K . Тогда существует единственный линейный функционал F на 1} [0, 1] такой, что

F(x) = f (x), x є K . (2.80)

Доказательство. Пусть x — произвольный вектор L. Тогда для него имеет место представление

x = x1 - x2, x1, x2 є K . (2.81)

Положим

F (x) = f(^) - f(x2). (2.82)

Покажем, что это определение корректно в том смысле, что не зависит от выбора x1 и x2 в представлении (2.82). Действительно, пусть

x = x1 - x'2 ; x(, x'2 є K . Тогда x1 + x'2 = x2 + x( є K.

Следовательно, f (x1 + x'2) = f (x2 + x\). Но f — аддитивный функционал. Поэтому

f (x1 ) + f (x'2 ) = f (x2 ) + f (x'l ) ,

т.е. f (x1) - f (x'2) = f (x1) + f (x2), что и требовалось.

Функционал F является аддитивным. Действительно, пусть x, у є L2[0, 1] , x — представлен в виде (2.82) и у = У1-У2, у1, у'2 є K . Тогда

x + У = (x1 + У1) - (x2 + У2), x1 + У1 є K .

Поэтому

F(x + у) = f (x + У1) - f (x2 + У2) = (f (x) + f (У1)) -- (f (x2 ) + f (У2)) = (f (x1)- f (x2)) + (ІЇУ1) - f (У2 )) = F(x) + + F(у).

Поскольку K — воспроизводящий конус, то существует такая константа C , что для любого

z є L2[0,1] имеет место представление [6, с. 389]

z = x - у; x, у є K; ||x|| < C||z||, ||у|| < C|Z||. (2.83) Покажем, что функционал F непрерывен в нуле.

Пусть последовательность {zk }'f=1 сходится к нулю. В соответствии с (2.83) существуют последовательности {xk }“, {ук }“ с K такие, что

Zk = xk - Уk, limxk = 0, limyk = 0. (2.84)

Но | f (x) | — непрерывная функция. Поэтому из (2.84) следует, что

F (Zk) = f (xk) - f (Уk),

lim I f (xk )| = I f (0)|, liH f (Уk ) = I f (0)|. (2.85) Заметим теперь, что f (0) = 0 . Действительно, пусть

x є K, x Ф 0. Так как f — аддитивный функционал, то при любом натуральном n будет

121

Поскольку | f (x) | — непрерывная функция, в последнем равенстве можно перейти к пределу при n^-да . Получаем | f (0) |= 0 . Тогда из (2.85) следует,

что функционал F непрерывен в нуле. Но аддитивный функционал, непрерывный в нуле, является линейным. Значит, F — линейный функционал. Единственность продолжения очевидна.

Лемма 2.7 доказана.

Доказательство теоремы 2.4. Установим сначала достаточность условий теоремы. Покажем, что векторы e1, e2,..., en линейно-независимы. В самом деле,

пусть ye +. . . + уnen = 0 . Положим J = {i | уi < 0} . Тогда

Z (-Yi )ei = z Уiei и ф\ 0 + Z (-Yi )ei, ZYіЄі | = 1.

feJ igJ V i^J HJ J

В силу условия 5 последнее равенство может иметь

место лишь при у i = 0; i = 1,..., п.

Равенство (2.79) ставит каждому вектору x є K в соответствие пару векторов (xv x2) по правилу

Xl = z а (x)ei, Х2 = E«i (x)ei (2 86)

Положим

Ax = x2 - x1. (2.87)

Тогда

Ф(x, y) = D(Ax, Ay). (2.88)

Действительно, пусть фx, y) = 1. Вместе с равенством Ф( x1, x2 ) = 1 это дает фx+x1, y+y1 ) = 1. Но (2.86) означает, что фx + x1, x2) = 1. В силу условий

2, 3 [1] тогда Ф(y + x1, x2) = 1. Из условия 5 следует, что последнее равенство может выполняться лишь при x1 = y1; x2 = y2. Поэтому Ax = Ay. Пусть, обратно, Ax = Ay . Так как система {ei }п=1 линейнонезависима, отсюда вытекает, что x1 = y1; x2 = y2. Значит, вместе с равенством ф x + x1, x2) = 1 справедливо равенство Ф(у+x1, x2) = 1. Но тогда фx+x1, y+у1) = 1. Применяя условие 6, получаем Ф x, у ) = 1.

Покажем, что оператор А аддитивен. Пусть x, у — произвольные точки конуса. Для векторов x1, x2, y1, y2, определенных формулой (3.40), имеют место равенства х1 + у1 =81e1 +... + 5nen, х2 + у2 =8'1e1 +... + 5'nen , где 5i, d'i — некоторые неотрицательные числа. Положим N = {i | Si >5'} и

и = Z (5 і-5і ')et , v = Z (5 і '-5 і )Єі ,

ieN igN

z = Z 5і ' Єі + Е5іЄі . (2.89)

ieN igN

Тогда x1 + y1 = u + z1; x2 + y2 = v + z . Из равенств Ф( x + x1, x2 ) = 1 и Ф( y + y1, y2 ) = 1 следует, что

Ф( x + y + Х1 + У1, х 2 + у 2 ) = 1, т.е. ф x + У + и + z, v + z ) = 1. Применяя условие 6,

получаем Ф(x + у + и, v) = 1. Но последнее есть равенство (2.79) для вектора x + у . Поэтому

A(x + y) = v-u = (Х2 + у2)- (х + У1) = Ax + Ay. Равенства (2.86), (2.87) можно переписать в виде

Ax = ZPi(x)ei, Pi(x) = ■

І а і (x), i Є і (x),

і=1 [-аі(x), i є I(x). (2.90)

Из аддитивности оператора А вытекает аддитивность функционалов Pi. Но | Pi (x) |= ai (x) | и фун-

кции ai непрерывны. Поэтому на основании леммы 2.7 можно заключить, что функционалы рг- допускают единственное продолжение до линейных функционалов на L2 [0, 1]. Чтобы не усложнять обозначений, будем продолженные функционалы обозначать теми же символами Pi.

При любых неотрицательных числах для вектора x = Y1e1 +... + Y nen имеет место равенство Ф(x, Y1e1 +... + Ynen) = 1. Следовательно, Pi(x) = yi и Ax = x . Это значит, что Im A содержит положитель-

ный конус L линейной оболочки L системы векторов {e1,..., en} . ПосколькуL — воспроизводящий конус в L, то отсюда следует, что Im A = L . Следовательно, система {pi }n=1 — линейно-независима. Для окончания доказательства достаточности осталось сослаться на лемму 2.3.

Докажем необходимость. Если предикат ф является n -мерным линейным, то условия 4 и 6, очевидно, выполняются. Выполнимость условий 5 и 7 вытекает из леммы 2.3.

Теорема 2.4 доказана.

Литература: 1. Походенко В.А., Тарасова Т.Т., Шабанов-Кушнаренко С.Ю. Теория цветового зрения. I // Радиоэлектроника и информатика. 1998. №1. С. 106-117. 2. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. 347 с. 3. Никайдо X. Выпуклые структуры и математическая экономика. М.: Мир, 1972. 533 с. 4. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Наука, 1979. 278 с. 5. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1976. 402 с. 6. Люстерник Л.А., Соболев В.И. Элементы функционального анализа. М.: Наука, 1965. 389 с.

Поступила в редколлегию 29.08.1998

Рецензент: д-р техн. наук, проф. Левыкин В.М.

Бондаренко Михаил Федорович, д-р техн наук, профессор, академик АН ВШ, ректор ХТУРЭ. Научные интересы: информатика. Адрес: Украина, 310726, Харьков, пр. Ленина 14, тел. 43-30-53.

Шабанов-Кушнаренко Сергей Юрьевич, д-р техн. наук, ведущий научный сотрудник кафедры ПО ЭВМ ХТУРЭ. Научные интересы: идентификация механизмов интеллекта человека. Адрес: Украина, 310726, Харьков, пр. Ленина 14, тел.: 40-94-46.

122

РИ, 1998, № 4

УДК 519.7

ТЕОРИЯ ЦВЕТОВОГО ЗРЕНИЯ. III1

БОНДАРЕНКОМ. Ф, ШАБАНОВ-КУШНАРЕНКО С.Ю.

Рассматривается теория цветового зрения человека. Изучается линейная предикатная модель цветового зрения для случаев открытого и произвольного выпуклых множеств, всего пространства; интегральное представление модели.

3.1. Координатная формулировка для случая открытого выпуклого множества

Теорема 3.1. Для того чтобы предикат ф, определенный на квадрате открытого выпуклого множества V с Z2 [0,1], был п -мерным линейным, необходимо и достаточно, чтобы он удовлетворял следующим условиям:

4) если фх, у ) = 1 и фх', у' ) = 1, то

Ф Дт, ^ )=1;

5) существуют такие точки {ei }n=11 с V , что для каждого х є V есть единственный набор неотрицательных чисел {аі (x)}n=o и единственное подмножество I(х) є {i = 1, 2,..., n} такие, что

ф(аох + Еаiei, Еад) =1; (3.1)

ІЄІ ЦІ

а о > 0; а і > 0; І є I, ао +^а і = 1; Еа і = 1; (3.2)

ІЄІ ЦІ

6) функции а І (х) непрерывны.

Доказательство. Проверим вначале достаточность.

Зафиксируем произвольные положительные числа

{а 0}n=11, сумма которых равна 1, и положим

а = а10е1 +... + а П+1еп+1 . (3.3) Ч.

Тогда а принадлежит V. Из рефлексивности

предиката ф и условия 5 следует, что аІ (х) = аІ0 (i = 1, 2,..., п +1), а0(х) = 1, I(а) = 0 . Тогда существует такая окрестность и с V точки а , что аІ (х) > 0, I(х) = 0 (i = 1,2,..., п +1; х є и). (3.4)

Неравенства для а i вытекают из непрерывности этих функций. Предположим, что вопреки доказательству существует последовательность {хп }”=1, сходящаяся к точке а , для которой I (хп) ^ 0 .

Поскольку функция х ^ I(х) принимает лишь конечное число значений, из этой последовательности можно отобрать такую подпоследовательность, для

которой I(хп) = I, где I — какое-нибудь непустое

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 Ч. I см. в журнале “Радиоэлектроника и инфор-матика”,1998. №1. С. 106-117

Ч. II см. в настоящем выпуске

подмножество множества {1, 2,..., п +1} . На этой последовательности по условию 5 будет

а0( хп) + Еаі (хп) = 1.

ІЄІ

В пределе по подпоследовательности, используя условие 6 и равенство а 0(а) = 1, получаем

1 + Еа° = 1, I ^0 .

іє!

Но это противоречит положительности чисел а 0,..., а п+1. Заметим теперь, что для всех х, у є V из равенства Ф( х, у ) = 1 вытекают равенства

аг(х)=аі(у), і=0,1, 2,..., п+1; I(х)=(у). (3.5)

Действительно, из равенств ф( х, у) = 1 и ф(еі, еі) = 1 на основании условия 4 получаем

ф(а0(х)х + ^ аі(х)Єі, а0(х)у + Еаі (х)е) = 1.

ієі (х) ієі ( X)

Сравнивая это равенство с (3.1), находим ф(а 0 (х) у + Е а і (х)еі, Еаі (х)е) = 1.

ієі(х) ЦІ(х)

В силу единственности чисел аі (у) и множества

I (у) отсюда вытекает (3.5).

Покажем теперь, что выполняется условие 5 теоремы 2.1 [2]. В качестве U возьмем любое открытое множество, для которого справедливо (3.4).

Пусть последовательности {хп}“=1, {уп}“=iC U сходятся к точкам х, у eU соответственно и ф(хп, уп) = 1. В силу равенства (3.5) тогда аі (хп) = аі (уп), і = 0,1,..., п +1. По непрерывности отсюда заключаем, что аі(х) = аі(у), і = 0,1,..., п +1.

Кроме того, в силу (3.4) I(х) = I(у) = 0 . Таким образом,

п+1 п+1

ф(х, ЕРіЄі ) = 1, ф(у, ЕРіЄі ) = 1 (Рі = аг (х) = аі (у)).

i=1 i=1

Тогда по условиям 2, 3 [1] и ф( х, у) = 1.

В силу теоремы 2.1 имеет место равенство (3.3) с некоторым ортопроектором Р. Тогда

п+1 п+1

Рх = ЕРі(х)Pei, ЕРі(х) =1 (хєV), (3.6)

i=1 i=1

где Рі (х) = -аІ (х)/а0(х) при і є I(х)

и Рі (х) = -аІ (х)/а0(х) при і і I(х) .

Первое равенство (3.6) вытекает из (3.1), второе — из (3.2). Поскольку V — телесное множество, из (3.6) следует, что ImP совпадает с аффинной оболочкой множества точек Pe1,..., реп+1. Проверим, что rgP = п. Для этого достаточно убедиться в аффинной независимости системы точек Pe1,..., Pen+l [1]. Предположим, что эта система аффинно зависима, т.е. существуют такие числа уi, что

РИ, 1998, № 4

123

n+1 n+1

ТугРег = 0, Туi = О, (Уі,...,уи+і) ф (0,...,0). (3.7)

i =1 г =1

Пусть а — точка, определенная равенством (3.3). Подберем число X Ф 0 так, чтобы а0 + Ху г > 0 (i = 1, 2,..., n +1). Используя (1.3), имеем

П+1

Pa = Р\ Т (а0 + Ху г )ег І, Ф\ а Т (а0 + Xy г )et \ = 1

л=1 ) \ i=1

n+1

Значит, аi (а) = а0 + Хуi (i = 1, 2,..., n +1), что противоречит установленным ранее равенствам

аi (а) = а°0. Достаточность доказана.

Необходимость вытекает из леммы 2.1 [2]. Теорема 3.1 доказана.

3.2. Координатная формулировка для случая произвольного выпуклого множества

Нам не известно, остается ли верной теорема 3.1 в случае, когда множество V не является открытым,

но affV = Z2[0, 1]. Верен, однако, вариант этого результата, отличающийся усилением условия 4 и одним дополнительным условием.

Теорема 3.2. Для того чтобы предикат ф, определенный на квадрате выпуклого множества V с

affV = Z2 [0, 1], был n -мерным линейным, необходимо и достаточно, чтобы он удовлетворял следующим условиям:

4) если Ф(X, у) = 1 и Ф(Xі, у') = 1 , У Є (0,1),

То Ф((1 — у) x + yx', (1 — у) у + уу' ) = 1 ;

5) существуют такие точки {ei}”+/ , что для каждого x є V есть единственный набор неотрицательных чисел {аг (x)}n+01 и единственное подмножество I(х) с {1, 2,..., n +1} такие, что

Ф(а0X + Тагeг, ТаіЄі) = 1; (3.8)

ієі i&I

а0 > 0; аг > 0; і є I; а0 + Таt = 1, Таг = 1; (T9)

ІЄІ ІЄІ

6) если X, у Є V , у Є (0,1) и при некотором і Ф(ух + (1 — у)Єг, уу + (1 — у)Єг ) = 1 , ТО Ф(X, у) = 1 ;

7) функции аг (x) непрерывны.

Лемма 3.1. Пусть V — выпуклое множество, аффинная оболочка которого совпадает со всем пространством; функция f , определенная на V, удовлетворяет условию

Я X^L )= 2(f(x) + f (у)), x, у є V (3.10)

и функция | f (x) | непрерывна в какой-либо точке x0 є V . Тогда существует единственный функционал f на 1}[0,1] и единственное число C такие, что f (x) = F(x) + C, xєV. (3.11)

Доказательство. Из равенства (3.54) вытекает, что при любом двоично-рациональном числе у є [0,1] имеет место равенство

f ((1 - У)x + уу) = (1 — Y)f (x) + yf (x) x, у є V. (3.12) Поскольку affV = Z2[0,1], то, как это следует из

формулы (2.22), каждая точка ^є Z2[0, 1] может быть представлена в виде

^ = P(x — у); Р> 0; x, у є V. (3.13)

Более того, число Р можно считать двоично-рациональным. Действительно, исходя из (3.13), возьмем любое рациональное число Р>Р ’. Точка

у' = (1

£x+ву

и имеет место равенство

S = P'( X — у').

Положим для £, , представленного в виде (3.13),

F(S) = P(f (x) — f (у)). (3.14)

Проверим корректность этого определения. Пусть одновременно с (3.14) имеет место равенство

^ = Р1(x1 — у1), Р1 > 0 — двоично-рациональное,

x1, у1 єV . Тогда P1(x1 — у1) = Р(x — у) и, следовательно,

Р

-X + -

Р1

-у1 = ^

у+

Р

x.

Р + Р1 Р + Р1 Р + Р1 Р + Р1

Точки, фигурирующие в каждой части этого равенства, являются выпуклыми комбинациями точек из V и поэтому сами принадлежат V. Применяя к

обеим частям равенства функцию f , получаем с учетом (3.12)

Р

-f ( X) +-

Р1

-f (у1) = ■

Р

-f ( у) + ;

Р

-f (x).

Р + Р1 Р + Р1 Р + Р1 Р + Р1

Отсщда p^f (X1) — f (у1)) = P(f (x) — f (у)). Таким

образом, определение (3.14) корректно.

Функция f является аддитивной. Действитель-

но, пусть ^1, ^2 — произвольные точки пространства

Z2[0, 1]. Представим их в виде (3.13):

^1 =P1(x1 — у1); ^2 =e2(x2 — у2).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Тогда

^1 + ^ 2 = (Р1 + Р2 )((

Р1

Р1 + Р:

-x1 +

Р1

Р1

Р 2

— (~^~ у1 +-

Р1 +Р/1 Р 2 +Р

Р1 +Р 2 у2 )^

X2) —

2

F (^1 +^2) = (Р1 +Р2)(/^-в^- X +тА- X2) —

Р1 +Р2 Р1 +Р2

— f (

Р1

Р1 +Р:

-у1 +

в Ю) =

Р2 +Р2

= Рь/ ( X1 ) +e2f ( X2 ) — Рь/(у1 ) Р2 f (у 2 ) = = Р1 (f (X1) — f (у1)) Р2 (f (X2 ) — f (у2 )).

124

РИ, 1998, № 4

Таким образом, F(S1 + S 2) = F (^j) + F (S 2).

Покажем, что функция F непрерывна в нуле.

Пусть последовательность (Sk }^=1 сходится к нулю. Воспользуемся леммой 2.5 [2]:

S k =Pk (uk - vk); uk, vkєУ; Pk >0;

| \uk - X0| | < 1; ||Vk - X0| | < 1; pk < C1|Skl |. (3.15) Рассуждая так же, как и в начале доказательства этой леммы, покажем, что в представлении (3.15) в

качестве Pk можно брать числа, являющиеся квадратами двоично-рациональных чисел. Итак, считаем

д/pk двоично-рациональными числами. Положим

Xk = Хо +л/Р^(Uk - Xo), yk = Xo +$k (Vk - Xo). Из последнего неравенства (3.15) следует, что при

достаточно больших k будет < 1. Поэтому

xk,yk є У . Имеем из (3.15)

Sk = л/РЇ(Xk - yk), ||xk - x0| <^jC\|SJ|,

II II < /ЙЙ (3.16)

y- X0i ч c Ski.

Тогда

F (Sk) = Vp7 (f(Xk) - f(yk)) и | f (Sk )|<Vp7 (|f (Xk )|-|f (yk )|). (3.17)

Из неравенств (3.16) следует, что последовательности (xJkU и (yk}t=j сходятся к точке X0. Тогда по

условию леммы последовательности (| f (Xk)|}^=1 и

(| f (yk) |}itU сходятся к точке \/(хо) и, следовательно, ограничены. Поэтому из неравенства (3.17) следует, что

liml F (Sk )| = 0.

k 1

Поскольку F — аддитивный функционал, то отсюда вытекает, что F (0) = 0 и, следовательно, функционал непрерывен в нуле. В таком случае F — линейный функционал.

Для любой точки X є У в силу (3.14) будет F(X - X0) = f (x) - f (X0). Функционал F линеен, так что F(x - x0) = f (x) - f (x0). Поэтому при

C = f (x0) - F(x0) имеем

f (x)=F (X-X0 )+f (X0 )=F (x)+(f (X0 )-F (X0 ))=F (x)+C. Равенство (3.11) доказано.

Проверим единственность функционала F и числа C . Пусть

f (x)=Fj(x)+Cj, xєУ, (3.18)

где F1 — линейный функционал; C1 — число. Поскольку F1 — линейный функционал, для числа S , представленного в виде (3.13), будет F1(S)=P(F1(x)-F1(y)). Тогда (3.18) дает

Fj (S)=P( f (x)-f (y)).

Сравнивая это равенство с (3.14), получаем F1 =F .

Тогда из (3.11) и (3.18) следует, что C1 =C .

Лемма 3.1 доказана.

Замечание. Утверждение о продолжаемости функции f остается в силе, если взамен равенства

affV=L [0, 1] потребовать лишь замкнутость множества affV . Утверждение о единственности продолжения при этом перестает быть верным.

Доказательство теоремы 3.2. Проверим достаточность. Покажем, что точки e1, e2, en+1 аффинно-

независимы. Пусть

n+1 n+1

Ere- = ° ZYi = 0. (3.19)

i=1 i=1

Положим

P1 =Y1 +1; Pi =yi; i=2,3,...,n+1. (3.20)

Тогда

n+1 n+1

Є1 = EPiei, ЕР- = 1, (3.21)

i =1 i =1

т.е. точка е1 представима в виде (2.24). Перейдем от этого представления к представлению (2.27) по формуле (2.26):

«0С + Еа iei = Еа iei. (3 22)

ієі Ш ( . )

Тогда

Ф\ a0e1 +Еаte,, Еаte, 1 = 1.

V ієі ш )

Кроме того, согласно условию 1 [1], Ф(е1, е1)=1. Поэтому из условия 5 следует, что

I=0, а0 =1, а1 =1, ai =0 при i=2,3,..., n+1. Переходя от (3.22) назад к (3.21), по формулам (2.14) получаем Р1 =1, Pi =0 при i=2,3,..., n+1. Тогда из (3.20) видно, что у1 =у2 =...=уn+1 =0 . Аффинная неза-

висимость точек e1, e2,..., en+1 доказана.

Заметим теперь, что условие 6 обобщается в следующей форме, именуемой в дальнейшем условием 6’: если

n+1

-, УєУ, Ф| Y0 > + Е Yi e* Y0 y0 + Е Yi ei I =1,

n+1

Y0 > 0 Yi ^ 0, Y0 + EYi =1, (3.23)

i =1

то Ф(х, у)=1. Действительно, заменим в (3.23) n на k и проверим по индукции справедливость утверждения при k =0, 1,..., n +1. Если k =0, утверждение вытекает из 6. Пусть утверждение выполняется при

некотором k . Перейдем к k +1. Положим

f k+1

x' =(1 -Yk+2) -1VY0x + Е Y-Єі

f k +2 .

У' =(1 - Yk+1)-1 ^Y0 У + Е Y-Єі J.

РИ, 1998, № 4

125

Посылка утверждения имеет вид

Ф((1 - У к+2) Х' + У к+2 +2 ,(1- Yk+2) У ' + У к+2 +2) = 1.

Тогда из 6 следует, что Ф(X, у1)=1, т.е.

k+1 n+1 Л n+1

Ф\ У'ох +SY,I■e.■, У'оУо + Еу'іЄі| =1, У'о + Еу' =1,

і=1

l=1

І=1

где у'і =(1-у к+2 ) 1 Yі . Предположение индукции позволяет заключить, что Ф(х, у)=1. Выполнимость условия 6’ доказана.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поставим в соответствие каждому xeV точки x1, x2 и Ax, определенные равенствами

Х1 = Еа к (x)ei,

ІЄІ (x)

x2 = к (x)ei, «о( x) Ax + хг = Х2. (3.24)

Ш (x)

Пусть числа Рі (x) связаны с числами ai (x) равенствами (2.24). Тогда

П+1

Ax = ЕРі(x)ei. (3.25)

І=1

Покажем, что

Ф(х, у)=D(Ax, Ay). (3.26)

Действительно, пусть Ф(х, у)=1. Тогда из условия 4 следует, что

Ф(ао(х)х+х1, ао(х)у+х1)=1. (3.27)

Но (3.8) означает, что

Ф(ао(х)х+х1, х2)=1. (3.28)

Сравнивая (3.27) с (3.28) и используя условия 1 и 2 [1] , получаем

Ф(ао(х)у+х1, х2)=1. (3.29)

Согласно условию 5, последнее равенство может выполняться лишь при ао(x)=ао(у), x1 = у1, x2 = у2. Значит, и Ax=Ay. Пусть, обратно, Ax=Ay. Поскольку система точек {ei }”+ аффинно-независима, представление (2.20) для любой точки из aff {ei }”+ является единственным. Поэтому из третьего равенства (3.24) следует, что ао(x) =ао(у), x1 = у1, x2 = у2. Значит, из

равенства Ф(ао(у)у+у1, у2)=1 вытекает (3.29). Вместе с (3.28) это дает (3.27). Применив к (3.27) условие 6’, получаем Ф(х, у)=1. Равенство (3.26) доказано.

Покажем теперь, что отображение А является аффинным. Пусть x, x1 — произвольные точки

множества V, X, X' — положительные числа, X+X'=1. Нужно проверить, что

A(Xx+X'xr)=XAx+X' Ax'. (3.30)

Согласно условию 5 имеют место равенства Ф(аох+х1, х2)=1, Ф(а'ох'+х'1, х'2)=1,

а=ао(х), а '=ао(х'). (3.31)

Положим

Xа о , X'a0

Y =-----------, у =-----------.

Xa о +X а о Xa о +X а о

Числа у и у' положительны, у + у' =1. Как видно из (3.24) и (3.9), при некоторых неотрицательных числах 51, 5V (і=1,..., n+1) будет

n+1 n+1

ує + у'x! = Е5е, yx2 + уx2 = T5iei,

i=1 i=1

n+1 n+1 (3.32)

а о у + а о у'+Е5і = 1, Е5І = 1.

i =1 i =1

Положим

N = {і 15і >5І}, V = £ (5і -5І), р = Е (5І - 5і).

i£N ІШN

Из (3.32) вытекает равенство

аоу + аоу' + V = р .

Пусть

u = Е (5і -5І )еі, v = Е (5І -5і )еі, z = Е5іс + Е5іеі.

ієї1

Тогда

iєN ІШN ієN ІШN

YlXl +у ' 1 x' 1 =u+z, у 2x2 +у '2 x '2 =V+Z, v-u = у 1 (x2 -x1 )+у'1 (x'2 -x'1). (3.22) и третье равенство (3.33) дают v-u =уа о Ax+Y'a'0 Ax'. Нетрудно подсчитать, что

(3.33)

(3.34)

X уао уао

X f f , X

уа о +у ао p-v Поэтому из (3.34) следует, что

у'а о

уа о +у 'а 'о

у 'а о

p-v'

v - u

р-v

= XAx + X 'Ax' ,

а о

(3.35)

-о yx + а оу x = Xx + X'x'.

р-v

В силу условия 4 из (3.31) вытекает равенство

Ф(а о уг+а'о y'x'+yx1 +y'x'1, yx2 +y'x'2)=1.

Комбинируя его с (3.33) и (3.35), получаем

,, (p-v)(Xx + X'x ') + u v ч ,

Ф(Р—-------------------+ z, р- + z) = 1. (3.36)

р р

Положим уо =р; уі =тіп{5і, 5'і}, і=1, 2,..., n+1. Тогда

n+1 n+1

z = Еу ее, у о + Еу і = 1.

і =1 і=1

Кроме того, р 1 ((p-v)(Xx+X'x')+u)єV .Действительно, если v=о, то u=о и утверждение очевидно. Если же v >о, то и этот факт вытекает из представления в виде выпуклой комбинации

р ^^-vXXx + X’x’) + u) = р—— (Xx + X'x') + р •u.

р р v

Наконец, p-1uєV . Таким образом, для равенства

(3.36) выполняется посылка условия 6. Его заключение дает

ф( —-— (Xx + X 'x ') + u, І р р

v

р

= 1.

Но последнее равенство является соотношением (3.28) для точки XxфX'x'. Поэтому

126

РИ, 1998, № 4

1

A(x + X'x') = —-

v _ u I = - _ u — — J —_ v'

Вместе с первым равенством (3.35) это дает требуемую формулу (3.30).

Поскольку точки {ei}”+ аффинно-независимы,

из равенств (3.25) и (3.30) вытекает, что Рг. — аффинные функционалы на V . Из (2.29) и условия 7 следует, что функции рг](х)| непрерывны. Тогда по лемме 3.1 функционалы допускают однозначное продолжение до аффинных функционалов на всем пространстве. Проверим теперь, что уравнения (2.25)

разрешимы при условии s1 +...+5^ =1. Пусть

s1,..., удовлетворяют этому условию. Покажем,

что точка

П +1

x = Е s,e,

І=1

Ja* (t)aj(t)dt = 8ij, i, jeJ, (3.37)

0

и такая, что для любых x, yeV равенства

ф(X, у)=1 (3.38)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и

1 1 J ak (t) x(t)dt = J ak (t)y(t)dt, keJ (3.39)

00

эквивалентны.

Проверим, что это определение эквивалентно исходному определению, данному в [2]. Пусть для предиката ф выполняется равенство (1.10) (см. [1]). Выберем в пространстве ImP какой-либо ортонормированный базис {ak\keJ} . Тогда

Px =Е (x, ak)ak . (3.40)

keJ

Легко видеть, что Px=Py тогда и только тогда, когда

является решением (2.25). Из равенствФ(еІ, еІ)=1 и условия 5 следует, что I(ei)=0, a0(ei)=1, aj(ei)=8j.. Поэтому из (2.58) вытекает, что Р j (ei )=1. Так как Р j — аффинные функционалы и s1 +...+5^ =1, то

Р j (x)=si.

Таким образом, выполняется первое условие леммы 2.4. Выполнимость второго вытекает из условий 4 и 6’. Утверждение теоремы в сторону достаточности вытекает из леммы 2.4.

Проверим необходимость. Пусть Ф — п -мерный линейный предикат. Тогда выполнимость условий 4 и 6 очевидна. Выполнимость условий 5 и 7 вытекает из леммы 2.4.

Теорема 3.2 доказана.

3.3. Интегральное представление линейных предикатов

В соответствии с теоремой Рисса для любого линейного функционала a(x) в L2[1, 0] существует единственный вектор ael}[1, 0] такой, что

a(x)=(a, x). Это равенство устанавливает канонический изоморфизм между функционалами и векто -рами (и тем самым оправдывает обозначение их одним и тем же символом). В интегральной форме равенство Рисса имеет вид

1

a( x) = Ja(t) x(t)dt.

0

Оно позволяет сформулировать результаты двух предыдущих частей в некотором окончательном с прикладной точки зрения виде.

3.4. Общий случай

Предикат ф, определенный на квадрате выпуклого множества V и удовлетворяющий условиям 13 [1] (рефлексивность, симметричность, транзитивность), назовем линейным, если существует конечная или счетная система функций {a i \ieJ} , a;. eL2[1, 0], удовлетворяющая условиям

ak (x)=ak (y), keJ . Используя формулу Рисса, последние равенства можно переписать в форме (3.39). Пусть, обратно, для предиката Ф существуют

функции {ai \ieJ} , удовлетворяющие (3.37), и такие, что соотношения (3.38) и (3.39) эквивалентны. Определим ортопроектор р равенством (3.40). Легко видеть, что Px=Py тогда и только тогда, когда выполняется условие (3.39). Таким образом, рассматриваемые определения действительно эквивалентны. Как видно из (3.40),

ImP=L({a i\ieJ}). (3.41)

Если affV=L2[1, 0], то линейному предикату отвечает лишь один ортопроектор. Таким образом, в этом случае предикат Ф является п -мерным линейным

тогда и только тогда, когда множество J состоит из п элементов.

Требование ортонормированности системы функций не всегда является удобным в приложениях. Заменим его менее ограничительным требованием. Будем для краткости называть конечную или счетную

систему {a i \ie J} базисной, если она является базисом своей линейной оболочки. Если система конечна, она является базисной тогда и только тогда, когда она

линейно-независима. Если система {at \ieJ} счетная, то линейной независимости, вообще говоря, недостаточно для базисности. Приведем одно достаточное условие. Пусть существуют такие положительные

константы m и M , что для любого собственного значения каждой из матриц Грама ( п =1, 2, 3,...)

Г (ab a 2,..., a п )

'(aba1)(aba2)...(aban) ' (a 2, aO(a 2, a 2)...(a 2, a n)

I (a п , aO(a n, a 2)...(a n, a n) )

справедливо неравенство m<X<M . Тогда система

{a t \ie J} является базисной и существует базисная

система {Рг. \ie J} , двойственная к системе {ai \ie J} .

РИ, 1998, № 4

127

Теорема 3.3. Для того чтобы предикат ф, определенный на квадрате выпуклого множества V, был линейным, необходимо и достаточно, чтобы существовала такая базисная система функций {a i \ie J},

aeZ2[1, 0], что для всех x, yeV равенства (3.38) и (3.39) являются эквивалентными. При этом, если affV=Z2[1, 0], то предикат Ф n-мерный линейный

тогда и только тогда, когда множество J состоит из n элементов.

Доказательство. Необходимость очевидна — в качестве системы {a i \ieJ} можно взять ортонормированную систему, фигурирующую в определении. Проверим достаточность. Пусть система {a i \ieJ} удовлетворяет условиям теоремы, {Рг. \ieJ} — двойственная система. Определим оператор B равенством Вх = £a г. (x)Pi. (3.42)

ieJ

Поскольку {a i\ieJ} — базисная система, ImB является замкнутым множеством. Очевидно, Вх=By

тогда и только тогда, когда ai (x)=a;. (y), ieJ . Поэтому эквивалентность равенств (3.38) и (3.39) означает справедливость формулы (1.11) [1]. Тогда предикат ф является линейным в силу леммы 1.1 [1]. Если множество J состоит из n элементов, предикат ф является n -мерным в силу леммы 2.1 [2]. Основной в настоящем разделе является Теорема 3.4. Пусть предикат ф определен на квадрате выпуклого множества V с замкнутой аффинной оболочкой. Для того чтобы существовала

базисная система функций {ak\keJ}, aкeZ2[1, 0]

такая, что для всех x, yeV равенство Ф(х, у)=1 выполняется тогда и только тогда, когда

1 1

Jak (t)x(t)dt = Jak (t)y(t)dt, keJ ,

0 0

необходимо и достаточно, чтобы предикат ф удовлетворял следующим условиям:

4) если ф(х, у)=1 и ф(х', у')=1, то

J x+x' y +уЛ

ф(—Hr f1;

5) если последовательность {x;- }“= сходится к

xeV, последовательность {у j }°j=1 сходится к yeV и

ф( х j, у j)=1, то ф( х, у)=1. Этот результат является комбинацией теорем 2.1 и 2.2 [2].

В случае, когда множество V открыто, условие 5 можно ослабить до формы, фигурирующей в теореме

2.1. Другие варианты условий 4 и 5 приведены в комментариях к теореме 2.1.

Будем говорить, что линейно-независимая система функций (не обязательно ортогональная)

{aк (t)\keJ} определяет линейный предикат ф, если равенства (3.38) и (3.39) эквивалентны.

Следствие 3.1. Для того чтобы две линейнонезависимые системы функций {a;- (t)}n=1 и {ui (t)}n=1 определяли один и тот же n -мерный линейный предикат ф на квадрате выпуклого множества с замкнутой аффинной оболочкой, необходимо и достаточно, чтобы существовала невырожденная матрица

a11 a12 .. •. a1n

a 21 a 22 . .. a2n

a n1 an2 . .. a nn

(3.43)

такая, что почти при всех te[0,1]

U1 (t)=a11a1(t)+a12a 2(0+...+a1na n (0,

u2 (t )=a21a1 (t)+a22a 2(t )+...+a2na n (t), .................................. (3.44)

Un (t)=an1a1(t)+an2a2 (t)+...+annan (t).

Это утверждение вытекает из следствия 2.1 [2]. Предположим теперь, что заданы два линейных

предиката ф1 и ф2. Будем говорить, что предикат ф2 грубее, чем предикат ф1, если для всех из условия ф1(x, у)=1 (3.45)

вытекает, что

ф2(X, y) = 1 , (3.46)

и существуют такие x0, y0 e V , для которых

ф1(^ У0)=0, ф2(^ У0)=1. (3.47) Следствие 3.2. Пусть V — выпуклое множество,

affV=Z2[1,0]. Пусть, далее, система {ak}к=1 определяет предикат ф1 на VxV , система {ak }k=1 определяет предикат ф2 на VxV . Для того чтобы предикат ф2 был грубее предиката ф1, необходимо и достаточно, чтобы было n2 <n1 и нашлась такая прямоугольная матрица

что

( с C11 с12 ... с ^ ^1n1

c21 c22 ... C2n1

v Cn2l cn2 2 ... c J ,

a" = cna1 + C12a 2 +... + Cm1 a n1,

a2 = C21a1 + c22a 2 +... + C2n1 a n1 ,

a n2 = cn21a1 + Cn2 2a 2 + .. + C a' n2 n1 n1

(3.48)

(3.49)

Доказательство. Пусть Р1 — ортопроектор, порождающий предикат ф1, Р2 — ортопроектор, порождающий предикат ф2. В соответствии с формулой (1.10) предикат ф2 грубее предиката ф1 тогда и

128

РИ, 1998, № 4

только тогда, когда для x, yeV из равенства

P1( x-y )=0 вытекает, что P2( x-y)=0 и существуют

xo,y0 такие, что р(Хо -Уо)^0, P2(Хо -yo)=0 . Эти равенства и неравенство являются другой формой записи соотношений (3.45)-(3.47). Поскольку

affV=L2 [ 1,0], любой элемент zeL2 [1,0] может быть

записан в виде z=P(x-y), x, yeV . Поэтому тот факт,

что Ф2 грубее, чем Ф\, означает, что для любого

zeL2[1, 0] равенство P1z=0 влечет равенство P2z=0

и существует z0eL2[1, 0] такой, что P1 z0 Ф0, P2z0 =0.

Другими словами, это значит, что KerP1 с KerP2 и это включение является строгим. Пользуясь разложением (1.9), это утверждение можно переписать в виде

ImP1 щ Im P2, причем включение является строгим. Вместе с (3.41) это дает

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

L({<}?=1) Щ L({<}П=1),

L({aк}П=1) Ф L({aк}£).

(3.50)

Поскольку каждая из систем {a 'к }к= и {a "к }к= линейно-независима, соотношения (3.50) означают, что n2 <n1 и существует такая матрица (3.48), что справедливо (3.49).

Следствие 3.2 доказано.

Обсудим вопрос о процедуре практической проверки линейной независимости функционалов

{a к }n=1. Такая система линейно-независима тогда и только тогда, когда линейно-независима система функций {a к (t )}n=1, 0<t <1, связанная с ней формулой Рисса. На практике система функций {a к (t)}J!=1 не может быть известна в точности. Обычно известными являются некоторые конечные приближения

a к = {a к1, a к 2,..., a кр } функций ak(t). Разумеется, чтобы точность аппроксимации была приемлемой, необходимо, чтобы было р>n . Таким образом, на практике вопрос о линейной независимости системы

{a к }]!=1 заменяется вопросом о линейной независимости системы {a к }]!=1. Оценим погрешность аппроксимации. Положим для 5 = (51 , s2,..., Sn)

Ds = Z Як a к

к=1

Ds = z Як a к

к=1

Мерой линейной независимости систем {a к }1=1 и {a к }n=1 могут служить величины

\\Ds\\

Ds

ц = minj

s ф0

и Ц = minJ

s Ф0

її 2 j

\\s\\ ^0 ||s||

являющиеся наименьшими собственными значениями матриц Грама Г (a1, a 2,..., a n) и Г (a1, a2,..., a n) соответственно. Имеем

2

2

2

iDsll2 \\Ds\

n

Z sksJ ((a к,a j)- (a к,a j))

к, j=1

Z s2

2=1

(3.51)

Для любой симметричной матрицы (by)”;-=1 имеет место неравенство

max

Z bk]SkS]

к, j=1______

n

Z s2

< n • max by .

к, j

Поэтому из (3.51) можно заключить, что

i =1

IDsll2 ||Ds|

m max | (a к, a,) - (a к, a ,) |.

к, j

Но тогда и

|ц-~| < n • max|(aк,a;) - (aк,a;) . (3.52)

к, j

Пусть известна верхняя оценка для точности конечномерной аппроксимации:

||(aк -aк)|<є , к=1, 2,..., n.

Тогда

|(a к, a j) - (a к, a; )| =| (a к, a к -a к) +

+ (a к, a j -a j) + (a к -a к, a j -a j )|< 2сє + є2,

где

с = maxi a J .

1<к <n

Тогда из (3.52) следует, что

|ц - ц| < n/2(є + є2).

Итак, если после вычисления величины ц (эта величина может быть найдена любым методом отыскания наименьшего собственного значения симметрической неотрицательно определенной матрицы)

окажется, что ~ > n/ 2(є + є2), то можно гарантиро-

вать линейную независимость системы {a к }пк=1. В

противном случае есть основания подозревать линейную зависимость этой системы. Во втором случае для дальнейшего уточнения можно попытаться экспериментально найти лучшую конечномерную аппроксимацию и исследовать вопрос для неё. Если окажется, что при уточненном исследовании будет

~ < n / 2(є + є2), а величина є достаточно мала, это

означает, что если система {a к }n=1 и не является

вырожденной, то она настолько близка к вырожденной, что с практической точки зрения её можно считать таковой.

Для более детального изучения n -мерных линейных предикатов рассмотрим раздельно основные интересующие нас случаи множества V .

РИ, 1998, № 4

129

3.5. Предикаты, определенные на квадрате всего пространства

Теорема 3.5. Пусть предикат ф определен на

декартовом квадрате пространства I2[1, 0] и удовлетворяет условиям:

4) если Ф( х, у )=1 и Ф( х', у')=1, то Ф(х+х', y+y')=1;

5) существует такой набор векторов {ek }пк=1, что для каждого хєі2 [1,0] есть единственный набор чисел {a k (х)}1=1, удовлетворяющих условию

х, pa kek j =1; (3-53)

6) функции a k (х) непрерывны.

Тогда существуют такие векторы {a k }Ч=1 сI2 [1, 0], что

1

ak(х) = Jak(t)х(ґ)dt, (3.54)

о

системы {ek }nk=1 и {ak }nk=l являются линейно-неза-

висимыми и пара систем {ek }k=1, {a k (х)}к=1 присоединена к предикату ф (понятие пары, присоединенной к к -мерному линейному предикату, было введено в части 2.1 [2]).

Это утверждение вытекает из теоремы 2.3 [2]. Верным является и обратное утверждение, а именно:

если {ek}k=1 и {ak(х)}к=1 — пара систем, присоединенных к предикату ф, то для этого предиката выполняются условия 4-6. Это утверждение очевидно.

Следствие 3.3. Для того чтобы пара {ak }к=1, {ek }k=1 была присоединена к k -мерному линейному предикату ф, определенному на квадрате пространства

I2[1, 0], необходимо и достаточно, чтобы равенство

Ф( х, у )=1 было эквивалентно равенствам (т.е. чтобы

система {ak }>k=1 определяла предикат ф)

1 1

Jak(t)х^)dt = Jak(t)y(t)dt, k = 1,2,...,k (3.55)

0 0

и чтобы выполнялось равенство

Ja j (t)e; (t)dt = 8y, i, j = 1,2,..., k. (3.56)

0

Это утверждение вытекает из следствия 2.2 [2] и теоремы Рисса.

Если {a k }k=1 — произвольная линейно-независимая система векторов, то условию (3.56) вместе с ней может удовлетворять двойственная ей система {Р i }k=1. Эта система может быть построена по формулам

Р1 = C„a1 + C12a 2 +...+ c1ka k ,

P2 = с21a1 + с22a2 +...+ C2nak, ................................(3.57)

Pk = Ck1a1 + Ck2a2 +...+ Ckkak ,

130

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где (Cj )kj=1 — матрица, обратная матрице Грама:

r(ab...,ak)

' 11 1 Л Ja1(t)a1(t)dt Ja1(t)a2(t)dt... Ja1(t)ak (t)dt

0 0 0 1 1 1

Ja2 (t)a1 (t)dt Ja2 (t)a2 (t)dt... Ja2 (t)ak (t)dt

0 0 0

1 1 1

J ak (t)a1 (t)dt J ak (t)a2 (t)dt... Jak (t)ak (t)dt

V0 0 0 j

При практических вычислениях более удобной является схема нахождения системы {р i }k=1, использующая следующий конечный итерационный процесс. Полагаем Pi0 = ai, i = 1,2,...,k . Предположим, что при некотором m=1, 2,..., k уже построена сис-

тема {Pim_1}k=1. Вычислим функцию Р mm по формуле

РР m m_1

mm 1 ,

JP m m_1 (t)a m (t)dt

0

а затем функцииPы (i = 1, 2,..., k, i Ф m) по формулам

Pirn =Pim_1 _[jP,m_1(t)am (t)dt

На n-м шаге получаем требуемый результат:

Рi =Pik, i=1, 2,..., k.

В приложениях одни системы векторов {ek }k=1

могут быть предпочтительнее других (например, потому, что удовлетворяют дополнительному требованию — все функции ек (t) неотрицательны). Поэтому приведем здесь общую конструкцию, позволяющую найти все такие системы векторов.

Следствие 3.4. Пусть ф — п -мерный линейный предикат, определенный на квадрате пространства

I2[1, 0], {a k }k=1 — линейно-независимая система

функционалов, определяющая предикат ф, {р k }k=1 — двойственная система. Для того чтобы пара систем {a k }k=1 и {ek }k=1 была присоединена к предикату ф, необходимо и достаточно, чтобы

ek =Рk + Yk, k = 1,2,..,k , (3.58)

где {y k }k=1 — любая система, удовлетворяющая условию

Jai (t)Yj (t)dt = 0, i = 1,2,..., k. (3.59)

0

Доказательство. Действительно, если система векторов {y j }“= удовлетворяет условию (3.59), т.е. ортогональна подпространству I{a1,..., a k} , то в силу двойственности систем {a i }k=1 и {р i }k=1 выполняются равенства (3.56) и пара {a i }k=1, {e;- }k=1 присоединена к предикату ф в силу следствия 3.3.

РИ, 1998, № 4

Теперь, пусть пара {аг }”=1, {ег }”=1 присоединена к предикату ф. Тогда имеют место равенства (3.56).

Но дёя двойственной системы {Рг }”=1 также вы-поёняются эти равенства. Тогда

(ек -рк,аi) = (ek,аi)-(Рк,аг) = 5ш -5кг = 0. Сёедствие 3.4 доказано.

Мы видеёи, что n -мерный ёинейный предикат ф не опредеёяет однозначно связанную с ним систему

{аг }П=1. Однако есёи задать систему векторов {ег }П=1, то существует ёишь одна система функционалов {а к }П=1 такая, что пара и {ek }П=1 присоединена к

предикату Ф. Действительно, пусть {ак }П=1 и

{uk }П=1 — две такие системы. Тогда они связаны равенством (3.44). Имеем

n

(иг,ek) = Еа1} (а;,ек). (3.60)

j=1

Но согласно следствию 2.1 (иг, ек)=51к,

(а г, ек )=5 }-к. Поэтому из (3.60) следует, что аг =5 jk.

Тогда из (3.44) вытекает, что иі =аг, 1=1, 2,..., п.

Пусть {ак}П=1, {ек}П=1 - оДнa, а {ик}П=1, {.ёк}П=1-другая пара систем, присоединенная к одному и тому

же предикату ф. Предположим, что системы {ак }П=1, {ек }п=1, {gk }П=1 известны. Вопрос заключается в том,

чтобы по этим данным найти систему {ик}П=1. Оказывается, что это может быть сделано даже без

знания системы {ек }П=1. А именно, система {иг }П=1 может быть найдена по формулам (3.44), где (3.43)— матрица, обратная матрице

Г1

|а1(1) g1(t )dt

0

1

|а 2 (t) g1 (t )dt

0

Jаl(t) g 2 (t )dt

0

1

|а 2 (t) g 2 (t )dt

0

1 \ |а1 (t) gn (t )dt

0

1

|а 2 (t) gn (t)dt

0

|а n (t) g1(t )dt

V о

|а n (t) g 2 (t )dt

0

|а n (t) gn (t )dt

0

J

(3.61)

Действительно, если пары {а к }n=1, {ек }n=1 и

{ик }n=1, {gk }n= присоединены к предикату ф, то

каждая из систем {ак }’П=1 и {ик }n=1 определяет этот предикат. Тогда согласно следствию 3.1 имеют место равенства (3.44), где (3.43) — некоторая невырожденная матрица. Умножая скалярно каждое из этих

равенств на gk (к = I, 2,..., n), получаем

n

(иг, gk) = Е av (а 1, gk),

j=1

1, к = 1,2,.., n . (3.62)

Но в силу следствия 3.3 справедливо равенство (иг,gi:) = 51к . Поэтому (2.10) [2] может быть переписано в матричном виде:

a11 a12 . .. a1 n \ Г(а1 g1) (а1?2) ...(a,1gn)^ Г1 о... о\

a21 a22 . .. a2n (а2g1)(а2g2) . . (а2gn) = 0 1 ... 0

a21 an2 . а nn J ч(аng1) (аng2) . . (аngn)у [00...1J

Таким образом, матрица (3.43) действительно обратна (3.61).

Пусть {а к }n=1 и {ик }n=1 — какие-либо системы

функционалов, определяющие предикат ф, {рк }n=1

и {ук }n=1 — двойственные к ним системы. Если известна матрица (3.43), связывающая системы {ак}пк=1 и {ик}пк=1 равенством (3.44), и система

{Рк }n=1, то для нахождения {vk}n=1 нет необходимо-

сти в задании {ик }n=1. Она может быть найдена по формулам

V1 = d11P1 + d12P 2 + ... + d1nP n , v2 = d 21P1 + d 22P 2 + ... + d 2nP n ,

............................. (3.63)

Vn = dn1P1 + dn2$ 2 + ... + dnnP n,

где

d11 d12 .dm ^

d 21 d22 .. dIn

dn1 dn2 .. dnn J

(3.64)

матрица, обратная сопряженной матрице (3.43). Дей-

ствительно, согласно следствию 3.1, системы {уг }n=1

и {Р і }n=1 связаны равенством (3.63), где {dij- }n,j=1 — некоторая невырожденная матрица. Тогда

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 кг = (ик , V1 ) = (ик Е dj Р j ) =Е dj (ик , Р j ). (3.65)

j=1 j=1

Но из (3.44) следует, что

n n n

(ик ,Р j) = (Е ®ьа в j) = Е aks (а s, р j) = Е aks5 щ = ац.

s=1 s=1 s=1

Вместе с (3.65) это дает

n

Е dijakj = 5 ik ,

j=1

или в матричном виде

d11 d12 . .. dm \ г au a12 . .. an1 \ Г1 0 . . 0 \

d 21 d22 . .. d2n a21 a22 . . an2 = 0 1 . . 0

V dn1 dn2 . .. dnn J V a1n a2n . .. a nn J V 0 0 . .lJ

Отсюда видно, что матрица (3.64) действительно обратна сопряженной матрице (3.43).

Сделаем последнее замечание, относящееся к замене координат в интегральном представлении n -мерного линейного предиката. Пусть, как и ранее,

{а к }n=1, {ек }n=1 — какая-либо пара функционалов и

РИ, 1998, № 4

131

векторов, присоединенная к предикату ф, {uk }пк=1 — какая-либо система функционалов, определяющая этот предикат. Требуется найти какую-либо систему

векторов {gk}к=1, которая вместе с {uk}к=1 присоединена к Ф . Эта задача может быть решена без знания {uk }к=і, если известна система {ek }’к=1 и матрица (3.64). Искомая система может быть найдена по формуле

gi = duei + dne2 +... + dlкeк, g 2 = d 21Є1 + d 22e2 +... + d 2кЄк, ........................... (3.66)

gк = dn1e1 + dк2e2 + ... + dккeк ,

аналогичной (3.63), с той же матрицей (3.64) — обратной сопряженной матрице (3.43). Действительно, пусть {gk }к=1 — система, определяемая равенствами (3.66). Положим

S j = gj - vj, і =1,2,...5к .

Тогда из (3.63), (3.66) и (3.58)

S І = Z djk (ek - р k) = Z djkY k .

k=1 k=1

Поэтому из (3.59) получаем

к

(S j,a i) = Z djk (Y k,a i) = 0 .

k=1

Вместе с (3.44) это дает

кк

(S j,us) = (S j,Zaslai) = Zasl (S j,at) = 0 .

i=1 i=1

Таким образом, система {uk}к=1 определяет предикат ф, {vk }к=1 — двойственная система gk =vk +Sk (k=1, 2,..., к) (Sk, uj)=0 (i, j=1, 2,..., к). Тогда, согласно следствию 3.4, пара систем {uk}к=1, {gk}к=1 присоединена к предикату ф, что и требовалось.

Литература: 1. Походенко В.А., Тарасова Т.Т., Шабанов-Кушнаренко С.Ю. Теория цветового зрения. I. Радиоэлектроника и информатика. 1998. №1. С. 106-117. 2. БондаренкоМ.Ф., Шабанов-Кушнаренко С.Ю. Теория цветового зрения. II. Радиоэлектроника и информатика. См. статью в настоящем выпуске.

Поступила в редколлегию 23.10.98 Рецензент: д-р техн. наук, проф. Левыкин В.М. Бондаренко Михаил Федорович, д-р техн. наук, профессор, академик АН ВШ, ректор ХТУРЭ. Научные интересы: информатика. Адрес: Украина, 310726, Харьков, пр. Ленина 14, тел. 43-30-53.

Шабанов-Кушнаренко Сергей Юрьевич, д-р техн. наук, ведущий научный сотрудник кафедры ПО ЭВМ ХТУРЭ. Научные интересы: идентификация механизмов интеллекта человека. Адрес: Украина, 310726, Харьков, пр. Ленина 14, тел. 40-94-46.

(Окончание. Начало см. на с.34)

Отношение интенсивностей падающего электромагнитного излучения, дифрагированного на модуляции концентрации электронов с амплитудой An и модуляции диэлектрической проницаемости решетки для случая ютр>1, равно [3]

2

ю p є Ак

ю* 2 * * * * * Ає п

4п-рг\єп I e

ТІ. I ~

є р v m

2 d2

A ,

где n — константа электромеханической связи; тр—

импульсное время релаксации; d — частота упругой

волны. При взаимодействии ультразвуковой волны, распространяющейся через проводящий кристалл с носителями заряда, пространственное группирование электронов и дырок не сопровождается формированием объёмного заряда, эффекты экранирования невелики и глубина модуляции плотности носителей n значительно возрастает. В этом случае в монокристалле n-JnSb при 300K на частотах 108-109

Гц, как показывают оценки, вклад в фотоупругий модуль P=Aen(e02S)-1 электронной компоненты почти на порядок превышает решеточную составляющую. Для модуляции интенсивности, распространяющейся через проводящий кристалл электромагнитной волны, может быть использовано явление электронного усиления ВЧ упругой волны дрейфом носителей тока во внешнем электрическом поле.

Эффективность электронного механизма управления излучением С02-лазера с длиной волны l = 10,6 мкм была проверена на экспериментальной ячейке из n-JnSb размером 5х5х15 мм с ориентацией [III] вдоль длинной стороны образца. Исследования проводились на продольных упругих колебаниях частотой 800 МГц в квазинепрерывном режиме с амплитудной модуляцией и синхронным детектированием

сигнала. При приложении к кристаллу потенциала в 10 В в направлении распространения ВЧ упругой волны наблюдается изменение интенсивности дифракционного максимума излучения на 30%. Это обусловлено тем, что усиление продольной ультразвуковой волны в данной геометрии эксперимента не превышает 14 дБ, в то время как на частотах 1,5 ГГц сдвиговых упругих волн оно достигает 26 дБ, что позволяет обеспечить 100% модуляцию дифрагированного светового потока. Другой возможностью повысить эффективность электронного механизма управления излучением является приложение внешнего магнитного поля, на один-два порядка увеличивающего тм и, соответственно, электронное усиление упругой волны, достигающее на частоте 1,5 ГГц величины 66 дБ/см.

Таким образом, приведенные экспериментальные результаты подтверждают возможность использовать электронный механизм управления амплитудой электромагнитного сигнала и создать на его основе аналого-дискретные преобразователи сигналов нового поколения.

Литература: Балакший В.И., Парыгин В.Н. Акустооптические системы непрерывного сканирования // Радиотехника и электроника. 1974, №10. С. 2163-2169. 2. Утида Н.,Ниидзеки Н. Материалы и методы акустооптического отклонения // ТИИЭР. 1974. Т.61, №8. С. 2143. 3. ГуляевЮ.В, ПрокловВ.В., Шкердин Г.Н. Дифракция света на звуке в твердых телах // УФН. 1978. Т.124. Вып.1. С. 61-107. 4. Рой В.Ф. Электродинамические явления в твердотельной плазме // Придніпровський науковий вісник. 1998. №84(151). С. 97-99.

Поступила в редколлегию 04.10.1998 Рецензент: д-р физ.-мат. наук, проф. Горобец Н.Н.

Рой Виктор Федорович, канд. физ.-мат. наук, доцент, докторант кафедры светотехники и источников света ХГАГХ. Научные интересы: радиофизика. Хобби: ампе-леология. Адрес: Украина, 310145, Харьков, ул. Космическая, 27, кв.40, тел. 32-48-01, 40-69-67.

132

РИ, 1998, № 4

i Надоели баннеры? Вы всегда можете отключить рекламу.