Научная статья на тему 'Функция и предикат поиска аэронавигационных данных для оценки загрузки воздушного пространства'

Функция и предикат поиска аэронавигационных данных для оценки загрузки воздушного пространства Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
144
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЭРОНАВИГАЦИОННАЯ ИНФОРМАЦИЯ / ИНФОРМАЦИОННЫЙ ОБРАЗ / ЗАПИСИ БАЗЫ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Омородион Рейчел Осарагуе, Рудельсон Лев Ефимович

Обсуждаются алгоритмы адресации записей переменной длины, принадлежащих динамическим файлам аэронавигационной информации. Предложен алгоритм определения номера записи, основанный на движении от известных доменов входящих в нее атрибутов. Построен предикат локализации записи, представляющий собой гистограмму распределения количества полетов. Приведены примеры реализации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Function and predicate of SEARCHING of AERONAUTICAL DATA FOR EVALUATION OF AIRSPACE LOADing

Two algorithms for addressing to variable-length records files belonging to a dynamic aeronautical information are discussed. The algorithm for determining the entry number, based on the movement of known domains of its constituent attributes. Built predicate localization of recording, which is a histogram of the distribution of the number of flights. Examples of realization are showed.

Текст научной работы на тему «Функция и предикат поиска аэронавигационных данных для оценки загрузки воздушного пространства»

УДК 629.735.015:681.3

ФУНКЦИЯ И ПРЕДИКАТ ПОИСКА АЭРОНАВИГАЦИОННЫХ ДАННЫХ ДЛЯ ОЦЕНКИ ЗАГРУЗКИ ВОЗДУШНОГО ПРОСТРАНСТВА

Р.О. ОМОРОДИОН, Л.Е. РУДЕЛЬСОН

Обсуждаются алгоритмы адресации записей переменной длины, принадлежащих динамическим файлам аэронавигационной информации. Предложен алгоритм определения номера записи, основанный на движении от известных доменов входящих в нее атрибутов. Построен предикат локализации записи, представляющий собой гистограмму распределения количества полетов. Приведены примеры реализации.

Ключевые слова: аэронавигационная информация, информационный образ, записи базы данных.

Введение

Одним из трудно формализуемых моментов в процессе построения компьютерных информационных образов [1] воздушной обстановки является определение разрядности и количества дискретов основания гистограмм распределения атрибутов. Основу информационного образа составляет новый подход к представлению полетных данных. Его назначение - создание информационного единства навигации (определения параметров полета каждого частного объекта - самолета) и управления потоками движения (общей задачи системы). Подход позволяет, с одной стороны, в любой момент времени характеризовать каждый конкретный объект, как это достигается методами навигации. С другой стороны, он группирует индивидуальные данные таким образом, чтобы эффективно обслуживать процессы принятия решений по взаимному расположению этих объектов в пространстве, т.е. отображает наиболее общие характеристики потоков движения.

Прообраз такой формы представления данных существует в статистике. Это гистограмма распределения результатов наблюдений. Каждый элемент каждого столбца гистограммы говорит о частных особенностях участников движения. Ее огибающая - функция распределения -описывает общие тенденции, создавая возможности предсказания и управления. Гистограммы распределения измеренных координат - это три среза модели воздушной обстановки. Гистограммы распределения моментов пролета точек и границ воздушного пространства (ВП) - это связанные модели загрузки диспетчеров управления полетами. Композиция гистограмм всех полетных данных - плановых, навигационных, метеорологических и нормативных - это информационный образ системы организации воздушного движения. Большая размерность данных о воздушной обстановке порождает в системе новое качество, присущее массивам: информация приобретает частотные закономерности, позволяющие манипулировать ее статистиками, не вычисляя их, а накапливая по мере поступления в столбцах гистограммы. Над образом можно надстраивать рельеф правдоподобия для обнаружения конфликтов и автоматизированной выработки рекомендаций по их предотвращению. Вспомогательные процессы накопления и формирования данных удается свести к сортировке, манипулирование ими - к поиску, а принятие решений - к обнаружению превышения допустимого порога на рельефе правдоподобия.

Столбцы гистограмм распределения атрибутов заполняются сцепленными с дискретами их оснований списками указателей номеров записей. Правила их формирования закреплены типовыми схемами присоединения и удаления звеньев цепи. Варианты сводятся, главным образом, к установлению способа замыкания частичных цепей, порождаемых разными дискретами, в единую. Достаточно удобен для построения информационного образа метод объединения элементарных цепей, основанный на связывании последнего звена столбца гистограммы со следующим значащим дискретом ее оси. Однако в приложении к манипулированию данными его схема создает лишь незначительные и далеко не бесспорные преимущества, определяемые вводом

записей и сортировкой принадлежащих ей атрибутов, а также упрощением поиска в заданном диапазоне изменения величины ключа. Это возможность движения по основанию гистограммы, минуя пустующие (нулевые) дискреты. Столь же несущественны преимущества схемы замыкания частичной цепи (столбца) в кольцо с помощью сцепления последнего звена с порождающим дискретом основания. Способ позволяет последовательно просматривать цепь, начиная от любого ее звена, не анализируя принадлежность разных звеньев общему дискрету. Ниже обоих вариантов по надежности располагается способ замыкания последнего звена «на себя», когда оно не сцепляется ни с каким другим звеном, а содержит лишь служебную информацию. При этом искажение любой части порожденного фрагмента приводит к потере всего последующего списка. Выбор способа замыкания производится исходя из специфики задач, для решения которых он применяется.

В любом случае целью создания композиции гистограмм почасовой загрузки элементов ВП является формирование рельефа функции распределения полетов во времени. Простейшие операции позволяют найти на этом рельефе экстремальные области, где загрузка диспетчера превышает установленные нормы, и области низкой интенсивности полетов. В статье рассмотрены алгоритмические и коммутационные схемы реализации этой цели.

1. Постановка задачи

Ряд перечисленных проблем продолжает необходимость восстановления номеров записей файла по извлекаемым из цепи адресам входящих в эти записи вторичных ключей. Сопровождение файлов записей постоянной длины не выдвигает подобных вопросов. Переход к записям переменной длины требует сформулировать правила преобразования номеров полей записей, отсчитываемых от начала домена, в номера записей в целом, отсчитываемых от начала файла базы данных (БД). Понятно, что в процессе ввода и сортировки записей такие правила не используются, и данные упаковываются в отводимом для них пространстве последовательно, атрибут за атрибутом, образуя единое поле. Однако в процессе сцепления в гистограммах информационных образов это единство если не утрачивается, то, по крайней мере, не становится востребованным. Запись как бы распадается на образующие элементы, которые после присоединения к частичным цепям, порожденным столбцами гистограмм атрибутов (в частности, вторичных ключей), принадлежат скорее сцепленным совокупностям (доменам) этих атрибутов, чем связанным общностью описания кортежам (записям). Двойственный характер связей атрибутов внутри записей и в теле домена поясняет рис. 1.

Сцепление номеров рейса

Сцепление по атрибуту состояния плана (пассивный, зарегистрированный) Сцепление по аэродрому назначения УРРР

Цепь № записей

Сцепление по входу и выходу из секторов УВД Р1 и Р4

Цепи навигационных пунктов

Начало Номер Статус Аэродром Р4 Р4 Р1 Р1 РЧТ РАЩ РРЮ

записи рейса плана посадки

Ю ВА117 + ФПЛ УРРР 11.20 11.35 11.35 11.47 11.21 11.29 11.44

Связи по принадлежности общей записи

Рис. 1. Двойственный характер связей атрибутов внутри записей и в теле домена

Нетрудно видеть, что идентификатор записи ГО управляет общностью атрибутов, описывающих план полета по рейсу ВА117 и размещенных в пространстве памяти последовательно в теле одной записи. Одновременно вторичные ключи - номер рейса, состояние плана, аэродромы, секторы, навигационные пункты - управляются столбцами гистограмм родственных атрибутов по принадлежности своим доменам.

Универсальным способом определения номера записи из столбца гистограммы является поиск поля идентификатора. Простейшая реализация состоит в последовательном просмотре полей по убыванию их адресов до обнаружения начала записи переменной длины. Для ускорения процесса используется фиксация величины шага сканирования записи в единицах объема, который можно пропустить без анализа при движении к началу. На рис. 2 представлены траектории поиска, организованного по принципам «через три шага на четвертый» и «через семь шагов на восьмой». Пунктиром указана траектория последовательного неуправляемого поиска.

Траектория поиска по схеме «через три шага на четвертый»

Начало записи Поле данных Поле данных Поле данных Поле данных Поле данных Поле данных

Шаг 0 Шаг 1 Шаг 2 Шаг 3 Шаг 3 Шаг 3

Шаг через поле

Шаг через три поля

Траектория поиска по схеме «через семь шагов на восьмой»

0123456788888888888

Рис. 2. Траектория управляемого поиска начала записи

Ускорение поиска с помощью изменения шага просмотра ограничено расходом ресурса на свое осуществление. Альтернативой служит другой универсальный способ преобразования позиции атрибута внутри домена в номер записи, которой он принадлежит. Для успешной локализации записи должно быть задано однозначное соответствие, табличное или аналитическое, между указателями местоположения атрибута в кортежах и в доменах БД. При такой организации поиска идентификатора записи потребность в компьютерных ресурсах зависит от количества N записей в файле (не превышая восходящей к К. Шеннону оценки k■log2N), а не от их переменной длины, что позволяет решать экстремальную задачу выбора схемы преобразования номеров при генерации системы.

2. Предикат локализации записей

Для сравнения алгоритмической схемы функциональной локализации с переменным шагом просмотра и схемы обращения к реляционному предикату преобразования позиции домена в номер записи воспользуемся примером БД планов полетов системы управления воздушным движением (УВД) Стрела. Средняя длина г записей о плане полета составляет 32 образующих элемента, а их заданное количество N = 3000. Следовательно, алгоритм поиска с переменным шагом требует для своей реализации не более г = 32 итераций. Максимальные затраты преобразования номеров на предикате поиска составляют log23 0 00 » 12 итераций, что предпочтительнее. Напомним, что k■log2N является нижней оценкой. Если предикат поиска представляется числовой осью, в которой значащими являются порождающие дискреты сцепленных образующих элементов, то поиск записи в нем потребует столько же времени, сколько и алгоритм последовательного сканирования.

Проблемы формирования предиката локализации записи концентрируются в рациональном выборе количества дискретов основания (оси) гистограммы распределения атрибута и, следовательно, их разрешающей способности (цены деления младшего разряда). Другими словами, для дискретов оси назначается основание системы счисления, в которой удобно представлять заданный диапазон разброса значений атрибута, т.е. задача назначения решается с учетом содержательного (неформального) смысла. Оси гистограмм образуются, таким образом, автономно по каждому атрибуту, с собственными значениями Ь количества дискретов и их разрядности т. Уменьшение цены младшего разряда двоичного представления дискретов позволяет сократить среднюю высоту столбцов гистограммы. Однако при этом возрастает величина Ь и увеличивается число пустующих (нулевых) дискретов, что приводит к росту компьютерных издержек на процедуру поиска внутри заданного диапазона.

Пример 1. Трудности выбора структуры гистограммы проиллюстрируем на примере подбора в БД авиапредприятия бригад технического обслуживания ВС во время стоянки на аэродроме. Первичным ключом поиска при комплектовании бригады является табельный номер специалиста. Пусть на предприятии работает тысяча человек, при этом количество табельных номеров составляет 2048. Если установить разрешающую способность дискрета оси гистограммы равной единице, то для формирования оси понадобится четыре килобайта памяти, а структура предиката локализации упростится до коммутационной таблицы. В значащих дискретах оси, соответствующих занятым табельным номерам, будут сосредоточены номера анкетных записей, которым принадлежат запрошенные атрибуты (т. е. принадлежность бригаде, рабочие специальности, дни дежурства и т.д.). Высоты столбцов в такой гистограмме не превышают единицы и, более того, половина таблицы не заполнена. Очевидно, что ее следует уплотнить, и первое поверхностное решение состоит в том, что с каждым дискретом можно сцеплять десяток, если не сотню последовательно расположенных табельных номеров. Однако нетрудно предположить, что равномерное деление диапазона изменения табельных номеров не приводит к равномерному распределению номеров записей о сотрудниках по столбцам гистограммы, и высота последних окажется различной.

Следствие это достаточно общее. В большинстве случаев, когда разработчику заранее не известен закон распределения величин атрибутов, и нет убедительных оснований ориентироваться на выбор какой-либо известной зависимости, ситуация вынуждает делить отрезок на равные части. Способ приближения к равномерному распределению для величин, законы изменения которых неизвестны, широко применяется в практике проектирования БД в различных модификациях перемешивания (хэширование, рандомизация). Схема метода состоит в разделении файла на секции, по которым распределяются записи, закон изменения первичного ключа которых неизвестен. Номер секции, в которой фиксируется запись, пересчитывается алгоритмом перемешивания из значения самого ключа. Распространены ряд таких алгоритмов, описанных еще в [2]. Согласно методу квадратов, предложенному фон Нейманом, величина ключа возводится в квадрат, и из результата выделяются расположенные в его центральной части разряды (в количестве, соответствующем исходному числу), интерпретируемые как номер секции файла, в которую помещается запись. В методе деления величина ключа делится на количество секций файла, и остаток от деления указывает искомый адрес или его составную часть. Известны методы встречных сдвигов битового изображения величины ключа, суммирования отдельных составных частей ключа, анализа некоторых разрядов, преобразования системы счисления, деления полиномов и другие. Выбор приемлемого алгоритма перемешивания осуществляют либо эмпирически, на основе исследования конкретных последовательностей ключей, либо исходя из неформальных посылок.

В БД авиационных систем специфика ключевых атрибутов состоит в широком разнообразии их представления, от измеренных величин до формальных буквенно-цифровых комбинаций. Рандомизация требует здесь принятия специальных мер по формированию единой области их определения. Рассмотрим один алгоритм такого преобразования.

3. Алгоритм формирования гистограммы

Отправляясь от неформальных посылок, рассмотрим простой прием, не описанный в известной литературе, и представляющий собой суперпозицию двух предельных интерпретаций методов: складывания величин ключей и преобразования выражающей их системы счисления (рис. 3). В отличие от обеих, в излагаемой схеме сложению подлежат не избранные разряды части значения ключа, а один за другим все его разряды. Результат представляется в системе счисления с основанием, равным количеству столбцов гистограммы. Сложение исходных разрядов ограничивается моментом, когда очередная сумма сможет быть представлена единственным разрядом системы счисления, в которой представлены дискреты формируемой гистограммы.

Рис. 3. Блок-схема алгоритма преобразования ключа в номер секции

Для примера 1 при условном разделении файла на десять секций и, следовательно, отображаемым десятью столбцами гистограммы, табельный номер 375 преобразуется в промежуточную сумму 3 + 7 + 5 = 15 (двухпозиционную). Конечный результат: <15> ^ 1 + 5 = 6 указывает, что запись о специалисте, имеющем табельный номер 375, должна распределяться в шестую секцию файла, а предикат локализации должен адресовать к ней все входящие в нее атрибуты из шестого столбца. Если же по условиям примера 1 используются по двенадцать секций файла и столбцов гистограммы, то табельный номер распределяется в двенадцатеричной системе: 37510 = 27312. Тогда алгоритм преобразования дает конечный результат за одно суммирование разрядов: 2 + 7 + 3 = 12 и указывает, что запись о работнике с табельным номером 37510 должна сцепляться с последним столбцом гистограммы.

Количество разделенных секций файла, устанавливающее основание системы счисления, в которой производится преобразование, определено в примере формально. Его следует корректировать эмпирически вследствие неадекватной аппроксимации реальной плотности распределения величин атрибутов равномерным законом. Даже из формальных соображений, при делении кадрового (анкетного) файла на десять секций невозможно достичь равномерности, так как при переходе через 999 поразрядные суммы повторяются лишь на половине интервала - от 1000 до 1999, а не во всем десятичном диапазоне. Нарушения равновероятного попадания в секции происходят не вследствие погрешности схемы, а в связи с тем, что в примере 1 используется лишь половина допустимых значений ключа, так как по условиям на авиапредприятии работают вдвое меньше сотрудников, чем зарезервировано табельных номеров.

Известно [2], что лучшим является не способ, обеспечивающий адекватное теоретическому распределение, а схема, позволяющая практически равномерно заполнить все адресуемое пространство файла. С этой точки зрения преимущества изложенного алгоритма сводятся лишь к ускорению преобразования - в силу простоты и отсутствия необходимости нормирования. Для сцепленных списков свойство «равнозаполненности» дает дополнительный выигрыш вследствие одинаковой длины столбцов гистограммы (частичных цепей). Полезным оно оказывается и при организации мероприятий по самоконтролю и восстановлению искаженной информации ввиду технологичности манипулирования одинаковыми объемами данных.

Как правило, добиться равномерного заполнения секций файла в системах с преобразованием ключей с помощью перемешивания не вполне удается, так как нет возможности управлять статичной схемой алгоритма. Однако в приложениях, подобных рассмотренному в примере 1, такая возможность предоставляется введением обратной связи. При найме на работу новых сотрудников следует присваивать им табельные номера не в произвольном порядке, а по запросу к БД. В ответ система рекомендует пользователю свободный табельный номер, который следует закрепить за новым работником для более равномерного заполнения памяти. Не все изменчивые файлы допускают такую обратную связь. В БД планов полетов система не наделена полномочиями давать рекомендации авиакомпаниям по кодированию номеров рейсов, или по прокладке маршрутов полетов, или по оснащению ВС бортовой аппаратурой, исходя из характеристик метода доступа к данным. Ниже анализируется универсальный метод манипулирования высотой столбцов гистограммы с помощью динамической обратной связи.

4. Динамическое управление предикатом локализации

Универсальным средством управления выбором структуры предиката на этапе проектирования является воспроизведение физических закономерностей или статистической природы изменения используемого атрибута. После идентификации функциональной (причинно-следственной) зависимости в области определения атрибута, т.е. распознавания его физической природы, остается решить техническую задачу отображения в структуре гистограммы найденного функционального отношения или, если причинно-следственная связь проявляется лишь статистически, плотности распределения значений атрибута на числовой оси. Другими словами, должна быть построена однозначная интерпретация модели физического процесса, характеризуемого атрибутом, безразлично, задается ли она явной зависимостью у = /(.х) или гистограммой распределения. График построенной функции с помощью любого численного метода селектируется на равновеликие вписанные прямоугольники. Их основания и становятся дискретами оси гистограммы с неравномерным шагом, т. е. с различной шириной столбцов (рис. 4).

«в

I §

5

и Ф К «в г и к

3

11 10 9 8 7 6 5 4 3 2 1

0 247 459 602 691 745 794 848 893 1006 1112

200 : 400 \ 600 800 \ 1000 \ г

Время суток в минутах

Рис. 4. Квантование дискретов основания гистограммы плотностью распределения значений атрибута

Квантование предиката локализации с помощью огибающей распределения значений атрибута позволяет исключить пустующие дискреты, не порождающие столбцов гистограммы, и делает статистически эквивалентными (по высоте) размеры этих столбцов. Однако непосредственная интерпретация величины атрибута как адреса записи при этом заменяется ее преобразованием в номер секции файла. Для пояснения воспользуемся примером БД планов полетов. Одним из вторичных ключей поиска записей о рейсе являются секторы ВП. Изменяемыми свойствами этого элемента, согласно технологии УВД, являются факты появления ВС в секторе в функции высоты и времени входа. Физическая зависимость фактов вторжения от высоты и времени неоднозначна, она может быть задана таблично на основе расписания, но такое представление обладает рядом недостатков. Как правило, используется статистическая или расчетная гистограмма распределения полетов во времени.

Тогда для каждого сектора, аэродрома, навигационного пункта удается сформировать собственный предикат локализации записи оптимальной по критерию достижимости структуры. Некоторые их характеристики окажутся сходными: например, столбцы, соответствующие ночным полетам (малая интенсивность движения) будут сцеплены в интервале сотен минут, в то время как полеты в часы пик ограничатся минутами. В общем случае, в силу неравномерности загрузки разных элементов ВП и соблюдения условия равной площади столбцов каждый предикат локализации записи будет набран из индивидуально различного количества разных по величине дискретов.

Приведенный пример, удобный для пояснения правил формализации и схемы построения предиката локализации, не вполне удачен с прикладной точки зрения. Трудно представить себе ситуацию, при которой почасовая загрузка элемента ВП превысила бы полсотни полетов. Средняя загрузка активного аэродрома или сектора составляет полтора десятка, навигационного пункта - десять полетов в час. Поиск в цепочках такой длины занимает незначительное время. Переменный шаг квантования позволяет сделать его еще меньше, однако влечет за собой необходимость преобразования величины атрибута (времени вторжения ВС) в номер столбца гистограммы. Более технологично селектировать основания гистограмм элементов двадцатью четырьмя часовыми интервалами, и распределять атрибуты по столбцам, номера которых совпадают с номером того часа суток, в пределах которого анализируемый маршрут затрагивает соответствующие элементы ВП.

Заключение

Рассмотрены два универсальных способа адресации записей переменной длины, принадлежащих динамическим файлам полетной информации, при интегральных запросах по частным критериям поиска. Для реализации первого из них предложен алгоритм определения номера записи, основанный на различных траекториях движения к началу записи, отправляясь от известных доменов входящих в нее атрибутов. Для второго построен предикат локализации номера записи, представляющий собой гистограмму распределения количества полетов, затрагивающих элемент ВП. Приведены примеры реализации.

ЛИТЕРАТУРА

1. Глаговский К.А., Моисеев О.В., Рудельсон Л.Е. Многокритериальный поиск данных на основе информационных образов // Статья в настоящем Вестнике.

2. Фуфаев Э.В., Фуфаев Д.Э. Базы данных. - М.: Академия, 2007.

FUNCTION AND PREDICATE OF SEARCHING OF AERONAUTICAL DATA FOR EVALUATION OF AIRSPACE LOADING

Omorodion R.O., Rudelson L.E.

Two algorithms for addressing to variable-length records files belonging to a dynamic aeronautical information are discussed. The algorithm for determining the entry number, based on the movement of known domains of its constituent attributes. Built predicate localization of recording, which is a histogram of the distribution of the number of flights. Examples of realization are showed.

Key words: aeronautical information, image of computer information, a database record.

Сведения об авторах

Омородион Рейчел Осарагуе, окончила МГТУ ГА (2013), аспирантка МГТУ ГА, автор 2 научных работ, область научных интересов - компьютерная поддержка планирования полетов и организации доступа к аэронавигационной информации.

Рудельсон Лев Ефимович, 1944 г.р., окончил МЭИ (1968), доктор технических наук, профессор МГТУ ГА, автор более 170 научных работ, область научных интересов - программное обеспечение автоматизированных систем организации воздушного движения.

i Надоели баннеры? Вы всегда можете отключить рекламу.