Актуальные проблемы авиации и космонавтики - 2014. Информационные технологии
УДК 004.056
В. В. Митращук, Е. Ю. Золотарева Научный руководитель - В. В. Золотарев Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
ОБРАБОТКА ЭЛЕМЕНТОВ ИЗОБРАЖЕНИЯ С ПРИМЕНЕНИЕМ ГАРМОНИЧЕСКОГО АНАЛИЗА
Рассмотрены некоторые аспекты программной реализации прямого и обратного преобразования Фурье.
Цель работы: создать программу, получающую из графического изображения амплитудные и частотные коэффициенты Фурье и совершающую обратное преобразование, для выделения объектов на контрастном фоне.
Задачи: используя формулы математического расчета прямого и обратного преобразования Фурье для графического изображения, получить данные о недостатках и особенностях программной реализации такого преобразования.
Особое внимание уделено анализу быстродействие выполнения преобразований Фурье в программе, исследована зависимость амплитудных и частотных коэффициентов Фурье от исходного изображения, были построены соответствующие графики по полученным данным.
В статье обращается внимание на проблемы, возникшие в ходе тестирования, связанные с искажением обратного преобразования изображений и зависанием программы при осуществлении ресурсоемких операций, предлагаются пути решения данных проблем, использованные в рассматриваемой программе. Авторы приходит к выводу, что преобразование Фурье происходит достаточно медленно, уже начиная, даже,
с изображений небольшого размера, в связи с этим, очень остро встает вопрос оптимизации. Обнаружено, что амплитудный график, начиная с определенного элемента, имеет ось симметрии и является четным, совпадающую с осью симметрии частотного графика, который является нечетным. В статье рассмотрено, как приведенный факт может помочь в дальнейшем оптимизировать программу почти в два раза. На основе изучения быстродействия программы установлено, что необходимо заняться поиском и оптимизированием других, возможных для улучшения, сегментов кода и функций.
Требуется и далее совершенствовать экспериментальное программное обеспечение и параллельно проектировать дальнейшую работу и опыты, которые позволят решить главную цель: выделение объектов на контрастном фоне.
Полученные результаты могут быть применены как при разработке новых подходов к исследованию изображений, так и в задачах охранного видеонаблюдения и интегрированных систем безопасности.
© Митращук В. В., Золотарева Е. Ю., 2014
УДК 004.056
Л. В. Панюшкина Научный руководитель - В. В. Золотарев Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
ОПТИМИЗАЦИЯ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ В ЗАДАЧЕ ЗАЩИТЫ ИНФОРМАЦИИ
Рассматривается проблема оптимизации и логического моделирования связей ресурсов, угроз и уязвимо-стей в задаче защиты информации.
В работе предлагается решение задачи оптимального распределения ограниченных ресурсов на снижение информационных рисков. При этом рассматриваются человеческие, программные, технические и другие ресурсы, приводится разработанная классификация угроз и уязвимостей системы. Под снижением информационных рисков понимается уменьшение вероятностей реализации информационных угроз до уровня информационного риска, приемлемого для рассматриваемого объекта. Решением поставленной задачи является такое распределение ресурсов, при котором суммарные затраты на
ресурсы минимальны и все риски принимают приемлемое значение.
Работа состоит из двух этапов: построение модели связи информационных рисков и расчет ресурсов, затрачиваемых на их снижение; создание программы, оптимально распределяющей ограниченные ресурсы на снижение информационных рисков. На данный момент задача оптимального распределения ограниченных ресурсов на снижение информационных рисков формализована, предложены варианты моделей зависимостей информационных рисков и ресурсов, затрачиваемых на их снижение.
* Работа выполнена в рамках гранта Президента молодым российским ученым - кандидатам наук, договор № 14.124.13.4037-МК от 04.02.2013.
Секция «Методы и средства зашиты информации»
Основные шаги решения задачи распределения ресурсов
№ Описание
1 Сбор данных о системе (угрозы, уязвимости, ресурсы, время снижения риска)
2 Выбор модели зависимостей информационных рисков и ресурсов и ее построение
3 Получение всех возможных решений задачи распределения ресурсов
4 Выбор решения, суммарные затраты на которое минимальны
Модели отличаются масштабом рассматриваемой системы, формой представления данных, а также минимальным списком входных данных, при наличии которого построение модели представляется возможным. Предложена модель решения задачи. С применением приведенной методики формирования угроз могут быть решены задачи моделирования и анализа в конкретных системах. Целью такого моделирования является контроль уровня защищенности информационных систем.
© Панюшкина Л. В., 2014
УДК 004.056
А. Ю. Перевалова Научный руководитель - В. Г. Жуков Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск
О ПРИМЕНЕНИИ СУФФИКСНЫХ ДЕРЕВЬЕВ В ЗАДАЧЕ КЛАСТЕРИЗАЦИИ
ТЕКСТОВОЙ ИНФОРМАЦИИ
Для организации электронных документов предлагается организация данных с помощью суффиксных деревьев, построенных по алгоритму Укконена.
В современных организациях циркулирует большое количество информации. Для организации она представляют собой большие данные (big data). Зачастую задачи в сфере больших данных весьма сложны для анализа и решения. Проблема не в том, что организации создают большие объемы данных, а в том, что большая их часть представлена в формате, плохо соответствующем традиционному структурированному формату БД, - это веб-журналы, видеозаписи, текстовые документы, машинный код или, например, геопространственные данные.
Особую ценность представляют текстовые документы, содержащие различную, в том числе конфиденциальную информацию. В результате организации могут иметь доступ к большому объему текстовых данных и не иметь необходимых инструментов, чтобы установить взаимосвязи между этими данными и сделать на их основе значимые выводы (в том числе, определить, относится ли документ к защищаемой информации). В качестве первого шага к решению задачи работы с большими данными рекомендуется их классифицировать.
При этом требуется выбрать способ организации классифицируемых данных.
Традиционно выделяют следующие методы организации данных:
- массивы;
- списки;
- графы;
- деревья;
- хэш-таблицы.
Морфологический словарь русского языка содержит около 5 млн словоформ. Поэтому способ организации данных с помощью хэш-таблиц является неэкономным. Также минусом хэш-таблиц являются коллизии.
При организации данных с помощью списков выполняется последовательный поиск путем полного перебора элементов списка - это неэффективно.
Основными способами представления словарей являются представление в виде алфавитно-упорядо-ченного списка либо в виде дерева [1].
Деревья и графы, в отличие от массивов и списков, представляют собой не линейные структуры. С точки зрения организации данных это дает разнообразие вариантов размещения одного и того же набора данных, а также различные варианты обхода одной и той же структуры.
Одним из перспективных подходов является использование структур данных на основе суффиксных деревьев (далее - СД) [2]. В СД все подстроки исходной строки образованы путем удаления первого символа строки-родителя. Суффикс - это последние (i-k) символов строки, где i - длина строки, k = 1...i. СД позволяет представить строку в виде, удобном при решении поставленной задачи.
Наиболее распространены алгоритмы построения СД Мак-Крейга и Укконена. Оба алгоритма строят СД за линейное время, но алгоритм Укконена строит дерево в режиме online, т.е. после начала работы алгоритма можно увеличивать длину строки.
В программной реализации эффективнее строить СД по буквам, а не по словам. Это обусловлено тем, что количество букв, в отличие от слов, ограничено (для русского языка - 33, для английского - 26).
Разрабатываемый программный модуль построения СД будет осуществлять кластеризацию информационных ресурсов (документов). На вход подаются документы (файлы) в определенном формате, затем они подвергаются отчистке от пунктуации и цифровой информации. Файл - одна большая строка. Далее