Научная статья на тему 'Конфиденциальный кластерный анализ методом самоорганизующихся карт при горизонтальном секционировании данных'

Конфиденциальный кластерный анализ методом самоорганизующихся карт при горизонтальном секционировании данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
63
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНФИДЕНЦИАЛЬНЫЕ МНОГОСТОРОННИЕ ВЫЧИСЛЕНИЯ / КЛАСТЕРНЫЙ АНАЛИЗ ДАННЫХ / DATA CLUSTERING / САМООРГАНИЗУЮЩИЕСЯ КАРТЫ / SELF-ORGANIZED MAPS / ГОРИЗОНТАЛЬНОЕ СЕКЦИОНИРОВАНИЕ ДАННЫХ / HORIZONTALLY PARTITIONED DATA / SECURE MULTIPARTY COMPUTATIONS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вашкевич А. В., Жуков В. Г.

Две организации, занимающиеся одинаковой деятельностью (например, проектированием спутников), могут захотеть провести совместный анализ своих ноу-хау, при этом не раскрывая детали друг другу. Самоорганизующиеся карты позволяют провести подобный анализ и наглядно отобразить его результаты. Предложено решение, позволяющее безопасно строить такие самоорганизующиеся карты.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Privacy-preserving clustering via self-organized map over HORIZONTally partitioned data

Two organizations engaged in the same activity (like designing satellites) may want to conduct a joint analysis of their know-how, without revealing details to each other. Self-organizing maps allow to perform such analysis and visualize the results. This paper presents a solution of secure constructing these self-organizing maps.

Текст научной работы на тему «Конфиденциальный кластерный анализ методом самоорганизующихся карт при горизонтальном секционировании данных»

Sandbox для обработки потока данных и тем самым повысить эффективность персонала ИБ. Компонент применяется в тестовом режиме внутри промышленно эксплуатируемой системы защиты информации

АО «ИСС» (г. Железногорск). Благодаря наличию гибкой системы фильтров и механизма обучения, система может легко адаптироваться к изменениям в прикладном ПО и новым версиям ОС.

Схема работы компонента

Библиографические ссылки

1. Работа антивирусных программ [Электронный ресурс]. URL: http://it-sektor.ru/rabota-antivirusnyx-programm.html (дата обращения: 10.10.2015).

2. Замкнутая программная среда [Электронный ресурс]. URL: http://certsrv.ru/sn5help.ru/uf_restricted_ application_environment.htm (дата обращения: 10.10.2015).

3. Automated Malware Analysis - Cuckoo Sandbox [Электронный ресурс]. URL: http://cuckoosandbox.org/ (дата обращения: 10.10.2015).

4. Malwr - Malware Analysis by Cuckoo Sandbox [Электронный ресурс]. URL: https://malwr.com/ (дата обращения: 10.10.2015).

5. VirusTotal [Электронный ресурс]. URL: https:// www.virustotal.com/ (дата обращения: 10.10.2015).

References

1. How antiviruses works. Available at: http://it-sektor.ru/rabota-antivirusnyx-programm.html.

2. Isolated software environment. Available at: http://certsrv.ru/sn5help.ru/uf_restricted_application_envi ronment.htm.

3. Automated Malware Analysis - Cuckoo Sandbox. Available at: http://cuckoosandbox.org/.

4. Malwr - Malware Analysis by Cuckoo Sandbox. Available at: https://malwr.com/.

5. VirusTotal. Available at:https://www.virustotal. com/.

© Бородавкин Д. А., 2015

УДК 004.056.5

КОНФИДЕНЦИАЛЬНЫЙ КЛАСТЕРНЫЙ АНАЛИЗ МЕТОДОМ САМООРГАНИЗУЮЩИХСЯ КАРТ ПРИ ГОРИЗОНТАЛЬНОМ СЕКЦИОНИРОВАНИИ ДАННЫХ

А. В. Вашкевич, В. Г. Жуков

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 Е-mail: [email protected], [email protected]

Две организации, занимающиеся одинаковой деятельностью (например, проектированием спутников), могут захотеть провести совместный анализ своих ноу-хау, при этом не раскрывая детали друг другу. Самоорганизующиеся карты позволяют провести подобный анализ и наглядно отобразить его результаты. Предложено решение, позволяющее безопасно строить такие самоорганизующиеся карты.

Ключевые слова: конфиденциальные многосторонние вычисления, кластерный анализ данных, самоорганизующиеся карты, горизонтальное секционирование данных.

PRIVACY-PRESERVING CLUSTERING VIA SELF-ORGANIZED MAP OVER HORIZONTALLY PARTITIONED DATA

A. V. Vashkevich, V. G. Zhukov

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation Е-mail: [email protected], [email protected]

Решетнеескцие чтения. 2015

Two organizations engaged in the same activity (like designing satellites) may want to conduct a joint analysis of their know-how, without revealing details to each other. Self-organizing maps allow to perform such analysis and visualize the results. This paper presents a solution of secure constructing these self-organizing maps.

Keywords: secure multiparty computations, data clustering, self-organized maps, horizontally partitioned data.

Создание космической техники часто проводится в условиях, когда разработка, изготовление и эксплуатация отдельных модулей проводится различными организациями, при этом зачастую невозможно заранее провести комплексные испытания итоговых образцов. Прогресс в развитии технологий проходит одновременно с ростом требований к безопасности космической аппаратуры. Для обеспечения высокого уровня надёжности космической техники на всех этапах её жизненного цикла требуется проводить сбор информации, её анализ и прогнозирование. Результаты работы интеллектуальных методов анализа данных способствуют более эффективному управлению, необходимому для обеспечения отказоустойчивости.

Самоорганизующаяся карта (СОК, self-organized map) - метод кластерного анализа, основанный на идее нейронной сети, учитывающей взаимное расположение нейронов [1]. Ее удобно рассматривать как двухмерную сетку узлов-нейронов, размещённых в многомерном пространстве и соединённых между собой связями. Значения каждого нейрона инициализируются случайным образом. После этого нейроны начинают перемещаться в пространстве согласно следующему алгоритму:

1. Случайным образом выбирается объект входных данных.

2. Производится поиск ближайшего к объекту нейрона на карте.

3. Координаты этого нейрона корректируются. Также корректируются (но меньше) и координаты его соседей.

4. Алгоритм повторяется заданное число раз. При этом коррекция нейронов становится всё меньше с каждым тактом согласно функции изменения координат.

На выходе алгоритма строится карта: двумерная сетка узлов-нейронов, размещённая в многомерном пространстве. Для изображения положения нейронов зачастую используется раскрашивание карты. Такие же карты строятся и для каждого из измерений.

При горизонтальном секционировании данных несколько аналитиков обладают разными объектами данных, каждый из которых имеет одинаковые число и тип измерений (например, каждый спутник характеризуется орбитой, собственными размерами, массой и т. п.). Возможна ситуация, когда аналитики захотят провести совместный анализ объектов данных, не раскрывая частные данные друг другу. При этом используются так называемые криптографические примитивы - относительно простые математические операции, проводимые совместно участниками без раскрытия входных аргументов с помощью криптографии. Вместе набор примитивов составляет алгоритм конфиденциальных многосторонних вычислений [2].

Существует множество алгоритмов конфиденциальной кластеризации [3], однако для конфиденци-

альных самоорганизующихся карт существуют только протоколы вертикального секционирования [4]. Обойтись только теми криптографическими примитивами, которые использовались при вертикальном секционировании, для горизонтального не удастся, поскольку механизм взаимодействия между участниками здесь принципиально иной: при вертикальном секционировании данные о нейронах разделены между участниками естественным образом по измерениям, а при горизонтальном секционировании участники вынуждены дробить данные о нейронах по какому-либо иному признаку.

В предыдущих исследованиях был модифицирован алгоритм конфиденциальной кластеризации Л-шеалБ [5], являющийся одним из самых распространённых алгоритмов кластеризации. В ходе работ был модифицирован протокол безопасного скалярного произведения (БСП). Этот протокол ориентирован на представление суммы нескольких конфиденциальных слагаемых в виде произведения нескольких конфиденциальных множителей. Такое преобразование позволяет, например, вычислить знак суммы, не раскрывая её точного значения. В работе [6], посвящённой вертикальному секционированию самоорганизующихся карт, безопасное скалярное произведение уже успешно применялось.

При горизонтальном секционировании нейроны являются общими для обоих участников. В ходе построения СОК одновременно обрабатывается только один объект данных, принадлежащий только одному участнику. Нейроны перемещаются в ходе построения СОК, и чтобы ни один участник по перемещению нейрона косвенно не вычислил данные другого участника, информация о нейронах также должна быть защищена.

Предлагается разбивать данные нейрона на две случайные части, хранимые у каждого участника. Эти части ^ и k2 (будем называть их «половинки») позволяют получить корректные данные нейрона K только при сложении по каждому измерению. Из-за дробления каждого нейрона на такие половинки защищаются оба шага алгоритма самоорганизующихся карт:

1. При поиске ближайшего нейрона к объекту один участник локально суммирует данные своего объекта со своей половинкой нейрона, а затем с помощью БСП суммирует полученное с половинкой нейрона другого участника: ^ + ^) + ^ = г1 • г2.

2. При обновлении координат нейронов требуется пропорционально уменьшать их расстояние до объекта. Поскольку точные расстояния не известны ни одному участнику, они меняют координаты своей половинки нейрона, прибавив к ним случайные числа, а затем смотрят, во сколько раз изменилась разница между объектом и нейроном. Участник 2 сохраняет коэффициент г2, т. е. ^ + А^) + &"2 = г\ • г2, а коэффициент г1 ' позволяет участнику 1 вычислить коэффици-

ент, на который каждому участнику следует умножить случайные числа для смены координат своей половинки нейрона.

Предложенное решение позволяет двум организациям конфиденциально строить самоорганизующиеся карты при горизонтальном секционировании данных, поскольку базируется на криптографических примитивах, с использованием которых участники не раскроют друг другу скрываемые сведения. А преимущества такого метода анализа данных, как самоорганизующиеся карты, позволят получать результаты анализа в наглядном виде.

Библиографические ссылки

1. Зиновьев А. Ю. Визуализация многомерных данных. Красноярск : Изд-во КГТУ, 2000. 180 с.

2. Шутый Р. С. Рандомизированные протоколы, применяемые для выполнения конфиденциальных многосторонних вычислений в компьютерных сетях / Санкт-Петербург. гос. ун-т телекоммуникаций им. проф. М. А. Бонч-Бруевича. СПб., 2009. 170 с.

3. Meskine F., Bahloul S. Privacy Preserving K-means Clustering: A Survey Research // International Arab J. of Information Technology. 2012. Vol. 9, no. 2. P. 194-200.

4. Han S., Ng W. K. Privacy-Preserving Self-Organizing Map // Proceedings of the 9th Intern. Conf. on Data Warehousing and Knowledge Discovery, 2007. P. 428-437.

5. Zhukov V. G., Vashkevich A. V. Privacy-preserving Protocol over Vertically Partitioned Data in Multiparty K-means Clustering // Middle-East Journal of Scientific Research. 2013. Vol. 17, no. 7, P. 992-997.

6. Вашкевич А. В., Жуков В. Г. Конфиденциальный кластерный анализ методом самоорганизующихся карт при вертикальном секционировании данных //

Решетневские чтения : материалы XVIII Междунар. науч. конф. 2014. Ч. 2. С. 301-302.

References

1. Zinovyev A. Y. Vizualizatsiya mnogomernykh dannykh (Visualization of multidimensional data). Krasnoyarsk State Technological University, 2000. 180 p.

2. Shutyy R. S. Randomizirovannye pro toko ly, pri-menyaemye dlya vypolneniya konfidentsial'nykh mnogos-toronnikh vychisleniy v komp 'yuternykh setyakh (Randomized protocols used to perform secure multiparty computations in computer networks). The Bonch-Bruevich Saint-Petersburg State University of Telecommunications, 2009, 170 р.

3. Meskine F., Bahloul S. Privacy Preserving K-means Clustering: A Survey Research // International Arab Journal of Information Technology, 2012. Vol. 9, no. 2, pp. 194-200.

4. Han S., Ng W. K. Privacy-Preserving Self-Organizing Map // Proceedings of the 9th International Conference on Data Warehousing and Knowledge Discovery, 2007, pp. 428-437.

5. Zhukov V. G., Vashkevich A. V. Privacy-preserving Protocol over Vertically Partitioned Data in Multiparty K-means Clustering // Middle-East Journal of Scientific Research, 2013. Vol. 17, no. 7, pp. 992-997.

6. Vashkevich A. V, Zhukov V. G. [Privacy-preserving Clustering via Self-organized Map over Vertically Partitioned Data] // Мaterialy XVIII Mezhdunar. nauch. konf. "Reshetnevskie chteniya" [Materials XVIII Intern. Scientific. Conf "Reshetnev reading"]. Krasnoyarsk, 2014, pp. 301-302 (In Russ.).

© Вашкевич А. В., Жуков В. Г., 2015

УДК 004.056

О ПРИМЕНЕНИИ МЕЖСЕТЕВЫХ ЭКРАНОВ НОВОГО ПОКОЛЕНИЯ ПРИ ОРГАНИЗАЦИИ ЗАЩИЩЕННОГО ГОСТЕВОГО ДОСТУПА В БЕСПРОВОДНЫХ ЛОКАЛЬНЫХ СЕТЯХ

А. К. Герасимов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: [email protected]

Рассматривается вопрос обеспечения информационной безопасности при организации защищенного гостевого доступа в беспроводных локальных сетях на основе межсетевых экранов нового поколения.

Ключевые слова: информационная безопасность, беспроводные локальные сети, гостевой доступ, межсетевые экраны.

USING NEW GENERATION FIREWALLS TO THE PROTECTED GUEST WIRELESS LAN

A. K. Gerasimov

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation Е-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.