К.
В.
Ткачёв
ИМИТАЦИОННАЯ
МОДЕЛЬ
ДЛЯ
ТЕСТИРОВАНИЯ
АЛГОРИТМОВ
КЛАСТЕРИЗАЦИИ
УЗЛОВ
В
БЕСПРОВОДНЫХ
НЕСТАЦИОНАРНЫХ
СЕТЯХ
К.
В.
Ткачёв
Институт
вычислительной
математики
и
математической
геофизики
СО
РАН
630090,
Новосибирск
УДК
519.6
DOI:
10.24412/cl-35066-2021-1-35-39
Описана
разработанная
имитационная
модель
движения
транспортных
средств
с
размещенными
на
них
приемо-передающими
узлами.
Для
оптимизации
передачи
данных
между
движущимися
узлами
и
уменьшения
процента
потерянных
сообщений
применяется
разбиение
узлов
на
подмножества
(кластеризация)
с
выбором
головного
узла.
Протестированы
различные
алгоритмы
кластеризации
и
выбора
наиболее
активного
узла
в
каждом
кластере.
Показано
что
использование
алгоритма
DBSCAN
с
выбором
активного
участника
методом
наиболее
связного
объекта
дает
лучшие
результаты,
т.
е.
является
предпочтительным
для
использования
в
беспроводных
сетях
с
узлами
на
движущихся
объектах.
Ключевые
слова:
нестационарная
беспроводная
сеть,
кластеризация,
транспортные
сети,
интерференция.
Введение
Увеличение
числа
автомобилей
приводит
к
возрастанию
количества
опасных
ситуаций
на
дорогах.
Концепция
умного
города
предлагает
интегрировать
в
городскую
инфраструктуру
современные
информационные
и
коммуникационные
технологии.
Для
минимизации
дорожно-транспортных
происшествий
разрабатываются
интеллектуальные
транспортные
системы
(ИТС).
С
помощью
датчиков,
размещенных
на
транспортных
средствах
и
на
придорожном
оборудовании,
происходит
сбор
и
передача
пользователям
в
режиме
реального
времени
информации
о
ситуации
на
дорогах,
об
оптимальных
маршрутах.
Передача
данных
осуществляется
узлами
в
беспроводной
сети,
в
которой
может
присутствовать
межканальная
интерференция
[1].
Интерференция
приводит
к
потере
данных,
то
есть
требуется
повторная
передача,
а
значит,
снижается
скорость
получения
необходимой
информации.
Для
исследования
проблемы
минимизации
негативных
эффектов
интерференции,
разработки
оптимизационных
алгоритмов
и
их
тестирования
удобно
применять
имитационное
моделирование.
Далее
описана
разработанная
имитационная
модель,
которая
имитирует
процесс
движения
транспортной
сети
и
передачу
информационных
сообщений
в
нестационарной
сети
от
одного
узла,
размещенного
на
транспортном
средстве,
к
другому.
1.
Постановка
задачи
В
последние
годы
во
всем
мире
проводится
множество
исследований
по
оптимизации
работы
интеллектуальных
транспортных
систем.
Сети
VANET
(Vehicle
ad-hoc
networks,
самоорганизующиеся
автомобильные
сети)
являются
важнейшим
компонентом
ИТС,
отвечающим
за
организацию
информационного
обмена
между
автомобилями
различного
назначения
(скорая
помощь,
полицейские
машины
и
др.).
Работа
выполнена
при
частичной
финансовой
поддержке
Российского
фонда
фундаментальных
исследований
(код
проекта
19-01-00562).
Проблемы
оптимизации
сложных
систем
–
2021
Основные
задачи
сбора
и
передачи
данных
пользователям
в
сетях
VANET
можно
разделить
на
три
группы:
–
помощь
водителю
во
время
движения
(передача
информации,
полученной
от
спутниковой
навигации),
информирование
об
ограничении
скорости
на
различных
участках,
о
зоне
ремонтных
работ;
–
рекламная
информация
о
расположении
магазинов,
аптек,
заправочных
станций
вблизи
места,
где
находится
в
данный
момент
автомобиль;
–
обмен
информацией
между
узлами
в
колонне
движущихся
транспортных
средств.
Технология
передачи
информации
в
сетях
VANET
постоянно
развивается,
но
остается
много
проблем,
которые
необходимо
решить,
чтобы
сделать
передачу
данных
в
нестационарной
сети
более
надежной
и
жизнеспособной.
Так,
например,
высокая
динамика
изменения
состава
и
структуры
таких
сетей
вследствие
мобильности
узлов
привела
к
необходимости
постоянно
оптимизировать
процесс
распределения
трафика
[2].
Это
связано
с
передачей
большого
количества
сообщений
на
одной
частоте.
Следовательно,
передача
данных
в
VANET-сетях
подвержена
эффекту
интерференции.
Межсетевая
интерференция
приводит
к
таким
проблемам,
как
частые
прерывания
во
время
передачи
информации,
медленное
сетевое
соединение,
медленная
передача
данных,
слабый
сигнал.
Для
того,
чтобы
избавиться
от
эффекта
интерференции,
можно
в
протоколе
передачи
данных
давать
возможность
передачи
сообщения
в
определенные
моменты
только
избранным
узлам
из
всего
множества
датчиков
сети.
Для
этого
необходимо
разделять
все
множество
узлов
на
подмножества
(кластеры),
выбирать
по
какому-либо
принципу
головной
узел
в
каждом
кластере,
и
этим
головным
узлам
предоставляется
возможность
собирать
данные
от
узлов
в
своем
кластере
и
передавать
их
в
базовую
станцию
[3].
Количество
потерянных
сообщений
при
использовании
кластеризации
должно
уменьшиться,
так
как
число
узлов,
одновременно
передающих
сообщения
на
одной
частоте,
будет
сокращено
в
несколько
раз.
Была
рассмотрена
задача
создания
имитационной
модели
для
имитации
движения
транспортных
средств
с
размещенными
на
них
датчиками
сбора
и
передачи
информации,
а
также
для
имитации
передачи
данных
между
узлами.
Моделировался
процесс
функционирования
узлов
в
нестационарной
сети,
при
котором
устройства
непрерывно
передают
и
получают
данные,
вследствие
чего
возникает
интерференция.
Для
оптимизации
передачи
информации
внутри
созданной
имитационной
модели
разбивается
все
множество
приемо-передающих
узлов
сети
на
кластеры,
выбирается
в
каждом
кластере
головной
узел,
который
будет
осуществлять
сбор
и
передачу
информации.
Для
разбиения
множества
всех
узлов
нестационарной
сети
на
подмножества
рассмотрены
наиболее
известные
алгоритмы
кластеризации:
метод
k-средних,
алгоритм
DBSKAN
(Density-based
spatial
clustering
of
applications
with
noise),
агломеративный
метод.
При
имитационном
моделировании
функционирования
нестационарной
сети
проводилось
разбиение
узлов
на
кластеры,
выбор
активных
мобильных
узлов
внутри
каждого
кластера
различными
методами.
Оценивалась
эффективность
выбранных
алгоритмов
кластеризации
для
минимизации
эффектов
интерференции
при
сборе
и
передаче
информации.
2.
Алгоритмы
кластеризации
Рассматривается
упрощенная
модель
движения
транспортной
сети,
где
на
некоторых
автомобилях
размещены
приемо-передающие
устройства.
Считаем,
что
мощности
передатчиков
одинаковые,
то
есть
радиус
действия
при
передаче
данных
одинаковый
для
К.
В.
Ткачёв
всех
узлов.
Устройства
объединены
в
нестационарную
беспроводную
сеть,
которая
функционирует
при
условии
попадания
одного
узла
в
радиус
действия
другого.
Для
оптимизации
передачи
данных
применяется
разбиение
узлов
на
подмножества,
сбор
данных
в
каждом
кластере
от
элементов
подмножества
к
головному
узлу,
передача
информации
между
головными
узлами
кластеров
на
базовую
станцию.
Для
сравнительного
тестирования
различных
методов
кластеризации
узлов
сети
были
промоделированы
действия
следующих
известных
алгоритмов:
статический
алгоритм
k-средних,
кластеризация
на
основе
плотности,
агломеративная
кластеризация.
Кластеризация
на
основе
метода
k-средних.
Для
реализации
этого
алгоритма
необходимо
выполнить
следующие
шаги
[4]:
–
выбираем
k
случайных
точек
в
качестве
центров
кластеров,
называемых
центроидами;
–
добавляем
каждую
точку
в
ближайший
к
ней
кластер,
вычислив
расстояние
до
каждого
центроида;
–
определяем
новый
кластерный
центр,
вычислив
среднее
значение
назначенных
точек;
–
шаги
2
и
3
повторяем
до
тех
пор,
пока
нельзя
будет
перемещать
объекты
между
кластерами.
Кластеризация
на
основе
плотности
DBSCAN
(Density-based
spatial
clustering
of
applications
with
noise).
Перед
выполнением
алгоритма
необходимо
определить
два
параметра:
минимальное
количество
точек,
сгруппированных
вместе,
чтобы
область
считалась
плотной
(отдельным
кластером)
и
меру
расстояния,
которая
определяет,
достижима
ли
точка.
Алгоритм
можно
разделить
на
этапы
[5]:
–
произвольно
выбираем
точку
из
набора
данных;
–
если
на
заданном
расстоянии
есть
минимальное
необходимое
количество
точек,
то
считаем,
что
все
точки
являются
частью
одного
кластера;
–
расширяем
кластеры
путем
рекурсивного
повторения
вычисления
для
каждой
соседней
точки.
Кластеризация
на
основе
метода
агломеративной
кластеризации.
Это
очень
понятный,
но
сложный
в
реализации
алгоритм,
который
требует
больших
временных
ресурсов,
но
имеет
тенденцию
выдавать
более
точные
результаты
по
сравнению
с
другими
алгоритмами
[6].
Шаги
алгоритма:
–
на
первом
шаге
каждую
точку
мы
считаем
за
отдельный
кластер;
–
объединяем
пару
ближайших
кластеров;
–
повторяем
пункт
2
до
того
момента,
пока
все
точки
не
объединятся
в
один
кластер.
После
выполнения
алгоритма
строим
дендрограмму,
с
помощью
которой
определяем
оптимальное
количество
кластеров.
Для
выбора
активного
участника
в
каждом
кластере
сети
были
использованы
2
алгоритма:
алгоритм
нахождения
геометрического
центра
и
"метод
наиболее
связного
узла".
Нахождение
геометрического
центра
заключается
в
нахождении
узла,
который
по
своему
местонахождению
в
данный
момент
приближен
к
среднему
арифметическому
местоположений
всех
точек,
входящих
в
выбранный
кластер.
Метод
наиболее
связного
узла
заключается
в
проверке
связности
каждого
элемента
и
выявлении
объекта,
имеющем
наибольшее
количество
связей
с
другими
объектами
в
кластере.
В
кластере
случайным
образом
выбирается
объект
(в
нашем
случае
приемопередающий
узел
с
заданным
радиусом
действия)
и
подсчитывается
количество
элементов,
попадающих
в
радиус
действия.
На
втором
этапе
рассматриваем
эти
выбранные
объекты,
и
из
них
также
выбираем
самый
связный,
затем
рассматриваем
его
соседей.
Алгоритм
продолжается
до
того
момента,
пока
не
будут
проверены
все
узлы
сети
Проблемы оптимизации сложных систем – 2021
3. Имитационная модель для тестирования
алгоритмов
Разработанная
имитационная
модель
предоставляет
пользователю
возможность
загрузить
дорожную
карту
той
территории,
на
которой
предполагается
рассматривать
сеть
с
движущимися
узлами, размещенными
на
автомобилях.
В
имитационной
модели
есть
предварительно загруженные
карты, но можно
воспользоваться
любой
другой,
необходимо
указать широту и долготу, а
также
дистанцию
от центра
карты до ее края.
При
моделировании
функционирования
сети, в
процессе
передачи
данных
между
узлами, пользователю
необходимо выбрать
разрешенный
лимит
на
количество потерянных
сообщений
из-за
возникающего эффекта
интерференции.
При
моделировании
отслеживается
процент
потерь, и
в
случае
превышения
этого лимита, для
узлов
в
сети
будет
применяться
разбиение
на
подмножества
с
помощью
выбранного алгоритма
кластеризации.
На
рис. 1 приведен
пример интерфейса
разработанной
имитационной модели.
Для
каждого алгоритма
пользователь
может
задать
количество кластеров, на
которые
будет
разбито все
множество узлов, или
воспользоваться
предварительно
установленным
значением. На
выходе
получается
имитационная
модель
с
транспортной
сетью,
движущимися
автомобилями, на
некоторых
из
которых
размещены
узлы,
объединенные
в
беспроводную сеть.
Узлы
формируются
в
динамически
изменяющиеся
кластеры, в
каждом
из
которых
выбирается
активный
участник. По завершению
движения
всех автомобилей
получаем
текстовый
отчет
по
выполненному
алгоритму, который
можно
сохранить
в
различных
форматах
данных.
На
рис. 2 приведены
результаты
тестирования
трех
алгоритмов, показан
процент потерянных сообщений для
каждого алгоритма.
Рис. 1 – Интерфейс имитационной модели
Рис. 2 – Результат тестирования алгоритмов
К.
В.
Ткачёв
4.
Заключение
Разработана
имитационная
модель
движения
транспортных
средств
с
закрепленными
на
них
приемо-передающими
узлами,
имитируется
процесс
передачи
информации
между
узлами
беспроводной
сети,
во
время
которого
происходит
потеря
данных
из-за
интерференции.
При
превышении
заданного
порога
ограничения
на
процент
потерянных
сообщений
начинается
процесс
кластеризации
узлов
сети,
выбор
головного
узла
в
каждом
кластере,
с
целью
уменьшить
потери
данных.
Далее
передача
данных
в
сети
происходит
с
помощью
выбранных
головных
узлов.
Модель
предназначена
для
тестирования
и
оценки
эффективности
различных
алгоритмов
кластеризации
узлов.
Исследованы
реализованные
алгоритмы
кластеризации:
алгоритм
k-средних,
DBSAN,
агломеративная
кластеризация.
Разработанные
алгоритмы
для
выбора
активного
участника
(головного
узла)
в
кластере
показали
свою
эффективность
и
простоту
реализации.
В
ходе
тестирования
эффективности
алгоритмов
кластеризации
было
выявлено,
что
при
использовании
DBSCAN
в
связке
с
выбором
головного
узла
методом
наиболее
связного
объекта
теряется
наименьшее
(в
процентном
соотношении)
количество
сообщений.
Можно
считать,
что
этот
алгоритм
является
предпочтительным
для
передачи
данных
с
использованием
кластеризации
узлов
в
беспроводных
сетях
с
движущимися
объектами.
Список
литературы
1.
А.
С.
Викулов,
А.
И.
Парамонов,
Анализ
основных
видов
помех
в
задаче
планирования
сетей
Wi-Fi
с
высокой
плотностью
пользователей.
URL:
http://www.sut.ru/doci/nauka/review/20185/2131.
(дата
обращения
19.05.21).
2.
S.
Glass,
M.
Portmann,
V.
Muthukkumarasamy.
Securing
route
and
path
integrity
in
multihop
wireless
networks.
Р.
25–29.
Security
of
Self-Organizing
Networks.
MANET,
WSN,
WMN,
VANET.
CRC
Press,
2011,
P.
595.
3.
Phillips,
Steven
J.
(2002-01-04).
Acceleration
of
k-means
and
related
clustering
algorithms.
In
Mount,
David
M.;
Stein,
Clifford
(eds.).
Acceleration
of
k-means
and
related
clustering
algorithms
//
Lect.
Notes
in
Comput.
Sci.
2409.
Springer
Berlin
Heidelberg.
P.
166–177.
DOI:10.1007/3-540-45643-0_13.
ISBN
978-3-540-43977-6.
4.
Schubert,
E.,
Sander,
J.,
Ester,
M.,
Kriegel,
H.
P.,
&
Xu,
X.
(2017).
DBSCAN
revisited,
revisited:
why
and
how
you
should
(still)
use
DBSCAN
//
ACM
Trans.
on
Database
Syst.
(TODS),
42(3),
19.
5.
F.
Nielsen.
Chapter
8:
Hierarchical
Clustering.
Introduction
to
HPC
with
MPI
for
Data
Sci.
ISBN
978-3-319-21903-5
(2016).
6.
Frank
Nielsen
"Chapter
8:
Hierarchical
Clustering".
Introduction
to
HPC
with
MPI
for
Data
Science
ISBN
978-3-319-21903-5
(2016).
Кирилл
Валерьевич
Ткачёв
–
мл.
науч.
сотр.
Института
вычислительной
математики
и
математической
геофизики
СО
РАН;
email: