Стохастическая модель протокола BitTorrent
Ключевые слова: протокол BitTonent, пиринговая сеть, математическая модель, система стохастических
дифференциальных уравнений, среднее время загрузки данных
Парадигмы централизованных и пиринговых коммуникаций исторически сменяют друг друга по мере развития компьютерного оборудования и телекоммуникационных сетей. Сейчас популярны пиринговые методы передачи, позволяющие перемещать большие объемы данных не расширяя возможности существующих линий пермшефдашкуедачи данных. Одним из наиболее распространенных протоколов пиринговых сетей является протокол типа ВіґГогтепІ Основная цель данного протокола — раздать файл как можно большему количеству участников таким образом, чтобы во время распространения доступность файла не уменьшалась. Предложена математическая модель распространения данных по протоколу типа ВіґГогтепІ, построенная с помощью аппарата стохастических дифференциальных уравнений. Модель описывает процесс распространения на большое число компьютеров (рабочих станций пользователей) дисплейного класса заранее подготовленного файла образа операционной системы и программного обеспечения. Модель позволяет проанализировать основные характеристики протокола — среднее число личеров, сидеров, среднюю пропускную способность системы и времени загрузки данных. Последняя характеристика особенно важна для анализа одного ив подходов к решению одной из основных задач системного администрирования - автоматизации процесса установки образа операционной системы и программного обеспечения на большое число рабочих мест пользователя за ограниченное время -а именно преимущество протокола ВіїТогтепІ перед другими возможными решениями задачи.
Кулябов Д.С.,
к.ф.-м.н., доцент кафедры систем телекоммуникаций РУДН, [email protected]
Королькова А.В.,
к.ф.-м.н., доцент кафедры систем телекоммуникаций РУДН, [email protected]
Зарядов И.С.,
к.ф.-м.н., старший преподаватель кафедры теории вероятностей и математической статистики РУДН, [email protected]
1. Введение
Пиринговые методы передачи, позволяющие перемещать большие объемы данных не расширяя возможности существующих линий передачи данных, представляют большой интерес для исследований [1-9]. Одним из наиболее распространенных протоколов пиринговых сетей является протокол ВкТоггсгП, позволяющий раздать файл как можно большему количеству участников таким образом, чтобы во время распространения доступность файла не уменьшалась.
Данная статья посвящена построению с помощью стохастических дифференциальных уравнений [3,10] математической модели распространения данных по протоколу типа ВИТоггст. Рассматривается процесс распространения на большое число компьютеров (рабочих станций пользователей) дисплейного класса заранее подготовленного файла образа операционной системы и программного обеспечения. Основная задача строящейся математической модели - с помощью аппарата стохастических дифференциальных уравнений с пуассоновским процессом получить по возможности аналитические выражения основных характеристик протокола - среднее число личеров, сидеров, среднюю пропускную способность системы и среднее время загрузки данных.
Структурно работа состоит из следующих разделов: раздел 2 посвящен постановке задачи, вводятся все основные используемые в работе обозначения, раздел 3 -сама модель, промежуточные и окончательные результаты, раздел 4 - заключение, список литературы.
2. Постановка задачи
Будем рассматривать в системе два типа пиров (peers)
— личеры (leechers) (пиры с неполным файлом) и сидеры (seeders) (пиры с полным файлом). Пусть с, и сf - число частей передаваемого файла, находящееся у /-го и j-го пиров в момент времени I, всего в системе в рассматриваемый момент времени t находится случайное число N(1) пиров. Величины с, и с принимают значения из
множества {0, 1, 2,..., М}, где М - общее число частей передаваемого файла.
Будем предполагать, что N(t) - пуассоновский процесс, описывающий число пиров в сеги в момент времени /.
Обозначим через Р вероятность того, что /'-й пир
получит хотя бы один недостающий кусок файла от у'-го пира. Вероятность Р имеет вид
1,
с j < Cj,
Cj
(1)
с, > с.
Стоит отметить, что для вероятности Р верно следующее неравенство:
Р,■ *1-1 —
М
Работа выполнена при частичной финансовой поддержке Министерства образования и науки Российской Федерации (проекты 879622013,14.U02.21.1874).
Введем следующие обозначения: Х(1) - число личе-ров в системе в момент времени /; К(/) - число сидеров в системе в момент времени /; Д(/) - интенсивность загрузки частей файла /-м пиром в момент времени 11,(г) - интенсивность отдачи частей файла /-м пиром в момент времени /; // — средняя интенсивность обмена данными для установленного соединения между двумя пирами (одинакова для всех возможных соединений); р - вероятность установления и поддержки соединения между двумя пирами (предполагается одинаковой для всех возможных соединений); В - максимальная пропускная способность установленного соединения (одинакова для всех возможных соединений).
Будем рассматривать два случая:
• нет ограничений на пропускную способность канала,
• наличие ограничений на максимальную пропускную способность канала.
3. Построение математической модели распространения данных по протоколу типа ВИТопе^ с помощью аппарата стохастических дифференциальных уравнений
3.1. Модель оценки средней загрузки
Если В = оо (нет ограничений на пропускную способность канала - широкополосный доступ к Интернету или малое число пиров в системе), то интенсивность загрузки Ц(/) можно представить в следующей форме:
ґмоу Л
р
Х(1)
Y(t)
( Х{1)
= PV
I +
W-' .
Zfy'+Zn/'
V У»! м ,
Границы для D(t):
р//Г(/)<Д.(/)<ды(Г( /)+*(/))•
Вычислим среднюю интенсивность загрузки M(Dt(t)) на i-м пире:
M(D,(t)) = pp
X(l)
I',
V /=|
\\
(2)
//
(4)
(5)
M
В
ZD,(0
V /=i / L
(6)
Используя тождество Вальда (М^Х> =М(У)М(Ху
где У-случайная величина, а X - независимые, одинаково распределенные случайные величины, У не зависит от X.), выражение (6) можно преобразовать к следующему виду:
(7)
Объединяя (2) и (7), можно записать общее выражение для средней интенсивности загрузки /-го пира:
(ХЦ) У\
М(£>(/))«тЫр//
Границы для средней загрузки M(D (/)): ppM(Y{t)) < < рр( M(X(t))+M(Y(t))).(3)
Если в сети есть ограничение на максимальную пропускную способность канала (например, файл раздается большому числу пиров), Т.е. б <00, то должно выполняться неравенство Di(t) + U,(/) — В■ На уровне всей сети данное ограничение имеет вид:
Mr) ЛГ(/) N0)
XA(/) + Z^(0^Zfi, = ^(/).
/=| 1=1 »=1
Запишем уравнение баланса:
NO) N(i)
ХОД = 1 ад.
/-1 i=l
Подставляя выражение (5) в (4), получим
N(1)
М(К(/)) + ЛУ
ч ^ У У ,
Объединяя выражения (3) и (8), можно записать граничные неравенства для средней загрузки:
ррМ(У(1))й М (ОД/))5т1п|/7//(Л/(А'(/)))+Л/(У(/))),у|.
(9)
которые в предположении о независимости и одинаковой распределенности интенсивностей зафузок ОД/) можно переписать в виде:
ррМ (К(/)) < М (0(/)) < шш | рр (М (Х«))) + Л/ (К(/))). ||.
(9’)
3.2. Стохастические дифференциальные уравнения, описывающие изменения числа личеров Х(1) и сидеров У(/) в системе
Составим дифференциальные уравнения, описывающие изменения числа личеров Х(1) и сидеров У(/) в системе:
АГ«>
ХОД
с1Х«) = с1М(1)-^Г)-----Л,
X*,
(10)
XV)
dY(t) = -
ІА (О
X(D
X sc>
-dt -yY(t)dt.
i=i X(l)
Здесь: V D (/) - объем информации, переданный
/=і
-V(/)
личерам; ^ .ус - объем данных, содержащийся у личем
ров, 5— размер передаваемого куска файла в битах; с//\/(Г) — интенсивность поступления новых личеров в
Х(1)
Ход
сеть; '"1
_jt - интенсивность перехода личеров в
Применим оператор математического ожидания к предыдущему выражению:
Х(1)
Хлг.
/=|
сидеры; у - интенсивность ухода сидеров из сети.
Упростим выражение (10), предположив, что
Х(1)
У с. л М ■ Тогда получим:
ы
ХО)
1Д(0
(IX N(1)--
-А,
(10’)
А"(/)
(1УЦ) *
аМ
-Ж-уУ(г)Ж.
Применим оператор математического ожидания к (10’):
і (т \
СІМ(Х(1))*ІІМ^(І))-—М\ У ОД/) ш,
ш ) (11)
с/М(У(0) *•-ЦМ ( X Щ0\Ж -уМ{У('))с/1.
Воспользуемся тождеством Вальда и получим систему дифференциальных выражений:
сШ(ХО)) * Л<//- — М(й(1))М{Х(!))(]!,
с!М( У(0) * М (0(0) М (Х(0)Ж - уМ (У(1))Ж.
(12)
Используя выражение (8) (учитываем возможные ограничения на пропускную способность соединений), получаем:
</Л/(Л’(г)) * КА
І^'І но\п)+м
М[ХЦ))А,
с/Л/( У(/)) *------тіп •{ /?//1 М()'(/)) + М
бМ
М(ХЦ))А-уМ(У(1))А.
(13)
С помощью выражения (9’) преобразуем систему уравнений (13) в систему неравенств:
М~т\п^(М{УМ+М(ХЦ))),!^М(Х«))А*<ітХЦ))<ї
іЛА-^-ЩГ0))М(Х0))А,
5Л1
Решим систему неравенств (15’). Для этого рассмотрим два случая: 1) у + X < /?, т.е. нет ограничений на пропускную способность соединения или мало пиров в сети и 2) р < У + X (есть ограничения на пропускную способность соединений или много пиров в сети).
3.4. Случай отсутствия ограничении на пропускную способность соединения.
Рассмотрим случай, когда У + X < /?, т.е. нет ограничений на пропускную способность соединения или мало пиров в сети.
Система неравенств (15’) преобразуется в следующую систему:
(А-а(У + Х)Х£0йА-аУХ,
\а?Х-уУ<0<а(У + Х)Х-уУ, которая, в свою очередь, записывается как две системы:
\А-а(У + Х)Х <0, и \ А-аУ Х>0,
\аУХ-уУ< 0, \а(У + Х)Х-уУ>0.
Решая эти системы, получим выражения для нахождения границ средних значений числа личеров и сидеров соответственно:
а
_ аХ _ а:Х3 +АаХ-уА> 0.
Л/(го))М (Х(г))А - уМ (Г</))<* < </.*/( П1))<
5 М
5-^тіп|ди(А/(К(/))+Л/(^(/))),||,і/(ДГ(/))Л-^(Г(/))Л.
(И)
3.3. Стационарный режим
Переходя к стационарному режиму, система дифференциальных неравенств (14) преобразуется в систему неравенств:
А—^—т\п\ри(У + Х),-\х <0<А--^-У X,
I і ’ 2) і Л/ (15)
— УХ-уУ<0< — тіпІр//(У + Х),—їх-уУ.
•ігЛ/ лЛ/ [ ' 2)
Здесь у = Л/(У(0)> а X = М{Х(!)).
Введя обозначения а=£Е. и п- ° . систему (15) «М 2 цр
можно переписать в виде:
А-ат\п{У + Х,р)Х <0<А-аУ X, (15^
аУХ-уУ<0<ат\п{?+Х,р)Х-уУ.
3.5. Случай наличия ограничения на пропускную способность соединений
Пусть теперь У + X > р, т.е. существуют ограничения на пропускную способность соединений или много пиров в сети.
Система неравенств (15’) преобразуется в следующую систему:
[А-арХ <0<А-аУ X, \аУХ-уУ<0<рХ-уУ, которая снова представляется в виде двух систем: \А-арХ< 0, и |0 <А-аУХ,
\аУХ-уУ< 0, [0 <рХ-уУ.
Решая системы, получим границы для средних значений числа личеров и сидеров соответственно:
[ А /Ту} - у
тах<—, ——\<Х < —,
I ар \ ар а
у< №.
1 ау
Используя теорему Литтла, можно получить среднее
— — X
время загрузки файла Т:1 как Т(1 = —, а точнее говоря,
А
границы изменения среднего времени загрузки файла личером.
4. Заключение
Данная работа является лишь началом исследования авторов по данной тематике, поэтому в некоторых разделах сформулированы лишь начальные результаты.
С помощью аппарата стохастических дифференциальных уравнений построена математическая модель распространения данных по протоколу типа BitTorrent, описывающая процесс распространения на большое число компьютеров (рабочих станций пользователей) дисплейного класса заранее подготовленного файла образа операционной системы и программного обеспечения.
Хотя полученная модель не ограничена по количеству хостов, она вполне адекватно может описывать задачу с ограниченным количеством узлов в предположении, что стационарный режим достигается прежде, чем будут исчерпаны личеры. Это предположение может работать, например, в случае, если наличествующее число хостов выбирает всю пропускную способность сети.
Получены аналитические выражения для границ среднего числа личеров, сидеров, а также выражения средней пропускной способности системы и времени загрузки данных.
Литература
1. А. Адаму, Ю.В. Гайдамака. Анализ вероятности непрерывного воспроизведения видеопотока в Р 2 Р -сети // «Вестник РУДН. Серия «Математика. Информатика. Физика».»
- М.: Изд-во РУДН. - 2011. - №4. - С. 38-46.
2. Aminu Adamu. Yuliya Gaidamaka. and Andrey Samuylov Discrete Markov Chain Model for Analyzing Probability Measures
of P2P Streaming Network // Lecture Notes in Computer Science. -Germany, Heidelberg: Springer. - 2011.— Vol. 6869. Pp. 428-439.
3. B. Fan. D.-M. Chiu, and J. Lui. “Stochastic differential equation approach to model bittorrent-like file sharing systems,” in Proc. of 14'1' IEEE International Workshop on Quality of Service, 2006
4. L. Guo. S. Chen. Z. Xiao, E. Tan. X. Ding, and X. Zhang, “A performance study of bittorrent-like peer-to-peer systems,” in IEEE Journal on Selected Areas in Communications, vol. 25, no. 1, January 2007
5. Y. Tian, D. Wu, and K. Ng, “Modeling, analysis and improvement for bittorrent-like file sharing networks,” in Proc. of IEEE INFOCOM, 2006.
6. Wei-Cherng Liao, Fragkiskos Papadopoulos, Konstanti-nos Psounis Performance Analysis of BitTorrent-like Systems with Heterogeneous Users http://www-scf.usc.edu/~weicherl/paper/ bttech_final.pdf.
7. B. Fan. D.-M. Chiu, and J. C. S. Lui, “Performance modeling of bittorrent-like file sharing systems,” Dept, of Computer Sci. and Eng. , the Chinese University of Hongkong, Tech. Rep., Nov 2005.
8. D. Qiu and R. Srikani, “Modeling and performance analysis of bittorrent-like peer-to-peer networks,” in Proc. ACM SIG-COMM, 2004.
9. X. Yang and G. de Veciana, “Service capacity of peer to peer networks,” in Proceedings of IEEE INFOCOM, 2004.
10. R. Brocket!, “Stochastic control,” Harvard University, lecture notes.
The stochastic model of Bittorent protocol
Kulyabov D.S., PhD, associate professor, telecommunication systems department, PFUR, [email protected] Korolkova AV. PhD, associate professor, telecommunication systems department, PFUR, [email protected] Zaryadov I.S., PhD, assistant professor, probability theory and mathematical statistics department, PFUR, [email protected]
Abstract
Paradigms of centralized and peer-to-peer communications historically follow each other with the development of the computer equipment and telecommunications networks. The peer-to-peer methods of data transmission that enable the movement of large amounts of data without expanding the capacity of existing transmission lines are popular now. The BitTorrent protocol is one of the most common protocols of peer-to-peer networks. The main task of the protocol is to distribute the file to the greatest number of peers without reducing the file accessibility. In this paper the mathematical model of data transmission by BitTorrent-like protocol based on stochastic differential equations is presented. The model describes the distribution of operation system and software image file among a high number of computers (workstations) in a display class. The proposed model allows analyze such main protocol characteristics as the mean value of leechers and seeders in the system, average throughput of the system and data loading time. The last characteristic is very important for the analysis of one of the approaches of solving one of the main tasks of system administration - the automation of the process of operation system and software installation on high number workplaces in the limited time - that is the advantage of the BitTorrent protocol over other possible solutions of the problem.
Keywords: BitTorrent protocol, peer-to-peer network, mathematical model, system of stochastic differential equations, means data download time.