Научная статья на тему 'Распределение логарифма сложности индивидуальных задач коммивояжера при фиксированной длине входа'

Распределение логарифма сложности индивидуальных задач коммивояжера при фиксированной длине входа Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
111
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА КОММИВОЯЖЕРА / TSP / МЕТОД ВЕТВЕЙ И ГРАНИЦ / МВГ / РЕСУРСНАЯ ЭФФЕКТИВНОСТЬ / СЛОЖНОСТЬ ИНДИВИДУАЛЬНОЙ ЗАДАЧИ / КВАНТИЛЬ / КВАНТИЛЬНЫЙ КОЭФФИЦИЕНТ АСИММЕТРИИ / КВАНТИЛЬНЫЙ КОЭФФИЦИЕНТ ЭКСЦЕССА

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Головешкин Василий Адамович, Жукова Галина Николаевна, Ульянов Михаил Васильевич, Фомичев Михаил Игоревич

На основе статистического анализа сложности индивидуальной задачи коммивояжера, решаемой методом ветвей и границ, показано, что распределение логарифма сложности удовлетворительно аппроксимируется нормальным распределением. Коэффициенты линейной регрессии выборки логарифма сложности на стандартное нормальное распределение использовались для оценки значений параметров аппроксимирующего нормального распределения. Даны оценки границ 90% интервала сложности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Головешкин Василий Адамович, Жукова Галина Николаевна, Ульянов Михаил Васильевич, Фомичев Михаил Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Распределение логарифма сложности индивидуальных задач коммивояжера при фиксированной длине входа»

УДК 519.854.2

Головешкин В.А.1, Жукова Г.Н.2, Ульянов М.В.3, Фомичев М.И.4

1 Московский государственный университет информационных технологии, радиотехники и

электроники (МИРЭА), г. Москва, Россия 2 Московскии политехническии университет (МПУ), г. Москва, Россия 3 Институт проблем управления РАН им. В.А. Трапезникова, г. Москва, Россия 4 ФКН НИУ Высшая школа экономики, г. Москва, Россия

РАСПРЕДЕЛЕНИЕ ЛОГАРИФМА СЛОЖНОСТИ ИНДИВИДУАЛЬНЫХ ЗАДАЧ КОММИВОЯЖЕРА ПРИ ФИКСИРОВАННОЙ ДЛИНЕ ВХОДА

АННОТАЦИЯ

На основе статистического анализа сложности индивидуальной задачи коммивояжера, решаемой методом ветвей и границ, показано, что распределение логарифма сложности удовлетворительно аппроксимируется нормальным распределением. Коэффициенты линейной регрессии выборки логарифма сложности на стандартное нормальное распределение использовались для оценки значений параметров аппроксимирующего нормального распределения. Даны оценки границ 90% интервала сложности.

КЛЮЧЕВЫЕ СЛОВА

Задача коммивояжера; TSP; метод ветвей и границ; МВГ; ресурсная эффективность; сложность индивидуальной задачи; квантиль; квантильный коэффициент асимметрии; квантильный коэффициент эксцесса.

Goloveshkin V. A.1, Zhukova G.N.2, Ulyanov M.V.3, Fomichev M.I.4

1 Moscow Technological University (MIREA), Moscow, Russia 2 Moscow Polytechnic University (MPU), Moscow, Russia 3 Institute of Control Sciences V. A. Trapeznikov Academy of Sciences, Moscow, Russia 4 Higher School of Economics National Research University, Moscow, Russia

PROBABILITY DISTRIBUTION OF THE COMPLEXITY OF THE INDIVIDUAL TRAVELING SALESMAN PROBLEM (FIXED NUMBER OF NODES)

ABSTRACT

It is shown that the logarithm of the complexity (number of nodes in the decision tree of a branch and bound algorithm) of the individual traveling salesman problem is approximately normally distributed. We use a linear regression model (logarithm of the complexity — standard normal distribution) to estimate parameters of normal distribution, which fit the sample. Borders of the interval, which contains 90% of the sample of the logarithm of the complexity, are also given.

KEYWORDS

Traveling salesman problem; TSP; branch and bound method; B&B; complexity; efficiency; quantile; quantile skewness; quantile kurtosis.

Метод ветвеи и границ [5] — один из наиболее распространенных методов точного решения задачи коммивояжера [1-3,5,7] (TSP, traveling salesman problem), корректно формулируемои как задача поиска минимального по сумме весов дуг гамильтонова цикла в полном графе. Время, которое требуется компьютернои программе, реализующеи этот метод, для нахождения решения задачи коммивояжера, существенно зависит от размерности и особенностеи матрицы стоимостеи задачи [12,14,15]. С физическим временем, затраченным на точное решение TSP методом ветвеи и границ связана такая независимая от программнои реализации характеристика индивидуальнои задачи как сложность. Под сложностью индивидуальнои задачи мы понимаем число порожденных вершин поискового дерева решении [5] в классическом алгоритме, реализующем метод ветвеи и границ [1,2].

Вычислительныи эксперимент проводился для задачи коммивояжера размерности 30. Матрица стоимостеи для индивидуальнои задачи получается на основе исходнои матрицы A,

элементами а. которой является стоимость в долларах США наиболее дешевого перелета для 1 взрослого человека из / аэропорта в j аэропорт (данные получены на сайте kayak.com). В случае отсутствия прямого реиса в качестве стоимости перелета использовалась минимальная цена перелета с пересадками, наиденная на том же саите.

В качестве элементов матрицы стоимостеи индивидуальнои TSP использовались нормально распределенные случаиные величины X . ~ N (а., о у ), параметр о у = Ка. , где

К = 0.1, К = 0.5 , а также равномерно распределенные на отрезке [0.5а.,1.5а.] случаиные

величины (с округлением до целых чисел), что порождает индивидуальные задачи трех типов.

Для каждого типа задач коммивояжера объем выборки (число экспериментов) для

получения статистически значимых результатов был выбран равным 105. Полученные при проведении вычислительных экспериментов значения сложности индивидуальных задач были использованы для подбора вероятностного распределения, удовлетворительно описывающего распределение величины т — десятичного логарифма сложности. Расчеты показали, что в качестве приближения для вероятностного распределения т можно использовать нормальное распределение.

Для предварительного анализа данных для выборки каждого из трех типов были вычислены выборочные коэффициенты асимметрии и эксцесса [4,11,13], как для всеи выборки

объема 105, так и для ее первои и второи половины и для каждои четверти. На рис. 1 в системе координат коэффициент асимметрии-коэффициент эксцесса черным ромбом изображается точка, соответствующая выборочным коэффициентам асимметрии и эксцесса для выборки объема 105, синии и голубои кружок соответствуют первои и второи половине выборки, треугольники -четвертям выборки. Нормальные случаиные величины имеют равные нулю коэффициенты асимметрии и эксцесса, что изображает фиолетовыи ромб в начале координат. Для большеи наглядности на рис. 1 также изображены точки, соответствующие выборкам из нормального распределения, полученным генератором псевдослучаиных чисел (желтые точки для выборок

5 4

объема 10 , голубые - 2.5 • 10 ).

а) N(а.= 0.1а.) б) N(а.= 0.5а.) в)равномерное [0.5а.,1.5а.]

Рис. 1. Коэффициенты асимметрии и эксцесса

Выборочныи коэффициент асимметрии больше 0.1, а коэффициент эксцесса достигает 0.9, что вызывает сомнение в том, что нормальное распределение удовлетворительно описывает выборку. Однако квантильные выборочные коэффициенты асимметрии и эксцесса [13] показывают на достаточную близость исследуемого распределения к нормальному (см. рис. 2). Ввиду того, что квантили практически не меняются при добавлении в выборку очень малого числа больших значении, а традиционные коэффициенты асимметрии и эксцесса очень чувствительны к наличию в выборке редких, но больших значении, принимаем гипотезу о нормальном распределении логарифма сложности.

Приведем формулы квантильных коэффициентов асимметрии £ и эксцесса Т:

^ = (е6 - 2 е4+Е2 ) /(Е6 - Е2 ), Т = Е - Е,+Ез - Е) / (Е6 - Е2 ),

где Е: = р:/8 = F-1 (//8), / = 1,2,...,7 октили непрерывнои функции распределения F(х) [8-10]. Выборочные квантильные коэффициенты асимметрии и эксцесса вычисляются по аналогичным формулам, вместо Е используются выборочные квантили.

Квантильные коэффициенты асимметрии и эксцесса выборок логарифма сложности

примерно такие же, какие наблюдаются у выборок того же объема из стандартного нормального распределения (рис. 2), обозначения такие же, как на рис. 1.

а) N(а ..,ан = 0.1а..) б) N(а ..,ан = 0.5а..) в)равномерное [0.5а..,1.5а..]

У У У У У У У У

Рис. 2. Квантильные коэффициенты асимметрии и эксцесса Как видно на рис. 2, выборочные квантильные коэффициенты асимметрии и эксцесса исследуемых выборок принимают значения из области, в которую попадают те же коэффициенты для выборок того же объема, взятых из стандартного нормального распределения.

Графическое представление данных - гистограммы и графики

Вычислим параметры k и Ь линеинои регрессии выборочных квантилеи на квантили стандартного нормального распределения

ЯГ,™ = кЧР + Ь

Значения параметров k и Ь , а также коэффициента регрессии г приведены в табл. 1.

Табл. 1 Параметры линейной регрессии стандартного нормального

распределения на выборки

Выборка Регрессия ст. норм. на выборку Регрессия выборки на ст. норм.

К Ь0 Г0 к, Ь Г1

N (а. ,0.1а.) 0.288 2.846 0.9997 3.468 -9.868 0.9997

N (а. ,0.5а.) 0.360 2.636 0.9998 2.778 -7.324 0.9998

равномерн. [0.5а. ,1.5а. ] 0.352 2.904 0.9997 2.839 -8.244 0.9997

Отметим, что линии регрессии стандартного нормального распределения на выборки и выборок на стандартное нормальное распределение практически совпадают.

Применим к выборке линеиное преобразование L : Lx = kx + Ь с вычисленными значениями

параметров k 1 и Ь\ (см. табл. 1.), затем для преобразовании выборки построим гистограммы с п интервалами, в каждыи из которых значение случаинои величины со стандартным нормальным распределением попадает с вероятностью 1/п. Для сравнения изобразим на гистограмме плотность стандартного нормального распределения (см. рис. 3, красная линия).

Как видно, гистограмма удовлетворительно аппроксимирует плотность стандартного нормального распределения в случае каждой из трех выборок.

а) N (а.., а .. = 0.1а..) б) N (а.., а .. = 0.5а..) в) равномерное [0.5а.. ,1. 5а.. ]

У У У У У У У У

Рис. 3. Гистограммы линейно преобразованных выборок

Изобразим на графике (рис. 4) точки (я81ПОГт, Я), где Я81ПОГт квантиль стандартного нормального распределения, Я - квантиль выборки, элементы которои равны сложности решения

индивидуальнои задачи коммивояжера с элементами платежной матрицы вида N (а у, о у = 0.1а. ) , уровень квантилей принимает значения из (0,1).

Рис. 4. Q-Q plot (график квантилей)

Как видно из рис. 4, самые большие и самые маленькие значения в выборке наблюдаются несколько чаще, чем это характерно для нормального распределения, в целом же нормальное распределение можно считать удовлетворительным приближением.

Уточнение параметров распределения выборки

Определив, что нормальное распределение достаточно хорошо описывает распределение логарифма сложности индивидуальных задач коммивояжера при их решении классическим алгоритмом методом ветвеи и границ (при фиксированнои длине входа), подберем параметры распределения, согласующиеся с выборкои.

Грубую оценку параметров можно провести по методу моментов, точечные оценки и доверительные интервалы приведены в табл. 2.

Более робастные оценки можно получить с использованием квантилеи, в качестве оценки параметра a используем выборочную медиану. Параметр и оценим, используя линеиное

преобразование выборки L : Lx = kx + b , при котором интерквантильньш размах Eg — E2

преобразованнои выборки равен интерквантильному размаху стандартного нормального

*

распределения. Учитывая, что при линеином преобразовании новые выборочные квантили E, равны

E j = kEt + b,

получим

E* — E*

k = 6 ^2

E6 — E2

(1)

В качестве оценки параметра о используем k, значения, вычисленные для каждои из трех выборок также приведены в табл. 2.

Табл. 2 Оценки параметров нормального распределения

выборка a <J

Выбороч Доверит. Выборочн Выборочное Доверит. отношение

ное интервал .медиана среднеквадр интервал интеркванти

среднее атическое отклонение льных размахов

N (a, ,0.1a.) 2.849 (2.847, 2.850) 2.842 0.291 (0.290, 0.292) 0.289

N (a, ,0.5a.) 2.638 (2.636, 2.640) 2.631 0.359 (0.358, 0.361) 0.359

равномерн. [0.5a. ,1.5a. ] 2.906 (2.904, 2.908) 2.899 0.352 (0.351, 0.353) 0.352

Как видно из табл. 2, значения параметров, вычисленные по методу моментов и с помощью квантилеи, очень близки.

Оценка границ интервала, в который попадает более 90% выборки

Примерно 99.7% выборки (достаточно большого объема) из нормального распределения

попадает в интервал (а—3с,а+3о), 99.99% попадает в интервал (а—4а,а+4а), далее будем называть

эти интервалы соответственно 3а и 4а. Границы интервалов 3а и 4а, минимальное и максимальное значения в выборке, а также доля выборки, попавшеи в эти интервалы, приведены в табл. 3. Для удобства приведены сами значения сложности, а не их десятичные логарифмы. Интервал 90% обозначает интервал между 5% и 95% квантилями, так что примерно 5% выборки попадает левее этого интервала и 5% правее.

Табл. 3. Границы выборки и интервалов 90%, 3а и 4а

выборка

Минимум в выборке Максимум в выборке 90% интервал 3а интервал 4а интервал

N (а. ,0.1а.) 69 248428 (200;2100) (100;5300), 99,58% (50;10300), 99,91%

N (а. ,0.5а.) 57 34531 (100;1700) (30;5200), 99,79% (20;12000), 99,99%

равномерн. [0.5а. ,1.5а. ] 57 92869 (200;3100) (70;9200), 99,74% (30;20600), 99,98%

Сравнивая максимальное значение сложности в выборке с правои границеи 90% интервала, видим отличие до 100 раз, правая граница интервала 3а почти в 3 раза больше правои границы 90% интервала и примерно в 2 раза меньше правои границы интервала 4а. Таким образом, основная часть выборки сложности принимает значения до 2000-3000, и лишь около 5% выборки превосходит 2000, причем больше 5000 в выборке наблюдается менее чем в 0.5% случаев, а более 10000 бывает реже 0.1% (в случае нормально распределенных элементов).

Отметим, что правые границы 90% интервала и интервалов 3а и 4а в случае равномерно распределенных элементов матрицы стоимости примерно в 2 раза больше, чем при нормально распределенных стоимостях перелетов.

Уточнение параметров распределения

Будем рассматривать «слишком большие» и «слишком маленькие» значения, не попавшие в интервал 3а и 4а, как исключения из правила, погрешность эксперимента и т.п. Исключим такие значения из выборки и по полученнои новои выборке вычислим медиану, среднее и среднеквадратическое отклонение, а также отношение интерквантильных размахов выборки и стандартного нормального распределения, коэффициенты асимметрии и эксцесса, в том числе квантильные. Результаты расчетов приведены в табл. 4 и 5.

Табл. 4 Характеристики усеченной выборки (медиана, среднее, среднеквадратическое отклонение)

выборка а а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

исходная усеченна я исходная усеченна я исходная усеченная

N (а. ,0.1а.) 2.842 2.841 2.849 2.845 0.291 0.283

N (а. ,0.5а.) 2.631 2.630 2.638 2.635 0.359 0.355

равномерн. [0.5а. ,1.5а. ] 2.899 2.898 2.906 2.904 0.352 0.347

Табл. 5 Характеристики усеченной выборки (коэффициенты асимметрии и эксцесса)

выборка К-т асимметрии К-т эксцесса Квантильный к-т асимметрии Квантильньш к-т эксцесса

исходн. усеч. исходн. усеч. исходн. усеч. исходн. усеч.

N (а. ,0.1а.) 0.26 0.09 0.63 -0.18 0.006 0.006 1.232 1.229

N (а. ,0.5а.) 0.13 0.07 -0.04 -0.20 0.015 0.015 1.225 1.226

равномерн. [0.5а. ,1.5а. ] 0.14 0.08 0.04 -0.17 0.012 0.012 1.234 1.236

Как видно из табл. 4. и 5. «усеченная выборка» имеет более близкие к теоретическим значения традиционных коэффициентов асимметрии и эксцесса, квантильные коэффициенты асимметрии и эксцесса практически одинаковы у исходнои и усеченнои выборок.

Таким образом, удовлетворительным приближением для вероятностного распределения

логарифма сложности индивидуальных задач коммивояжера классическим алгоритмом метода ветвей и границ можно считать нормальное распределение с параметрами a и о, равными соответственно выборочнои медиане и отношению интерквантильных размахов (1) или коэффициентам bo и ko линеинои регрессии стандартного нормального распределения на выборку (см. табл. 1).

Заключение

Показано, что логарифм сложности решения задачи коммивояжера методом ветвеи и границ (в случае платежнои матрицы с нормально или равномерно распределенными элементами) можно считать нормально распределенным, оценки параметров можно получать на основе параметров линеинои регрессии стандартного нормального распределения на выборку.

Поскольку тип аппроксимирующего распределения логарифма сложности оказался одинаковым в случае нормально и равномерно распределенных элементов платежнои матрицы, возможно, класс распределении элементов платежнои матрицы, приводящии к нормальному распределению логарифма сложности, содержит еще какие-то типы распределении.

Работа выполнена при поддержке гранта РФФИ №16-07-160.

Литература

1. Dantzig G. B., Fulkerson R., Johnson S. Solution of a large scale traveling salesman problem. Technical Report P-510. RAND Corporation, Santa Monica, California, USA. - 1954.

2. Dantzig, G. B., Fulkerson D. R., Johnson S. M. «On a linearprogramming, combinatorial approach to the traveling-salesman problem» // Operations Research 1959. №7, pp. 58-66.

3. Eastman, W. L. Linear Programming with Pattern Constraints. Ph.D. Thesis. Department of Economics, Harvard University, Cambridge, Massachusetts, USA. - 1958.

4. Jonhnson N.L., Kotz S., and Balakrishnan N. Continuous Univariate Distributions. Vol. 2, Wiley, 1995.

5. Knuth, D. E. «Estimating the efficiency of backtracking programs» // Mathematics of Computing, 1975. Vol. 29, pp. 121-136.

6. Land, A. H., Doig A. G. «An automatic method of solving discrete programming problems» // Econometrica 1960. №28, pp. 497-520.

7. Little, J. D. C., Murty K. G., Sweeney D.W., Karel C. «An algorithm for the traveling salesman problem» // Operations Research, 1963. №11, pp. 972-989.

8. Moors J. J. A. A quantile alternative for kurtosis// The Statistician, 1988. Vol. 37, pp. 25-32.

9. Moors J. J. A., Coenen V. M. J., Heuts R. M. J. «Limiting distributions of moment- and quantile-based measures for skewness and kurtosis». School of Economics and Management, Tilburg University, Res. Mem. FEW 620, 1993.

10. Moors J. J. A., Wagemakers R. Th. A., Coenen V. M. J., Heuts R. M. J., Janssens M. J. B. T. «Characterizing systems of distributions by quantile measures» // Statistica Neerlandica, 1996. Vol. 50, № 3, pp. 417-430.

11. Pearson, K. «Contributions to the Mathematical Theory of Evolution. III. Regression, Heredity and Panmixia» // Philosophical Transactions of the Royal Society of London, 1896. 187, pp. 253-318.

12. Головешкин В.А., Жукова Г.Н., Ульянов М.В., Фомичев М.И. «Сравнение ресурсных характеристик традиционного и модифицированного метода ветвей и границ для TSP» // Современные информационные технологии и ИТ-образование, 2015. Т. 2, № 11. С. 151-159.

13. Крамер Г. Математические методы статистики. — М.: Мир, 1975. — 648 с.

14. Ульянов М.В., Фомичев М.И. «Ресурсные характеристики способов организации дерева решений в методе ветвей и границ для задачи коммивояжера» // Бизнес - информатика, 2015. № 4 (34). С. 38-46.

15. Ульянов М.В. Ресурсно-эффективные компьютерные алгоритмы. Разработка и анализ. — М.: ФИЗМАТЛИТ, 2008. — 304 с.

References

1. Dantzig G. B., Fulkerson R., Johnson S. Solution of a large scale traveling salesman problem. Technical Report P-510. RAND Corporation, Santa Monica, California, USA. - 1954.

2. Dantzig, G. B., Fulkerson D. R., Johnson S. M. «On a linearprogramming, combinatorial approach to the traveling-salesman problem» // Operations Research 1959. №7, pp. 58-66.

3. Eastman, W. L. Linear Programming with Pattern Constraints. Ph.D. Thesis. Department of Economics, Harvard University, Cambridge, Massachusetts, USA. - 1958.

4. Jonhnson N.L., Kotz S., and Balakrishnan N. Continuous Univariate Distributions. Vol. 2, Wiley, 1995.

5. Knuth, D. E. «Estimating the efficiency of backtracking programs» // Mathematics of Computing, 1975. Vol. 29, pp. 121-136.

6. Land, A. H., Doig A. G. «An automatic method of solving discrete programming problems» // Econometrica 1960. №28, pp. 497-520.

7. Little, J. D. C., K. G. Murty, D.W. Sweeney, C. Karel «An algorithm for the traveling salesman problem» // Operations Research, 1963. №11, pp. 972-989.

8. Moors J. J. A. A quantile alternative for kurtosis// The Statistician, 1988. Vol. 37, pp. 25-32.

9. Moors J. J. A., Coenen V. M. J., Heuts R. M. J. «Limiting distributions of moment- and quantile-based measures for skewness and kurtosis». School of Economics and Management, Tilburg University, Res. Mem. FEW 620, 1993.

10. Moors J. J. A., Wagemakers R. Th. A., Coenen V. M. J., Heuts R. M. J., Janssens M. J. B. T. «Characterizing systems of distributions by quantile measures» // Statistica Neerlandica, 1996. Vol. 50, № 3, pp. 417-430.

11. Pearson, K. «Contributions to the Mathematical Theory of Evolution. III. Regression, Heredity and Panmixia» // Philosophical Transactions of the Royal Society of London, 1896. 187, pp. 253-318.

12. Goloveshkin V.A., Zhukova G.N., Ul'yanov M.V., Fomichev M.I. «Sravnenie resursnykh kharakteristik traditsionnogo i modifitsirovannogo metoda vetvey i granits dlya TSP» // Sovremennye informatsionnye tekhnologii i IT-obrazovanie, T. 2, № 11, 2015, S. 151-159.

13. Kramer G. Matematicheskie metody statistiki. M.: Mir, 1975. — 648 s.

14. Ul'janov M.V., Fomichev M.I. «Resursnye harakteristiki sposobov organizacii dereva reshenij v metode vetvej i granic dlja zadachi kommivojazhera» // Biznes - informatika, 2015. № 4 [34]. S. 38-46

15. Ul'janov M.V. Resursno-jeffektivnye komp'juternye algoritmy. Razrabotka i analiz. — M.: FIZMATLIT, 2008. — 304 s.

Поступила: 10.10.2016

Об авторах:

Головешкин Василий Адамович, д.т.н., профессор Московского государственного университета информационных технологий, радиотехники и электроники (МИРЭА), [email protected];

Жукова Галина Николаевна, к.ф.-м.н., доцент Московского политехнического университета (МПУ), [email protected];

Ульянов Михаил Васильевич, д.т.н., профессор, ведущий научный сотрудник Института проблем управления РАН им. В.А. Трапезникова, [email protected];

Фомичев Михаил Игоревич, студент магистратуры ФКН НИУ Высшая школа экономики, [email protected].

i Надоели баннеры? Вы всегда можете отключить рекламу.