<Тешетневс^ие чтения. 2016
УДК 519.6
ГЕНЕТИЧЕСКИЙ АЛГОРИТМ С ЖАДНОЙ ЭВРИСТИКОЙ ДЛЯ РЕШЕНИЯ СЕРИИ ЗАДАЧ
М. Н. Гудыма*, В. И. Орлов, Л. А. Казаковцев
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected]
Рассматривается задача автоматической группировки электрорадиоизделий космического применения по производственным партиям. Предложен генетический алгоритм с жадной эвристикой для решения серии задач. Алгоритм проверен экспериментально, проведено сравнение с другими распространенными алгоритмами.
Ключевые слова: алгоритмы кластеризации, электрорадиоизделия, автоматическая группировка.
GENETIC ALGORITHM WITH GREEDY HEURISTICS FOR SOLVING SERIES OF PROBLEMS
M. N. Gudyma*, V. I. Orlov, L. A. Kazakovtsev
Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]
In this paper we consider a problem of automatic grouping of spaceship electronic components by producing a batch. We propose a genetic algorithm with greedy heuristics for solving series of problems. Algorithm is experimentally tested and compared with other popular algorithms.
Keywords: clustering algorithm, electronic components, automatic grouping.
С целью повышения надежности и срока службы космических аппаратов в последние годы внедряется новый принцип комплектования аппаратуры через специализированные испытательные технические центры [1] с проведением операций сплошного входного контроля электрорадиоизделий (ЭРИ), дополнительных отбраковочных испытаний (ДОИ), диагностического неразрушающего контроля (ДНК) с применением выборочного разрушающего физического анализа (РФА).
Цель проведения разрушающего анализа - выявление в партиях изделий дефектов, влияющих на устойчивость к тепловым и радиационным нагрузкам. Для того чтобы распространять результаты проведенного анализа на всю поступившую партию, нужно быть уверенными в том, что мы имеем дело действительно с единой партией ЭРИ, изготовленной из единой партии сырья. Поэтому выявление истинных производственных партий из предположительно сборных партий ЭРИ является одним из важнейших мероприятий при проведении испытаний.
Некоторые подходы к выявлению однородных партий рассмотрены в [2]. При этом показано, что применение метода ¿-средних для обработки результатов ДОИ и ДНК позволяет выявлять однородные производственные партии.
Задача ¿-средних может быть классифицирована как задача теории размещения [3]. Целью является нахождение к точек (центров, центроидов) Х1, ..., Хк в ^-мерном пространстве, таких, чтобы сумма квадра-
тов расстояний от известных точек (векторов данных) A1, ..., An до ближайшей из искомых точек достигала минимума:
En И ц2
, min \\X; - АЛ .
'=1 MW II J Jll
В нашем случае векторами данных являются векторы характеристик ЭРИ: один вектор соответствует одному экземпляру ЭРИ в сборной партии, а размерность пространства соответствует числу параметров (характеристик), получаемых в ходе неразрушающих испытаний.
Большинство алгоритмов для решения задачи ¿-средних и р-медианной задачи, таких как ALA-процедура или генетический алгоритм с рекомбинацией подмножеств фиксированной длины [3], требуют, чтобы число кластеров p было известно. Другие алгоритмы, как, например, X-means [4; 5], выбирают наилучшее значение p в соответствии со специальным критерием. Выбор адекватного критерия - отдельная сложная задача. В данной статье предложена простая модификация жадной эвристики: после достижения требуемого числа кластеров p процесс исключения кластеров продолжается, и алгоритм продолжает фиксировать наилучшие известные значения целевой функции для каждого числа кластеров вплоть до 2 кластеров. Таким образом, мы можем получить решения серии задач с ре {2, pmax}. При этом максимальное предполагаемое значение числа кластеров pmax все же должно быть известно.
Математические методы моделирования, управления и анализа данных.
Генетический алгоритм с жадной эвристикой для решения серии задач с ре {2, pmax}:
1. Инициализация популяции из Npop особей. Каждая особь является множеством из pmax центров (обозначим их X). Присвоить Fnewj = +» для каждого je{1, Npop}. Инициализировать массивы значений целевой функции F k = +» и лучших решений X k = {} для каждого ке {2, pmax}.
2. Выбрать случайным образомji,j2e [1, N], ji^j2.
3. Xnew = Xj1 U Xj2 .
4. Пока \Xnew\ > pmax:
4.1. Выбрать элемент j такой, чтобы его исключение давало наименьший прирост целевой функции:
j = arg ШШ F(Xnew \{j}). jeXnew
4.2. Xnew=Xnew\{j}. Следующая итерация 4.
5. Присвоить Fnew = 0; X = Xnew.
6. Пока \Xnew\ > 2:
6.1. Присвоить Fnew = Fnew + ./(Xnew)'; к = Xnew\' Fk=f(Xnew); если Fk < F*k, то присвоить F*k = Fh
6.2. Выполнить шаги 4.1 и 4.2 для Xnew. Следующая итерация 6.
7. Выбрать j3 с использованием турнирной селекции по значению Fnew,j. Присвоить
F = F •
j new
Хз = Х ' F
. = F .
new. J3 new
8. Проверить условия останова, перейти к шагу 2.
В таблице показано, что алгоритм с жадной эвристикой демонстрирует более качественные результаты по сравнению с другими алгоритмами и перспективен для разработки систем обеспечения качества электрорадиоизделий космического применения.
Сравнительные результаты вычислительных экспериментов
Набор данных, его параметры p и мера расстояния Алгоритм Средний результат
Отбрак. испытания микросхемы 1526ТЛ1, N = 1234 p = 14, l22 ALA ГА ФП+ALA ГА ЖЭС+ALA 150,124869801 149,954679652 149,78736565*
UCI Mopsi Joensuu, N = 6014 P = 10, l2 ALA ГА ФП+ALA ГА ЖЭС+ALA 359,680203232 359,545250068 359,410460803*
BIRCH-3, N = 100000 p = 100, l22 ALA ГА ФП+ALA ГА ЖЭС+ALA 3,7513245-1013 3,7711179' 1013 3,740432-1013*
Примечание. ALA - мультистарт процедуры ^-средних (ALA-процедуры); ГА ФП+ALA - ГА с рекомбинацией подмножеств фиксированной длины в комбинации с ALA-процедурой; ГА ЖЭС+ALA - ГА с для решения серии задач; - лучший результат.
Библиографические ссылки
1. Куклин В. И., Орлов В. И., Федосов В. В. Результаты работ по обеспечению качества электрора-диоизделий отечественного производства для комплектования бортовой аппаратуры космических аппаратов за период 01.2008-06.2009 // Электронная компонентная база космических систем : VIII Рос. науч.-техн. конф. М., 2009. С. 64-66.
2. Казаковцев Л. А., Орлов В. И., Ступина А. А. Выбор метрики для системы автоматической классификации электрорадиоизделий по производственным партиям // Программные продукты и системы. 2015. № 2. С. 124-129. DOI: 10.15827/0236-235X.110.124-129.
3. Farahani R., Hekmatfar M. Facility Location: Concepts, Models, Algorithms and Case Studies. Springer-Verlag Berlin Heidelberg, 2009.
4. Sheng W. A., Liu X. Genetic k-medoids clustering algorithm // Journal of Heuristics. 2004. Vol. 12(6). P. 447-466.
5. Pelleg D. Moore A 2000 X-means: Extending ¿-means with efficient estimation of the number of clusters // Seventeenth Internat. Conf. on Machine Learning. P. 727-734.
References
1. Kuklin V. I., Orlov V. I., Fedosov V. V. [Results of operations of quality assurance of domestic electronic components for on-board equipment of spacecrafts in the period from January 2008 to June 2008]. VII Russian scientific and technical conference. Electronic components in space industry. Moscow, 2009, рр. 64-66.
2. Kazakovtsev L. A., Orlov V. I., Stupina A. A. [On distance metric for the system of automatic classification of the EEE devices by production batches]. Programmnye produkty i sistemy, 2015. № 2, рр. 124-129. Doi: 10.15827/0236-235X.110.124-129.
3. Farahani R., Hekmatfar M. Facility Location: Concepts, Models, Algorithms and Case Studies, Springer-Verlag Berlin Heidelberg, 2009.
4. Sheng W. A., Liu X. Genetic k-medoids clustering algorithm Journal of Heuristics, 2004, Volume 12(6), pp. 447-466.
5. Pelleg D., Moore A. 2000 X-means: Extending k-means with efficient estimation of the number of clusters, Seventeenth Internat. Conf. on Machine Learning, 2000, pp. 727-734.
© Гудыма М. Н., Орлов В. И., Казаковцев Л. А., 2016