Научная статья на тему 'Машинное обучение для поддержки принятия решений в сфере качества на промышленном предприятии'

Машинное обучение для поддержки принятия решений в сфере качества на промышленном предприятии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
243
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинное обучение / принятие решений / ситуационно-онтологическая методология разработки систем поддержки принятия решений / метод дерева решений / обеспечение качества / Python / испытания продукции в промышленности / machine learning / decision making / situational-ontological methodology for developing decision support systems / decision tree method / quality assurance / Python / product testing in industry

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Конев Константин Анатольевич

Статья посвящена описанию подходов к реализации методологии ситуационно-онтологического проектирования систем поддержки принятия решений в сфере обеспечения качества для продукции на машиностроительном предприятии. Исследование проводилось с целью подтверждения возможности реализации данной методологии с использованием методов машинного обучения на основе библиотек Python для цифрового анализа данных об испытаниях с принятием по ним решений. Актуальность проведения данного исследования обусловлена необходимостью решения проблемы, связанной с повышенными требованиями к профессиональной подготовке сотрудников, занятых в сфере обеспечения качества. Их работа связана с принятием многочисленных разнородных решений, для которых, как известно, эффективным инструментом является система поддержки принятия решений. Новизна предложенного решения заключается в новаторском подходе к ситуационно-онтологическому проектированию систем поддержки принятия решений, а также в применении методов машинного обучения на основе библиотек Python при формировании системы поддержки принятия решений для процесса испытаний продукции машиностроительного предприятия. Результаты исследования демонстрируют реализуемость предложенной методики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Конев Константин Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Machine Learning for Quality Decision Support in an Industrial Enterprise

The article is devoted to the description of approaches to the implementation of the methodology of situational-ontological design of decision support systems in the field of quality assurance for products at a machine-building enterprise. The study was conducted to confirm the possibility of implementing this methodology using machine learning methods based on Python libraries for digital analysis of test data with decision making. The relevance of this study is due to the need to solve the problem associated with increased requirements for the professional training of employees involved in the field of quality assurance. Their work is connected with the adoption of numerous heterogeneous decisions, for which, as you know, a decision support system is an effective tool. The novelty of the proposed solution lies in an innovative approach to the situational-ontological design of decision support systems, as well as in the application of machine learning methods based on Python libraries in the formation of a decision support system for the process of testing products of a machine-building enterprise. The results of the research demonstrate the feasibility of the proposed methodology.

Текст научной работы на тему «Машинное обучение для поддержки принятия решений в сфере качества на промышленном предприятии»

УДК 004.89

DOI 10.52575/2687-0932-2023-50-3-689-703

Машинное обучение для поддержки принятия решений в сфере качества на промышленном предприятии

Конев К.А.

Уфимский университет науки и технологий, Россия, 450076, Республика Башкортостан, г. Уфа, ул. Заки Валиди, д. 32

E-mail: [email protected]

Аннотация. Статья посвящена описанию подходов к реализации методологии ситуационно-онтологического проектирования систем поддержки принятия решений в сфере обеспечения качества для продукции на машиностроительном предприятии. Исследование проводилось с целью подтверждения возможности реализации данной методологии с использованием методов машинного обучения на основе библиотек Python для цифрового анализа данных об испытаниях с принятием по ним решений. Актуальность проведения данного исследования обусловлена необходимостью решения проблемы, связанной с повышенными требованиями к профессиональной подготовке сотрудников, занятых в сфере обеспечения качества. Их работа связана с принятием многочисленных разнородных решений, для которых, как известно, эффективным инструментом является система поддержки принятия решений. Новизна предложенного решения заключается в новаторском подходе к ситуационно-онтологическому проектированию систем поддержки принятия решений, а также в применении методов машинного обучения на основе библиотек Python при формировании системы поддержки принятия решений для процесса испытаний продукции машиностроительного предприятия. Результаты исследования демонстрируют реализуемость предложенной методики.

Ключевые слова: машинное обучение, принятие решений, ситуационно-онтологическая методология разработки систем поддержки принятия решений, метод дерева решений, обеспечение качества, Python, испытания продукции в промышленности

Для цитирования: Конев К.А. 2023. Машинное обучение для поддержки принятия решений в сфере качества на промышленном предприятии. Экономика. Информатика, 50(3): 689-703. DOI: 10.52575/2687-0932-2023-50-3-689-703

Machine Learning for Quality Decision Support in an Industrial Enterprise

Konstantin A. Konev

Ufa University of Science and Technology, 32 Zaki Validi St., Ufa, Republic of Bashkortostan, 450076, Russian Federation

E-mail: [email protected]

Abstract. The article is devoted to the description of approaches to the implementation of the methodology of situational-ontological design of decision support systems in the field of quality assurance for products at a machine-building enterprise. The study was conducted to confirm the possibility of implementing this methodology using machine learning methods based on Python libraries for digital analysis of test data with decision making. The relevance of this study is due to the need to solve the problem associated with increased requirements for the professional training of employees involved in the field of quality assurance. Their work is connected with the adoption of numerous heterogeneous decisions, for which, as you know, a decision support system is an effective tool. The novelty of the proposed solution lies in an innovative approach to the situational-ontological design of decision support systems, as well as in the application of machine learning methods based on Python libraries in the formation of a decision support system for the

process of testing products of a machine-building enterprise. The results of the research demonstrate the feasibility of the proposed methodology.

Keywords: machine learning, decision making, situational-ontological methodology for developing decision support systems, decision tree method, quality assurance, Python, product testing in industry

For citation: Konev K.A. 2023. Machine Learning for Quality Decision Support in an Industrial Enterprise. Economics. Information technologies, 50(3): 689-703 (in Russian). DOI: 10.52575/2687-09322023-50-3-689-703

Введение

В современном мире промышленные процессы и услуги значимо зависимы от использования информационных технологий. Важной вехой в их развитии в нашей стране стал проект "Цифровая экономика РФ" [Цифровая экономика РФ, 2018], ставящей своей целью создание цифровой инфраструктуры и имеющий искусственный интеллект в качестве одного из ключевых направлений. Одной из главных задач в рамках проекта "Цифровая экономика РФ" является внедрение и развитие технологий машинного обучения в различных сферах. Примером успешных решений по машинному обучению в рамках указанного проекта может служить, например, создание системы мониторинга и контроля заболеваемости гриппом, основанная на алгоритмах машинного обучения [Система мониторинга заболеваемости гриппом, 2019].

Серьёзной проблемой при внедрении искусственного интеллекта является сложность выбора подходящих наборов данных и моделей машинного обучения. Для успешного функционирования таких систем необходимо обеспечить их надежность в различных условиях, что предполагает высокую компетентность соответствующего персонала [Специалист по качеству, 2021] и ведёт к увеличению сроков и удорожанию данных работ. Как следствие важность приобретают системы поддержки принятия решений, позволяющие повысить качество принимаемых решений в конкретной предметной области.

Одним из возможных решений для обеспечения поддержки принятия решений является создание платформ, позволяющих проводить тестирование работы алгоритмов машинного обучения на реальных наборах данных. В этой связи, важно уделять внимание не только техническим аспектам разработки и тестирования систем искусственного интеллекта, но и вопросам формирования качественных наборов данных.

Ситуационная схема принятия решений с использованием искусственного интеллекта

В последние десятилетия широкую популярность при проектировании систем поддержки принятия решений получила концепция, основывающаяся на анализе ситуации. Эта концепция базируется на трудах Поспелова [Поспелов, 1986] и других исследователей (например, [Клыков, 1974]), и предполагает анализ ситуации с последующим выбором оптимального решения из альтернатив. В развитие этой концепции рассматривается ситуационно-онтологическая методология, позволяющая приблизить идеи классиков к практическому воплощению [Конев, Антонов и др., 2020]. Ранее было показано, что ситуационная модель процесса может быть дополнена разными инструментами, в том числе и интеллектуальными [Антонов, Конев, 2021]. Такие средства позволяют обеспечить поддержку принятия решения ЛИР. В результате была разработана ситуационно-онтологическая методология создания систем поддержки принятия решений. На рисунке 1 показана обобщённая схема принятия решения с позиции данной методологии.

Показатели для оценки

Команды / информация

Рис. 1. Структурная схема СППР Fig. 1. Structural diagram of the DSS

Хорошим примером таких инструментов является машинное обучение, которое нашло применение во многих областях, включая медицину, финансы, промышленность и транспорт [Шапиро, Фаринский, 2018]. В промышленности машинное обучение зачастую используется для анализа вопросов, связанных с обеспечением качества продукции.

В данной статье предполагается решить следующие задачи:

1) Разработка обобщённой схемы алгоритма для получения готовых решений на основе анализа данных при помощи метода машинного обучения. Эти данные должны быть доступны после идентификации ситуации, которая может быть отнесена к заранее определенному типу на основе условий внутренних регламентов машиностроительного предприятия.

2) Формирование практического примера использования предложенного алгоритма на базе реальной задачи принятия решений в бизнес-процессе машиностроительного предприятия.

Машинное обучение и обобщённая схема алгоритма принятия решений на основе анализа данных

Машинное обучение - это инструмент для обработки и анализа больших данных в различных сферах деятельности, служащий для решения задач по поддержке принятия решений при реализации мер по повышению эффективности управления в промышленности (см. рис. 3).

Рис. 2. Упрощённая схема машинного обучения Fig. 2. Simplified Machine Learning Scheme

Исследователи уделяют большое внимание применению данного инструмента при решении различных задач в промышленности. Так, в концептуальной статье, посвященной машинному обучению в технологической подготовке производства [Мурзагулов, Замятин, 2018] авторы описали подход к использованию методов машинного обучения для идентификации выхода за допустимые границы совокупности сигналов с датчиков SCSDA-си-стемы. Анализ результатов исследований неисправностей оборудования АЭС в статье [Кацер и др., 2019] предлагает обзор различных статистических и машинного методов обучения, позволяющих решать задачи обнаружения неисправностей в работе оборудования атомных электростанций. В статье [Bustillo и др., 2020] показано применение машинного обучения в контроле за технологическим процессом машиностроительного производства. А в известном журнале «Nature» опубликована статья «Bayesian reaction optimization as a tool for chemical synthesis» («Оптимизация байесовской реакции как инструмент химического синтеза»), в которой исследователи показали возможности для использования метода Байеса в химической промышленности [Shields и др., 2021].

Решая первую поставленную выше задачу, сформируем алгоритм для получения готовых решений на основе анализа данных при помощи метода машинного обучения с использованием ситуационно-онтологической методологии, как последовательность из следующих шагов:

1. Анализ ситуации. Необходимо собрать данные, описывающие ситуацию. Эти данные могут быть получены напрямую с помощью датчиков или собраны вручную.

2. Идентификация ситуации. После сбора данных необходимо выполнить их анализ и идентификацию ситуации с помощью заранее определенных критериев.

3. Разработка решения. На основе полученных данных и идентификации ситуации необходимо разработать решение, которое удовлетворит внутренним регламентам промышленного предприятия.

4. Уточнение ограничений. Прежде чем решение будет принято в работу, необходимо убедиться, что оно соответствует жестким ограничениям внутренних регламентов промышленного предприятия.

5. Реализация решения. После определения жестких ограничений решение может быть реализовано на практике.

6. Оценка эффективности. Наконец, необходимо оценить эффективность решения и принять меры для его улучшения, если это необходимо. Иллюстрирует данную методику рис. 3:

Рис. 3. Алгоритм принятия решений на основе ситуационно-онтологической модели Fig. 3. Decision-making algorithm based on situational-ontological model

Рассмотрим бизнес-процесс машиностроительного предприятия, для которого можно применить предложенную схему алгоритма.

Бизнес-процесс перезапуска испытаний изделия после устранения дефекта одного из компонентов

Периодические, приёмо-сдаточные, типовые, квалификационные и другие виды испытаний - неотъемлемая часть жизненного цикла сложных изделий в производстве [ГОСТ Р ИСО 9001, 2015]. В процессе испытаний могут возникать как отказы, так и признаки некорректной работы изделия или его отдельных узлов. Для простых недорогих изделий проблема решается заменой. Однако существует немало изделий, которые настолько сложны и дороги, что не могут быть просто отправлены в утилизацию, а должны проходить де-фектацию (поиск дефектного компонента), ремонт и снова попадать на испытания.

Данную проблему не обошли вниманием многочисленные исследователи. Так, в статье «Анализ результатов приемо-сдаточных испытаний» [Голуб, Черемухина, 2022] авторы рассматривают основные проблемы, с которыми сталкиваются производители при восстановлении изделий после отказов на испытаниях. В исследовании методов восстановления качества ремонтированных изделий в двигателестроении [Баганов и др., 2022], на основе анализа достоинств и недостатков этих методов, предложены рекомендации по улучшению

процесса контроля качества ремонтируемых изделий. Многие авторы описывают способы прогнозирования результатов испытаний, а также эффективные способы их проведения.

В авиационном двигателестроении даже не самый большой двигатель может стоить миллионы рублей и может быть утилизирован только, если отказ привёл к невозможности восстановления изделия (см., например, рис. 4). В реальности такие отказы крайне редки.

Рис. 4. Иллюстративное фото значительных разрушений при отказе турбины авиадвигателя Fig. 4. Illustrative photo of significant damage caused by aircraft engine turbine failure

При восстановлении изделия возникает комплекс вопросов по обеспечению его качества, одним из которых является вопрос: продолжить ли цикл испытаний или начинать их заново? Причиной важности данного вопроса является высокая стоимость испытательных мероприятий и забота о том, чтобы их результатам можно было доверять.

Если рассмотреть вопрос о том, каким образом начинать испытания после отказа в качестве задачи принятия решений, то это будет принятие решения по выбору из следующих альтернатив:

- очень оптимистический сценарий - продолжить испытания на том же цикле испытаний, начиная с технологической операции, на которой испытания были остановлены;

- оптимистический сценарий - продолжить испытания с первой технологической операции того цикла испытаний, на которой испытания были остановлены;

- пессимистический сценарий - начать все испытания заново;

- самый пессимистический сценарий - утилизировать изделие и начать испытывать заново новый образец.

Каждый сценарий требует обоснования, поэтому необходимо создать алгоритм для решения этой задачи.

Представим каждую оцениваемую при выборе сценария характеристику как множество значений, имеющую собственное обозначение (см. таб. 1).

Таблица 1 Table 1

Значения характеристик, влияющих на выбор сценария Values of characteristics influencing the choice of scenario

Характеристика Обозначение Множество значений

1. Влияние на испытания IT критическое, значительное, малозначительное

2. Масштаб ремонта SI значительный, средний, незначительный

3. Значимость компонента CS критический, важный, малозначительный

4. Масштаб дефекта DS изделие, подсистема (агрегат), компонент

5. Уровень ценности изделия PVL очень дорогое, дорогое, среднеценное, малоценное

6. Уровень ответственности изделия PRL высокая ответственность, иное

7. Уровень стоимости испытаний TCL значительный, средний, незначительный

8. Возможность восстановления RP есть, отсутствует

Влияние на испытания - это характеристика, определяющая влияние дефектного компонента на результаты испытаний. Например, механическая поломка одного из креплений авиаагрегата на стенде при испытаниях на вибрационную стойкость значительно больше влияет на их исход, чем поломка при испытании на воздействие пониженной температуры.

Масштаб ремонта - это характеристика, определяющая уровень вмешательства в конструкцию изделия для устранения дефекта. Например, разрушение питающего кабеля потребует лишь его отстыковку от изделия и пристыковку нового, а отказ процессора в схеме управления потребует гораздо более сложного технологического процесса ремонта изделия.

Значимость компонента - это характеристика, определяющая уровень влияния дефектного компонента (компонентов) на качество всего изделия. Например, сломанная ручка переключения режимов на пульте управления беспилотным летательным аппаратом значительно меньше влияет на его характеристики, чем поломка в его моторе.

Масштаб дефекта - это характеристика, которая определяет количество компонентов, оказывающихся затронутыми последствиями отказа на испытаниях. Например, оторвавшаяся лопатка турбовентиляторного реактивного двигателя может за счёт своей кинетической энергии серьёзно повредить целый ряд его компонентов.

Уровень ценности изделия - это характеристика, определяющая относительную стоимость изделия. Например, ручка переключения режимов авиационного двигателя может стоить на несколько порядков дешевле его самого.

Уровень ответственности изделия - это характеристика, определяющая насколько серьёзные последствия могут наступить, если в ходе испытаний не будет обнаружена уязвимость изделия, способная привести в эксплуатации к его выходу из строя. Например, выход из строя одной свечи зажигания автомобиля может привести к проблемам при начале его эксплуатации, а выход из строя авиационного двигателя на боевом самолёте, выполненным по однодвигательной схеме, может стоить не только жизни пилоту, но и привести к срыву выполнения его боевой задачи.

Уровень стоимости испытаний - это характеристика, определяющая относительный уровень материальных затрат на выполнение каждой операции испытаний. Например, для проведения некоторых испытаний требуется закупка и сборка испытательных стендов, стоимостью в десятки миллионов рублей.

Возможность восстановления определяет существует ли изделие как целое после отказа.

Рассмотрим формирование критериев для принятия решений (см. табл. 2).

Таблица 2 Table 2

Критерии выбора решений на основе регламента действий Criteria for choosing decisions based on the rules of action

Решение Комбинация характеристик

Самый оптимистический сценарий Логическое И для всех перечисленных компонентов Влияние на испытания (1Т) = малозначительное Масштаб дефекта (DS) = компонент Масштаб ремонта ^1) = незначительный Уровень ответственности изделия (PRL) = иное Значимость компонента (CS) = малозначительный

Оптимистический сценарий Логическое И Влияние на испытания (1Т) = малозначительное Масштаб дефекта (DS) = компонент Масштаб ремонта ^1) = незначительный (Уровень стоимости испытаний (Т^) = средний) Логическое ИЛИ (Уровень стоимости испытаний (Т^) = значительный)

Пессимистический сценарий Логическое И (Влияние на испытания (1Т) = малозначительное) Логическое ИЛИ (Влияние на испытания (1Т) = критическое) (Масштаб ремонта ^1) = средний) Логическое ИЛИ (Масштаб ремонта ^1) = значительный) (Значимость компонента (CS) = важный) Логическое ИЛИ (Значимость компонента (CS) = критический) (Масштаб дефекта (DS)= подсистема (агрегат)) Логическое ИЛИ (Масштаб дефекта (DS)= изделие) ((Уровень ценности изделия (PVL) = очень дорогое) Логическое ИЛИ (Уровень ценности изделия (PVL) = дорогое)) Логическое ИЛИ ((Уровень ценности изделия (PVL) = среднеценное) Логическое И (Уровень стоимости испытаний (Т^)= незначительный))

Самый пессимистический сценарий Логическое И Уровень стоимости испытаний (TCL) = значительный Возможность восстановления (ЯР) = отсутствует

Использование языка Python для решения задачи перезапуска испытаний изделия

Используем для поддержки принятия решений метод решающих деревьев, реализованный средствами языка Python.

Метод решающих деревьев представляет собой эффективное средство для анализа и статистической обработки данных, применяемое в задачах по поддержке принятия решений [Паклин, Орешков, 2013]. CART (Classification and Regression Trees) является популярным алгоритмом, используемым для построения бинарных решающих деревьев [Zhu, 2018]. В соответствии с алгоритмом CART, объекты, составляющие выбранную группу, характеризуются долей наиболее частого значения выходного признака, причём для таких групп этот показатель достаточно высок [Li, 2021].

Алгоритм CART начинается с того, что выбирается k -й признак fk для разбиения выборки (множества) D на две части, чтобы в каждой части оказалось как можно больше

объектов одного класса (в случае классификации) или чтобы достигнуть наилучшей точно-

d (k) е D(k)

сти предсказания (в случае регрессии). Далее формируется такое значение 0 для

f, k = 1 n г Ginisp (Т) ,

всех признаков k , , чтобы мера неоднородности spy ' была минимальной,

т.е.

d0k) = arg min Gini (т, d(k))

0 bfk :d(k)ED( k) SpK '

Затем процедура рекурсивно выполняется для любой последующей выборки пока условия для останова процесса не будут выполнены.

Причём критерии для расщепления могут быть следующими: мера энтропии:

E = -ZPi log(Pi)

¡=1

- индекс Джини:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

C

Gini(D ) = X p, (1 - p,)

C

pt - частота или вероятность нахождения точек i-го класса в блоке, C - число разбиений;

Python - интерпретируемый язык программирования общего назначения, широко используемый в научных и инженерных приложениях, веб-разработке и машинном обучении. Данный язык переживает период значительного роста популярности как у отечественных разработчиков [Жуков, 2020], так и у зарубежных [Sweigart, 2015, McKinney, 2017].

Разработаем методику классификации различных ситуаций в один из заданных сценариев решения на основе решающего дерева. Для анализа используем инструментарий моделирования процесса по методологии BPMN [Silver, 2017] в качестве средства визуализации (см. рис. 5).

Рис. 5. BPMN-модель процесса принятия решений по перезапуску испытаний Fig. 5. Decision-making BPMN model for restarting tests

Вариант неопределённой ситуации создаёт проблему. При наличии нескольких критериев использование жесткой логики может приводить к нелепым ситуациям, когда решение очевидно, но комбинация условий его исключает. Поэтому необходим гибкий алгоритм машинного обучения, для создания которого уменьшим число параметров и сделаем их количественными. Кроме того, опросим экспертов в предметной области в части того, какие действия следует принимать, если прямое совпадение всех условий по какому-либо варианту недостижимо и на основе ответов сформируем обучающую выборку.

Обобщим близкие по смыслу параметры, введя количественную их оценку. Влияние на испытания (IT), масштаб дефекта (DS) и масштаб ремонта (SI) во всех рассуждениях при выборе сценария используются вместе, что позволяет их переопределить количественным параметром Значимость ситуации (ISd), измеряемым от 0 до 100. Если продолжать анализ показателей, то можно отметить, что уровень ценности изделия (PVL) и уровень ответственности изделия (PRL) очень близки по смысловой нагрузке и не противоречат, а дополняют друг друга, поэтому их можно обобщить показателем Значимость изделия (SPd), измеряемым также от 0 до 100. Отметим, что показатель возможности восстановления (RP) выпадает из общей логики тем, что он жестко детерминирован крайним сценарием (утилизация) и должен быть выведен за скобки нашего рассмотрения. Показатели Значимость компонента (CS) и Уровень стоимости испытаний (TCL) не очень поддаются обобщению, поэтому для них просто введём шкалу оценки также от 0 до 100, а сами показатели, для исключения перепутыва-ния, маркируем литерой d, т.е. они будут иметь обозначение: CSd и TCLd. В результате на выходе получим четыре относительных показателя и один логический:

- значимость ситуации (ISd);

- значимость изделия (SPd);

- значимость компонента (CSd);

- уровень стоимости испытаний (TCLd);

- возможность восстановления (RP).

Обработка логического значения при столь малом числе параметров сильно огрубит результат, поэтому введём степени ремонтопригодности и зададим их от 10 до 100%.

На основе данных предприятия за несколько лет сформируем набор данных для машинного обучения в формате Excel, фрагмент которого представлен на рис. 6:

А А В С D Е F

■ ISd SPd CSd TCLd RP Solution

2 12 22 35 17 60 VOS

3 10 10 96 90 70 VPS

4 15 97 80 54 40 PS

5 64 58 55 50 10 PS

6 43 55 34 44 30 OS

7 59 95 46 26 90 VPS

8 43 30 55 12 20 OS

9 64 9 41 47 40 OS

10 53 71 15 80 20 PS

95 64 67 34 10 PS

12 75 72 15 9 50 OS

'3 83 32 30 38 30 PS

'4 41 52 16 6 10 OS

'5 67 93 51 9 40 PS

16 19 91 30 41 10 PS

'7 57 97 73 17 100 VPS

18 65 35 55 81 40 PS

'9 41 44 22 41 30 OS

20 12 25 58 32 10 OS

21 42 59 75 24 40 PS

22 33 31 50 63 10 PS

23 29 28 52 29 30 OS

24 67 48 80 54 10 PS

25 32 12 89 53 40 PS

26 83 97 53 99 10 PS

27 67 96 64 92 20 PS

28 4 23 18 20 50 vos

Рис. 6. Фрагмент обучающей выборки в MS Excel Fig. 6. Fragment of the training sample in MS Excel

Используем функционал библиотек Python для построения решающего дерева. Применим библиотеку sklearn, а именно класс DecisionTreeClassifier. Он принимает на

вход: массив X, содержащий обучающие образцы, и массив Y целочисленных значений, формы, содержащий метки классов для соответствующих обучающих образцов. Для начала импортируем необходимые библиотеки:

import pandas as pd

import matplotlib.pyplot as plt

Далее загрузим сохранённые в формате «csv» данные из файла в Excel для обучающей выборки и для рабочей выборки. Вместе с этим уберём из наборов логический параметр

train features = pd.read csv('trainingset.csv', sep=";") test features = pd.read csv('analysisdata.csv', sep=";")

Зададим множество характеристик и решений:

х = train features.iloc[:,:5] y = train features.iloc[:,5:]

Сформируем и обучим дерево решений при помощи библиотеки sklearn from sklearn import tree

RoM = tree.DecisionTreeClassifier(criterion='entropy', max depth = 5) RoM = RoM.fit(x,y)

Зададим множество характеристик и выводов

feature names = df.columns[:5]

target names = df['Solution'] .unique().tolist() fig, axe = plt.subplots(figsize=(20,10))

Отобразим дерево решений

tree.plot tree(RoM,

feature names = feature names, class names = target names, filled = True, rounded = True, ax = axe, fontsize=15) Получившееся дерево решений показано на рис. 7.

Рис. 7. Решающее дерево для принятия решений о перезапуске испытаний сложного изделия Fig. 7. Decision tree for making decisions about restarting tests of a complex product

Получив дерево решений, имеем возможность сформировать результат для любых реальных данных, которые определены в файле analysisdata. csv.

Для начала задаем множество характеристик для тестовых данных

X test = test features.iloc[:,:5]

Применим обученное дерево решений для принятия решений при помощи метода predict()

y pred = RoM.predict(X test)

Создаем новый столбец с прогнозами в рабочей выборке test_features с прогнозами на основе примененного дерева решений

test features['Prediction'] = y pred

Выводим результаты, включая характеристики из analysisdata. csv и соответствующие прогнозы по каждой строке

print(test_features[['ISd','SPd', 'CSd','TCLd','Prediction']]).

Получаем предложенные варианты решений по каждой из ситуаций. На рис. 8 видно, что Python сформировал дополнительное поле 'Prediction', в котором указал код рекомендуемого решения, сформированного на основе обученного решающего дерева.

print(test_features[[ ■IScT ,'SPd',rCSd1j

isd spd csd TCLd RP Prediction

в 4S Ii 65 93 10 PS

ï 64 4-5 66 67 9Э VPS

2 es 16 29 31 30 OS

з 4S 4 .2 17 40 OS

4 5 E 14 39 10 vos

s. 60 64 84 2 100 VPS

в 95 86 61 30 80 V/PS

7 98 54 28 74 50 PS

3 95 88 71 24 40 PS

Э IS 83 79 54 30 PS

10 6 18 2 £5 10 PS

11 37 80 S3 54- 20 PS

12 30 4в 6 20 20 OS

13 36 87 11 18 60 vos

14 75 84 32 96 50 PS

15 93 89 11 2 30 OS

ie 46 45 99 60 20 PS

17 98 16 5 77 70 vos

TS 29 69 61 92 36 PS

19 38 59 59 35 90 VPS

20 75 83 67 35 30 PS

21 40 90 86 93 10 PS

22 26 48 59 37 10 OS

23 4-1 77 38 S3 20 PS

24 5 95 22 91 30 vos

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

25 17 23 86 73 40 PS

26 70 73 99 5 40 PS

27 80 60 31 43 30 PS

23 91 33 56 61 10 PS

Рис. 8. Фрагмент результата решения в Python Fig. 8. Solution result snippet in Python

Таким образом, алгоритм машинного обучения позволяет выбирать решения в сложившихся ситуациях при перезапуске испытаний на промышленном предприятии и, в зависимости от степени обученности алгоритма, давать решения в ситуациях с новыми исходными данными, например, с использованием библиотек для машинного обучения языка Python.

Заключение

В ходе исследования были поставлены задачи на основе анализа применяющихся и методов принятия решений разработать обобщённую схему алгоритма для получения готовых решений на основе анализа данных при помощи метода машинного обучения и сформировать пример практического использования предложенного алгоритма в бизнес-процессе машиностроительного предприятия.

Разработка алгоритма была проведена с использованием известной методологии моделирования процессов BPMN на примере метода решающих деревьев машинного обучения. В качестве примера процесса для анализа был выбран бизнес-процесс перезапуска испытаний изделия авиационного двигателестроения после устранения дефекта одного из компонентов. Результаты показали пригодность предложенной методики для анализа данных, полученных в производстве. Следовательно, обе задачи были успешно решены.

Дальнейшие исследования будут посвящены расширению использования интеллектуальных методов в промышленности.

Список источников

Проект "Цифровая экономика РФ" [Электронный ресурс]. Министерство экономического развития Российской Федерации. - Режим доступа:

http://economy.gov.ru/minec/activity/sections/ict/calculate/koap.html?c=koap (дата обращения: 30.05.2023).

Материал о системе мониторинга заболеваемости гриппом [Электронный ресурс]. РИА Новости. -

Режим доступа: https://ria.ru/20191025/1560152349.html (дата обращения: 30.05.2023). Специалист по качеству: Профессиональный стандарт N° 40.062. Утв. приказом Министерства труда

и социальной защиты РФ № 276н от 22.04.2021: 26 с. Системы менеджмента качества. Требования: ГОСТ Р ИСО 9001-2015. 2015. М.: Стандартинформ: 23 с.

Список литературы

Антонов, В.В., Конев К.А. 2021. Интеллектуальный метод поддержки принятия решений в типовой ситуации / В.В. Антонов. Онтология проектирования, т.11, 1(39): 126-136. DOI 10.18287/22239537-2021-11-1-126-136.

Баганов Н.А. и др. 2022. Оценка качества ремонта автотракторных двигателей. Технический сервис

машин, 2(147): 67-75. - DOI 10.22314/2618-8287-2022-60-2-67-75. Голуб И.А., Черемухина Ю.Ю. 2022. Анализ результатов приемо-сдаточных испытаний. Наука и

бизнес: пути развития, 5(131): 202-205. Жуков Н.Н. 2020. Введение в разработку на языке Python: Учебное пособие. СПб.: "НИЦ АРТ": 66 с. ISBN 978-5-907260-30-6.

Кацер Ю.Д. и др. 2019. Методы обнаружения неисправностей оборудования АЭС, 4: 5-27. DOI

10.26583/npe.2019.4.01. Клыков Ю. И. 1974. Семиотические основы ситуационного управления. М.: МИФИ, 169 с. Конев К.А., Антонов В.В. и др. 2020. Основы концепции онтологического моделирования бизнес-процессов для задач принятия решений. Современные наукоемкие технологии. 12-1: 71-77. DOI 10.17513/snt.38413.

Мурзагулов Д.А., Замятин А.В. 2018. Адаптивные алгоритмы машинного обучения в правлении

технологическими процессами. Автоматизация. Современные технологии, т. 72, 8: 354-361. Паклин Н.Б., Орешков В.И. 2013. Бизнес-аналитика: от данных к знаниям. СПб.: Питер, 704 с. Поспелов Д.А. 1986. Ситуационное управление: теория и практика. М.: Наука, 138 с. Шапиро О.М., Фаринский В.А. 2018. Применение искусственного интеллекта в промышленном производстве. Новые технологии и оборудование для машиностроения и металлообработки: сборник научных статей международной конференции (Минск, 25-27 сентября 2018 г.). Минск: Технологии машиностроения: 141-148.

Bruce Silver. 2017. BPMN Quick and Easy Using Method and Style: Process Mapping Guidelines and Examples Using the Business Process Modeling Standard., Cody-Cassidy Press: 286 p. ISBN-13 978-0982368169

Bustillo A. et al. 2021. Machine-learning for automatic prediction of flatness deviation considering the wear of the face mill teeth. Journal of Intelligent Manufacturing: 1-18 DOI 10.1007/s10845-020-01645-3.

Fubao Zhu et al. 2018. A Classification Algorithm of CART Decision Tree based on MapReduce Attribute Weights. International journal of performability engineering, v. 14, 1: 17-25.

Li W. et al. 2021. A Survey of Learning-Based Intelligent Optimization Algorithms. Archives of Computational Methods in Engineering, 28(5), 3781-3799. V:10.1007/s11831-021-09562-1

McKinney Wes. 2017. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython 2nd Edition, O'Reilly Media: 724 p. ISBN 9781449319793

Shields B.J. et al. 2021. Bayesian reaction optimization as a tool for chemical synthesis. Nature, v. 590, 7844: 89-96. DOI 10.1038/s41586-021-03213-y.

Sweigart A. 2015. Automate the Boring Stuff with Python: Practical Programming for Total Beginners. No Starch Press: 504 p. ISBN 1593275994.

Project "Digital Economy of the Russian Federation" [Electronic resource]. Ministry of Economic Development of the Russian Federation. Available at:

http://economy.gov.ru/minec/activity/sections/ict/calculate/koap.html?c=koap (Accessed:

30.05.2023) (in Russian).

Material on the influenza incidence monitoring system [Electronic resource]. RIA News. Available at: https://ria.ru/20191025/1560152349.html (Accessed: 30.05.2023) (in Russian).

Quality Specialist: Professional Standard No. 40.062. Approved by order of the Ministry of Labor and Social Protection of the Russian Federation No. 276n dated April 22, 2021: 26 p. (in Russian).

Quality management systems. Requirements: GOST R ISO 9001-2015. 2015. Moscow. Standartinform: 23 p. (in Russian).

References

Antonov, V.V., Konev K.A. 2021. Intelligent decision support method in a typical situation / V.V. Antonov. Design ontology, v.11, 1(39): 126-136. DOI 10.18287/2223-9537-2021-11-1-126-136 (in Russian).

Baganov N.A. et al. 2022. Assessment of the quality of repair of automotive and tractor engines. Technical service of machines, 2(147): 67-75. - DOI 10.22314/2618-8287-2022-60-2-67-75 (in Russian).

Golub I.A., Cheremukhina Y.Y. 2022. Analysis of the results of acceptance tests. Science and business: ways of development, 5(131): 202-205. (in Russian).

Zhukov N. N. 2020. Introduction to Python Development: Tutorial. St. Petersburg: "NIC ART": 66 p.ISBN 978-5-907260-30-6 (in Russian).

Katser YD. et al. 2019. Methods for detecting faults in NPP equipment, 4: 5-27. DOI 10.26583/npe.2019.4.01 (in Russian).

Klykov Yu. I. 1974. Semiotic foundations of situational management. Moscow. MIFI, 169 p. (in Russian).

Konev K.A., Antonov V.V. et al. 2020. Fundamentals of the concept of ontological modeling of business processes for decision-making problems. Modern science-intensive technologies. 12-1: 71-77. DOI 10.17513/snt.38413 (in Russian).

Murzagulov D.A., Zamyatin A.V. 2018. Adaptive machine learning algorithms in process control. Automation. Modern technologies, v. 72, 8: 354-361. (in Russian).

Paklin N.B., Oreshkov V.I. 2013. Business Intelligence: From Data to Knowledge. St. Petersburg. Peter, 704 p. (in Russian).

Pospelov D.A. 1986. Situational Management: Theory and Practice. Moscow. Nauka, 138 p. (in Russian).

Shapiro O.M., Farinsky V.A. 2018. Application of artificial intelligence in industrial production. New technologies and equipment for mechanical engineering and metalworking: collection of scientific articles of the international conference (Minsk, September 25-27, 2018). Minsk. Engineering Technologies: 141-148 (in Russian).

Bruce Silver. 2017. BPMN Quick and Easy Using Method and Style: Process Mapping Guidelines and Examples Using the Business Process Modeling Standard., Cody-Cassidy Press: 286 p. ISBN-13 978-0982368169

Bustillo A. et al. 2021. Machine-learning for automatic prediction of flatness deviation considering the wear of the face mill teeth. Journal of Intelligent Manufacturing: 1-18 DOI 10.1007/s10845-020-01645-3.

Fubao Zhu et al. 2018. A Classification Algorithm of CART Decision Tree based on MapReduce Attribute

Weights. International journal of performability engineering, v. 14, 1: 17-25. Li W. et al. 2021. A Survey of Learning-Based Intelligent Optimization Algorithms. Archives of

Computational Methods in Engineering, 28(5), 3781-3799. V:10.1007/s11831-021-09562-1 McKinney Wes. 2017. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython 2nd

Edition, O'Reilly Media: 724 p. ISBN 9781449319793 Shields B. J. et al. 2021. Bayesian reaction optimization as a tool for chemical synthesis. Nature, v. 590,

7844: 89-96. DOI 10.1038/s41586-021-03213-y. Sweigart A. 2015. Automate the Boring Stuff with Python: Practical Programming for Total Beginners. No Starch Press: 504 p. ISBN 1593275994.

Конфликт интересов: о потенциальном конфликте интересов не сообщалось. Conflict of interest: no potential conflict of interest related to this article was reported.

ИНФОРМАЦИЯ ОБ АВТОРЕ

Конев Константин Анатольевич, кандидат технических наук, доцент, доцент кафедры автоматизированных систем управления, Уфимский университет науки и технологий, г. Уфа, Россия

INFORMATION ABOUT THE AUTHOR

Konstantin A. Konev, Candidate of Technical Sciences, Associate Professor, Associate Professor, Department of Automated Control Systems, Ufa University of Science and Technology, Ufa, Russian Federation

i Надоели баннеры? Вы всегда можете отключить рекламу.