НОВЫЕ ИНСТРУМЕНТЫ МОНИТОРИНГА КАЧЕСТВА. МОНИТОРИНГ ДАННЫХ, ВРЕМЕННЫЕ РЯДЫ ПОТРЕБЛЕНИЯ КОНТЕНТА И УСИЛЕНИЕ ИХ ПРОГНОЗИРУЮЩИХ СВОЙСТВ АНСАМБЛИРОВАНИЕМ СЛАБЫХ МОДЕЛЕЙ

Мосин Владимир Геннадьевич; Козловский Владимир Николаевич; Благовещенский Дмитрий Иванович

Sadkovskaya Natalia Evgenievna, doctor of technical sciences, professor, [email protected], Russia, Moscow, MIREA - Russian University of Technology

УДК 005.6

DOI: 10.24412/2071-6168-2024-1-237-238

НОВЫЕ ИНСТРУМЕНТЫ МОНИТОРИНГА КАЧЕСТВА. МОНИТОРИНГ ДАННЫХ, ВРЕМЕННЫЕ РЯДЫ ПОТРЕБЛЕНИЯ КОНТЕНТА И УСИЛЕНИЕ ИХ ПРОГНОЗИРУЮЩИХ СВОЙСТВ АНСАМБЛИРОВАНИЕМ СЛАБЫХ

МОДЕЛЕЙ

В.Г. Мосин, В.Н. Козловский, Д.И. Благовещенский

В статье представлены результаты разработки и реализации новых инструментов управления качеством. На основании имеющегося временного ряда данных о потреблении контента на канале одного из ведущих хостингов построена регрессионная модель, аппроксимирующая его поведение кубическим полиномом. После разбиения данных на несколько непересекающихся классов построена серия подобных регрессионных моделей. Показано, что ансамблирование частичных моделей приводит к существенному повышению прогнозирующей способности регрессионного анализа.

Ключевые слова: контент, оценка качества, анализ данных, регрессия, scikit-learn, pandas.

Временные ряды — это наборы данных, в которых значения измеряются в последовательные моменты времени. Они используются для анализа и прогнозирования переменных, которые изменяются во времени, таких как цены акций, количество продаж и другие. В анализе временных рядов применяются различные методы и модели для выявления скрытых закономерностей, трендов, цикличности, сезонности и шума в данных. Результаты таких исследований используются для предсказания будущих значений на основе предыдущих наблюдений. Временные ряды широко применяются в различных областях, таких как финансы, экономика, маркетинг и многие другие, для анализа данных, прогнозирования и принятия решений на основе временных трендов и паттернов (см., [5], [7]).

Теоретическая часть. Если временной ряд обладает высокой волатильностью, то его анализ представляет определенные сложности из-за своих особенностей. Вот некоторые из них:

1. Шум и непостоянство. Высокая волатильность приводит к шуму и непостоянству в данных. Это затрудняет определение трендов и паттернов во временных рядах.

2. Нестационарность. Временные ряды с высокой волатильностью часто бывают нестационарными, то есть их статистические свойства (среднее и дисперсия) меняются со временем. Нестационарность усложняет применение классических методов анализа, которые предполагают стационарность.

3. Сложности прогнозирования. Волатильность создает большую неопределенность в прогнозировании будущих значений временных рядов. Это связано с тем, что даже небольшие изменения в данных или внешние факторы могут привести к значительным изменениям в прогнозах.

Необходимость использования продвинутых методов. С учетом всех вышеперечисленных сложностей, анализ временных рядов с высокой волатильностью требует применения более продвинутых методов и моделей для достижения точных результатов.

Анализ временных рядов с высокой волатильностью может представлять определенные вызовы, но с правильным подходом можно извлечь полезную информацию. Один из таких подходов состоит в построении ансамбля моделей [5, 6, 7]. Ансамблиро-вание моделей в машинном обучении — это метод, который объединяет предсказания нескольких моделей, чтобы получить более точный и стабильный прогноз. Он основан на идее, что объединение нескольких слабых моделей может привести к созданию более сильной и устойчивой модели. Процесс ансамблирования включает в себя два основных шага:

1. Создание множества моделей. Вместо использования единственной модели для предсказания, ансамбль создает несколько моделей, которые могут быть обучены с использованием различных методов или различных наборов данных. Например, можно использовать разные алгоритмы машинного обучения, разные фрагменты данных и т. д.

2. Комбинирование предсказаний. После того как модели обучены, их предсказания объединяются для получения окончательного прогноза.

Преимущества ансамблирования очевидны: они включают повышение точности предсказаний, устойчивость к шуму и выбросам, а так же, что самое важное, улучшение обобщающей способности модели. Заметим, что ансамблирование моделей является широко применяемым методом в машинном обучении и используется в различных задачах, включая классификацию, регрессию и анализ временных рядов [3, 6], 7].

Предмет исследования. Мы исследуем данные о просмотрах образовательного контента на канале одного из ведущих хостингов. Данные представлены в виде временного ряда с дневной периодичностью с 2023-03-28 по 2023-06-28.

Методика исследования. Для исследования мы применяем методы линейной и полиномиальной регрессии в два этапа. На первом этапе мы анализируем полные данные по всей выборке. На втором этапе мы разбиваем выборку на несколько фрагментов и анализируем их по отдельности, после чего агрегируем результаты.

Цель исследования. Наша цель состоит в повышении прогнозирующей способности регрессионной модели временного ряда данных. Для этого мы сравниваем результаты моделирования, которые получаются на первом и втором этапах нашего исследования.

Технологии. Мы обрабатываем и анализируем данные, используя среду Jupyter Notebook. Эта среда предоставляет удобные возможности для работы на языке программирования Python и его основных библиотеках: NumPy, Pandas, Scikit-learn и Matplotlib [1, 2]. Библиотека NumPy является одним из ключевых инструментов для научных вычислений и обработки массивов данных в Python. Она предоставляет эффективные структуры данных, алгоритмы и функции для работы с одномерными и многомерными числовыми массивами. Pandas — самая мощная библиотека для работы с данными в Python. Она плотно интегрируется с другими инструментами для анализа и обработки данных на платформе Python, такими как NumPy, Scikit-learn и Matplotlib. Pandas предоставляет эффективные методы обработки информации, а также множество алгоритмов и функций для анализа и визуализации данных [1]. Для решения регрессионных задач мы применяем библиотеку Scikit-learn, также известную как sklearn. Scikit-learn является мощным и гибким инструментом машинного обучения с широким спектром возможностей и удобным интерфейсом.

Описание данных. Данные содержат сведения о количестве просмотров образовательного контента на канале одного из ведущих хостингов, представленные в виде временного ряда. Период временного ряда — с 2023-03-28 по 2023-06-28, частота наблюдений — ежедневно.

Алгоритм.

1. Чтение данных

Методом read_csv библиотеки pandas загружаем в среду исполнения набор данных и формируем дата-фрейм.

Дата Просмотры

0 2023-03-28 1557

1 2023-03-29 1313

2 2023-03-30 1248

90 2023-06-26 1154

91 2023-06-27 980

92 2023-06-28 902

2. Разведочный анализ. Применяем метод info библиотеки pandas и выводим сведения о признаках.

Column Non-Null Count Dtype

Дата 93 non-null object

Просмотры 93 non-null int64

Признак 'Дата' относится к строковому типу, признак 'Просмотры' — к типу целых чисел, пропущенных данных нет.

3. Визуализация временного ряда. Пользуясь методом plot библиотеки matlpotlib, визуализируем временной ряд: по горизонтали отложены номера дат, по вертикали — количество просмотров (рисунок 1).

Рис. 1. Временной ряд просмотров

4. Построение и обучение регрессионных моделей. Мы проведем исследование и сравним несколько регрессионных моделей: сначала построим линейную модель, а затем две полиномиальные — квадратичную и кубическую.

4.1. Предварительная подготовка данных. Данные признака 'Дата' являются строковыми, и мы не можем использовать этот признак в качестве независимой переменной регрессионной задачи, поскольку библиотека skleam поддерживает только числовые данные. Мы добавляем в дата-фрейм столбец, совпадающий с индексом, и объявляем его признаком 'Номер':

Дата Номер Просмотры

0 2023-03-28 0 1557

1 2023-03-29 1 1313

2 2023-03-30 2 1248

90 2023-06-26 90 1154

91 2023-06-27 91 980

92 2023-06-28 92 902

Визуально ничего не изменилось. Если посмотреть на рис. 1, то на нем и раньше по горизонтали откладывались не сами даты, а их номера. Зато теперь данные являются числовыми, и мы можем строить регрессионные модели.

4.2. Линейная регрессионная модель. Сначала мы формируем одномерную регрессионную задачу с линейной моделью. Пользуясь методом drop библиотеки pan-

239

das, удаляем из дата-фрейма признаки 'Просмотры' и 'Дата', пользуясь методом to_numpy, переводим оставшийся фрагмент в массив numpy и объявляем его левой частью регрессионной задачи (обозначение — X). В качестве правой части — наоборот, используем признак 'Просмотры' (обозначение — у). Затем, пользуясь методом LinearRegression модуля sklearn.linear_model из библиотеки sklearn, мы формируем объект model и, применяя к нему метод fit, обучаем модель на X и у. При помощи метода score мы вычисляем коэффициент детерминации: R2 = 0.22, и наконец, средствами библиотеки matplotlib визуализируем модель (рисунок 2(a)).

4.3. Квадратичная регрессионная модель. Полученные выше на шаге 3.4.2 коэффициент детерминации кране низок. Чтобы усилить нашу модель, мы вводим еще один предиктор, равный квадрату предиктора 'Номер'.

Дата Номер Квадрат номера Просмотры

0 2023-03-28 0 0 1557

1 2023-03-29 1 1 1313

2 2023-03-30 2 4 1248

90 2023-06-26 90 8100 1154

91 2023-06-27 91 8281 980

92 2023-06-28 92 8464 902

Затем, обучаем, оцениваем (получается R2 = 0.25, это лучше чем было, но по-прежнему очень мало) и визуализируем квадратичную модель (рисунок 2(Ь)).

4.4. Кубическая регрессионная модель. Следующая попытка усилить модель состоит в том, что мы вводим еще один предиктор, равный кубу предиктора 'Номер':

Дата Номер Квадрат номера Куб номера Просмотры

0 2023-03-28 0 0 0 1557

1 2023-03-29 1 1 1 1313

2 2023-03-30 2 4 8 1248

90 2023-06-26 90 8100 729000 1154

91 2023-06-27 91 8281 753571 980

92 2023-06-28 92 8464 778688 902

После чего, обучаем, оцениваем и визуализируем кубическую модель (рисунок 2(с)).

На этот раз поучаем R2 = 0.48. Это неудовлетворительно низкий результат. Причем, характер поведения кривой временного ряда таков, что кубическая парабола хорошо воспроизводит ее основной тренд, но не справляется с дневными колебаниями, и никакая алгебраическая кривая большей степени с ними тоже не справится, то есть, путь полиномиального усиления регрессионной модели следует признать тупиковым.

Это значит, что нам нужны какие-то другие идеи для решения.

Повторное чтение данных. Ранее 3.1. мы прочитали данные из файла *.csv, а

этот формат не содержит сведений о типе данных. Поэтому признак 'Дата' был прочитан как строковый, в тот момент как на самом деле он относится к типу дата-время. Чтобы изменить тип этого признака, мы методом read_csv библиотеки pandas снова читаем данные из файла *.csv, но на этот раз используем атрибут parse_dates, для того чтобы интерпретировать признак 'Дата' в нужном формате.

Повторный разведочный анализ. Пользуясь методом info, выводим сведения о прочитанных данных.

# Column Non-Null Count Dtype

0 Дата 93 non-null datetime64

1 Просмотры 93 non-null int64

Теперь признак 'Дата' имеет тип дата-время, а это значит, что он приобретает дополнительную информативность.

Построение дополнительного признака. Формат дата-время позволяет апеллировать к календарям и вычислять по любой дате день недели, который приходился (или еще придется) на эту дату. Для этого в библиотеке pandas предусмотрен метод dt.dayofweek, применяя который мы заносим в наш дата-фрейм еще один предиктор 'День недели'.

Дата День недели Просмотры

0 2023-03-28 1 1557

1 2023-03-29 2 1313

2 2023-03-30 3 1248

90 2023-06-26 0 1154

91 2023-06-27 1 980

92 2023-06-28 2 902

Дни недели закодированы, начиная с понедельника, таким образом: понедельник — 0, воскресенье — 6, и все промежуточные значения по порядку.

Визуализация дополнительного признак. На этом шаге мы применяем методы библиотеки matplolib, для того чтобы отметить чередование дней недели на общей кривой временного ряда (рисунок 3).

Рис. 3. Просмотры, локализованные по дням недели

241

Бросается в глаза разительное отличие, например, суббот от вторников, хотя само по себе это наблюдение, конечно, не является неожиданным. Действительно, мы изучаем потребление образовательного контента, а образовательный процесс обладает естественной недельной цикличностью: по выходным студенты, как правило, отдыхают, а не учатся — отсюда глубокие пятничные и субботние провалы в потреблении. В начале недели студенты проявляют наибольшую активность, а воскресенье, хотя и выходной, но уже заставляет студентов задуматься о том, что завтра понедельник.

Построение и обучение частичных регрессионных моделей. Наша основная идея состоит в том, чтобы моделировать потребление контента не на всем массиве данных, а на отдельных его фрагментах: построить и обучить отдельную модель для понедельников, отдельную — для вторников и так далее, по всем дням недели.

Предварительная подготовка данных. Здесь мы, так же как и ранее, применяем сквозную нумерацию объектов, добавляя в дата-фрейм дополнительный признак 'Номер'.

Дата День недели Номер Просмотры

0 2023-03-28 1 0 1557

1 2023-03-29 2 1 1313

2 2023-03-30 3 2 1248

90 2023-06-26 0 90 1154

91 2023-06-27 1 91 980

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

92 2023-06-28 2 92 902

Модель на понедельниках. Прежде всего, пользуясь методом loc библиотеки pandas, мы выполняем локализацию дата-фрейма по условию 'День недели' = 0 и получаем локальный дата-фрейм

Дата День недели Номер Просмотры

6 2023-04-03 0 6 1171

13 2023-04-10 0 13 1196

20 2023-04-17 0 20 966

76 2023-06-12 0 76 1796

83 2023-06-19 0 83 1749

90 2023-06-26 0 90 1154

В нем, в отличие от полных данных не 93, а всего 13 записей, причем, номера и даты следуют с шагом 7. Затем обучаем кубическую модель, вычисляем ее метрику эффективности R2 = 0.79 и визуализируем в виде кубической параболы (рисунок 4

(а)).

Модели на остальных днях недели. Повторяем шаг в цикле по дням недели. Получаем еще 6 моделей (каждую на своей локализации), обучаем их, вычисляем метрики эффективности и визуализируем (рисунок 4).

Результаты. Как линейная, так и полиномиальная модели потребления контента на полных данных оказались неудовлетворительными. Поэтому мы разбили данные на классы по дням недели, после чего построили и обучили частичные регрессионные модели третьей степени. Каждая из них по сравнению с начальной полиномиальной моделью обладает большим коэффициентом детерминации, однако, окончательная прогнозирующая способность всей совокупности частичных моделей оказывается еще выше.

Рис. 4. Частичные регрессионные модели и их оценки

Понедельник

Вторник

Среда

Четверг

Пятница

Суббота

Воскресенье

Ансамбль моделей. Итак, у нас есть семь моделей потребления контента в зависимости от дня недели. Пользуясь методом coef_ библиотеки sklearn, которая выводит наборы коэффициентов, а также методом intercept_, который возвращает свободный член неоднородной регрессионной модели, мы можем описать потребление в виде явной функции от времени:

1789.4219 - 85.5687 n + 2.2736 n2 -0.0153 n3

1575.2983 - 61.1187 n + 1.7041 n2 -0.0118 n3

1536.0606 - 57.3905 n + 1.6779 n2 -0.0119 n3

'Просмотры' = 1331.5792 - 32.1736 n + 0.8119 n2 - если 0.0046 n3

1018.4471 - 33.0131 n + 0.9056 n2 -0.0057 n3

0889.4622 - 41.2487 n + 1.2501 n2 -0.0089 n3

1621.7125 - 68.7657 n + 1.8182 n2 -0.0122 n3

Здесь n означает порядковый номер дня в ряду от 0 до 92. Эта функция не имеет аналитического описания, но это не делает ее менее привлекательной с точки зрения эффективности ее прогнозирующих свойств. Напротив, она эффективна именно потому, что не претендует на универсальность, а разнесена на семь записей в виде семи полиномов.

Метрика эффективности ансамбля моделей. Для того чтобы получить общую метрику эффективности ансамбля моделей, нужно вспомнить определение коэффициента детерминации [3, 4]:

R2 = 1 - S*/ S'.

Здесь S* — накопленный квадрат отклонения предсказанных значений от истинных значений целевой функции, а S' — накопленный квадрат отклонения среднего значения целевой функции от ее истинных значений.

Применяя метод predict библиотеки sklearn, получаем предсказанные значения у* для каждой из частичных моделей, вычитаем их из истинных значений у, возводим в квадрат и суммируем методом sum. После этого в цикле по дням недели складываем все частичные суммы, получаем S* для всего ансамбля моделей. Для вычисления знаменателя S' применяем метод mean, который возвращает среднее значение массива, к правой части общей регрессионной задачи, отнимаем среднее значение от общего массива истинных значений, возводим результат в квадрат и суммируем элементы массива методом sum.

В результате имеем R2 = 0.82. Если сравнить это значение с коэффициентом детерминации, полученным выше, когда мы строили кубическую модель на полных данных (тогда получалось R2 = 0.48), то окажется, что мы повысили метрику эффективности на 4 единицы в первом знаке после запятой! Это колоссальный рост коэффициента детерминации (обычно при повышении прогнозирующей способности регрессионной модели борьба ведется за хотя бы какой-нибудь сдвиг во втором знаке).

Выводы. Регрессионный анализ на частичных фрагментах данных с последующим построением ансамбля моделей обладает более высокой прогнозирующей способностью по сравнению с регрессионной моделью, построенной на полных данных по всей выборке.

Это происходит, прежде всего, из-за учета локальной структуры данных: алгоритмы ансамблирования моделей, построенные на частичных фрагментах данных, точнее учитывают локальную структуру данных и нелинейные зависимости в выборке. Модель, построенная на полных данных, может упустить некоторые особенности или несоответствия в данных, а это приводит к менее точным прогнозам.

В нашем исследовании нам удалось существенно повысить точность регрессионной модели после того, как мы включили в данные дополнительный такой показатель как день недели, что связано с недельным образовательным циклом. Однако ярко выраженная недельная цикличность наблюдается не только в образовании и потреблении образовательного контента, но и во многих других общественных, экономических и производственных процессах.

1. Например, в большинстве стран установлен 5-дневный рабочий график с выходными днями в субботу и воскресенье. Недельная цикличность имеет прямое отношение к этому графику.

2. Потребление продуктов и услуг также имеет недельную цикличность: в выходные дни у потребителей больше времени для похода в рестораны, совершения покупок или посещения культурно-развлекательных мероприятий [8, 9].

3. Отдельного внимания заслуживает изучение транспортного потока: интенсивность транспортного движения существенно меняется в зависимости от дня недели. В будние дни транспортный поток обычно увеличивается, особенно в часы пик, в выходные дни и вечером движение обычно снижается.

4. В туристической отрасли можно наблюдать выраженную недельную цикличность. Многие люди предпочитают ездить в путешествия на выходных, поэтому спрос на отели, рестораны и развлекательные мероприятия оказывается выше в эти дни.

И это лишь некоторые примеры процессов, в которых можно наблюдать ярко выраженную недельную цикличность.

С учетом сказанного выше, вне зависимости от предметной области, если процесс обладает ярко выраженной недельной цикличностью, то целесообразно провести регрессионное моделирование, учитывая этот фактор.

Прежде всего, абсолютно необходимо добавление фактора дня недели, так как включение этого фактора в регрессионную модель позволит учесть недельную цикличность. Для этого можно создать фиктивные переменные, соответствующие каждому дню недели, и включить их в модель в качестве предикторов. Это поможет учесть различия в поведении процесса по дням недели.

Кроме того, рекомендуется ансамблирование моделей, разделенных по дням недели. Это означает построение отдельных модели для каждого дня недели и использование их для прогнозирования в соответствующие дни. Когда такие модели построены и обучены, их можно объединить в виде ансамбля для получения общего прогноза.

Вместе с тем нужно отметить, что ансамблирование моделей может быть полезным, только если недельная цикличность действительно важна, и различия в поведении процесса действительно ярко выражены по дням недели. Следует помнить, что использование ансамблей моделей требует дополнительных ресурсов и анализа резуль-

татов, поэтому решение об организации ансамблирования нужно принимать на основе анализа данных, контекста и конкретных требований задачи прогнозирования.

Список литературы

1. Хейдт М. Изучаем Pandas. Москва: ДМК Пресс, 2018. 438 с.

2. Бурков А. Машинное обучение без лишних слов. СПб: Питер, 2020. 192 с.

3. Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования. М.: МЦИМО. 2013. 387 с.

4. Бринк Х. Машинное обучение / Х. Бринк, Дж. Ричардс, М. Феверолф. СПб.: Питер, 2017. 336 с.

5. Газизов Д. И. Обзор методов статистического анализа временных рядов и проблемы, возникающие при анализе нестационарных временных рядов // Научный журнал. 2016. № 3 (4). С. 9-14.

6. Фирулина М. М., Корунова Н. В. Разработка автоматизированных методов прогнозирования временных рядов // В сборнике: Прикладные информационные системы. Вторая Всероссийская НПК: сборник научных трудов. 2015. С. 401-405.

7. Безверхий О. В., Курейчик В. М. Применение интеллектуальных информационных технологий при прогнозировании временных рядов // В сборнике: Искусственный интеллект в автоматизированных системах управления и обработки данных. Сборник статей Всероссийской научной конференции. В 2-х томах. Москва, 2022. С. 160-165.

8. Козловский, В.Н. Цифровая среда поддержки управления конкурентоспособностью / В.Н. Козловский, Д.В. Айдаров, Д.И. Панюков, М.М. Васильев // Стандарты и качество. 2018. № 6. С. 86-89.

9. Козловский, В.Н. Потребительская ценность качества автомобилей / В.Н. Козловский, Г.Л. Юнак, Д.В. Айдаров, С.А. Шанин // Стандарты и качество. 2017. № 12. С. 76-80.

Мосин Владимир Геннадьевич, канд. физ.-мат. наук, доцент, [email protected], Россия, Самара, Самарский государственный технический университет,

Козловский Владимир Николаевич, д-р техн. наук, профессор, заведующий кафедрой, [email protected], Россия, Самара, Самарский государственный технический университет,

Благовещенский Дмитрий Иванович, д-р техн. наук, профессор, [email protected], Россия, Тула, Государственный региональный центр стандартизации, метрологии и испытаний в Тульской и Орловской областях

NEW QUALITY MONITORING TOOLS. MONITORING DATA, TIME SERIES OF CONTENT CONSUMPTION AND STRENGTHENING THEIR PREDICTING PROPERTIES

BY ENSEMBLY OF WEAK MODELS

V.G. Mosin, V.N. Kozlovsky, D.I. Blagoveshchensky

The article presents the results of the development and implementation of new quality management tools. Based on the available time series of data on content consumption on the channel of one of the leading hosting providers, a regression model was built that approximates its behavior by a cubic polynomial. After dividing the data into several non-overlapping classes, a series of similar regression models was built. It is shown that ensemble of partial models leads to a significant increase in the predictive ability of regression analysis.

Key words: content, quality assessment, data analysis, regression, scikit-learn, pandas.

Mosin Vladimir Gennadievich, candidate of physical and mathematical sciences, do-cent, [email protected], Russia, Samara, Samara State Technical University,

Kozlovsky Vladimir Nikolaevich, doctor of technical sciences, professor, head of the department, [email protected], Russia, Samara, Samara State Technical University,

Blagoveshchensky Dmitry Ivanovich, doctor of technical sciences, professor, [email protected], Russia, Tula, State Regional Center for Standardization, Metrology and Testing in the Tula and Orel Regions

УДК 629.113

DOI: 10.24412/2071-6168-2024-1-246-247

ИНСТРУМЕНТЫ МОДЕЛИРОВАНИЯ В ОБЕСПЕЧЕНИИ КАЧЕСТВА НОВЫХ КОНСТРУКЦИЙ АВТОМОБИЛЕЙ В ПРОЦЕССЕ ПРОЕКТИРОВАНИЯ

И.А. Беляева, В.Н. Козловский, С.А. Васин

В статье представлены результаты анализа современных инструментов моделирования используемых при проектировании автомобилей и электромобилей.

Ключевые слова: конкурентоспособность; качество; автомобиль.

На этапе разработки концепции новых автомобилей разработчик может учитывать различные проблемы которые могут возникнуть в процессе проектировании. Один из надежных способов сделать это - поручить этот этап специалисту имеющему большой практический опыт. Однако в отношении новых материалов - высокопрочных сталей, алюминия и магния - на многие подробные вопросы в отношении новых материалов не имеют полного ответа, поэтому опыт не помогает определить, как следует производить детали. Базы данных содержат знания, к которым можно обращаться в любое время. Тут важным является корректное внесение новой информации и обслуживание большого объема информации. Кроме того, пользователи должны передавать свои знания в общую базу данных. Но несмотря на существующие информационные базы, все еще существуют вопросы об использовании новых материалов [1, 2].

Выбранный метод моделирования процесса полного жизненного цикла автомобиля зависит от конечных результатов, которые должны быть получены, и данных, доступных на определенном этапе разработки. При подобных методах обычно для моделирования требуется только геометрия компонента и минимальные ее характеристики - материал, толщина (если это не объемный компонент или компонент, который отвечает за тепловые, электромагнитные и другие подобные явления). Характеристики материала и толщина листа являются достаточным набором характеристик для начала работы по моделированию формования [3, 4].

Более точные одностадийные результаты можно получить, включив элементы в математическую модель расчета, чтобы учесть влияние инструмента формовки. Кроме того, эти данные можно использовать для последующего точного проектирования самой оснастки [5].