Научная статья на тему 'Подготовка данных для построения нейросетевых моделей при малом количестве экспериментов'

Подготовка данных для построения нейросетевых моделей при малом количестве экспериментов Текст научной статьи по специальности «Химические технологии»

CC BY
222
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБУЧЕНИЕ НЕЙРОННОЙ СЕТИ / СТАТИСТИЧЕСКИЙ МЕТОД / ЧИСЛЕННЫЙ ЭКСПЕРИМЕНТ / ПРОЧНОСТЬ / NEURAL NETWORKS TRAINING / STATISTICAL METHOD / NUMERICAL EXPERIMENT / TOUGHNESS

Аннотация научной статьи по химическим технологиям, автор научной работы — Соколовский Алексей Ратмирович, Соколовская Ирина Юрьевна

В статье представлена методика статистического моделирования данных для обучения нейронных сетей с целью прогнозирования прочностных свойств волокнисто-пористых биокомпозитов. Методика апробирована на примерах данных экспериментальных исследований прочности хромовых кож из бычины и эластичных кож

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по химическим технологиям , автор научной работы — Соколовский Алексей Ратмирович, Соколовская Ирина Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA MINING FOR CONSTRUCTION MODELS OF NEURAL NETWORKS UNDER LIMITED NUMBER OF EXPERIMENTS

The approach of statistical modeling of data for neural networks training in order to predict strength characteristics for fiber-porous biocomposites is presented. This approach was attested on the examples of test data of the toughness for box-calf and elastic leather

Текст научной работы на тему «Подготовка данных для построения нейросетевых моделей при малом количестве экспериментов»

УДК 675.017:519.6:004

UDC 675.017:519.6:004

ПОДГОТОВКА ДАННЫХ ДЛЯ ПОСТРОЕНИЯ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ ПРИ МАЛОМ КОЛИЧЕСТВЕ ЭКСПЕРИМЕНТОВ

Соколовский Алексей Ратмирович к. т. н., доцент

Соколовская Ирина Юрьевна к. т. н., доцент

Новосибирский технологический институт Московского государственного университета дизайна и технологии, Россия

В статье представлена методика статистического моделирования данных для обучения нейронных сетей с целью прогнозирования прочностных свойств волокнисто-пористых биокомпозитов. Методика апробирована на примерах данных экспериментальных исследований прочности хромовых кож из бычины и эластичных кож

Ключевые слова: ОБУЧЕНИЕ НЕЙРОННОЙ СЕТИ, СТАТИСТИЧЕСКИЙ МЕТОД, ЧИСЛЕННЫЙ ЭКСПЕРИМЕНТ, ПРОЧНОСТЬ

DATA MINING FOR CONSTRUCTION MODELS OF NEURAL NETWORKS UNDER LIMITED NUMBER OF EXPERIMENTS

Sokolovsky Aleksey Ratmirovich Cand.Tech.Sci., assistant professor

Sokolovskaya Irina Yrevna Cand.Tech.Sci., assistant professor

Novosibirsk Technological Institute, a branch of Moscow State University Design and Technology, Novosibirsk, Russia

The approach of statistical modeling of data for neural networks training in order to predict strength characteristics for fiber-porous biocomposites is presented. This approach was attested on the examples of test data of the toughness for box-calf and elastic leather

Keywords: NEURAL NETWORKS TRAINING, STATISTICAL METHOD, NUMERICAL EXPERIMENT, TOUGHNESS

Одной из основных проблем при создании нейросетевых моделей для анализа экспериментальных данных и дальнейшего использования при прогнозировании является количество данных, необходимое для обучения и тестирования сети. Малое число примеров может вызвать "переобученность" сети [1-3], когда она хорошо функционирует на примерах обучающей выборки, но плохо - на тестовых примерах, подчиненных тому же статистическому распределению. Считается [4,5], что число наблюдений должно быть в десять раз больше числа связей в сети.

При построении нейронных сетевых моделей для прогнозирования прочностных свойств материалов часто сталкиваются с проблемой недостаточности обучающей выборки [6,7]. Если задача получения большего количества данных при пассивном эксперименте связана в основном с временными затратами, то при активном эксперименте - это еще и большие материальные расходы.

Физико-механические свойства материалов имеют четкую вероятностную природу, начиная с атомно-молекулярного уровня и заканчивая уровнем элемента конструкции. Свойства материала оказываются не только различными в разных точках одного и того же элемента конструкции, но они являются различными и при испытании образцов в лабораторных условиях [8,9]. Для волокнисто-пористых биокомпозитов это объясняется наличием неконтролируемых флуктуаций химического состава материала, его композиционной структурой, случайными изменениями параметров технологических процессов и их неустойчивостью. В силу особенностей структуры ориентация пучков коллагеновых волокон носит случайный характер [6], поэтому отмечают преимущественную ориентацию волокон в одном из направлений (в чепрачной части - вдоль хребтовой линии), что на макро-уровне приводит к проявлению анизотропных свойств. В результате такие физикомеханические характеристики, как предел прочности, относительное удлинение при разрыве, неупругая деформация приобретают ярко выраженный стохастический характер.

На предприятиях производства кожи и меха лабораторией технического контроля осуществляется инструментальный контроль физико-механических свойств кожевой ткани выборочно по партии, которые комплектуются по виду исходного сырья и другим параметрам. Прочностные свойства определяются в среднем при разрыве образцов в продольном и поперечном направлении хребтовой линии (сопротивление разрыву, сопротивление разрыву по лицу, предельные удлинения) [10] из стандартных участков кож, взятых случайным образом из партии. Количество данных, полученных за несколько лет измерений обычно достаточно для построения нейросетевой модели, но, так как в плоскости листа материал проявляет ортотропные свойства, для построения поверхности прочности необходимы дополнительные данные по

прочностным показателям, как минимум, в направлении 450 к хребтовой линии кож [11,12].

На основании вышеизложенного стоит задача дополнения экспериментальных данных за счет статистического моделирования.

При моделировании экспериментальных данных, отражающих макро-неоднородности материала, необходимо исходить из того, что причиной их рассеяния могут являться два фактора: свойства материала (неоднородность, вариации химического состава) и методики испытаний (погрешность изготовления образцов и измерений деформаций или приложенной нагрузки и т.д.). Таким образом, предполагаем, что предельные состояния образцов являются аддитивными составляющими двух случайных функций:

°р = °1 +°2, (1)

где М[ о2 ] = 0 и о1 <<о2 (М[^] - оператор математического ожидания).

В связи с этим о2 может рассматриваться как шум, порождающийся

второй группой факторов и наложенный на случайную функцию с1,

отражающую стабильные случайные свойства материала. Так как роль о2 сводится к созданию незначительных флуктуаций около каждой из реализаций о1, то при создании статистической модели данных о2 в явном виде может быть опущена.

При построении стохастической модели данных по предельным напряжениям и предельным деформациям волокнисто-пористого биокомпозита необходимо:

- иметь экспериментальные данные по предельным напряжениям и предельным деформациям в направлениях: преимущественной ориентации пучков коллагеновых волокон, под углом 900 и 450 к этому направлению;

- установить вид законов распределения случайных значений

модели;

- установить корреляционную зависимость между предельным напряжениями и (или) предельным деформациям в направлении преимущественной ориентации пучков коллагеновых волокон и ориентированных под углом 900 и 450 к этому направлению.

Предположим, что величины: аЦ - предел прочности при

нагружении в направлении преимущественной ориентации волокон; ар2 -предел прочности при нагружении в направлении 900 к преимущественной ориентации волокон; ар2 - предел прочности при нагружении в

направлении 450 к преимущественной ориентации волокон имеют случайный характер. В тоже время их значения связаны между собой регрессионной зависимостью.

Обозначая через F(X) любую из перечисленных величин, можем записать [13]:

F (X) = M [X] + 5 [X]• п , (2)

где п - нормированная случайная величина, М [п] = 0, М [п2 ] = 1,

М«] и £[•] - соответственно операторы математического ожидания и

среднеквадратического отклонения (5 = 4о, 0[^] - оператор дисперсии). Преобразуем (2) к виду

F (X )= М (X )• Очевидно, что при

1+Ж

М (X)

(3)

5 (X)

= сот1

(4)

М (X)

соотношение (3) преобразуется к виду

F ^) = т • М [X], М [т] = 1, (5)

Определяя коэффициенты эмпирической линейной регрессии

получим зависимость этих величин от значений предельных напряжений в направлении преимущественной ориентации волокон. Из (6) учетом (5) получаем модельные значения для обучения нейронной сети. Вместо линейной зависимости в (6) и (7) может быть использована и нелинейная корреляционная зависимость.

Алгоритм моделирования статистических данных состоит в следующем. На основании данных экспериментов проверяется гипотеза корреляционной зависимости данных и определяется уравнение регрессии. С учетом функциональной зависимости в средних значениях, соотношения (4) и генерации случайных величин п (5), распределенных по нормальному закону, получаем набор данных.

Экспериментальная проверка условия (4) и моделирования статистических данных была выполнена на основании экспериментальных данных по определению предела прочности бычины хромового дубления и эластичных кож. Данные получены на ЗАО «КОРС», отбор производился по отдельным кожам, взятых случайным образом по три из партии. Из каждой кожи отбиралось по три образца направлением ориентации вдоль,

а 22 (а') на а' [14]:

°22 (ар1 ) = ар2 + Ь21 -ар1 ) ,

ар2 (ар1 ) = ар2 + Ь31 -аП ) ,

(6)

(7)

где ар2 и ар ар2 - средние выборочные ар2 и ар и ар2;

г (ар2, ар) и г (ар2, ар) - коэффициенты корреляции,

поперек и под углом 45 к хребтовой линии, усредненные значения по образцам использовались при дальнейшей обработке и моделировании.

В таблице 1 представлены данные по корреляции значений предельных напряжений для различных кож (рисунки 1, 2).

Таблица 1 Значение коэффициентов корреляции

Материал °р2 ^2

бычина °0 1 0,977 0,775

^45 °!2 0,977 1 -

^90 ^2 0,775 - 1

эластичные кожи °0 1 0,823 0,543

^45 0,823 1 -

^90 ^2 0,543 - 1

полукожник °0 1 0,995 0,947

^45 °р2 0,995 1 -

^90 ^2 0,947 - 1

а) б)

Рисунок 1 Регрессионные зависимости значений предельных напряжений для бычины: а) о 0 и о 90 - предельные напряжения соответственно вдоль и поперек хребтовой линии, МПа; б) о0 и о45 - предельные напряжения соответственно вдоль и под 450 к хребтовой линии, МПа

Как видно из таблицы значения коррелированны между собой, что позволяет найти функциональные зависимости в средних значениях.

а) б)

Рисунок 2 Регрессионные зависимости значений предельных напряжений для эластичных кож: а) о0 и о90 - предельные напряжения соответственно вдоль и поперек хребтовой линии, МПа; б) о0 и о45 - предельные напряжения соответственно вдоль и под 450 к хребтовой линии, МПа

На рисунках 3 и 4 представлены полигоны и функции нормального распределения для значений предельных напряжений образцов.

МО ^ Ю ЛЮ

20 30 40 17 37

О 0 , мпа О 45 . МПа <7 до ■ МПа

Рисунок 3. Функции нормального распределения 1 и полигоны 2 для предельных напряжений бычины: о0, о90 и о45 - предельные

напряжения соответственно вдоль, поперек и под 450 к хребтовой линии, МПа.

Проверка по критерию Пирсона С2 [13] (Таблица 2) подтвердила высокую степень согласованности статистических и теоретических распределений.

Рисунок 4 Функции нормального распределения 1 и полигоны 2 для предельных напряжений эластичных кож: о0, а90 и о45 - предельные напряжения соответственно вдоль, поперек и под 450 к хребтовой линии, МПа

В соответствии с полученными значениями критерия Пирсона гипотезу о выбранных законах распределения можно считать правдоподобной.

Таблица 2. Значения величин критерия Пирсона %2

Материал Направление Расчетное .,2 значение c Критическое .,2 значение С

вдоль хребтовой линии 5,944 5,991

Бычина поперек хребтовой линии 1,836 5,991

под 450 к хребтовой линии 1,570 5,991

Эластичные кожи вдоль хребтовой линии 5,801 5,991

поперек хребтовой линии 4,52 5,991

под 450 к хребтовой линии 1,982 5,991

вдоль хребтовой линии 5,801 5,991

Полукожник поперек хребтовой линии 4,52 5,991

под 450 к хребтовой линии 1,982 5,991

Таким образом, разработанная методика моделирования

статистических данных позволяет дополнить результаты экспериментов до необходимого количества для построения нейронной сети.

Список литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Хайкин, Саймон Нейронные сети: полный курс /Саймон Хайкин. — М.: «Вильямс», 2006. -1104 с.

2. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных /Под. ред. В.П. Боровикова. 2-е изд., перераб. и доп. -М.: Горячая линия-Телеком, 2008. -392 с..

3. Джейн Анил, К. Введение в искусственные нейронные сети./ Джейн Анил К., Мао Жианчанг, К.М. Моиуддин // Открытые системы - 1997 - №4. - с. 3-24

4. Горбань, А.Н. Обучение нейронных сетей. -М.: Изд. СССР-США СП "ParaGraph", 1990. 160 с. (English Translation: AMSE Transaction, Scientific Siberian, A, 1993, Vol. 6. Neurocomputing, рр.1-134).

5. Горбань, А.Н. Нейронные сети на персональном компьютере.// А.Н.Горбань, Д.А. Россиев. -Новосибирск: Наука, 1996. 276 с.

6. Соколовский А. Р. Прогнозирование прочности волокнисто-пористых биокомпозитов с использованием нейронных сетей (монография) / А.Р. Соколовский -М.: МГУДТ. 2010. 92 с. ISBN 978-5-87055-121-0

7. Мунасипов С.Е. Построение поверхности прочности анизотропного пористоволокнистого биокомпозита с применением нейронных сетей //С. Е. Мунасипов, А.Р. Соколовский, И.Ю. Соколовская / Динамика систем, механизмов и машин. Материалы VII Международной научно-технической конференции -Омск: ОмГТУ, 2009. -Кн. 2. с.384

8. Ломакин, В. А. Статистические задачи механики твердых деформируемых тел. / В.А. Ломакин М.: Наука. 1970. 139 с.

9. Самарин, Ю.П. О применении стохастических уравнений в теории ползучести материалов // Изв. АН СССР. МТТ, 1974. №1. С. 88-94.

10. ГОСТ 938.11-69 Кожа. Метод испытания на растяжение.. -М.: Издательство стандартов. 10 с.

11. Соколовский А. Р. Исследование анизотропии прочностных свойств кож для низа обуви и кожгалантерейных изделий. // А.Р. Соколовский, А.С. Железняков /Обувь: Маркетинг конструирование технология, материалы. Межвузовский сборник научных трудов. -М: МГАЛП, 1999. с.71-74

12. Соколовский А. Р. Влияние технологических операций на прочность волокнисто-пористого биокомпозита / А. Р. Соколовский // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №61(09). - Режим доступа: http://ej.kubagro.ru/2010/07/pdf/07.pdf

13. Вентцель, Е.С. Теория вероятностей. М.: Наука. 1969. 576 с.

14. Корн, Г.Справочник по математике для научных работников и инженеров / Г. Корн, Т. Корн - М: Наука. - 1984. - 831 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.