УДК 519.85
МАТЕМАТИЧЕСКАЯ ФОРМАЛИЗАЦИЯ ЗАДАЧИ НАКОПЛЕНИЯ ИНФОРМАЦИИ ПРИ ПОЭТАПНОМ ПОСТРОЕНИИ ИНС-МОДЕЛИ ЭКСПЕРТНОЙ СИСТЕМЫ
С ВЕБ-ИНТЕРФЕЙСОМ
© А.В. Неудахин, А.А. Арзамасцев
Ключевые слова: экспертная система; формализация; ИНС-модель; веб-интерфейс.
Освещаются вопросы, касающиеся задачи накопления информации, поступающей с распределенных терминалов, необходимой для построения ИНС-модели экспертной системы с веб-интерфейсом.
Основные принципы формализации. Пусть имеется распределенная система получения исходной информации, включающая N терминалов, каждый из которых предназначен для ввода п независимых параметров, имеющих т уровней каждый. Работа терминалов организована таким образом, что каждый из них работает лишь часть времени так, что интервалы их простоя являются случайными величинами, заданными плотностями распределений ру(т), р2(т), ■■■, Р^т). Время ввода информации не зависит от номера терминала, но линейно зависит от п, т. е. тпри, = куп, где ку - некоторый коэффициент пропорциональности. Будем считать, что очередная доля информации добавляется к БД в виде одной записи, когда на г-м терминале (г = 1, ■■■, Л) каждому независимому параметру х) ( = 1, ■■■, п) присвоен соответствующий уровень 1Ь (Ь = 1, ■■■, т). Также учитывается, что передача информации с любого терминала в БД осуществляется мгновенно, т. к. это время на несколько порядков меньше времени, затрачиваемого пользователем на ввод информации.
Тогда среднее время одного цикла работы г-го терминала (ввод + ожидание следующего ввода информации), соответствующее добавлению в базу данных одной записи, может быть вычислено как:
т. = км +
^т рі (т)аТ .
Поэтому за период времени Т (например, Т = 24 ч) на г-м терминале могут быть осуществлена: г1 циклов ввода, соответствующие добавлению в базу данных г1 записей: Т . Необходимо отметить,
кп + ^ т Р (т)Л
0
что Гг является целым числом, полученным в результате округления в большую сторону полученного из уравнения значения. Соответственно, общее число записей информации в БД, полученное со всех терминалов за период Т, составит:
Выполним оценку периода первичного накопления данных в БД, предшествующего первому обучению ИНС-модели.
В соответствии с теоремами А.Н. Колмогорова [1, 2] о представимости функций нескольких переменных с помощью суперпозиций и сумм функций одного переменного, можно утверждать, что каждая непрерывная функция п переменных (в ЭС п соответствует количеству вводимых независимых параметров), заданная на единичном кубе п-мерного пространства, пред-
2п+1 п
ставима в виде: / (Хі, х2,...Хп) = Тк“ Хфр (хр)
4=1 _ р=1
где функции И (м) непрерывны, а функции фр (х ),
кроме того, еще и стандартны, т. е. не зависят от выбора функции /
Фактически это означает, что «минимальная» структура ИНС-модели, позволяющая аппроксимировать функцию п переменных, должна иметь следующий вид: входной слой, состоящий из п (п соответствует переменным функции) нейронов, первый скрытый слой, включающий (2п + 1)п функциональных нейронов, второй скрытый слой, состоящий из (2п + 1) функциональных нейронов, и выходной, суммирующий нейроны (рис. 2). Указанная нейронная сеть не является полносвязанной и имеет (2п + 1)-п + (2п + 1)-п + 2п + + 1 = (2п + 1)2 связей (степеней свободы при обучении ИНС-модели).
Необходимо заметить, что теоремы А.Н. Колмогорова не несут никакой информации о типе нелинейности функций ф и к. Так, в системе знаний экспертной системы, базируемой на ИНС-модели, используется
активационная функция /(х) =-—— и полносвя-
1 + е “
занная сеть - многослойный персептрон. Для этого случая число степеней свободы ИНС-модели будет (2п + 1)-(3п2 + п + 1). Учитывая, что число записей в БД должно быть не меньше, чем число степеней свободы, получим оценку для первичного периода накопления данных:
км + ^ р (т)Л
О
г=1
г=1
(l)
где К - параметр, характеризующий число степеней свободы: K = (2п +1)2 для ИНС-модели, построенной в соответствии с теоремой А.Н. Колмогорова, и K = (2п +1) х
х (Зп2 + п +1) для полносвязанной ИНС-модели.
Процесс обучения модели знаний ЭС заключается в минимизации функционала вида:
E[w(n)] = ||A|| = \Ytab‘ - Y“‘ (w) И
на котором она будет зафиксирована в конце цикла обучения ИНС-модели; к4 - параметр удельной скорости обучения, зависящий от п, объема обучающей выборки и используемого метода минимизации невязки (2); Г - безразмерное время процесса обучения, полученное отнесением реального времени к времени первого цикла обучения Ге[ГьГ2] (рис. 3, 4). Уравнение (4) отражает феноменологию процесса обучения: в начальный момент времени невязка равна Е0 и стремится к Ев конце цикла обучения.
Разделяя переменные в уравнении (4) и интегрируя, получим:
(2)
I
dE (t) k4 (E * - E(t))
= |dt
Вектор ^ определяется структурой сети, которая, в свою очередь, связана с числом ее входов п (п соответствует числу нейронов входного слоя ИНС-модели) так, что имеется однозначное соответствие п и w. По*
этому вектор w , зависящий от структуры сети и минимизирующий функционал (2), соответствует оптимальной ИНС-модели и может быть определен как:
w = argminF (w)
weQ
iF (w),
(З)
где Q - множество векторов весовых коэффициентов нейронов.
Минимизацию функционала (2) осуществляем двумя методами: градиентным, так что последующие значения вектора w вычисляются по формуле wt+1 = w - h(t)grad(E(w‘)) , и методом сканирования. Для указанных методов оценки времени обучения могут быть получены следующим образом: ®gr„d = k2nR и &skan = k3RaN. Здесь k и k - коэффициенты, зависящие от технических характеристик используемого оборудования, a - число разбиений диапазона изменения переменной.
Целью обучения ИНС-модели на основе эмпирических данных является нахождение подходящей структуры и коэффициентов ИНС, минимизирующих невязку (2). Указанная структура обобщает в себе знания, полученные на основе данных, поступивших с терминалов в БД.
Данные, используемые для обучения ИНС-модели, могут различаться как в количественном отношении (число записей в БД на момент начала обучения), так и в качественном (дисперсия, наличие ошибок и т. д.). Поэтому разработка аналитической модели обучения для различных объектов не позволяет использовать теоретические подходы. В качестве эмпирической модели обучения предлагается использовать следующее дифференциальное уравнение:
= k4 E - E(t)], (4)
dt
с начальным условием: E(0) = E0,
где E(t), Eo и E* - значения приведенной среднеквадратичной погрешности, ее начального значения и уровня,
-1 ln[*4 (e* - E(t))] = t + с.
k 4
Рис. 2. Представление функции n переменных в виде MHC-модели
Е*=0,0б
E0=l
к=1
Е*
, , , : j t
Т
Рис. 3. Корреляция эмпирических данных по среднеквадратичной погрешности обучения сети - Е (треугольники) от времени обучения с результатами расчета по уравнению (5). На графике показаны приведенные безразмерные значения
Рис. 4. Зависимость накопления первичной информации от безразмерного времени (верхняя часть рисунка): R - число записей в БД, полученных с терминалов; процесс обучения ИНС-модели (нижняя часть рисунка): Е - приведенная среднеквадратическая ошибка ИНС-модели, L - уровни ее обученности
Определив постоянную интегрирования из начальных условий (4), получим решение в виде:
E(t) = E * (1 - e - k4t)+ E0e-k4‘.
(5)
Предложенные аналитические модели (1), (5) на практике позволяют решить следующие задачи: оценить первичный период накопления информации, необходимой для построения ИНС-модели исследуемого объекта; определить начальную структуру ИНС-моде-ли на основе входных характеристик объекта исследования; сделать оценку количества циклов обучения ИНС-модели в присутствии эксперта.
ЛИТЕРАТУРА
1 Колмогоров А.Н. О представлении непрерывных функций нескольких переменных суперпозициями непрерывных функций
меньшего числа переменных // Докл. АН СССР. 1956. Т. 108. № 2. С. 179-182.
Колмогоров А.Н. О представлении непрерывных функций нескольких переменных в виде суперпозиции непрерывных функций одного переменного // Докл. АН СССР. 1957. Т. 114. № 5. С. 953956. (Цит. по: Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996).
Поступила в редакцию 20 ноября 2013 г.
Neudakhin A.V., Arzamastsev A.A. MATHEMATICAL FORMALIZATION OF PROBLEM OF INFORMATION ACCUMULATION IN PHASED CONSTRUCTION OF ANN-MODEL OF EXPERT SYSTEM WITH WEB INTERFACE The issues related to the problem of accumulation of information from the distributed terminals needed to build the ANN-model of the expert system with a web interface are considered.
Key words: expert system; formalization; ANN-model; web interface.
Неудахин Александр Викторович, Тамбовский государственный университет им. Г.Р. Державина, г. Тамбов, Российская Федерация, магистрант по направлению подготовки «Прикладная математика и информатика» института математики, физики и информатики, e-mail: [email protected]
Neudakhin Aleksander Viktorovich, Tambov State University named after G.R. Derzhavin, Tambov, Russian Federation, Candidate for Master’s Degree of Direction of Preparation of “Applied Mathematics and Informatics” of Mathematics, Physics and Informatics Institute,, e-mail: [email protected]
Арзамасцев Александр Анатольевич, Тамбовский государственный университет им. Г.Р. Державина, г. Тамбов, Российская Федерация, доктор технических наук, профессор, зав. кафедрой компьютерного и математического моделирования, email: [email protected]
Arzamastsev Alexander Anatolyevich, Tambov State University named after G.R. Derzhavin, Tambov, Russian Federation, Doctor of Technics, Professor, Head of Computer and Mathematical Simulation Department, e-mail: [email protected]