Научная статья на тему 'Метод создания лингвистических переменных нечеткой модели'

Метод создания лингвистических переменных нечеткой модели Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
125
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛИРОВАНИЕ / СТАТИСТИЧЕСКИЕ ДАННЫЕ / НЕЧЕТКАЯ ЛОГИКА / АЛГОРИТМ СУГЕНО / БАЗА ПРАВИЛ / ФУНКЦИЯ ПРИНАДЛЕЖНОСТИ / ТЕРМ / АВТОМАТИЗАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Морозов Антон Игоревич, Писарев Александр Иванович

Предложен метод создания лингвистических переменных нечетких моделей объектов и процессов, который исключает участие экспертов при их разработке. Алгоритм имеет широкую область применения, т. к. основан только на обработке статистических данных

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Морозов Антон Игоревич, Писарев Александр Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

This paper proposes a method of creating of linguistic variables for the fuzzy models of objects and processes, which excludes the participation of expert» in their design. The algorithm has a wide of application, since it is based only on statistical data processing.

Текст научной работы на тему «Метод создания лингвистических переменных нечеткой модели»

графических образов. Тестовые данные содержали 1700 векторов идентификационных признаков. Значение выходной переменной ННС является вещественным числом, поэтому для оценки точности прогнозирования допускалось варьирование в пределах до 0,01 в большую и меньшую стороны. Ошибки обучения и классификации рассчитывались по формуле (9).

Как показывают экспериментальные исследования, подход с использованием ННС является

наиболее оправданным, поскольку при расширении диапазона девиации архитектура сети не изменится, дополнительный объем вычислений будет незначительным, по сравнению с МНС. Предлагаемый метод не требует ручной настройки параметров и конфигурации, как это требует нечеткий вывод, а также не требует постоянного присутствия эксперта в работе. Данный подход можно использовать для распознавания различных образов: визуальных и звуковых сигналов; финансовых и социальных ситуаций.

СПИСОК ЛИТЕРАТУРЫ

1. BaseGroups Labs. Технологии анализа данных [Электронный ресурс] http://www.basegroup.ru

2. Фомичева, С.Г. Нейро-нечеткий анализ графических образов экосистемы [Текст] / С.Г. Фомичева, С.А. Мальчевский // Научно-технические ведомости СПбГПУ - 2009. - № 2. - С. 115-122.

3. Демидова, Л.А. Алгоритмы и системы нечеткого вывода в задачах диагностики городских инженер-

ных телекоммуникаций [Текст] / Л.А. Демидова, В.В. Кираковский, А.Н. Пылькин. -М.: Радио и связь - Горячая линия - Телеком. - 2005. - 592 с.

4. Леоненков, А.В. Нечеткое моделирование в среде Matlab и FuzzyTECH [Текст] / А.В. Леоненков. -СПб.: БХВ-Петербург, 2005. - 736 с.

УДК 681.5.017

А.И. Морозов, А.И. Писарев

МЕТОД СОЗДАНИЯ ЛИНГВИСТИЧЕСКИХ ПЕРЕМЕННЫХ

НЕЧЕТКОЙ МОДЕЛИ

Алгоритм построения «нечеткой» модели Су-гено благодаря виду подзаключений [1, 2] своих правил позволяет получить адекватные результаты при наличии необходимых статистических данных. Существующие методы настройки базы правил Сугено основаны на компенсировании «мгновенной ошибки» (разницы между рассчитанным и фактическим значениями) [2]. Главными недостатками этих методов являются:

количество термов, выбор вида функций принадлежности и структура правил устанавливается «экспертом» и не изменяется при настройке «нечеткой» модели;

статистика используется только для расчета настроечных параметров функций принадлежности.

В данной статье предлагается метод построения «нечетких» моделей, лишенный этих недостатков.

Формализация задачи

Введем понятие строки статистических данных - совокупность значений входных и выходных параметров в фиксированный момент времени tv, обозначим Zv = ), У^у)}, где ) -значение .-го входного параметра в момент времени tv, и . = 1 Ы, V = 1 К ; уру) - значение 7-го выходного параметра в момент времени tv, где 7 = 1 ^ Ь; М = {2} -множество строк статистических данных.

Статистические данные должны удовлетворять следующим требованиям:

количество строк статистических данных (К) и количество входных параметров (Ы) должны удовлетворять условию К >> Ы;

строки статистических данных не должны повторяться;

статистические данные должны содержать информацию только об установившихся режимах работы объекта моделирования.

Практическое использование теории нечеткого вывода предполагает наличие функций принадлежности, которыми описываются входные параметры.

В литературе [1-3] предлагается несколько видов функций принадлежности и методов их построения. Наиболее часто используется функция Гаусса. Ее достоинство в том, что она задается всего двумя параметрами. В то же время функция никогда не принимает нулевое значение, что является существенным недостатком, т. к. на этапе фаззификации становятся активными все правила. Этот недостаток приводит к множеству дополнительных расчетов, а, следовательно, и к повышению трудоемкости.

Введем следующие обозначения: и. - количество термов /-го входного параметра; х - координата максимума у-го терма /-го входного параметра, где у = 1 ^ и.; Д - носитель у-го терма / -го входного параметра; X .. = {х/^)} -множество значений -го входного параметра; ц/у(х.) - функция принадлежности у-го терма /-го входного параметра.

Решением задачи будет считаться определение конечного числа термов и лингвистической переменной с конкретными значениями х и Д.,

г Г /у /у?

а также коэффициентов функций подзаключений, максимально правдоподобно отображающих исходные статистические данные.

Для решения данной задачи предлагается применять следующую функцию принадлежности (пример функций принадлежности для трех термов Т Т Т показан на рис. 1).

Такая функция задается формулой:

Э1П

271

А

-х, +---

2ты:„

Д»

+ 1

пг У

д.

При X; I

О, при х, е

¿V _ ,

—- х Ч---

2 ' * 2

(1)

и

х1У + ' 2

+ оо

Примем следующие обозначения:

Х™", Хтах - нижнее и верхнее значения /-го входного параметра; х™п, хтах - координаты нижнего и верхнего граничных значений у-го терма /-го входного параметра.

Алгоритм формирования термов лингвистических переменных

Для формирования термов входных параметров необходимо определить значения х и Д для каждого из них. Процедура вычисления параметров следующая.

1. Введем две промежуточные переменные а и X, начальное значение которых единица.

2. Произведем сортировку строк статистических данных во множестве М по возрастанию входного параметра Х%.

3. Определим количество термов для каждого входного параметра по формуле:

Рис. 1. Пример функций принадлежности

и. = К - (а(Ы + 1) - 1). (2)

4. Выполним выборку V1 строк статистических данных по формуле:

Уу ={м\хх{фхх(0<х^у+а[м+1у1)}. (3)

5. Выполним выборку У2 значений .-х входных параметров по формуле:

У^^ЛО^1}- (4)

6. Определим множества У™11 и У™* значений .-х входных параметров, удовлетворяющих условиям:

(5)

7. Определим границы термов хтп и х тах по

формулам:

ШШ _ I у

х*г IУ

Г тах У™", при шшУЬтш X,.;

I V ' V 1 V

1Х™1, при гтп V,2 = тт X..

I V ' V

тт У™*, при тах У? < тах X ;

V * V ' V

(6)

тах _ ) у ' V ■ V (7)

" IХ™, при тах У? = тах X,.. (7)

I V ' V

8. Объединим термы, у которых носители совпадают, либо один носитель находится внутри другого.

9. Определим для каждого терма значения координаты центра термов х и носителя Д по формулам:

тах _ тш

- тш , ¡У

X = Ч-----—

'У <у Т 0

г/ "г/

(8)

10. Сформируем базу правил путем перебора всех возможных комбинаций термов входных параметров:

№ 1:Еслих1(^)е Гл и л:2(?)е Т21 и ...

и 2Ь5ПВ 521(4 ...,5Ы(0;

№ 2:Еслих1(^)е Ти и *2(0е ^21 и —

То 512(г), 522(?), ...,5^(0;

№ Я ¡ЕслиX!(*)б Тщ и *2(0е и ... и *ж(0е Г^, То 51д(О,

Здесь: Гу - у терм .-го входного параметра; 5.р -7-е подзаключение р-го правила, где р = 1 ^ Я .

11. Определим количество правил Я по формуле:

*=гк

12. Проверим следующие условия (для того, чтобы в каждое из Я правил попадало по (Ы + 1) строк статистических данных):

1) если хотя бы одному из правил соответствует менее (Ы + 1) строк, тогда переменная а увеличивается на единицу и повторяются все действия с п. 3;

2) если ни одному правилу не соответствует число строк менее (Ы + 1), но хотя бы одному правилу соответствует число строк более (Ы + 1), то такие правила необходимо делить следующим образом:

делению подвержены только термы '-го входного параметра;

при делении термов структура правила (термы остальных входных параметров и подзаклю-чения) не изменяется;

количество новых правил определяется как разность между количеством строк статистических данных, соответствующих правилу, и числом входных параметров;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

терм Т^, соответствующий правилу с избыточным количеством строк, разделяется на термы (Т'х , Т" и т. д.) так, чтобы каждому новому правилу соответствовало (Ы + 1) строк статистических данных;

после деления всех правил объединяются только одинаковые термы '-го входного параметра;

повторяющиеся правила сокращаются.

При определении количества термов и их параметров х и Д одновременно формируется база правил.

Далее необходимо определить значения коэффициентов в подзаключениях. Формула для расчета подзаключений Сугено имеет вид:

(10)

где В/ - коэффициенты .-го подзаключения р-го правила, где £ = 0 ^ Ы.

Преобразовав формулу (10), получим уравнение (Ы + 1)-мерной плоскости в Ы координатах х,(0 и .):

+ А3„ =0, (11)

¡=1

где А1 , А2 , А3 - множества параметров

р.' р/ р. 1-1-

(Ы + 1)-мерной плоскости.

При этом значения коэффициентов уравнения (10) будут определяться следующим образом:

ах _ ПХ _ АЗР/

91'

р/о

-А2.

(12)

Для однозначного определения параметров (Ы + 1)-мерной плоскости достаточно знать координаты (Ы + 1) точек этой плоскости. Действия (п. 12) выполнялись для того, чтобы каждому правилу соответствовало (Ы + 1) строк статистических данных. Полученные в п.12 статистические данные используются для расчета коэффициентов уравнения (11).

Расчет коэффициентов Б. уравнения (10) выполняется в следующей последовательности.

1. Определение функции принадлежности термов, соответствующих р-му правилу (множество Б ).

г

2. Выборка Vх строк статистических данных по формуле:

Ур2 - {м I (о < Ц1т(х,)е Вр) и (о < ц2у(*2)е Вр )и...

...(о<1ч(х,Мр)}, (13)

где у = 1 ^ и, V = 1 К.

3. Составление трех квадратных матриц У4., V2 и V43 размером (Ы + 1)х(Ы + 1) из множества

Vх : "

р

У4 включает N первых столбцов множества V (столбец (Ы + 1) делается единичным), послед-

ний столбец с номером соответствует (Ы + .)-му столбцу множества Vх;

V4 включает Ы первых столбцов множества V7,, последний столбец с номером (Ы + 1) единичный;

У43 включает Ы первых столбцов множества V7, последний столбец с номером (Ы + 1) соответствует (Ы + .)-му столбцу множества У,.

4. Вычисление значения коэффициентов уравнения (11) по формулам

1-(14)

А1 .. = IVА1

Р/< Р/<

А2 . = УА2

ю яч

А\=-

Подставив выражения (14) в (12), получим конечный вид формул для расчета коэффициентов уравнения (10):

В.

Vм УЛЗ

Р-М ПХ Г»'

'Р}°~\уЛ2\' (15)

' Р/ | | Р/

Следует отметить, что если точность полученной модели не удовлетворяет требованиям, то необходимо увеличить параметр X на единицу и повторить алгоритм формирования термов, начиная с п. 2. Параметр X можно увеличивать до значения Ы включительно.

Если ни с одним значением X точность модели не удовлетворяет требованиям, то, возможно: между рассматриваемыми входными и выходными параметрами нет взаимосвязи;

не выполняются указанные выше требования к статистическим данным;

статистических данных недостаточно.

Таблица 1

Строки статистических данных

V у А)

1 15,712 135,383 62171,5

2 15,772 143,583 62185,7

3 15,835 142,467 63714,7

4 15,842 128,867 60803,17

5 15,857 130,517 59265,7

6 15,867 138,85 63784,7

7 15,890 153,733 71616,7

8 15,906 132,25 73654,7

9 15,914 138,717 65466,7

10 16,047 135,917 63392,17

11 16,149 133,867 62385,17

12 16,172 141,317 70042,7

13 16,310 136,3 65640,5

14 16,465 145,333 65323,7

15 16,501 150,883 72295,7

Таблица 2

Аналитическая таблица при X = 1

V *2(0 у А) УГ(0 Ду,(0 £,(0

1 15,712 135,383 62171,5 62171,5 0 0

2 15,772 143,583 62185,7 62185,7 0 0

3 15,835 142,467 63714,7 63714,7 0 0

4 15,842 128,867 60803,17 60803,17 0 0

5 15,857 130,517 59265,7 59265,7 0 0

6 15,867 138,85 63784,7 63784,7 0 0

7 15,890 153,733 71616,7 71616,7 0 0

8 15,906 132,25 73654,7 73654,7 0 0

9 15,914 138,717 65466,7 65466,7 0 0

10 16,047 135,917 63392,17 63392,17 0 0

11 16,149 133,867 62385,17 62385,17 0 0

12 16,172 141,317 70042,7 70042,7 0 0

13 16,310 136,3 65640,5 65640,5 0 0

14 16,465 145,333 65323,7 65323,7 0 0

15 16,501 150,883 72295,7 72295,7 0 0

Применение алгоритма формирования

Рассмотрим пример построения нечеткой модели Сугено для случая двух входных параметров хр Х2 и одного выходного т. е. N = 2 и Ь = 1. Данный пример лишь демонстрирует порядок действий, в статье не производится обработка статистических данных в соответствии с поставленными к ним требованиями. Предположим, что

между входными и выходными параметрами есть зависимость, задаваемая строками статистических данных (табл. 1).

Тогда применение предлагаемого алгоритма приведет к результатам, представленным в табл. 2.

В предлагаемом алгоритме формирование термов и базы правил происходит неразрывно друг от друга, поэтому ситуации (одновременно

Рис. 2. Термы первого входного параметра

у двух и более термов значения функций принадлежности превышают 0,5) противоречивости не вносят, а лишь говорят об избыточности статистических данных на конкретных участках. Количества статистических данных (15 строк) недостаточно, чтобы предусмотреть все режимы любого объекта моделирования, результат - участок, где ни у одного терма значение функции принадлежности не превышает 0,5.

В табл. 1 значения абсолютной и относительной ошибки расчета указаны нулевые, т. к. реальные их значения имеют порядок 10-10. Этими значениями ошибок можно пренебречь, поскольку ни один прибор контроля технологических параметров не обладает такой точностью измерения.

На рис. 2 и 3 показаны термы первого и второго входных параметров.

Рассмотренный в данной статье алгоритм автоматического формирования лингвистических переменных может использоваться при априорном формировании вектора управляющих переменных для сложных технологических процессов. Например, при управлении процессом электролиза меди. Данный алгоритм применим при достаточном количестве статистических данных, описывающих процесс, и не требует присутствия эксперта

Приводимые алгоритмы не предназначены для ручного расчета (к вопросу о трудоемкости). Предлагаемый метод создания нечетких моделей реализован в виде программы. Производительность расчетов зависит от технических характеристик ЭВМ. В частном случае, получение результатов построения модели в примере произошло мгновенно.

СПИСОК ЛИТЕРАТУРЫ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Леоненков, А.В. Нечеткое моделирование в среде МАТЪАВ и Ги72уТЕСН [Текст]/А.В. Леоненков. -СПб.: БХВ-Петербург, 2005.-736 с.

2. Штовба, С.Д. Проектирование нечетких систем средствами МА^АВ [Текст]/С.Д. Штовба. -М.: Горячая линия-Телеком, 2007.-288 с.

3. Саати, Т.Л. Взаимодействие в иерархических системах [Текст]/Т.Л. Саати//Техническая кибернети-ка.-1979.-№ 1.-С. 68-84.

4. Воеводин, В.В. Матрицы и вычисления [Текст]/ В.В. Воеводин, Ю.А. Кузнецов.-М.:Наука,1984.-320 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.