Научная статья на тему 'Нейросетевые методы оценки качества поверхностных вод по гидробиологическим показателям'

Нейросетевые методы оценки качества поверхностных вод по гидробиологическим показателям Текст научной статьи по специальности «Математика»

CC BY
583
135
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Шитиков В. К., Зинченко Т. Д., Головатюк Л. В.

Представлен опыт использования искусственных нейронных сетей для моделирования стохастической связи показателей качества поверхностных вод со структурно-функциональными характеристиками донных сообществ. Приведены примеры обучения сетей различной конфигурации для оценки класса качества вод. Описан генетический алгоритм для выделения таксономических групп зообентоса, являющихся индикаторами состояния водоемов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS OF NEURAL NETWORKS FOR ESTIMATION OF SUPERFICIAL WATER.S QUALITY BY USAGE OF HYDROBIOLOGICAL EXPONENTS

The experience of imitation neural networks using for creating models of casual connection of freshwater reservoir.s quality with structure and functional characteristics of water ecosystem is presented. There are examples of different configuration.s network training for estimation of water quality. The genetic algorithm for separation of taxonomical groups of zoobenthos, which are indicators of reservoir.s state is described.

Текст научной работы на тему «Нейросетевые методы оценки качества поверхностных вод по гидробиологическим показателям»

УДК 577.4

НЕЙРОСЕТЕВЫЕ МЕТОДЫ ОЦЕНКИ КАЧЕСТВА ПОВЕРХНОСТНЫХ ВОД ПО ГИДРОБИОЛОГИЧЕСКИМ ПОКАЗАТЕЛЯМ

© 2002 В.К. Шитиков, Т.Д. Зинченко, Л.В. Головатюк

Институт экологии Волжского бассейна РАН, г. Тольятти

Представлен опыт использования искусственных нейронных сетей для моделирования стохастической связи показателей качества поверхностных вод со структурно-функциональными характеристиками донных сообществ. Приведены примеры обучения сетей различной конфигурации для оценки класса качества вод. Описан генетический алгоритм для выделения таксономических групп зообентоса, являющихся индикаторами состояния водоемов.

Постановка задачи

Пусть задано пространство признаков X размерностью п>1, точками которого являются конкретные данные гидробиологического мониторинга х = {х .., х .,хп}, где х. - значение 1-го гидробиологического показателя, измеренное в определенный момент времени в заданной точке отбора пробы. Анализируемая матрица из т наблюдений ||х||, ] =

1, 2,., т, в общем случае представлена двумя классами переменных (п = пв + пи): непосредственными измерениями биомассы и численности экземпляров отдельных видов гид-робионтов хв1 (1 = 1, 2, .,пв ) и некоторым подмножеством обобщенных индексов Хик (к = 1,

2, ., пи ), которые являются в конечном итоге функциями того же видового обилия. К числу обобщенных индексов Хи могут быть отнесены такие общепризнанные показатели как информационный индекс Шеннона, биотический индекс Вудивисса, сапробиологи-ческие показатели, отдельные составляющие материального или энергетического баланса экосистемы, абсолютные или относительные показатели обилия некоторых таксономических групп гидробионтов, считающихся индикаторами (олигохеты, хирономиды и др.) [1]. Единственным критерием для включения индекса в модель является его предполагаемая информативность, т.е. возможность учесть при анализе данных новые информационные аспекты, не содержащиеся в явном виде в исходном пространстве видов X

Пусть "качество вод" - некоторая внешняя характеристика водоема [2, 3], оцени-

вающая возможность его использования в тех или иных практических целях, которая может быть представлена шкалой заданного непрерывного или дискретного показателя У (для определенности предположим, что величина У возрастает с уменьшением качества вод). Поскольку структурные и функциональные характеристики водных биоценозов являются важными индикаторами состояния водной экосистемы, то существует статистически значимая стохастическая связь между показателем У и матрицей гидробиологических измерений X, а оператор ¥ выражения У = ¥(Х) доставляет нам состоятельную и эффективную оценку неизвестного качества воды по результатам мониторинга. Линейная интерпретация задачи прогнозирования У имеет вид

пв пи

У = а0 - (Х а в1х в1 +Х а икх ик), (1)

1=1 к=1

где: ав1 и аик - найденные коэффициенты статистической модели, а0 - свободный член.

Любая гидробиологическая среда представляет собой большой, сложный, слабо детерминированный и эволюционирующий объект исследования. Поэтому, как показывает практика, предположения о линейности аппроксимирующей функции (1) недостаточны для отображения сложности изучаемого процесса развития экосистем ("Время простых моделей прошло" [5]). Теория самоорганизации моделей показывает, что огромное большинство процессов в природе может быть описано, например, в виде полиномов

высокой степени, являющихся частным случаем обобщенного полинома Колмогорова -Г абора [4]:

п п п

у=a+X агхг +XX a,ajx,xj +

i=1

i=1 j=1

n n n

+

XXXa«jakxrxJxk+•••

(2)

i=i j=1 k=1

Число членов полного полинома равно С‘т+ч, где т - число переменных, д - степень

полинома, и уже при п = д = 7 достигает 3600. Поэтому основная задача моделирования сложных систем с использованием регрессионных уравнений заключается в том, чтобы исключить в полиноме (2) подмножество "лишних" неинформативных коэффициентов и сохранить необходимое и достаточное сочетание объясняющих членов. Сложность синтезированной модели будет оптимальной, если необходимая адекватность обеспечивается при минимальном количестве составляющих ее элементов [5].

В этих условиях традиционная параметрическая статистика требует либо очень большого объема известных данных, либо очень сильных предположений о виде функций распределения. Поэтому естественным является желание иметь единую парадигму построения различных эмпирических моделей, решающих задачи предсказания и классификации, которая бы удовлетворяла следующим условиям:

1. Достаточно высокая вычислительная эффективность, позволяющая получить работоспособные модели при разумных ресурсных издержках.

2. Отсутствие определяющих ограничений на функцию распределения данных.

3. Обеспечение возможности обработки разнотипных экспериментальных данных (без сведения всех признаков к одной шкале) и инвариантность к допустимым преобразованиям шкал признаков.

4. Робастность и технологичность при наличии пропусков в таблице, а также в случае, если число измеренных признаков п значительно превышает число объектов т.

5. Простота получения результата и инвариантность к конкретной проблемной области.

В некотором смысле большинству перечисленных требований удовлетворяют разнообразные алгоритмы, получившие бурное развитие за последние 2о лет и моделирующие процессы искусственного интеллекта [6]. Предметом настоящей работы явилось моделирование оценки качества воды поверхностных водоемов с использованием эволюционных методов и нейронных сетей различной конфигурации.

Экспериментальный материал

Анализ эффективности методов нейро-сетевого моделирования осуществлялся на массиве гидробиологических наблюдений [7], проведенных на 34 малых реках разного типа и степени антропогенной нагрузки, расположенных в степной и лесостепной зонах Самарской области. В обучающую выборку были включены 542 пробы, взятые на 247 станциях за период с 1987 по 2001 г. г. Для каждой станции наблюдения по совокупности гидрохимических показателей оценивали класс качества вод (Y) от 1 до 6 в соответствии с методиками [2, 3]. В качестве объектов биологического мониторинга в отобранных точках наблюдения использовались показатели обилия 546 видов организмов зообентоса. Суммарные значения численности T и биомассы Bsj видов, принадлежащим к различным таксонам, пересчитывались в величины логарифма плотности населения хJ = Ln((TsjBsj)0,5), которые использовались в качестве варьируемых переменных Хв, пв = 49. Для наиболее представительного семейства хиро-номид детализация таксономических групп была выполнена на уровне подсемейств и триб. Подпространство признаков Хи было сформировано из 9 широкоупотребляемых индексов и обобщенных показателей, рекомендуемых к применению [1]. Вычисления проводились с применением универсальной программы нейросетевого анализа STATISTICA Neural Networks (адрес в Интернете http://www.statsoft.ru/home/products/ Neuralnetwork).

Генетический алгоритм селекции информативных переменных

Важным условием применения любых статистических методов является предварительный анализ заданного набора признаков, который разбивается на две категории: информативные переменные, существенные для решения поставленной задачи, и незначимые переменные, несущие мало дополнительной информации для нахождения искомой зависимости. Для этой цели в традиционной статистике используют различные секвенциальные (пошаговые) процедуры, не всегда приводящие к результату, достаточно близкому к оптимальному. Элегантный автоматизированный подход к выбору значимых входных переменных может быть реализован с использованием генетического алгоритма, который можно считать "интеллектуальной" формой метода проб и ошибок.

Генетический алгоритм [8, 9], позаимствованный у природных аналогов, является наиболее ярким представителем эволюционных методов и представляет собой мощное поисковое средство, эффективное в различных проблемных областях и основанное на трех компонентах:

- генетической памяти, сконцентрированной в " хромосомах";

- воспроизведения, осуществляемого при помощи операторов кроссинговера и мутации;

- селекции продуктивных решений методами оптимизации многоэкстремальных функций.

Каждый возможный вариант набора входных переменных Хв представлялся в виде хромосомы - битовой маски длиной пв = 50 по одному биту на каждую переменную. Ноль в соответствующей позиции означает, что эта исходная переменная не включена во входной набор, а единицы соответствуют базовому набору признаков. Популяция - совокупность решений на конкретной итерации, состоящая из некоторого количества хромосом г, которое задавалось изначально (г = 100) и в процессе мутаций не изменялось. Исходная популяция потенциальных решений на начальной итерации формировалась с исполь-

зованием специальных простых правил.

Эффективность каждой найденной комбинации признаков, представленной в популяции хромосомой ъ ( = 1, ..., г), оценивалась функцией оптимальности Г (2), равной стандартному отклонению от регрессии при обучении обобщенно-регрессионной нейронной сети одинаковой конфигурации с коэффициентом сглаживания, равном 0,3. Мутации популяций осуществлялись с учетом вероятностей дальнейшего воспроизведения отдельных хромосом:

. Г(2;)

р(. = -rL^, . = 1..., г

IГ(2])

.=1

в результате чего создавалась новая версия популяции, причем на каждом шаге с большей вероятностью воспроизводились наиболее эффективные элементы. Хромосомы производили потомков, используя операции рекомбинации: кроссинговера и мутации.

Оператор кроссинговера (эволюционного приспособления) производит скрещивание хромосом и обмен генетическим материалом между родителями для получения наиболее жизнеспособных потомков. Простейший одноточечный кроссинговер производит обмен частями кода, на которые хромосома разбивается точкой кроссинговера, выбираемой случайно. Оператор мутации (эволюционного исследования) применяется к каждому биту хромосомы с небольшой вероятностью (Р1 ~ 0,001), в результате чего бит (аллель) изменяет значение на противоположный.

Процесс эволюции продолжали на протяжении 100 поколений, т.е. цикл "отбор-по-рождение-оценка" был повторен 100 раз и при этом в поисках оптимального набора генов было построено и оценено 10000 версий нейросетевых моделей. В соответствии с найденным субоптимальным решением, все таксоны зообентоса разбили на две примерно равные категории: 27 групп информативных индикаторов качества воды (табл.1, левый столбец) и 22 группы организмов, малозначимых для нейросетевого моделирования (см. табл.1, правый столбец). Следует под-

Таблица 1. Результаты селекции информативного набора переменных с использованием генетического алгоритма

Информативные таксономические группы зообентоса Таксономические группы зообентоса, незначимые для прогноза качества воды

Amphipoda, Ceratopogonidae, Chaoboridae, Coleoptera, Dermaptera, Ephemeroptera, Trichoptera, Plecoptera, Odonata, Limoniidae, Megaloptera, Psychodidae, Ptychopteridae, Simuliidae, Tabanidae, Hidracarina, Bivalvia, Dreissenidae, Gastropoda, Nematoda, Oligochaeta, Polychaeta, Chironomidae: Diamesinae, Orthocladiinae, Prodiamesinae, Tanypodinae, Chironomini, Tanytarsini. Crustacea, Arachnoidae, Hirudinea, Unionidae, Collembola, Culicidae, Cylindrotomidae, Dolichopodidae, Diplura, Dixidae, Ephydridae, Hemiptera, Homoptera, Muscidae, Nematocera, Rhagionidae, Stratiomyidae, Tipulidae, Hydrida,

черкнуть, что отнесение какого-либо таксона к малоинформативной категории вовсе не означает отсутствие фактической биологической зависимости обилия организмов этого таксона от уровня загрязнения, а, например, его сильной корреляцией с какой-либо другой значащей группой.

Иногда бывает полезно уменьшить размерность задачи даже ценой некоторой потери точности, создав дополнительный стимул к исключению лишних переменных в виде специального штрафа за элемент X. Варьируя этим параметром генетического алгоритма можно эшелонировать весь список переменных по уровню их связи с целевой функцией. Жирным шрифтом в таблице 1 показаны группы организмов, информативные при X = 0,002. Если же увеличить штраф за элемент до 0,005, то выбирается только один значимый признак - обилие организмов семейства Ephemeroptera, которое с этих позиций оказывается наиболее значимым индикатором качества воды.

Альтернативная классификация на основе многослойного персептрона

Современные искусственные нейронные сети (ИНС) конструируются из формальных нейронов, отдалённо напоминающих свой биологический прототип. Структура нейрона имеет вид, представленный на рис.1, при следующих обозначениях: x1..xn - значения, поступающие на входы

(синапсы) нейрона;

w1..wn - веса синапсов, которые могут быть как тормозящими, так и усиливающими;

£ - взвешенная сумма входных сигналов:

Я = 1,4% -Т,

г=1

где Т - порог нейрона;

Е - функция активации нейрона, преобразующая взвешенную сумму в выходной сигнал

У = Е (Я).

Вид функции активации Б может иметь различное математическое выражение, из которых наиболее широкое распространение получили линейная у = к ■ £ и логистическая у = -С8) функции, где С >0 - ко-

эффициент ширины сигмоидной кривой, имеющей Б-образную форму.

В основе нейросетевого подхода [10] лежит идея построения вычислительного устройства из большого числа параллельно работающих простых элементов (т.е. описанных выше формальных нейронов), которые функ-

Хп -

Рис.1. Структура искусственного нейрона

ционируют независимо друг от друга и связаны между собой однонаправленными каналами передачи информации. Каждый отдельный нейрон моделируется довольно простой функцией, но зато совокупная сложность модели, гибкость ее функционирования и другие важнейшие качества определяются структурой связей и многоуровневой иерархией всей сети.

На сегодня описано много разновидностей нейронных сетей [10-13], характерных для различных типов задач. Рассмотрим возможности обучения ИНС на примере трехслойного персептрона [11] с прямым распространением информации, представленного на рис.2 и моделирующего альтернативное значение отклика У.

Нейроны регулярным образом организованы в слои, причем элементы любого слоя связаны только с нейронами предыдущего слоя, т. е. информация распространяется от предыдущих слоёв к последующим. Во входной (распределительный) слой сети подаются значения обилия 27 таксономических групп зообентоса, отобранных в результате генетического алгоритма, а также количество видов в пробе. Взвешенные линейные комбинации функций преобразования элементов промежуточного слоя, состоящие из 14 ассоциативных нейронов, составляют реакцию системы. На выходе обученной нами сети формируется логическое высказывание "Чисто" (класс

качества вод 1-111) или " Грязно" (классы качества вод- 1У-У1) в виде некоторого значения апостериорной вероятности на интервале от 0 до 1. Эффективность синтезируемой ИНС зависит от многих структурных и вычислительных факторов, которые обычно подбираются полуэмпирическим путем:

- количества промежуточных слоев и числа элементов в каждом слое;

- математического выражения для функции активации нейронов каждого слоя;

- используемого алгоритма и критерия оптимизации ошибки при обучении сети;

- соотношения между обучающей и контрольной выборками для независимой кросспроверки качества сети.

Наилучшая сеть, конфигурация которой представлена на рис.2, была обучена методом оптимизации Левенберга-Маркара с оценкой качества ИНС по информационному критерия (простой энтропии). Вариант построения нелинейной разделяющей поверхности с использованием сигмоидной функции активации оказался более эффективен по сравнению с вариантом линейных разделяющих гиперплоскостей. Сеть обучалась на 400 примерах, а остальные 120 примеров выделялись в качестве внешнего дополнения и независимого контроля качества сети. Результаты моделирования, представленные в табл.2, по традиции для всех задач классификации оценивались как доли ошибочных

Рис.2. Схема многослойного персептрона для оценки категории качества воды

по обилию групп зообентоса

Таблица 2. Результаты использования модели персептрона с одним промежуточным слоем для оценки категории качества воды

Результат прогноза Обучающая выборка Контрольное множество

Класс “Чисто” Класс “Грязно” Правильный прогноз, % Класс “Чисто” Класс “Грязно” Правильный прогноз, %

“Чисто” 141 0 97,9 34 4 91,9

“Грязно” 2 276 100 2 58 92,1

Отказ 1 0 1 1

Итого 144 276 99,3 37 63 92,0

опознаний на обеих выборках.

Решение задачи классификации с многими классами

Другим примером нейронной сети для непосредственной оценки значения класса качества водоемов в виде числа от 1 до 6 является персептрон с одним промежуточным слоем, архитектура которого представлена на рис.3. В качестве девяти варьируемых переменных было использовано подмножество обобщенных гидробиологических показателей Хи. Сеть имеет 5 выходов, соответствующие каждому из присутствующих в обучающей выборке классов качества воды и при правильном распознавании на одном из выходных элементов появляется высокое значение активации при незначительной ее величине на остальных четырех. Нами использовалась в выходном слое специальная функция активации (Бойтах), представляющая собой взвешенную и нормированную на еди-

ницу сумму экспонент. Нетрудно показать, что если входные данные представляют собой выборку из какого-либо экспоненциального распределения, то выходы софтмакс-эле-ментов можно трактовать как вероятности. Например, если для измерения на ст.1 р. Бай-туган активации выходных нейронов сети оказались равными {0,314; 0,503; 0,142;

0,028; 0,018}, то с вероятностью 0,503 можно предположить, что это измерение было взято из водоема 3 класса качества, а с вероятностью 0,817 - из водоема 2-3 классов.

Результаты достоверности оценки классов качества представим в виде таблицы сопряженности " Факт-Прогноз" (табл.3), где по главной диагонали проставлены частоты правильной оценки групп измерений, а в остальных клетках - имеющиеся ошибки прогноза отдельно для обучающей выборки и контрольной последовательности.

Нейронную сеть, вследствие ее принципиальной многомерности, обычно интерпре-

Рис.3. Нейронная сеть для прогнозирования пяти классов качества воды

Таблица 3. Результаты прогнозирования класса качества вод по модели многослойного персептрона

Классы качества вод Фактические Итого прогноз Правильный прогноз, % Ошибка на два и более класса, %

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 3 4 5 6

Прогноз по обучающей выборке 2 18 10 3 0 0 31 58,06 9,67

3 13 52 24 6 0 95 54,47 6,31

4 11 25 77 15 17 145 53,10 19,31

5 0 10 14 36 15 75 48,0 13,3

6 1 2 6 6 9 24 37,5 37,5

Итого факт 43 99 124 63 41 370 51,89 13,5

Прогноз по контрольной выборке 2 7 3 2 0 0 12 58,33 16,6

3 2 15 14 3 1 35 42,86 11,42

4 1 8 40 6 7 62 64,52 12,9

5 0 2 5 13 11 31 41,94 6,45

6 0 1 2 2 5 10 50,00 30,0

Итого факт 10 29 63 24 24 150 53,33 12,66

тируют как "черный ящик", поскольку визуальный или статистический анализ коэффи -циентов усиления и порогов, как это делается, например, в множественной регрессии, для всех структурных связей графа представляет собой весьма утомительную процедуру, не гарантирующую достоверных выводов. Тем не менее, при желании, можно заглянуть внутрь этого ящика и попытаться выяснить роль каждого скрытого элемента, создаваемый ими потенциал активации и прочие нейронные характеристики. Например, анализ чувствительности сети по ее входам дает возможность идентифицировать исходные переменные с низкой информативностью, которые могут быть игнорированы в последующих просчетах. Чувствительность каждой входной переменной измеряется как соотношение двух ошибок: ошибки сети без использования .-го признака к аналогичной ошибке при его наличии. Если это отношение П. равно или менее 1, то анализируемая переменная либо не участвует в работе нейросетевой модели вообще, либо даже мешает ее работе, снижая общую надежность и компактность. Значения прироста ошибки 8. и отношения чувствительности П. для переменных, использованных в рассматриваемом примере, представлены в табл.4. Подробные выводы легко может сделать сам чита-

тель; мы же обращаем его внимание на рокировку ролей общей биомассы и индекса Шеннона при переходе от стадии обучения к контролю, которая объясняется не только случайными причинами.

Решение задачи о понижении размерности

Задача состоит в получении сжатого (редуцированного) представления исходных данных в виде матрицы Б с меньшим числом переменных р (п > р) без существенной потери информации, содержащейся в исходной матрице X. Один из недостатков традиционного факторного анализа заключается в ортогональном характере преобразований, в результате чего улавливаются только линейные направления максимальной вариации. Более общий нелинейный вариант метода главных компонент основан на применении автоассоциативных сетей [14, 15]. Такая симметричная сеть предназначена для воспроизведения на выходе своих же сигналов, т. е. число выходов совпадает с числом входов, а все нейроны имеют особое свойство. Если число элементов промежуточного слоя сделать меньше числа входов/выходов, то это заставляет сеть "сжимать" информацию, представляя ее меньшим числом переменных. Трехслойная автоассоциативная сеть

Таблица 4. Анализ чувствительности входных переменных модели многослойного персептрона для прогнозирования класса качества вод

Анализируемые входные переменные Обучающая выборка Контрольная выборка

Ранг 8. П. Ранг 8. П.

Биотический индекс Вудивисса 1 0,377 1,095 1 0,381 1,078

Олигохетный индекс Пареле 2 0,355 1,030 2 0,369 1,045

Общая биомасса (Ьп мг/м ) 3 0,351 1,018 7 0,354 1,003

Число видов в пробе 4 0,350 1,016 3 0,357 1,012

Хирономидный индекс Балушкиной 5 0,348 1,010 8 0,354 1,003

Общая численность (Ьп экз/м ) 6 0,348 1,009 5 0,356 1,007

Доля хищников (по численности) 7 0,347 1,007 9 0,353 0,999

Доля хищников (по биомассе) 8 0,347 1,006 6 0,356 1,007

Индекс Шеннона 9 0,346 1,003 4 0,356 1,008

сначала линейно преобразует входные данные в меньшую размерность промежуточного слоя, а затем снова линейно разворачивает их в выходном слое, реализуя стандартный алгоритм анализа главных компонент. Для того чтобы выполнить нелинейное понижение размерности, используют пятислойную сеть: ее средний слой служит для уменьшения размерности, а соседние с ним слои, отделяющие его от входного и выходного слоев, выполняют нелинейные преобразования.

Чтобы осуществить нелинейное понижение размерности исходной матрицы наблюдений для прогнозирования класса качества вод, используемой в предыдущем примере, выполняли следующие действия:

- построили и обучили на множестве из

520 примеров автоассоциативную сеть - пер-септрон с пятью слоями;

- удалили два последних слоя автоассо-циативной сети и получили сеть для пре-про-цессирования, понижающую размерность данных, где количество варьируемых признаков было сведено от 9 до 3 без существенной потери информации;

- строили обрабатывающую сеть в виде второго трехслойного персептрона (при обучении на ее вход подавали выходные сигналы пре-процессирующей сети);

- объединив обе сети (см. рис.4), получили единую сеть, которая последовательно пересчитывает исходные данные в пространство трех главных компонент, после чего обрабатывает уже преобразованные факторы,

Рис.4. Последовательность двух сетей для понижения размерности признакового пространства

Рис.5. Изображение в пространстве двух главных компонент облака точек, соответствующих различным классам качества воды

прогнозируя значение отклика.

В нашем конкретном случае достоверность распознавания по полученной двухуровневой сетевой модели несколько снизилась по сравнению с обычным персептоном, представленным на рис.3. Однако общий смысл перехода в пространство небольшой размерности не столько в том, чтобы повысить эффективность прогноза, сколько в попытке дать какое-то содержательное объяснение имеющимся внутренним механизмам анализируемых явлений после сведения многочисленных взаимозависимых наблюдаемых переменных к немногим обобщенным ненаблюдаемым факторам. Один из способов это сделать - проанализировать двух- или трехмерную визуализацию классифицируемых объектов в осях главных факторов (см. рис.5). Изучив на полученном графике сильно трангрессирующее облако точек, принадлежащих разным классам качества воды, можно, по крайней мере, оценить, какая нетривиальная задача была поставлена перед системой распознавания.

Поскольку мы ограничены рамками настоящей публикации, вне обсуждения остался материал, посвященный следующим аспектам использования нейросетевых технологий для оценки качества воды водоемов:

- ИНС-модели, основанные на обоих классах признаков X и X, а также сравни-

тельный анализ их информативности;

- решение задачи регрессии с помощью нейросетей различной архитектуры для прогнозирования гидрохимических и гидробиологических показателей, измеренных в непрерывных шкалах;

- кластерный анализ и визуализация полученных наблюдений с использованием самоорганизующихся карт Кохонена;

- оценка класса качества вод с использованием иерархических деревьев решений.

Заинтересованный читатель может воспользоваться нашим адресом электронной почты [email protected], чтобы высказать свое мнение или получить дополнительную информацию. В приложение к списку литературы приводим некоторые использованные нами сайты, где размещены Интернет-публикации, ссылки и библиография по проблемам искусственного интеллекта и нейросетевых технологий: http://metalwarrior.narod.ru и http://vlasov.iu4 .bmstu.ru/neurnews.html.

СПИСОК ЛИТЕРАТУРЫ

1. Руководство по методам гидробиологического анализа поверхностных вод и донных отложений. Л.: Гидрометеоиз-дат, 1983.

2. ГОСТ 17.1.3.07-82 Охрана природы. Гидросфера. Правила контроля качества воды

водоемов и водотоков. М., 1982.

3. Драчев С.М. Борьба с загрязнением рек, озер и водохранилищ промышленными и бытовыми стоками. М.-Л.: Наука, 1964.

4. Ивахненко А.Г., Зайченко Ю.П., Димитров В.Д. Принятие решений на основе самоорганизации. М.: Сов. радио, 1976.

5. Эшби Р. У. Введение в кибернетику. М.: ИЛ, 1959.

6. Лорьер Ж.Л. Системы искусственного интеллекта. М.: Мир, 1991.

7. Зинченко Т.Л., Шитиков В.К. // Известия Самарского научного центра РАН. 1999. №1.

8. GoldbergD.E. Genetic Algorithms. Reading, MA: Addison Wesley, 1989.

9. Скурихин А.Н. Генетические алгоритмы

// Новости искусственного интеллекта. 1995. №4.

10. Уоссермен Ф. Нейрокомпьютерная техника. М.: Мир, 1992.

11. Розенблатт Ф. Принципы нейродинамики (перцептроны и теория механизмов мозга). М.: Мир, 1965.

12. Нейроинформатика / А.Н. Горбань, В.Л. Дунин-Барковский, А.Н. Кирдин и др. Новосибирск: Наука. Сибирское предприятие РАН, 1998.

13. Горбань А.Н. Обучение нейронных сетей. М.: ParaGraph, 1990.

14. Bishop C. Neural Networks for Pattern Recognition. Oxford: University Press, 1995.

15. Нейронные сети. Statistica Neural Networks. М.: Горячая линия - Телеком, 2001.

METHODS OF NEURAL NETWORKS FOR ESTIMATION OF SUPERFICIAL WATER’S QUALITY BY USAGE OF HYDROBIOLOGICAL EXPONENTS

© 2002 V.K. Shitikov, T.D. Zinchenko, L.V. Golovatiyk

Institute of Ecology of the Volga River Basin of Russian Academy of Sciences, Togliatti

The experience of imitation neural networks using for creating models of casual connection of freshwater reservoir’s quality with structure and functional characteristics of water ecosystem is presented. There are examples of different configuration’s network training for estimation of water quality. The genetic algorithm for separation of taxonomical groups of zoobenthos, which are indicators of reservoir’s state is described.

i Надоели баннеры? Вы всегда можете отключить рекламу.