Научная статья на тему 'Автоматизированная система хранения онтологических знаний об энергосистемах'

Автоматизированная система хранения онтологических знаний об энергосистемах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
590
136
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Автоматизированная система хранения онтологических знаний об энергосистемах»

Удобные и функциональные графические средства способны в значительной степени повысить оперативность и эффективность мониторинга и интерактивного управления АСУ УО.

Модуль автоматического круглосуточного управления контрольными пунктами функционирует в режиме системного таймера: включает и выключает КП, заданные в списке в определенное время (по одному списку и одной программе). Внешнему ПО доступны команды оператора системы.

Реализация элементов АСУ УО для управления освещением в ряде городов, а также комплекса организационно-технических и аппаратно-алгоритмических мероприятий позволили: автоматизировать процессы коммутации сетей уличного освещения; оперативно управлять уровнем освещения в зависимости от времени суток; осуществить диагностику сетей и оборудования; реализовать алгоритмы энергосберегающего управления; снизить энергозатраты на освещение на 11% (возможно еще большее увеличение значения этого показателя); сократить эксплуатационные расходы и максимально использовать имеющееся технические средства.

Автоматизированные системы управления уличным освещением могут быть использованы для оперативного и эффективного управления уличным освещением муниципальных образований (большие и средние города, поселки городского типа и т.д.) в различных регионах России и зарубежья.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Колесников А.А., Кадария Ф.Д., Пшихопов В.Х. и др. Программноаппаратная реализация энергосберегающих алгоритмов управления уличным освещением // Сб. материалов международной научно-технической конференции «Конверсия, приборостроение, медицинская техника». -Владимир, 1999. -с.165-167.

2. Pshikhopov V. Kh., Kalyagin I.A., Svetlichny O.A., Kabanets V.A., Ivanov J.I., Zhuravlev E.V.The new approach to designing the integrated control systems by municipal networks of street lighting // Proc. of VIII International SAUM Conference on Systems, Automatic Control and Measurements. Beograd, Serbia, 2004 (is published).

А.С. Злыгостев

АВТОМАТИЗИРОВАННАЯ СИСТЕМА ХРАНЕНИЯ ОНТОЛОГИЧЕСКИХ ЗНАНИЙ ОБ ЭНЕРГОСИСТЕМАХ

Основным способом представления информации являются тексты на естественном языке. С появлением возможности хранения текстов в цифровом виде стала актуальной проблема автоматизации обработки и обеспечения удобного доступа к информации.

В настоящее время разработано множество систем хранения и поиска текстовых документов. Но человеку, не обладающему навыками работы с информационными системами, удобнее спросить у другого человека, не обладает ли он знаниями в каком-либо вопросе, чем изучать специфику работы с компьютерными системами поиска и просмотра информации.

А теперь представим ситуацию, когда человек сидит в чате и задаёт собеседнику вопрос. Если ответ будет правильный - возможно, он вообще не будет интересоваться, кто сидел на том конце. Таким образом, для человека, не

обладающего навыками работы с компьютером, по мнению автора, наиболее удобной системой была бы говорящая программа, обладающая онтологическими знаниями в предметной области, интересующей пользователя.

Для создания интеллектуальной системы человеко-машинного диалога необходимо разработать модели представления онтологических знаний предметной области. За основу человеко-машинного диалога автор статьи предполагает взять AIML боты, разработанные доктором Ричардом Уоллисом (Dr. Richard S. Wallace). Система, ведущая диалог на естественном языке при конструировании ответов на вопросы будет использовать шаблоны ответов, представляющие комбинацию заранее заданных образцов реакций на пользовательские запросы и знаний из предметной области, полученными из текстов электронной библиотеки.

Рассмотрим историю развития компьютерных систем, позволяющих вести диалог с человеком на естественном языке и дадим более подробное описание AIML ботов (Artificial Intelligence Markup Language - язык разметки искусственного интеллекта).

Приведём историческую справку из [1]: «Первый бум исследований в этой области искусственного интеллекта приходится на середину 60-х. ELIZA, созданная в 1966 г. в MIT и имитирующая диалог путем простого повторения фраз собеседника в форме вопроса, очаровала достаточное количество генералов, чтобы шум вокруг таких программ продолжался еще лет двадцать».

Казалось, что если чуть-чуть лучше разбирать предложения, нарастить базы знаний - и компьютеры заговорят как минимум на языке Шекспира. Но годы шли, а ничего, кроме слегка улучшенных версий ELIZA, не получалось. Особенно когда вспоминали тест Тьюринга, придуманный еще в 50-х годах. Согласно этому тесту, машина считается «разумной», если человек, ведущий с ней диалог, не может отличить, кто его собеседник - компьютер или другой человек в соседней комнате. Ничего похожего на подобного рода программы так и не удалось создать. Множество дорогостоящих проектов по компьютерной обработке естественного языка были закрыты.

Однако в 90-е годы с появлением Интернета говорящие программы снова начинают мелькать в технологических новостях. Более того, появляются компании, специализирующиеся на продаже таких бото. В 1990 г. Х. Лебнер учредил премию, пообещав 100’000 долларов и золотую медаль тому программисту, чья программа пройдет тест Тьюринга. Учреждена также ежегодная премия Лебнера в 2’000 долларов и бронзовая медаль для того, чья программа, если и не прошла тест, то оказалась лучшей из представленных за год. Ни одной программе до сих пор так и не удалось обмануть жюри и получить гран-при.

Победившая в 2001 году диалоговая программа ALICE отличилась тем, что смогла обмануть одного из судей - он поставил ей более высокую оценку, чем одному из людей, которые использовались во время теста в качестве «контрольной группы».

Основная идея ALICE состоит в том, что она обходится без лингвистического, семантического, онтологического анализа, так как по мнению авторов программы, «это не работает, не обеспечивает более короткой связи между сенсором и механизмом» [1]. Когда мы спрашиваем, сколько будет один плюс один, и кто-то отвечает «два» - это не потому, что у него в голове включился калькулятор. Он просто знал, что один плюс один будет два. ALICE основана на этом простом принципе: есть образцы и есть определенная реакция при распознавании этих образцов [1].

В интервью [1] Н. Буш, один из учредителей ALICE AI Foundation, рассказывает следующее ещё об одной системе (CYC), позволяющей вести человеко-машинный диалог на естественном языке: «Это гигантская база данных, состоящая из формальных логических утверждений о мире, которую собирают уже 17 лет. Предполагается, что, собрав достаточное количество таких знаний, компьютер сможет решать определенные задачи. Скажем, если я говорю, что Чикаго находится между Нью-Йорком и Лос-Анджелесом, а Цинцинатти - между Чикаго и Нью-Йорком, то можно сделать вывод, что Чикаго - между Цинцинати и Лос-Анджелесом. Цель проекта CYC - сделать так, чтобы подобные выводы мог делать компьютер. В проекте участвует огромное количество разных специалистов

- лингвисты, социологи, даже психологи - поскольку требуется формально описать множество вещей, например "что такое мораль?". На проект потрачены миллионы долларов. И все равно это не работает! В диалоге CYC не лучше, чем ALICE».

Ещё об одной системе под названием GAC (Generic Artificial Consciousness), ориентированной на сбор фактов при помощи пользователей Интернет и последующую их обработку при помощи нейронных сетей, упоминается в [2]: «...автор GAC, канадский исследователь Крис Мак-Кинли рассчитал, что достаточного приближения к человеческому мышлению можно достигнуть, если база будет состоять из миллиарда элементов - «атомов знаний». Каждый такой атом (mindpixel) должен отражать одно простейшее знание о какой-либо реалии окружающего мира, например, «лёд холодный». Проект рассчитан на 10 лет. Полученная в результате база знаний будет использована для обучения нейронной сети, на которой и будет базироваться искусственный разум. Нейронные сети могут не только обучаться, но и самообучаться.

Рассмотрим подробнее систему ALICE. Доктор Ричард Уоллис является создателем первого AIML бота ALICE (Artificial Linguistic Internet Computer Entity) и автором языка AIML (Artificial Intelligence Markup Language). Работы над ALICE были начаты в 1995 г. В 1998 г. система была переписана на языке Java, для устранения платформенной зависимости. Программа была распространена с открытым кодом под лицензией GNU, в результате чего более 300 разработчиков со всего мира внесли свой вклад в разрабатываемую систему [3].

О создании ALICE Ричард Уоллис в [4] рассказывает следующее: «Однажды в 1995 мне прислали два схожих бланка, которые были нужны двум различным отделениям университета. Несколько часов потребовалось бы для внесения ответов в формы. Две формы были почти, но не целиком идентичны: имя, адрес, должность, научная степень, публикации в 1995 г. и т.д. Уже уставший и напряжённый до предела я понял, что ELIZA-подобная программа может заполнить подобные формы возможно даже лучше, чем я сам. В этот день я забросил эти формы и начал работу над ALICE».

В основе заранее заготавливаемых ответов на вопросы лежит закон профессора Дж. Зипфа: «Возьмём все слова в тексте, например, сегодняшней газеты Нью-Йорк Таймс и сосчитаем число повторений каждого из слов в тексте. Если полученный результат отсортировать по числу встреченных повторений, то наиболее часто встречаемые слова окажутся вначале (“a”, “the”, —for”, “by”, “and”,..). Если полученную кривую нарисовать в двойной логарифмической сетке, то получится прямая линия с наклоном -1». Кривая Зипфа характеризует человеческие языки, а также многие другие феномены естественного происхождения. Закон Зипфа применим не только к словам, но и к фразам и целым предложениям естественного языка.

Гистограмма пользовательских запросов, полученная ALICE, и отсортированная по частоте встречаемости показывает, что человеческому языку чуждо случайное распределение. Принимая во внимание обширность множества того, что могут сказать люди, и что будет являться грамматически корректным, число того, что люди говорят на самом деле удивительно мало.

Эксперименты с ALICE показали, что число слов, с которых начинают фразу только около двух тысяч. Конкретнее 1800 слов покрывает 95% всех первых слов во вводимых пользователями запросах для ALICE. Число вариантов для второй позиции около двух [5]. AIML является XML-совместимым, прост в изучении и позволяет начать работу с ботом Alice в течение нескольких минут.

Рассмотрим наиболее значимые элементы AIML, приведённые в статье [6]:

• <aiml> - тег начала и конца AIML-документа;

• <category> - элемент, отмечающий «единицу знаний» в базе знаний бота Alice;

• <pattern> - используется для хранения простейших образцов, по которым определяется, что мог сказать пользователь боту Alice;

• <template> - содержит ответ на пользовательский ввод.

Часто встречаются около 20-ти тегов файлов AIML. Существует возможность создать свой собственный тег.

Свободно распространяемая база знаний A.L.I.C.E. AIML включает почти 41000 категорий. Приведём пример одной из категорий:

<category>

<pattern>WHAT ARE YOU</pattern>

<template>

<think><set name="topic">Me</set></think>

I am the latest result in artificial intelligence,

which can reproduce the capabilities of the human brain

with greater speed and accuracy.

</template>

</category>

(Открывающийся и закрывающийся тег <aiml> здесь не приводится, так как это выдержка из середины документа).

Всё, что находится между <category> и </category>, есть категория. Категория может иметь один образец пользовательского ввода (<pattern>) и один образец ответа пользователю (<template>). В категории также может содержаться тег <that>).

Показанный образец (<pattern>) подойдёт только к фразе “what are you” (регистр букв игнорируется). Возможна ситуация, когда идёт обращение из одной категории к другой, для этого используется тег <srai>.

В любом случае, если эта категория вызвана, будет произведён ответ: “I am the latest result in artificial intelligence...”, показанный выше. Использованием тега <think> задаётся тема в памяти системы на понятие “Me”. Это позволит каким-нибудь категориям где-то в другом месте со схожим значением темы “ME” подобрать лучшую из категорий с тем же образцом, которые не имеют подобной темы. Данный механизм предоставляет бот-мастеру дополнительный механизм управления ходом разговора.

В заключении отметим следующее. Рассмотрев систему, построенную на AIML, можно разработать систему помощи, способную консультировать персонал, работающий с энергосистемой. При этом решается вопрос изучения работы с поисковыми средствами системы, хранящей документацию. Пользователю будет необходимо лишь ввести запрос на естественном языке, а разработчику необходимо предусмотреть возможные вопросы и внести их в базу знаний системы помощи. Подобный подход позволит избежать глубинного семантического анализа вводимых пользователем запросов и обойтись лингвистическим аппаратом на уровне морфологического разбора слов естественного языка при ведении диалога с человеком.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. http://www.netoscope.ru/theme/2001/12/13/4333-print.html - “Кто такая

ALICE, или Откуда у робота русская грусть”

2. http://www.netoscope.ru/news/2000/09/04/199.html “За создание искусственного разума берутся пользователи Интернета”

3. http://www.alicebot.org/bios/richardwallace.html - “Dr. Richard S. Wallace”

4. http://www.alicebot.org/articles/wallace/start.html - “How It All Started”

5. http://www.alicebot.org/articles/wallace/zipf.html - “Zipfs Law”

6. http://www.alicebot.org/aiml.html - “AIML: Artificial Intelligence Markup Language”

7. http://cyc.com

Г.А. Саракитян, В.И. Финаев СИСТЕМНЫЕ МЕТОДЫ ПРИ ПРОЕКТИРОВАНИИ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ОРГАНИЗАЦИОННОГО УПРАВЛЕНИЯ ЭНЕРГЕТИЧЕСКИМИ ПРЕДПРИЯТИЯМИ

Проектирование любой информационно-управляющей системы (ИУС), в том числе и для Зеленчукской ГЭС, предусматривает, как минимум, пять этапов:

- выполнение содержательного описания исследуемого промышленного предприятия;

- разработка формализованной математической схемы;

- разработка математической модели;

- разработка технического задания на систему в целом, технических заданий на подсистемы и создание пилот-проекта информационной системы;

- этап внедрения информационной системы.

Выполнение первых трех этапов связано с постановкой задачи проектирования ИУС "Зеленчукская ГЭС" и представляет собой сбор и обработку всех сведений, необходимых для дальнейшей подготовки технического задания на систему в целом и ее подсистемы. Постановка задачи проектирования наиболее достоверно будет соответствовать целям функционирования предприятия "Зеленчукская ГЭС", и определять условия эффективного решения задач проектирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.