Литература: 1. Бондаренком. Ф., Хаханов В.И., Литвинова Е.И. Структура логического ассоциативного мультипроцессора // Автоматика и телемеханика. 2012. № 10. С. 71-92. 2. Хаханов В.И., Литвинова Е.И., Чумаченко С.В., Гузь О.А. Логический ассоциативный вычислитель // Электронное моделирование. 2011. № 1(33). С. 73-89. 3. Hahanov V., Wajeb Gharibi, LitvinovaE., Chumachenko S. Information analysis infrastructure for diagnosis // Information an international interdisciplinary journal. 2011. Japan. Vol. 14, № 7. Р. 2419-2433. 4. НП 306.2.141-2008. Общие положения безопасности атомных станций. К: ГКЯРУ, 2008. 42 с. 5. Protecting against common cause failures in Digital I&C Systems of Nuclear Power Plants: Nuclear Energy Series / International Atomic Energy Agency. Vienna: IAEA, 2009. No. NP-T-1.5. 65 p. 6. Ястребенецкий М.А. Информационные и управляющие системы АЭС Украины: результаты и проблемы / М.А. Ястребенецкий // Проблемы обеспечения безопасности информационных и управляющих систем АЭС:. сб. науч. тр. Одесса: «Астропринт», 2010. С. 9-19. 7. Modern Instrumentation and Control for Nuclear Power Plants: Technical Reports Series / International Atomic Energy Agency. -Vienna: IAEA, 1999. No. 387. 629 p. 8. Application of the Single Failure Criterion: Safety Series / International Atomic Energy Agency. Vienna: IAEA, 1990. No. 50-P-1. 134 p. 9. Герасименко К.Е. Методы непрерывного контроля и диагностирования оборудования управ-
ляющих систем безопасности энергоблоков АЭС по функции защит / К.Е. Герасименко // Радіоелектронні і комп’ютерні системи. 2010. №3 (44). С. 152-156. 10. Герасименко К.Е. Использование непрерывных функций в элементах оборудования защит АЭС для диагностирования неисправностей типа «несрабатывание по требованию» / К. Е. Герасименко // Радіоелектронні і комп’ ютерні системи. 2011. №1 (49). С. 29-33.
Поступила в редколлегию 14.10.2012
Рецензент: д-р техн. наук, проф. Литвинова Е.И.
Хаханов Владимир Иванович, декан факультета КИУ ХНУРЭ, д-р техн. наук, профессор кафедры АПВТ ХНУ-РЭ. Научные интересы: техническая диагностика цифровых систем, сетей и программных продуктов. Увлечения: баскетбол, футбол, горные лыжи. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-326. E-mail: hahanov@kture. kharkov. ua.
Г ерасименко Константин Евгеньевич, заведующий отделом информационно-управляющих систем ЧАО «СНПО “Импульс”». Научные интересы: техническая диагностика цифровых систем управления объектами с повышенными требованиями к безопасности и надежности. Адрес: Украина, 93405, Северодонецк, пл. Победы 2, тел. 60194. E-mail: [email protected].
УДК 519.7
ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ОБЩЕЙ МОДЕЛИ СЛОВОИЗМЕНЕНИЯ ИМЕН ПРИЛАГАТЕЛЬНЫХ РУССКОГО ЯЗЫКА
КАМЕНЕВА И.В., АФАНАСЬЕВ А.С.___________
Рассматривается работа разработанного приложения AdjNet, основанная на общей модели словоизменения прилагательных русского языка, на примерах решения задач синтеза, анализа и нормализации словоформ, а также анализируется произношение полных непритяжательных имен прилагательных, представленных в звуковой форме.
Введение
На протяжении многих лет предпринимались попытки автоматизации процесса выявления слов из текста и их классификации, были разработаны модели существительных, глаголов, прилагательных [1-4]. Полная автоматизация процесса корректировки, анализирования и нормализации естественно-языкового текста не была продемонстрирована ни в одной из работ с частями речи в полной мере. Школой М.Ф. Бондаренко и Ю.П. Шабанова-Кушнаренко «Бионика интеллекта» уже разработаны модель полных непритжа-тельных имен прилагательных [1], модель полных непритяжательных имен прилагательных, представленная звуковой формой [4]. Разработанная нами модель кратких имен прилагательных [5] помогла приблизиться к построению общей полной модели словоизменения прилагательных русского языка [6].
На основании трех указанных выше моделей реализовано программное приложение AdjNet. Оно позволяет автоматизировать процесс работы эксперта в задачах синтеза, анализа и нормализации текста с именами прилагательными.
Приложение AdjN et основ ано на модели реляционной сети логической мозгоподобной структуры [7]. В основе определения понятия мозгоподобной структуры лежит понятие отношения. Школой разработана алгебраическая система предикатов для формульного представления отношений и действий над ними [8]. Данная система делится на алгебру имен предикатов и модель предикатов. Схемная реализация формул, описывающих алгебро-логические структуры, приводит к логическим сетям - функциональным и реляционным [9, 10]. Программа AdjNet представляет собой приложение, которое позволяет моделировать процесс склонения и словоизменения прилагательных русского языка на основании полной модели склонения непритяжательных имен прилагательных, полной модели склонения непритяжательных имен прилагательных, представленных в звуковой форме, и модели кратких имен прилагательных.
Подробная структура программного приложения представлена на рис. 1.
AdjNet имеетудобный интерактивный интерфейс, при работе с которым пользователь будет получать исчерпывающую информацию об общем словоизменении имен прилагательных русского языка. Работа программы изображена на диаграмме вариантов использования (Use case) (рис. 2).
52
РИ, 2012, № 3
Удаление основ А
Gass 4 Form
* Fields
* Methods
/ л ShortPritag А Gass
«Word
+- Fields
" Methods
0 Analising
б BuitdWord
в DefrteLastLert...
в DetermineP
0 Gethfo
а GetP
0 GetZK
0 SetP
0 SetY
SetYK
4> SetZK
б SetZOK
0 V ShortPriljg j
Главное окно
Gass ■* Form
® Fields *■ Methods •*' Nested Types
. Основными задачами, которые решает данное прило-
Добавление основ Л жение, ЯВЛЯЮТСЯ:
Сам .
+ F°m - синтез словоформы;
з Field; л Methods
Word *
Class
4 Fields
^Methods
© GetSone
0 GetPos
© GetSignW
0 GetSignXZ
© GetWord
© SetBone
© SetPcs
© SetSignXl
© SetSignXZ
© Set Word
)
longPrilag ■
Class « Word
fields
“ Methods [ б Analysing
І б ButldWord
Ф DefinitronYl б DefinitionZ б DefinitionZO ® DefinitionZI б DtfinitionZ2 Ф DefinitionZ3 О DeiinitionZL О DefinitionZP j б Deter fTuneQ
б DeternineR б Getlnfo І б GetQ
б GetR О GetS б GetZ 0 GetZL О GetZP б LongPriJag ® Normalising б SerQ ® SetR б Sets б SetS*grX3 б SetS<gnX4 б SetSigrXS б SetZL б SetZP
l
Рис. 1. Диаграмма классов
- анализ словоформы; нормализация словоформы;
- проверка устной речи.
Поиск и выбор прилагательных из текста осуществляется методом сравнения существующих основ имен прилагательных со словами в предложении. Существующие основы имен прилагательных хранятся в текстовом файле, основы можно добавлять, что делает программу расширяемой, а также просматривать и удалять основы слов из репозитория.
Выявленные программой прилагательные выводятся в список, который отображен в главном окне программы, а так же отображается в окне синтеза, анализа и нормализации, что делает интерфейс более интерактивным. Классификация прилагательных на краткие и полные выполняется методом сравнения выявленного прилагательного со списком всех существующих окончаний полных прилагательных русского языка. Если окончание прилагательного присутствует в списке, то оно является полным, если нет - кратким, что выполнено в соответствии с моделью, базирующейся на алгебре конечных предикатов.
Рассмотрим пример решения задачи синтеза словоформы.
Задача синтеза заключается в определении словоформы в соответствии с окружающим контекстом слова. Суть задачи заключается в преобразовании ошибочно “введенных слов в корректные словоформы, в соответствии с контекстом предложения, и заменой их.
Рис.2. Use case диаграмма AdjNet
Остановимся подробнее на решенных задачах с помощью программного приложения.
Для настройки признаков (рода, числа, падежа, признака одушевленности, употребляемости, ударности и признака смягчения) в окне «Синтез» существуют списки для их выбора. После выбора необходимых признаков AdjNet изменяет прилагательное в соответствии с предъявленными экспертом требованиями и предлагает вставить его обратно в текст.
Выполним синтез предложения, которое введено неверно: «хорошая указчик дороже десяти работников», для полного непритяжательного имени прилагательного. Благодаря настройкам эксперта прилагательное можно привести к необходимому правильному виду употребляемости в предложении.
Приведем пример синтеза данного слова:
- род - М;
- число - Ед.;
- падеж - В;
- признак одушевленности - О;
- признак употребляемости - С.
Получаем слово «хороший».
РИ, 2012, № 3
53
Далее программа позволяет вставить корректное слово обратно в исходный текст - «хороший указчик дороже десяти работников».
Также программа осуществляет синтез слов кратких имен прилагательных в предложении. С ее помощью можно синтезировать слова без сопровождаемого контекста как для полных, так и для кратких имен прилагательных.
Для наглядного примера выполним синтез для слова «свеж» модели кратких имен прилагательных русского языка, введем такие признаки:
- род - *;
- число - Мн.;
- ударная буква основы - е;
- ударение - на окончание и.
Получаем слово «свежи». В примере и со словом «хороший», и со словом «свеж» мы наблюдаем, что программа AdjNet корректно выполняет словоизменение по указанным экспертом признакам и определяет ударность. В данном слове присутствует двойное ударение. Приложение определяет, что ударение падает как на основу, так и на окончание и имеет два варианта правильного употребления слова, т.е. выявляет двойное ударение.
Рассмотрим пример решения задачи анализа словоформы. Она заключается в определении грамматических признаков словоформы в соответствии с окружающим контекстом формы слова. Суть задачи состоит в выведении корректно расклассифицированных признаков словоформы.
Введем предложение: «Ребята играли на зеленой лужайке - она была ухожена». Программа выделила 2 прилагательных: «зеленой» и «ухожена», выполним их анализ.
В окне анализа из списка выделим необходимое прилагательное «зеленой» и проанализируем его. В результате получаем, что слово «зеленой» имеет:
- полное прилагательное - зеленой;
- основа слова - зелен;
- номер влияния контекста - 9;
- род - Ж;
- число - Ед.;
- падеж - П;
- последняя буква основы слова - н;
- окончание - ой;
- левая часть окончания - о;
- правая часть окончания - й;
- первая буква окончания - о;
- вторая буква окончания - й;
- третья буква окончания - *.
Анализ слова «ухожена» показал:
- краткое прилагательное - ухожена;
- основа слова - ухожен;
- род - Ж;
- число - Ед;
- номер ячейки таблицы - 2;
- окончание - а;
- ударная буква основы - о.
Программа AdjNet правильно проанализировала два слова для полного и краткого имени прилагательного, что подтверждает правильность и корректность ее работы, а также то, что программа выполняет одну из основных своих задач - анализ слов в представленном тексте.
Рассмотрим пример решения задачи нормализации словоформы. Задача нормализации заключается в определении слова, соответствующего словоформе. Суть задачи состоит в отыскании словарных форм словоформ.
Введем предложение «Глубока была река, а солнце своими теплыми лучами ее прогревало и ярким светом освещало близлежащую зеленую лужайку». Программа выделила 5 прилагательных: «глубока», «теплыми», «ярким», «близлежащую» и прилагательное «зеленую». Для выполнения задачи нормализации словоформы в окне «нормализация» из списка выделяем необходимое прилагательное - «глубока» и запускаем нормализацию. Результат нормализации -«глубок», для «теплыми» - «теплый». Для прилагательного «ярким» - «яркий», для прилагательного «близлежащую» - «близлежащий», для прилагательного «зеленую» результатом нормализации словоформы будет слово «зеленый».
Наконец, рассмотрим работу задачи склонения полных непритяжательных имен прилагательных русского языка, представленных звуковой формой. Переключим программу в режим устной речи, в окне синтеза или анализа, в зависимости от того, какая из задач решается, установим переключатель «Устная речь». Введем предложение «Я увидела радостного человека в окне». Программа определила одно прилагательное полной модели склонения непритяжательных имен прилагательных, которая доопределяется правильным произношением (транскрипцией) слов и характеризуется полной моделью склонения прилагательных русского языка в звуковой форме.
Таким образом, выполнив анализ слова «радостного» для полной модели склонения непритяжательных имен прилагательных, которое определяется признаками:
- полное прилагательное - радостного;
- основа слова - радостн;
- номер влияния контекста - 2;
54
РИ, 2012, № 3
- род - М;
- число - Ед.;
- падеж - Р;
- последняя буква основы слова - н;
- окончание - ой;
- левая часть окончания - о;
- правая часть окончания - го;
- первая буква окончания - о;
- вторая буква окончания - г;
- третья буква окончания - о,
можем увидеть наглядное представление правильного произношения (транскрипции) слова, переключив модель на «Устная речь». Получаем:
- полное прилагательное - радостного;
- основа слова - радостн;
- номер влияния контекста - 2;
- род - М;
- число - Ед.;
- падеж - Р;
- последняя буква основы слова - н;
- окончание - ой;
- левая часть окончания - о;
- правая часть окончания - во;
- первая буква окончания - о;
- вторая буква окончания - в;
- третья буква окончания - о.
Это также решено с использованием общей модели словоизменения русского языка на основании алгебры конечных предикатов.
Выводы
Научная новизна: представлено практическое применение программного приложения для задач: анализа, синтеза и нормализации.
Практическая значимость: программа работает быстро и эффективно, что помогает корректно выводить результат, ожидаемый экспертом.
Перспективы исследования. В дальнейшем планируется разработать модель кратких имен прилагательных, представленных звуковой формой, что позволит
расширить возможности процесса словоизменения модели.
Литература: 1. Мельникова, Р.В. Алгебраические модели морфологии и их применение в логических сетях. Дис. ... канд. техн. наук. Х.: ХНУРЭ, 2005. 152 с. 2. Лещинский, В. А. Модели бинарных логических сетей и их применение в искусственном интеллекте. Дис. ... канд. техн. наук. Х.: ХНУРЭ, 2006. 157 с. 3. Дударь, З.В. Математические модели флективной обработки словоформ и их использование в системах автоматической обработки текста русского языка. Дис. ... канд. техн. наук. Х.: ХИРЭ, 1984. 215 с. 4. Русакова Н.Е. Моделирование мозгоподобных структур и их применение в искусственном интеллекте Дис. ... канд. техн. наук. Х.: ХНУРЭ, 2012. 157 с. 5. Каменєва І.В. Побудова реляційної мережі коротких прикметників російської мови /І.В. Каменєва, А.С. Афанасьєв // Вісник Київського національного університету технологій та дизайну: Київ. 2012. № 5. C. 195-202. 6. КаменеваИ.В. Общая модель словоизменения имен прилагательных русского языка / И. В Каменева, А. С. Афанасьев // АСУ и приборы автоматики. 2012. С. 3-8. 7. Бондаренко, М.Ф. Мозгоподобные структуры / М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко // Справочное пособие. Том первый / Под ред. И.В. Сергиенко. К.: Наук. думка, 2011.460 с. 8. Бондаренко, М. Ф. Алгебра предикатов и предикатных операций / М.Ф. Бондаренко, З.В. Дударь, Н.Т. Процай, В.В. Черка-шин, В.А. Чикина, Ю.П. Шабанов-Кушнаренко // Радиоэлектроника и информатика. 2000. № 4. С. 15-23. 9. Бондаренко М. Ф. О реляционных сетях / М. Ф. Бондаренко, И. А. Лещинская, Н. П. Кругликова, Н. Е. Русакова, Ю. П. Шабанов-Кушнаренко // Бионика интеллекта. 2010. № 3. С. 8-13. 10. Бондаренко М. Ф. О булевых реляционных сетях / М. Ф. Бондаренко, И. В. Каменева, И. А. Лещинская, Н. Е. Русакова, Ю. П. Шабанов-Кушнаренко, И. Ю. Шубин // Бионика интеллекта. 2011.
Поступила в редколлегию 12.10.2012 Рецензент: д-р техн. наук, проф. Четвериков Г.Г.
Каменева Ирина Витальевна, аспирантка кафедры ПИ ХНУРЭ. Научные интересы: искусственный интеллект, интеллектуальная обработка данных. Увлечения: изучение иностранных языков. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 702-16-46, Е -
mail: [email protected].
Афанасьев Анатолий Сергеевич, студент кафедры ПИ ХНУРЭ. Научные интересы: искусственный интеллект, программирование на языках C++, C#. Увлечения: кулинария. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 702-16-46. Е-mail: [email protected].
РИ, 2012, № 3
55