Научная статья на тему 'Использование интеллектуальных технологий обработки неструктурированных данных в НСИ'

Использование интеллектуальных технологий обработки неструктурированных данных в НСИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
600
117
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванова О. В., Иванов П. В., Борисов К. А.

Факторный анализ основных проблем в корпоративных системах (ERP, порталы, системы бюджетирования, документооборота, нормативноLсправочной информации, бухгалтерские системы 1С) выявляет избыточность данных, возникающих при интеграции инфраструктуры предприятия. При реализации интеллектуальных функций присутствует информация, называемая знаниями, следовательно, интеллектуальные системы являются системами обработки знаний. Совершенствование интеллектуальных систем (информационноLпоисковых систем высокого уровня, диалоговых систем, базирующихся на естественных языках, интерактивных человекоLмашинных систем, используемых в управлении, проектировании, научных исследованиях) во многом определяется тем, насколько успешно будут решаться задачи представления знаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование интеллектуальных технологий обработки неструктурированных данных в НСИ»

Использование интеллектуальных технологий обработки неструктурированных данных в НСИ

Факторный анализ основных проблем в корпоративных системах (ЕНР, порталы, системы бюджетирования, документооборота, нормативно-справочной информации, бухгалтерские системы 1 С) выявляет избыточность данных, возникающих при интеграции инфраструктуры предприятия. При реализации интеллектуальных функций присутствует информация, называемая знаниями, следовательно, интеллектуальные системы являются системами обработки знаний. Совершенствование интеллектуальных систем (информационно-поисковых систем высокого уровня, диалоговых систем, базирующихся на естественных языках, интерактивных человеко-машинных систем, используемых в управлении, проектировании, научных исследованиях) во многом определяется тем, насколько успешно будут решаться задачи представления знаний.

Иванова О.В., Иванов П.В., Борисов КА.,

МТУСИ

Для достижения согласованности, консолидации и целостности бизнес-процессов при организации единых корпоративна справочных ресурсов требуется разработать методологию и регламенты ведения нормативно-справочной информационной системы предприятия, которая позволяет реализовывать интеллектуальные задачи в относительно ограниченной области.

Интеграция неструктурированной информации (ECI, Enterprise Content Integration) обеспечивает накопление неструктурированной информации организации в рамках единого хранилища данных и предоставления общего доступа к этой информации всем заинтересованным сотрудникам. Выработка подходов и правил для решения проблемы интеграции неструктурированных данных, которые обеспечивали более эффективное управление содержанием в рамках сближения неструктурированной (информация о предпочтениях и наклонностях потребителей, качественная динамика цепей поставок, защита данных о потребителях) и структурированной информации с целью последующего анализа и формирования данных для принятия решения.

В современных условиях поиск оптимального решения в данном направлении приобретает характер комплексной задачи в рамках единого рабочего места оператора при взаимодействии с несколькими программными системами или коммуникационными средами, а стандартизация сценариев повышают качество взаимодействия в системе В2С при большом количестве обращений по телефону, е-mail, SMS, WEB, ICQ. Диалоговые системы обеспечивают динамическое распределение терминальных устройств на архитектурном и функциональном уровнях. Предлагаемые решения аппаратно-программных средств интерфейса взаимодействия могут быть выстроены на базе моделирования современных многофункциональных комплексах обработки и отображения информации.

Перед разработчиками стоит задача проектирования более высокого уровня модели предметной области. При этом следует учитывать, что традиционные интерфейсы обычно не обладают моделью предметной области как таковой, и в лучшем случае скрывают от пользователя искусственные средства и особенности структуры, присущие конкретному типу НСИ (такие, как связи по идентификаторам между таблицами в реляционных базах данных или синтаксис XML). Естественно-языковой интерфейс (ЕЯИ) - разновидность пользовательского интерфейса, который принимает запросы на естественном языке, а также использует ЕЯ и для вывода информации (реакции системы на запрос пользователя). Проводя анализ основных составных частей ЕЯ-интерфейсов в НСИ, целесообразно выделить

из интерфейса анализатор ЕЯ, который реализует метод анализа естественного языка. От него зависит архитектура системы и основные характеристики интерфейсов на основе данного компонента.

Функциональность анализатора заключается в построении внутреннего представления входного ЕЯ-текста (запроса), который доступен в виде некоторой структуры, например, синтаксического дерева, семантической сети, фреймовой структуры; лексический анализ (пред-анализ) позволяет преобразовать входной текст как последовательность символов, в цепочку лексем. Для создания запроса на формальном языке источника данных используется модель источника данных, которая базируется на структуре справочника. Ряд систем имеет модуль синтеза ЕЯ, который используется для генерации естественно-языкового представления запроса, например, для верификации понимания запроса системой или для генерации уточняющих вопросов.

Система электронного обмена информацией потенциально может использовать разные программные решения, в которые входят всевозможные форматы данных для взаимодействия в разных сферах документооборота, и если интеграция применяется без соблюдения структурированного подхода, то понижается аналитическая составляющая управленческой информации, ее достоверность и непротиворечивость.

Программные средства для обработки неструктурированных данных могут выполнять следующие функции: распознавание текстов и синтез речи, обработка клиентских данных в интерактивных системах ответа на телефонные звонки и тд. Программное обеспечение дает возможность заполнять стандартные диалоговые формы, используя корпоративные БД, повышая скорость решения операторских задач и позволяя задействовать различные информационные потоки, к которому прилагается документ (руководство пользователя), содержащий написанную текстовую часть (подсказки оператору), схему разговора, разработанную в нотации BPMN и комментарии к сценарию диалога.

Для управления этой информацией используются специализированные системы управления неструктурированными данными (Content Management Systems). Управление неструктурированными данными — включает основные компетенции: системы управления архивами документов DMS (Document Management Systems); хранилища документов (Document Warehousing); системы управления знаниями (Knowledge Management); системы маршрутизации и контроля исполнения документов (DocFlow системы).

В сегмент интеграционного решения включены компоненты доступа, преобразования и форматирования данных для обеспечения их сквозной обработки в разнородных системах. Реализация осуществляется на транспортном уровне, который отвечает за маршрутизацию и доставку данных. Системы корпоративного поиска

56

T-Comm, #10-2012

(Enterprise Search) обеспечивают безопасный поиск документов, фактов, досье и другой неявной информации. Для создания информационных систем корпоративного поиска целесообразно использовать информационные продукты: IQ Search, FAST, Autonomy.

Для построения комплексной информационной системы, решающей эти задача, в мировой практике применяются СРМ-системы, которые включают в себя комбинацию методик, показателей, процессов и систем для управления эффективностью бизнеса, ее можно рассматривать как аналитический модуль в учетных транзакционных ERP-системах.

Структурированный интегрированный подход при построении архитектуры сервиса информационного обмена использует такие принципы ориентации на сервис, при которых использование самой корпоративной системы могло бы динамически развиваться в зависимости от растущих требований информационной инфраструктуры предприятия.

Программный интегрированный подход, ориентированный на сервисе EAI строится по принципам: интеграции данных (Data Integration) по стандарту XSLT; защиты передачи данных по протоколам LDAP, TLS; транзакции данных

В свою очередь программная интеграция ключевым образом

связана с В2В-сектором корпоративной системы, но при этом разделяет их бизнес-логику, бизнес-процессы по потребностям каждой из служб системы.

Литература

1. Иванов П.В., Иванова О.В. Тишкин С.В. Интегрированные решения в области компьютерного обеспечения для корпоративных пользователей // Т-Сотт — Телекоммуникации и транспорт. Спецвыпуск по итогам 3-й отраслевой научной конференции — форум 'Технологии информационного общества" посвященная 150-летию со дня рождения А.С. Попова. — М.: 2009. С. 154-155.

2. Аликин СС, Иванова О.В., Иванов П.В. Создание интеллектуального интерфейса для оператора почтового отделения // Т-Сотт — Телекоммуникации и транспорт, 2011. — №10. — С. 39-41.

3. Иванова О.В. Правовое регулирование электронных коммуникаций // Т-Сотт — Телекоммуникации и транспорт”, 2011. — №12. — С. 54-55.

4. Иванов ПВ, Иванова О.В. Проектирование работы почтовой системы // Т-Сотт — Телекоммуникации и транспорт, 2010. — №4. — С. 38-41.

5. Смелов М.Н, Иванова ОЛ,, Иванов П.В. Проблемы и алгоритмы поиска информации в глобальных компьютерных сетях // Т-Сотт — Телекоммуникации и транспорт”, 2010. — №3. — С. 23-25.

T-Comm, #10-2012

S7

i Надоели баннеры? Вы всегда можете отключить рекламу.