Использование интеллектуальных технологий обработки неструктурированных данных в НСИ
Факторный анализ основных проблем в корпоративных системах (ЕНР, порталы, системы бюджетирования, документооборота, нормативно-справочной информации, бухгалтерские системы 1 С) выявляет избыточность данных, возникающих при интеграции инфраструктуры предприятия. При реализации интеллектуальных функций присутствует информация, называемая знаниями, следовательно, интеллектуальные системы являются системами обработки знаний. Совершенствование интеллектуальных систем (информационно-поисковых систем высокого уровня, диалоговых систем, базирующихся на естественных языках, интерактивных человеко-машинных систем, используемых в управлении, проектировании, научных исследованиях) во многом определяется тем, насколько успешно будут решаться задачи представления знаний.
Иванова О.В., Иванов П.В., Борисов КА.,
МТУСИ
Для достижения согласованности, консолидации и целостности бизнес-процессов при организации единых корпоративна справочных ресурсов требуется разработать методологию и регламенты ведения нормативно-справочной информационной системы предприятия, которая позволяет реализовывать интеллектуальные задачи в относительно ограниченной области.
Интеграция неструктурированной информации (ECI, Enterprise Content Integration) обеспечивает накопление неструктурированной информации организации в рамках единого хранилища данных и предоставления общего доступа к этой информации всем заинтересованным сотрудникам. Выработка подходов и правил для решения проблемы интеграции неструктурированных данных, которые обеспечивали более эффективное управление содержанием в рамках сближения неструктурированной (информация о предпочтениях и наклонностях потребителей, качественная динамика цепей поставок, защита данных о потребителях) и структурированной информации с целью последующего анализа и формирования данных для принятия решения.
В современных условиях поиск оптимального решения в данном направлении приобретает характер комплексной задачи в рамках единого рабочего места оператора при взаимодействии с несколькими программными системами или коммуникационными средами, а стандартизация сценариев повышают качество взаимодействия в системе В2С при большом количестве обращений по телефону, е-mail, SMS, WEB, ICQ. Диалоговые системы обеспечивают динамическое распределение терминальных устройств на архитектурном и функциональном уровнях. Предлагаемые решения аппаратно-программных средств интерфейса взаимодействия могут быть выстроены на базе моделирования современных многофункциональных комплексах обработки и отображения информации.
Перед разработчиками стоит задача проектирования более высокого уровня модели предметной области. При этом следует учитывать, что традиционные интерфейсы обычно не обладают моделью предметной области как таковой, и в лучшем случае скрывают от пользователя искусственные средства и особенности структуры, присущие конкретному типу НСИ (такие, как связи по идентификаторам между таблицами в реляционных базах данных или синтаксис XML). Естественно-языковой интерфейс (ЕЯИ) - разновидность пользовательского интерфейса, который принимает запросы на естественном языке, а также использует ЕЯ и для вывода информации (реакции системы на запрос пользователя). Проводя анализ основных составных частей ЕЯ-интерфейсов в НСИ, целесообразно выделить
из интерфейса анализатор ЕЯ, который реализует метод анализа естественного языка. От него зависит архитектура системы и основные характеристики интерфейсов на основе данного компонента.
Функциональность анализатора заключается в построении внутреннего представления входного ЕЯ-текста (запроса), который доступен в виде некоторой структуры, например, синтаксического дерева, семантической сети, фреймовой структуры; лексический анализ (пред-анализ) позволяет преобразовать входной текст как последовательность символов, в цепочку лексем. Для создания запроса на формальном языке источника данных используется модель источника данных, которая базируется на структуре справочника. Ряд систем имеет модуль синтеза ЕЯ, который используется для генерации естественно-языкового представления запроса, например, для верификации понимания запроса системой или для генерации уточняющих вопросов.
Система электронного обмена информацией потенциально может использовать разные программные решения, в которые входят всевозможные форматы данных для взаимодействия в разных сферах документооборота, и если интеграция применяется без соблюдения структурированного подхода, то понижается аналитическая составляющая управленческой информации, ее достоверность и непротиворечивость.
Программные средства для обработки неструктурированных данных могут выполнять следующие функции: распознавание текстов и синтез речи, обработка клиентских данных в интерактивных системах ответа на телефонные звонки и тд. Программное обеспечение дает возможность заполнять стандартные диалоговые формы, используя корпоративные БД, повышая скорость решения операторских задач и позволяя задействовать различные информационные потоки, к которому прилагается документ (руководство пользователя), содержащий написанную текстовую часть (подсказки оператору), схему разговора, разработанную в нотации BPMN и комментарии к сценарию диалога.
Для управления этой информацией используются специализированные системы управления неструктурированными данными (Content Management Systems). Управление неструктурированными данными — включает основные компетенции: системы управления архивами документов DMS (Document Management Systems); хранилища документов (Document Warehousing); системы управления знаниями (Knowledge Management); системы маршрутизации и контроля исполнения документов (DocFlow системы).
В сегмент интеграционного решения включены компоненты доступа, преобразования и форматирования данных для обеспечения их сквозной обработки в разнородных системах. Реализация осуществляется на транспортном уровне, который отвечает за маршрутизацию и доставку данных. Системы корпоративного поиска
56
T-Comm, #10-2012
(Enterprise Search) обеспечивают безопасный поиск документов, фактов, досье и другой неявной информации. Для создания информационных систем корпоративного поиска целесообразно использовать информационные продукты: IQ Search, FAST, Autonomy.
Для построения комплексной информационной системы, решающей эти задача, в мировой практике применяются СРМ-системы, которые включают в себя комбинацию методик, показателей, процессов и систем для управления эффективностью бизнеса, ее можно рассматривать как аналитический модуль в учетных транзакционных ERP-системах.
Структурированный интегрированный подход при построении архитектуры сервиса информационного обмена использует такие принципы ориентации на сервис, при которых использование самой корпоративной системы могло бы динамически развиваться в зависимости от растущих требований информационной инфраструктуры предприятия.
Программный интегрированный подход, ориентированный на сервисе EAI строится по принципам: интеграции данных (Data Integration) по стандарту XSLT; защиты передачи данных по протоколам LDAP, TLS; транзакции данных
В свою очередь программная интеграция ключевым образом
связана с В2В-сектором корпоративной системы, но при этом разделяет их бизнес-логику, бизнес-процессы по потребностям каждой из служб системы.
Литература
1. Иванов П.В., Иванова О.В. Тишкин С.В. Интегрированные решения в области компьютерного обеспечения для корпоративных пользователей // Т-Сотт — Телекоммуникации и транспорт. Спецвыпуск по итогам 3-й отраслевой научной конференции — форум 'Технологии информационного общества" посвященная 150-летию со дня рождения А.С. Попова. — М.: 2009. С. 154-155.
2. Аликин СС, Иванова О.В., Иванов П.В. Создание интеллектуального интерфейса для оператора почтового отделения // Т-Сотт — Телекоммуникации и транспорт, 2011. — №10. — С. 39-41.
3. Иванова О.В. Правовое регулирование электронных коммуникаций // Т-Сотт — Телекоммуникации и транспорт”, 2011. — №12. — С. 54-55.
4. Иванов ПВ, Иванова О.В. Проектирование работы почтовой системы // Т-Сотт — Телекоммуникации и транспорт, 2010. — №4. — С. 38-41.
5. Смелов М.Н, Иванова ОЛ,, Иванов П.В. Проблемы и алгоритмы поиска информации в глобальных компьютерных сетях // Т-Сотт — Телекоммуникации и транспорт”, 2010. — №3. — С. 23-25.
T-Comm, #10-2012
S7