Научная статья на тему 'Анализ возможностей применения атомарной модели описания данных для поддержки процедур системы управления знаниями'

Анализ возможностей применения атомарной модели описания данных для поддержки процедур системы управления знаниями Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
315
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА УПРАВЛЕНИЯ ЗНАНИЯМИ (СУЗ) / АТОМАРНЫЙ ЭЛЕМЕНТ ОПИСАНИЯ / ОНТОЛОГИЯ / АТОМАРНАЯ МОДЕЛЬ ОПИСАНИЯ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бакулин Андрей Александрович

Произведен анализ основных видов информации, с которыми сталкивается менеджер. Рассматривается архитектура системы управления знаниями, основное внимание уделяется формированию структуры организации и хранения данных и информации. Произведен анализ деятельности ИТ-менеджера, на основании которого построена модель описания данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EXPLORING THE USE OF ATOMIC MODEL OF THE DATA DESCRIPTION FOR THE SUPPORT OF THE PROCEDURES OF THE KNOWLEDGE MANAGEMENT SYSTEM

The analysis of the main types of information faced by the manager. The architecture of knowledge management systems, focusing on the formation and structure of the organization and storage of information. The analysis of IT management, based on a model which describe the data.

Текст научной работы на тему «Анализ возможностей применения атомарной модели описания данных для поддержки процедур системы управления знаниями»

УДК 004

Ап^еу БакиИп

А.А. Бакулин

В процессе решения бизнес-задач, в процессе обучения или работая с какой-либо иной целью с поисковой системой Сети, менеджер сохраняет определенное количество файлов. Классически они помещаются в директорию под корень, чтобы в свободное время можно было их изучить, классифицировать, организовать [1; 3]. Процесс обработки файлов означает, что данные превращаются в информацию. Уменьшается мера неопределенности, и в рамках определенной логико-смысловой модели той предметной области, в которой менеджер занят, возникает новый раздел или появляется возможность положить в существующий раздел какую-то новую информацию.

Основные виды информации по форме представления, способам ее кодирования и хранения следующие:

1. Графическая информация предоставляется как график, рисунок, фотография, схема, диаграмма, различного рода шкалы.

2. Звуковая информация - это записи переговоров на диктофон и дальнейшее их воспроизведение, различные звуки об ошибках, предупредительные сигналы, звуковые сообщения.

3. Текстовая информация - способ кодирования речи человека специальными символами-буквами, причем разные народы имеют разные языки и используют различные наборы букв для отображения речи; данный вид предоставления информации используется в книгах, журналах, плакатах и т. д.

4. Числовая информация аналогично текстовой отображается методом кодирования специальными символами-цифрами, причем системы кодирования (счисления) могут быть разными.

5. Видеоинформация - способ сохранения живых картин окружающего мира; в современном мире используется в видеоконференциях, онлайн-обучениях, записи определенных событий и в дальнейшем их воспроизведение.

Таким образом, каждый из вышеназванных типов данных представляет атомарный элемент описания. Такие атомарные элементы описания в основном есть неструктурированные данные. Обычно они хранятся в форме, не позволяющей осуществить простую и логическую классификацию. Книги, фильмы, печатные документы, файлы, простые и электронные письма, презентации, элек-

© Бакулин А.А., 2014

тронные таблицы, рисунки, чертежи, отпечатки пальцев, фотографии, музыкальные клипы, новости, контракты, видеоролики, архивы камер наблюдения - вот лишь малая часть примеров неструктурированных данных. В совокупности они образуют внутреннее знание организации.

Если попытаться спроецировать атомарные элементы описания данных на схему видов деятельности менеджера, можно получить характерную информационную модель менеджера (см. рис. 1).

Рис. 1. Информационная модель менеджера

Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, включают руководства, письма, новости, информацию о заказчиках, сведения о конкурентах и данные, накопившиеся в процессе работы [2]. На рис. 1 изображены только основные виды информации, с которыми приходится работать менеджеру. В ритме современного информационного общества количество видов информации растет. Всех «потребителей» данных в субъектах экономической деятельности можно разбить на три группы: топ-менеджмент, менеджеры и рядовые сотрудники. Рассмотрим кратко особенности принятия решений в каждой группе. Топ-менеджерам, ответственным за принятие стратегических решений, необходимо своевременно «переварить» терабайты слабоструктурированных корпоративных данных, которые прошли через объединение, абстрагирование и преобразование. Менеджеры, отвечающие за принятие тактических решений, ориентируются на информацию, связанную с ограниченной предметной областью. Они вырабатывают решения на основе аналитических отчетов, полученных на основе гигабайт данных. И, наконец, рядовые сотрудники, принимающие стандартные решения, также сталкиваются с необходимостью ежедневной обработки мегабайт данных и информации.

Для того чтобы организовать этот огромный массив документов, писем, схем, диаграмм, аудиозаписей и т.д., необходимо спроектировать методические рекомендации по формированию СУЗ для персонофицированной поддержки деятельности менеджера, которая будет поддерживать быстрый поиск, обобщение всей информации, то есть некоторое ее структурирование, хранение информации и ее вывод менеджеру.

Само по себе понятие система управления знаниями (СУЗ) определяется как средство, целью которого являются содействия сотрудникам в приобретении знаний и использовании их в рамках выполнения бизнес-задач по средствам предоставления релевантной информации и помощи в ее структуризации и интерпретации. Необходимость разработки систем управления знаниями обусловлена следующими причинами:

1) работники организации тратят слишком много времени на поиск необходимой информации;

2) опыт ведущих и наиболее квалифицированных сотрудников используется только ими самими;

3) ценная информация захоронена в огромном количестве документов и данных, доступ к которым затруднен;

4) дорогостоящие ошибки повторяются из-за недостаточной информированности и игнорирования предыдущего опыта.

Так, в качестве одной из ключевых и первоочередных задач при построении СУЗ указывается необходимость структурирования и формализации знаний организации, выработки понятийной структуры, которая может быть представлена в форме классификаторов, рубрикаторов, а чаще всего - онтологии, являющейся классификацией знаний организации. Лучше всего это видно на схеме архитектуры системы управления знаниями (см. рис. 2) [5].

Рис. 2. Архитектура системы управления знаниями

Нижний уровень архитектуры обеспечивает получение знаний из разнородных источников структурированной (базы данных и знаний, таблицы, формы) и неструктурированной (документы) информации. Получение знаний подразумевает аннотирование разнородных источников информации с помощью онтологии, которая позволяет отразить содержание информации. Для получения онтологии используются программные средства автоматического формирования онтологии, поддержки ручной разработки и редактирования онтологии, средства слияния, объединения и оценки качества онтологий. Для аннотирования используются средства автоматической классификации документов по онтологии, извлечения информации из текста и баз данных. Полученные онтологии и метаданные представляются с помощью специальных языков OWL, RDF.

Промежуточный уровень обеспечивает хранение онтологий и метаданных, управление версиями, доступом, передачу данных для взаимодействия с внешними системами и хранилищами, обработку запросов и логический вывод.

Пользовательские приложения предоставляют пользователям доступ к знаниям, находящимся в системе. Доступ может осуществляться с помощью поискового механизма, средств навигации и визуализации, а также путем непосредственного обмена знаниями между пользователями (например, обмена ссылками на ресурсы). Взаимодействие пользовательских приложений с промежуточным уровнем осуществляется с помощью языков запросов и манипулирования данными (например, SPARQL).

Представленная архитектура может воплощаться в СУЗ полностью или частично. В одних случаях упор может делаться на программную реализацию задач уровня пользовательских приложений - поиск, визуализацию знаний, в других - на получение, хранение, интеграцию знаний [4].

СУЗ существенно отличается от информационных систем организаций, достигших определенных технологических и инновационных высот в своем развитии. Если предназначением информационных систем являются эффективное хранение, обработка и предоставление пользователям по регламенту или запросу искомой информации, то предназначением СУЗ является увеличение объема и повышение уровня использования знаний организации за счет их эффективного поиска и фильтрации, включения в коллективную память организации профессиональных знаний и опыта, в том числе хранящихся в головах менеджеров. Информационная система рассматривает менеджера как функционера, то есть человека, выполняющего определенные функции, которые она (система) должна информационно обеспечить. СУЗ же рассматривает менеджера как основной источник знаний, которому требуется оказывать помощь в предоставлении недостающих знаний в процессе генерации идей и решении задач, а также в создании новых знаний.

Построение СУЗ для персонофицированной поддержки менеджера осуществляется путем комбинирования атомарных элементов описания данных с элементами организации данных, что в целом представляет собой целостный механизм для работы с данными и информацией, позволяющий формировать новые знания на основе старых. Данное преобразование возможно за счет корректного представления данных, информации и знаний, в удобном для пользователя виде - атомарном представлении, а именно атомарной модели описания данных.

Анализ деятельности ИТ-менеджера позволяет сделать следующие выводы относительно способов организации, хранения и поиска данных.

1) ИТ-менеджер получает данные из различных источников, при чем не только информационных:

а. в случае информационного файла для его организации и хранения менеджер использует древовидную систему каталогов файловой системы. Данная система подразумевает некоторую иерархию и представляет собой совокупность элементов (файлов), расположенных в порядке подчинения одного элемента другому, образуя при этом перевернутое дерево-граф. Принцип организации

данных таким методом означает, что несколько узлов низшего уровня связаны только с одним узлом верхнего уровня;

b. в случае получения физического документа менеджер может осуществить ряд действий с ним, зависящих от бизнес-задачи: сохранить документ, передать документ на подпись, распознать документ, превратив его в информационный, а соответственно организовать внутри своей файловой системы, уничтожить документ ввиду необходимости.

2) ИТ-менеджер сталкиваюется с различными форматами информационных данных (чаще всего это: DOC, Xls, PPT, PDF, 1РЕв).

3) Помимо распознавания текстов, менеджеры используют и другие способы оцифровки физических документов. К таким способам относится фотографирование документов и компиляция видео- и аудиофайлов.

4) Часто отсутствует классификация данных по предметным областям, что означает сохранение данных «в корень» файловой системы, а вследствие сложности в поиске необходимых файлов.

Соответственно, при атомарном предоставлении информации решается проблема организации информации и данных путем составления классификаций и выстраивания логически понятного древа, в котором атомами выступают конечные документы, а узлами - каталоги (см. рис. 3).

Рис. 3. Атомарная модель описания данных: в- головной узел;®'- второстепенный узел (здесь: как раздел предметной области); О* - детализированный элемент раздела: атом представленной модели; дуги, которые формируют отношения между узлами (разделами);'О- ссылочный узел, атом (подразумевает наличие

ссылки на файл в различном разделе); - пунктирные дуги, которые демонстрируют отношения между

ссылками в различных разделах

Относительно атомарной модели описания данных необходимо сделать акцент на таком важном понятии, как субъективизм. Все человеческое познание является ассоциативным и, соответственно, попытки жестко классифицировать информацию и выстроить персональную систему управления знаниями являются экспертными. Следовательно, у каждого пользователя данной системы классификация информации будет субъективной.

Одним из основных элементов данной модели является преобразование данных и информации. Представленная классификация предметной области на разделы, подразделы и атомы позволяет не только корректно организовать данные, но и формировать новые знания на основе старых. Каждый раздел может расширяться, могут появляться новые атомы и ссылки на них за счет изучения менеджером предметной области, формирования и формализации выводов и знаний в самой модели.

На основе получившихся выводов анализа деятельности ИТ-менеджеров автором представлена модель организации, хранения и извлечения информации - атомарная модель описания данных, позволяющая верно организовать и классифицировать входящие данные, осуществлять быстрый поиск необходимых данных и своевременно отображать результаты.

Библиографический список

1. Болотов А.С., Болотова Т.П. Файловая система NTFS: обзор версий, производительность / А.С. Болотов, Т.П. Болотова // Вестник Университета (Государственный университет управления). - 2012. - № 7.

2. Дзалбо В.И. Системы управления знаниями. Назначение и архитектура [Электронный ресурс]. - Режим доступа: http: // dzalbo.com/

3. Файловые системы Windows Server 2012 / Болотов А.С., Болотова Т.П. // Вестник Университета (Государственный университет управления). - 2013. - № 1.

4. Mika, P., Akkermans H. Towards a New Synthesis of Ontology Technology and Knowledge Management Knowledge // Engineering Review, Cambridge University Press, Volume 19, № 4, 2004.

5. [Электронный ресурс]. - Режим доступа: http://bigc.ru/publications/bigspb/km/itkm/

i Надоели баннеры? Вы всегда можете отключить рекламу.