Литература
1. Бождай А.С. Комплексная инфраструктура территории: методы и модели информационного мониторинга // Информационные технологии. - 2009. - №9, стр. 57 - 63
2. Бершадский А.М., Бождай А.С. Мониторинг эффективности деятельности системы послевузовского профессионального образования в вузах Российской Федерации с учетом социально-экономических факторов // Открытое образование. - 2010. - № 2. - С. 24-32.
3. Бершадский А.М., Бождай А.С. Концепция мониторинга комплексной инфраструктуры территории: монография - Пенза : Изд-во ПГУ, 2010. - 242 с.
4. Бождай А.С., Бершадский А.М. Методика оценки качества подготовки специалистов в системе высшего профессионального образования с учетом их востребованности на рынке труда // Информационная среда вуза XXI века : материалы III Междунар. науч.-практ. конф. - Петрозаводск, 2009. - С. 2527.
5. Бершадский А. М., Бождай А.С., Осипова Н.В. Разработка методики мониторинга состояния информатизации органов государственной власти региона // Известия Волгоградского государственного технического университета. Серия: Актуальные проблемы управления, вычислительной техники и информатики в технических системах - 2009. - Вып. 7. - № 12 (60).- С. 92-95
6. Бершадский А. М., Финогеев А.Г., Бождай А.С. Разработка и моделирование гетерогенных инфраструктур для беспроводного информационного обеспечения процессов мониторинга // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2010. - № 1. - С. 36-46.
УДК 002.53:004.89 ВАК 05.25.05 ГРНТИ 12.41.55, 20.23.25
ОБЩЕСИСТЕМНЫЕ И ТЕХНОЛОГИЧЕСКИЕ ОСНОВЫ УПРАВЛЕНИЯ ЗНАНИЯМИ
О. Л. Голицына, доц., к. т. н., доцент кафедры системного анализа Тел.: (495) 323-93-65, e-mail: [email protected] Н. В. Максимов, проф., д. т. н., профессор кафедры системного анализа Тел.: (495) 323-93-65, e-mail: [email protected] Национальный исследовательский ядерный университет «МИФИ»
http://www.mephi.ru
In the context of system analysis the basic principles of designing information environment, oriented toward the system of knowledge control support are considered. For organizing information space, oriented towards obtainment and preservation of knowledge, the structure of classification type, dynamically reflecting the similarity and differences of available and new knowledge on sign, concept and documentary levels is offered to use.
С позиций системного анализа обсуждаются основы построения информационной среды, ориентированной на поддержку систем управления знаниями. Для организации информационного пространства, ориентированного на получение и сохранение знаний, предлагается использовать структуру классификационного типа, динамически отражающей сходство и различия состоявшегося и нового знания на знаковом, понятийном и документальном уровне.
Ключевые слова: информационная среда; знания; информация; информационный поиск; системы представления знаний.
Keywords: Information environment; knowledge; information; information search; knowledge representation systems
Введение
Проблемы образовательных процессов в настоящее время связаны не столько с тем, чтобы сформировать конкретные знания в некоторой области и представить их в традиционной или электронной форме, сколько с достижением умения (компетентности) применить эти знания при решении конкретных задач. Характерной особенностью современности является и то, что электронная информация играет все большую роль во всех сферах жизни современного общества, в том числе в образовании и науке. Ее разнообразие и растущие объемы создают большие трудности для нахождения актуальной и достоверной информации. Кроме того, и информация, и знания в вычислительной среде представляются в единой цифровой форме, что приводит к обезличенности и потере разнообразия связей.
Нельзя не учитывать и такую особенность человека, как невозможность однозначно специфицировать (выразить наличными лингвистическими и понятийными средствами) познавательную или информационную потребность, особенно если она связана с начальным этапом познания.
Наука и образование вступают в функциональные взаимосвязи и теряют прежнюю изолированность, поэтому для решения научных и кадровых задач инновационного развития процесс создания информационной среды должен включать не только формирование информационных ресурсов. Не менее важным является создание на основе системного анализа процессов генерации, сохранения и использования знаний единого подхода и средств организации информационных потоков, метаинформации и хранилищ, включая разработку:
(1) многоуровневой системы идентификации знаний и информации, обеспечивающей гибкий многоаспектный поиск в распределенных информационных ресурсах;
(2) хорошо структурированных форм представления знания в виде систематизированного набора взаимосвязанных информационных объектов, представляющих различные аспекты и этапы жизненного цикла предмета познания;
(3) информационных технологий динамического создания и актуализации средств систематизации и идентификации знаний;
(4) программно-информационных средств поиска и анализа знаний, сохраняемых в разнородных информационных ресурсах.
1. Когнитивные процессы. Знания и информация
Формирование знания - создание еще не известных субъекту понятий на основе понимания и применения известных, в целом основывается на изложенных в [1] следующих характерных для проблемно-ориентированного обучения положениях:
• Знание проявляется во взаимодействии человека с доступной (а в случае процессов образования - предоставленной) средой. Этот тезис свидетельствует о необходимости поддерживать в сознании обучаемого схему преобразований знание ^ информация ^ знание: познание основано на использовании ассоциированной с известным знанием информации и дальнейшем ее преобразовании в новое знание.
• Противоречие в познании - стимул для учения. В процессе обучения противоречия могут быть разрешены путем структуризации полученных знаний с позиции состоявшегося обобществленного знания, представленного, например, в виде локальной классификации, отражающей взгляд индивида.
• Познание основывается на взаимодействии - сотрудничестве с другими субъектами и использовании их знания. Одной из форм сотрудничества является использование знаний, представленных в информационных ресурсах.
Образовательный процесс, ориентированный на научный прогресс и инновации, должен сочетать репродуктивное и продуктивное познание, создавая знание, которое будет ориентировано на исследование той или иной предметной области, в итоге приводя к ее преобразованию. При этом технологической основой любого познавательного процесса является то, что, получая как факты элементы состоявшегося, проверенного теорией и практикой, знания, за счет его декомпозиции и упорядочения в соот-
ветствии с собственной методологической схемой субъект познания формирует личное знание, новое, по крайней мере, для него самого и которое, в свою очередь, становится объектом проверки, исследования и использования.
1.1. Информация и знание с точки зрения информационных взаимодействий
Определим, что представляют собой познавательные процессы с информационной точки зрения. Информация выступает как форма существования знания, отчужденная от его носителя (сознания субъекта) и обобществляющая его для использования другими субъектами. Получая информацию, субъект превращает ее путем интеллектуального усвоения (информационно-когнитивного процесса) в свои новые личностные знания, т. е. происходит воссоздание знаний на основе информации. В процессе познания (а в итоге - синтеза знания), с одной стороны, имеет место дезинтеграция, «расчленение и разбрасывание» уже накопленного знания, а с другой - на этой «хаотизированной» основе осуществляется построение комбинаций элементов знания и выбор нового пути синтеза. Такой выбор связан с выходом (по существу - случайным) на одну из предопределенных в данной среде и имеющих относительно устойчивое состояние структур, после чего происходит процесс самоорганизации и проверка непротиворечивости нового знания [2].
С процедурной точки зрения процессы обучения, так же как и процессы научного поиска, имеют общую схему, которая, согласно [3], включает следующие этапы: 1) поиск и извлечение информационных блоков из среды; 2) упорядоченная или случайная комбинаторная проверка ценности этих блоков; 3) расширение знаний за счет тех комбинаций информационных блоков, которые в совокупности с наличным знанием образуют систему понятий (т. е. отвечают принятой аксиоматике и критериям); 4) представление нового «личного» знания субъекта в такой форме (технического решения, сообщения, документа и т. д.), которая обеспечит его «узнаваемость» и повторное использование внутри и вне когнитивного процесса.
Поиск в информационных ресурсах как замещающая часть некоторого участка процесса генерации знания включает следующие этапы:
1) отбор из информационных ресурсов документов, каждый из которых представляет, по крайней мере, один информационный компонент или его образ;
2) комбинаторное построение на основе некоторого множества характеристических признаков кластеров информационных компонентов и определение степени «целостности» этих кластеров уже как новых информационных компонентов;
3) упорядочение этих кластеров по их «ценности» с целью сокращения объема просматриваемой субъектом выборки и в предположении, что мера ценности соответствует вероятности содержания в кластере искомого нового.
Таким образом, комбинаторное сочетание является своеобразным методом генерации знания и общей технологической основой для относительно самостоятельных и в то же время взаимообусловливающих процессов основной и информационной деятельности, а информационно-поисковая система (ИПС), по терминологии теории динамических систем [4], формируя неравноценные комбинации (выборки документов) будет выполнять функцию «перемешивающего слоя», обеспечивая тем самым ускорение возникновения неравновесного состояния.
Для формализации машинного представления знаний используем введенные в [5] понятия информация и знание, рассматриваемые с точки зрения информационных взаимодействий. В отличие от физических взаимодействий, непосредственно происходящих в конкретный момент времени между оригиналами - отдельными телами или силам, в информационных взаимодействиях участвуют и их образы - информационные объекты, отражающие свойства оригиналов, но не обладающие ими. Причем такие объекты-образы способны вступать между собой во взаимодействие уже без ограничений, присущих оригиналам, что позволяет для развития оригиналов использовать эволюцию их образов. В пределах этой системы информационных объектов уже возможно вводить собственные метрики и моделировать прошлое и будущее соответствующих объектов предметной области (ПрО). Кроме того, снижение размерности (путем абстрагирования) позволяет реализовать процесс моделирования существенно быстрее, чем в натурном эксперименте. То есть система информационных объектов будет самостоятельно развивающейся виртуальной предметной областью.
Заметим, что информационные взаимодействия отличаются от физических еще и тем, что нас в этих взаимодействиях интересует не состояние информационного объекта, а состояние ПрО, изменяющееся в результате взаимодействия. Характерным свойством информационных
взаимодействий является нелинейность (необратимость), обусловленная дискретным характером процесса отображения из одного операционного пространства в другое - редукцией свойств оригинала при генерации образа, происходящей при выборе конкретного отображения (преобразования, системы кодирования).
Информационный объект имеет характерную двойственность состояния: до взаимодействия - это некоторый целостный объект, во время взаимодействия - это макрообразование отдельных частей (микрообъектов). Причем эти определенным образом связанные микрообъекты в то же время могут использоваться как элементы образов других, существующих или будущих, объектов-оригиналов. Например, для документальной формы такими микрообъектами являются понятия, обозначаемые в тексте терминами языка, которые могут использоваться в любых других текстах. То есть информация по отношению к ПрО может рассматриваться как случайная величина. Поэтому можно сказать, что информация - это суперпозиция возможных состояний информационного объекта в п предметных областях, количественно характеризуемая функцией
где ЕI- функция распределения для 1-й предметной области, I = 1, ..., п; Л = С1Е1 + С2Е2 +... + СпЕп , С - вероятностный показатель отнесения информационного объекта к 1-й
предметной области.
Тогда результат информационного взаимодействия можно характеризовать функцией
^ = Еп + ей + + Е 0 Где ®' - функция распределения для информационного объекта, с
С1 1 1 С2 2 2 ■■ Сп п п > которым взаимодействует исходный, для 1-й предметной области.
В частности, для текстовой формы представления информации, ориентированной на координатный метод идентификации содержания, пространство (первичные координаты) задается на дискретном множестве терминов, представляемых целостными понятийными конструкциями слов и их комбинаций (словосочетаниями, фразами, полными текстами). Функция распределения в этом случае может быть задана с помощью матриц типа «термин - документ» для соответствующих ПрО.
В общем случае информация не тождественна информационному объекту, который ассоциируется с формой существования, в то время как информация - с действием, потенциально производимым этим объектом. То есть можно сказать, что информация - это информационный объект во взаимосвязи с обстоятельствами взаимодействия.
Как было отмечено ранее, в процессе информационного взаимодействия появляется объект (образ), не влияющий на исходный (оригинал). Однако здесь следует обратить внимание на то, что исходный информационный объект, практически не меняя своего физического состояния, явно или неявно обретает новое свойство - «Быть использованным в 1-й ПрО». То есть, взаимодействуя с ПрО, информация принимает единственное состояние из множества возможных, а в суперпозиции возможных состояний происходит редукция функции распределения -из всех областей выбирается одна. При этом такой выбор приоритетного направления изменяет функцию распределения для последующих взаимодействий, уменьшая вероятности использования этой информации в других ПрО.
Такое случившееся в результате выбора состояние информации, зафиксированное в виде контекстно дообусловленного информационного объекта, и может называться знаниями. В результате информационного взаимодействия изменяется личное знание и появляется новый информационный объект, который, в свою очередь, может стать доступным для взаимодействия, в том числе вне операционной среды.
С точки зрения механизма взаимодействия информация должна включать «интерфейсные» средства (элементы или свойства), сопряженные (имеющие общность природы) с взаимодействующими объектами. Соответственно, механизм «сочетания», который реализует собственно взаимодействие поступившей информации и наличного знания, включает три этапа:
- выявление «сопрягающей» общности и различий - локализация проблемной ситуации;
- выделение и «вписывание» элементов новизны, которые в совокупности порождают новое качество (элемент, связь или свойство);
- синтез нового знания - оценка конструктивности (ценности) комбинации и генерация самостоятельного информационного объекта, включающего, возможно, сопутствующие факты, такие как, например, эффективность полученной информации, использованные теории и методы решения, порождаемые в результате процесса решения новые задачи и т. д.
Можно сказать, хотя и достаточно условно, что знания (и, соответственно, форма их представления) ориентированы на формирование «замкнутых» самодостаточных систем, а информация - на формирование «открытых» систем, основное назначение которых - взаимодействие
с внешними объектами. Это означает, что интерфейс знаний ориентирован «внутрь»: задача его элементов - предопределять единообразное восприятие основного содержания как целостной конструкции, т. е. произвести «редукцию» возможных смыслов к тому, который обеспечивает субъекту эффективное и устойчивое применение (в рамках конкретной проблемы) и передачу знаний. Интерфейс информации ориентирован «наружу»: его элементы отражают связи с возможными проблемными ситуациями, а не только с той, которая привела к появлению информации. Именно вследствие этого методологически невозможно построить унифицированное содержательное описание проблемной ситуации, т. е. интерфейс информации должен «строиться» через укрупнение - использование общепринятых понятий.
Таким образом, знания и информация как объекты обработки имеют одинаковое существо, но различаются обстоятельствами взаимосвязи со средой.
1.2. Когнитивные процессы как система
И научное исследование, и образовательный процесс с точки зрения общей теории систем [6] соответствуют ситуации построения абстрактной системы Si =< М, Ль Яь X > - отвечающее закону композиции X множество элементов М, определенных на множестве характеристических признаков Л, и связанных отношениями Я,, которое сводится к выполнению следующих шагов:
1) отбор из универсума элементов (объектов) М по единому основанию - множеству характеристических признаков Л/0) некоторой совокупности - множества первичных элементов;
2) наложение на первичные элементы определенных отношений единства - связей Я/1-1 и образование по некоторому закону Х/1-1 множества композиций элементов М^г> . В качестве закона композиции может, например, выступать принцип или цель построения системы;
3) такое изменение композиций множества М/1-1 и такой вывод согласно отношениям Я/2), Я/3"1, Я/4"1, ..., Я/^1"1 и законам композиции Х®, Х(3), Х(4), ..., множеств композиций М'¡~1>,
..., при которых композиции всех этих множеств оказываются построенными из
первичных элементов одного и того же множества М/0-1.
4) вывод для данных Ль Яь X множества объектов М\ и таким образом формирование системы £ = М = {М(0), М(1), ..., М(5+1)}.
Определяемая таким образом система обладает свойством гетерогенности, так как в общем случае реализуется не одно, а множество оснований. Кроме того, отсюда следует, что любая система состоит из подсистем.
Механизм построения композиций может быть основан на использовании системного подхода, представляющего любой объект как систему в системе объектов того же рода, что позволит:
• представить объект как множество связанных некоторыми отношениями типизированных однородных элементов, в совокупности образующих единство, для которого характерно появление свойств, не присущих составляющим;
• представить систему этих однородных объектов в виде классификации, что даст возможность выделять в явной форме в том числе и новые, характеристические признаки, определять способы выделения подсистем, а на основе свойств соответствия и симметрии обнаруживать связи с другими системами классификации.
Такая система описывается, как правило, при помощи согласованного в целостное представление набора сравнительно независимых аспектных представлений (подсистем, каждая из которых имеет свое системное основание - «сетку» базовых понятий и отношений). Аспектное представление дает частичное знание о системе в целом, но полное по отношению к данному аспекту. Целостное же представление формируется путем установления связей между аспект-ными представлениями.
1.3. Траектория когнитивного процесса
И обучение, и научное исследование имеют траекторию. Траектория образовательного процесса задается государственными образовательными стандартами (представляющими совокупность требований, обязательных при реализации основных образовательных программ подготовки кадров), а ее прохождение достаточно жестко декларировано образовательными программами и соответствующими учебно-методические материалами, а также индивидуальными программами обучения. В случае научного поиска такая траектория задана, например, в форме плана исследований или дерева целей, а результат определен, скорее, гипотетически. Но и в том, и в другом случае познавательного процесса для каждого субъекта реальное прохождение траектории и результат будут индивидуальными и представляться наборами информационных
компонентов трех типов: документально-фактографическими, полноценно описывающими знание и процесс его синтеза, структурно-логическими, представляющими «точку зрения» субъекта, и понятийно-терминологическими, используемыми для описания знаний.
Сам процесс как последовательность состояний может быть представлен парой марковских цепей: цепью наборов информационных компонентов на уровне кластера документов, имеющих некоторую общность и полностью контекстно определенных, и цепью наборов на уровне понятий - множеств терминов (в том числе и вне контекста), обозначающих понятия, характерные для этого кластера. Эти цепочки будут подобными: вследствие парности процедур их построения (на каждом шаге для полученного кластера документов строится кластер терминов): они имеют одинаковое число элементов и поглощающие состояния, одинаково отвечающие завершению процесса поиска. При этом каждое состояние может быть представлено компонентами, отражающими как новое знание, так и состоявшееся (опубликованное и общепринятое). И поскольку обе цепочки отражают единый процесс (имеют общее системообразующее основание, представленное структурно-логическим компонентом, например, классификационной схемой), то можно говорить о наличии статистической связи их параметров. Более того, эту последовательность можно рассматривать уже не как последовательность состояний, а как цепочки символов, например нулей и единиц, где единица означает состояние релевантности. Такое представление соответствует марковским цепям, что позволяет говорить о том, что могут быть построены такие цепи ограниченной длины, которые будут не только однозначно отвечать устойчивым последовательностям состояний, но и определять не равновероятные переходы к другим состояниям.
2. Систематизированная структура представления знаний
Система представления знаний должна обеспечивать: (1) эффективность (и вариантность) идентификации содержания знания, (2) адекватность интерпретации (учитывающей особенности соответствующего представления предметной области, цели и обстоятельства получения или использования), (3) поиск и упорядочение фрагментов знаний («перемешивание») для задач синтеза нового знания.
2.1. Формы представления знаний
Рассматривая познание как управляемый процесс основной деятельности, включающий (1) блок основной деятельности (ОД), где операционными объектами являются собственно познаваемые объекты или их описания; (2) блок управления, где операционными объектами являются атрибуты познаваемых объектов и параметры процесса ОД; (3) блок информационной поддержки, обеспечивающий сбор, хранение и поиск информации, где операционными объектами являются сведения о познаваемых объектах (адресе хранения и содержании). Таким образом, с точки зрения назначения и характера использования можно выделить три типа информационных объектов: полные описания (фактографический компонент), аналитические описания и поисковые образы.
Полные описания выступают в качестве операционного эквивалента объекта в задачах основной деятельности. Это информационный образ вещественного или абстрактного объекта, представленный средствами языка, возможности которого соответствуют классу решаемой задачи, например язык математики, инженерная графика, структурные формулы химических соединений, технологические схемы и т. д. Он является «действующей» операционной моделью, позволяющей воспроизводить, оценивать и прогнозировать состояние или поведение самого объекта или создавать новые объекты.
Аналитическое описание представляет обычно в декларативной форме основные характеристические свойства объекта, позволяющие выделить элементы новизны и полезности. Наиболее известными примерами являются авторефераты диссертаций, формулы изобретений, реферативные обзоры по научным направлениям, информационные карты НИОКР.
Поисковые образы (ПО) как самостоятельные информационные объекты изначально создаются не для задач анализа или синтеза знаний. Поисковые образы - это идентификационный эквивалент объекта (или его описания) в задачах выделения/отождествления объекта среди других объектов. Поисковый образ идентифицирует содержание, но с той степенью полноты и точности, которые позволяют выделить объект (или даже группу похожих на него) среди всех других. Отметим, что особенностью информационного поиска, как, впрочем, и научного, является то, что для спецификации информационной потребности, равно как и проблемной ситуации или принципиально нового решения, мы должны использовать общепринятые и известные
понятия. Соответственно, для достижения достаточно полных ответов поисковые образы должны включать характеристические понятия, но это должны быть скорее обобщенные и известные понятия, а не те, которые обозначают новизну решения. В классе поисковых задач такая «общность» представления предметной области достигается построением поискового образа на основе свойства концентрации информации, в частности, снижением детальности понятий и упрощением связей, а также нормализацией лексики, используемой для описания.
Как известно, технологии машинного поиска так или иначе сводятся к определению степени общности поисковых (машинных) образов запрашиваемого и хранимого. Обычно в большинстве современных ИПС в качестве ПО используют в той или иной степени расширенные библиографические описания. Такой образ, по существу, предназначен для указания кластера объектов, имеющих определенное сходство с данным, что реализуется путем классификации или координатного индексирования. То есть ПО в этом случае идентифицирует место в упорядоченном (обычно через введение системы характеристических признаков) пространстве ПрО, но не существо решения, что потребовало бы указать не только основные компоненты, но и характер связей между ними. Отметим, что использование связей в описании содержания документа было реализовано в языке ЛХ-кодов [6], который использовался в 60-е годы в первых ИПС. Однако формирование такого ПО было на порядки более ресурсоемким, чем на основе дескрипторного языка, и не давало существенных преимуществ, поэтому не получило развития.
Создание интегральных ИС, появление систем сохранения и управления знаниями, развитие семиотики и лингвистического анализа привели к возрождению этого направления в виде средств построения онтологических описаний. Такие технологии строятся на сведении текста к ограниченному набору ключевых понятий, связанных смысловыми отношениями. Однако на практике процедуры автоматического реферировании и индексирования пока применяются слабо. Это связано с тем, что в полнотекстовом представлении понятия вводятся не только по схеме хорошо структурированных компактных дефиниций (через род и видовые отличия), но также и через аналогии, противопоставления, примеры и т. п., причем текст может быть достаточно пространным и многоаспектным, содержать апелляции к другим источниками и т. д. Поэтому поиск (выделение и выбор) сверхфразового единства в пространстве, где отдельный термин (слово, словосочетание, шифр) имеет не единственный контекст, трудно формализовать, тем более что новизна зачастую выражается статистически незначимой лексикой.
2.2. Системы представления и идентификации знаний
Для построения идентифицирующего описания обычно используется та или иная терминологическая система, представляющая собой целостное собрание семантически связанных понятий и существующая, например, в виде тезаурусов и онтологий. Как отмечалось ранее, это самостоятельно развивающиеся системы, однако самостоятельность здесь относительна и определяется их функциями и целями. Цель тезауруса - обеспечение унифицированности представления и полноты охвата предметной области, причем с точностью, определяемой требованиями к степени различимости информационных объектов-образов, а не самих объектов-оригиналов ПрО. Цель онтологии - обеспечение полноты структурно-понятийного представления отдельного объекта ПрО с точностью, определяемой требованиями к различению самих объектов в предметной области.
И тезаурусы и онтологии являются сетевыми структурами, узлами которых служат понятия, а дуги фиксируют существенные для данного контекста связи. Но при этом, если типология связей в онтологии подобна отношениям в ПрО, то основным типом связи в тезаурусе являются родовидовые, которые отвечают основному методу определения понятий (как процессу генерирования информационных объектов) - через род и видовые отличия. Основное назначение тезауруса отражается его изначальным определением как средства, предназначенного для «... облегчения выражения понятий» [7]. Тезаурус, таким образом, является моделью инструмента познания (и соответствующей знаковой системы), отражающей в первую очередь свойства (специфичность и разнообразие) и структуру знаковой системы обычно на уровне отрасли знаний. Он представляет знание о понятийно-знаковой системе (языке), используемой для описания ПрО. Онтология же является моделью конкретного объекта и представляет знание о предметной области. Она отражает разнообразие основных сущностей и характеристических связей между ними, обычно на уровне отдельного решения или компактной ПрО. Следует, тем не менее, отметить, что практика применения тезауруса для идентификации содержания (и, в частности, использование понятий в качестве узлов онтологий), фиксируемая в тезаурусе в виде ассоциативных связей, приводит к тому, что тезаурус также становится моделью ПрО,
обобщенно отражая ее состав, а в случае фиксирования связей с рубрикатором этой области - и ее структуру. Таким образом, тезаурус обеспечивает «навигацию» по понятийной системе (и определяет выбор соответствующих знаков) и дает понимание степени возможной полноты, точности и специфичности описания объекта. Онтология обеспечивает «навигацию» по предметной области и дает представление об основных составляющих и путях развития тех или иных направлений.
Для систематизации и идентификации информации и знаний на макроуровне традиционно используются классификаторы научно-технической продукции, рубрикаторы научных направлений и специальностей и т. п. Они также используются для идентификации содержания того или иного информационного сообщения путем отнесения его к определенному классу, но их основное назначение - представление ПрО как методологического результата процесса познания. Отражая системность организации науки, фиксируя принятое представление о составе и взаимосвязях отдельных разделов и направлений исследований, они формируют (и т. о. сохраняют) методологическое знание. Будучи общепринятыми и понятными, классификационные структуры в то же время конструктивно соединяют «логику» и «физику» когнитивных процессов: индукцию/дедукцию, анализ/синтез, декомпозицию/интеграцию. Такие структуры хорошо соответствуют и механике процесса познания: углубление знаний осуществляется по схеме специализации, обычно путем деления целого на части в соответствии со значениями выбранного признака деления. Однако следует отметить, что такое деление будет корректно только для фиксированного, уже состоявшегося знания, а не для того, которое, возможно, будет. То есть, выделяя те или иные области исследования и тем самым определяя «главные направления», мы неявно имеем еще и «мнимую» область, остающуюся вне процесса познания. Это означает, что производится не «целочисленное», а «дробное» деление предметной области и, соответственно, структура ее представления, фиксируемая классификационной схемой, в общем случае имеет основания для изменения вследствие возможного развития направления, соответствующего «мнимой» составляющей.
3. Средства формирования представлений и сохранения знаний
Как было определено выше, знания - это не только описание существа теории, метода и т. п., но и контекст - конкретизированная для ПрО система понятий и знаков. Более того, контекст знания составляют также цели и обстоятельства его получения или использования. Особенность последних состоит в том, что они задаются как лингвистическими способами, так и внелингвистическими, выражаемыми ситуационной привязкой. Отметим, что именно контекстная составляющая будет определять уровень компетенции субъекта - носителя знаний.
В [8] была предложена основанная на методах и средствах документального поиска и анализа информации интерактивная итеративная технология, обеспечивающая распределенное формирование и персонифицированное использование информационных компонентов, представляющих знания на предметном, концептуальном и знаковом уровне.
В основе технологии лежит обобщенное понятие рабочего пространства, объединяющего в себе как информационные (документы, запросы, ссылки на ассоциированные ресурсы) и мета-информационные (словари предметных областей, классификации, рубрикаторы, тезаурусы, онтологии) компоненты, так и результаты аналитической обработки (временные ряды публикаций и лексики, наукометрические показатели и т. п.). Причем в качестве контекста, определяющего структуру предметной области, выступают классификаторы научно-технической продукции, рубрикаторы научных направлений и специальностей, тезаурусы лексики, традиционно используемые в задачах информационного обеспечения науки и управления для систематизации и идентификации информации и знаний.
Рабочее пространство пользователя (обучаемого), ориентированное на формирование научно-образовательной среды, может быть описано тройкой объектов:
где - доступные мировые информационные ресурсы (в том числе документальные ресурсы научной и учебно-методической информации); цг£ _ ¡!я 1Я р \ !Яи _ локальные информационные ресурсы пользователя (создаваемые в про-
\ V' шя/? цессе освоения учебного курса или решения научно-исследовательских задач);
- структура, организующая рабочее пространство и отражающая личный взгляд индивида на ПрО.
Исходя из общего принципа индексирования каждого документа в рабочем пространстве, для описания совокупности 1ЯШ и 1Яи может быть использована линейная модель [9] представ-
ления документа терминами универсального словаря, а документального потока - матрицей «термин - документ» (Х0).
Структура, организующая рабочее пространство, представляется как классификационная схема, реализуемая в форме когнитивного рубрикатора (КР), фиксирующего знания пользователя (имеющиеся и полученные) о решаемой проблеме на документальном, лексическом и понятийном уровне.
Со структурной точки зрения КР имеет традиционную для рубрикаторов иерархическую организацию и представлен в виде ориентированного дерева О = а2,...,} (пЯ - число рубрик КР). Документально-лексическая модель = (Я,М} может быть описана двумя матрицами:
Л - бинарной матрицей «рубрика - документ»;
М - матрицей смежности ориентированного дерева О.
Лексический состав рубрик в таком случае характеризует произведение матриц £0*ЛТ
Наполнение отдельной рубрики КР отвечает задаче фиксирования аспектного (отражающего выбранную точку зрения) представления как типизированного элемента классификации, которое характеризуется такими параметрами, как шифр и наименование рубрики, отражающие место рубрики в общем взгляде на проблему; наименование и значение признака деления рубрики (именно эта возможность позволяет вводить признак деления не на уровне классификации, а в рамках отдельного элемента классификационной схемы); фрагменты тезаурусов и онтологий для ПрО; шифры общепринятых действующих в ПрО классификационных систем; поисковые запросы и отобранные по ним документы; лексика рубрики, представленная в виде различных словарных структур; результаты аналитической обработки.
КР не хранит знания в виде, «готовом к употреблению», хотя и содержит документы, описывающие фрагмент конкретных знаний с полнотой и точностью, необходимой для целевого применения. Но при этом такая структура не только фиксирует описание фрагмента знаний и субъективное представление о нем, но и позволяет оперативно исследовать динамику развития создаваемой таким образом модели ПрО (путем построения и анализа временных рядов потоков публикаций и лексики для различных составляющих и аспектов предметной области, анализа изменения значений меры значимости терминологических единиц, меры пересечения лексических пространств и т. п.).
Такой когнитивный рубрикатор позволяет интенсионально (через систему классификационных признаков) и экстенсионально (через подборки документов, фрагментов понятийных и терминологических систем) представлять индивидуальные знания, соотнесенные с общепринятыми представлениями. Интегральность такого представления достигается за счет того, что оно (1) реализуется объектами как уровня ресурсов - упорядоченными подборками документов, ссылками на ассоциированные ресурсы и т. д., так и уровня терминологии - запросами, словниками, фрагментами рубрикаторов и тезаурусов, используемых в данной ПрО, и (2) явно фиксирует общепринятое и индивидуальное представления ПрО, характерные для конкретной проблемной ситуации как с точки зрения полноты и специфичности представления объекта информационной потребности различными терминологическими системами, так и с точки зрения характера ее представления в различных ресурсах, в том числе отражаемого динамикой развития ПрО (временными рядами потоков публикаций и лексики для различных составляющих и аспектов предметной области).
В целом наполнение КР, которое реализуется в не одноактном процессе поиска и аналитической обработки, отражает траекторию познания на документально-фактографическом, понятийно-терминологическом и структурно-логическом уровне. Информационный поиск не только является важной и определяющей составляющей когнитивного процесса, но и имеет с ним общую «операционную» базу и подобен ему «технологически». По существу, здесь процесс поиска - это итеративная последовательность согласования информационных представлений ПрО, генерируемых человеком и системой в виде проблемно-ориентированных наборов документов и лексики.
4. Среда и технологии
Как отмечалось выше, контекст знания составляют не только соответствующие понятийно-терминологические системы, но и конкретные цели и обстоятельства его получения или использования, которые задаются и внелингвистическими формами. Последнее предполагает, что
для того, чтобы «вытянуть» из сознания человека «невербализованную» составляющую необходимо использование интерактивных методов, которые обеспечат итерационное взаимодействие человека и информационной системы, причем последняя может выступать в качестве генератора возможных противоречий или связей.
Принимая предложенный в [10] основанный на профильном описании индивидуализированный подход к организации информационного пространства процесса познания, можно сказать, что в общем случае, с точки зрения задачи формирования и управления индивидуальной траекторией познания, информационная среда должна представлять собой совокупность средств представления знаний; средств доступа к распределенным гетерогенным информационным ресурсам; а также совокупность метаинформационных компонентов, включая классификационные и понятийно-терминологические системы.
Технология, представленная на рис. 1 (см. на обложке 3), реализована в ИАС х1ЯВ1Б [11] и включает следующие этапы:
1) построение многоаспектного документального представления ПрО;
2) построение основы терминологической системы ПрО;
3) построение понятийно-терминологической сети (тезаурусов и онтологий) ПрО;
4) анализ состояния и тенденций развития на основе КР.
Формирование документально-фактографического компонента осуществляется вполне традиционными методами и средствами. Играя в целом вспомогательную роль, информационный поиск выполняет важнейшую функцию - обеспечивает за счет использования взаимодополняющих мультиагентных технологий полноту отбора из всех доступных ресурсов материала для формирования аспектных представлений, что в дальнейшем позволяет анализировать полученные документальные и лексические потоки по различным признакам.
Терминологическая система предметной области строится на основе словников - списков терминов, представляющих в релевантных документах основной смысл и снабженных частотными и структурными характеристиками, позволяющими рассчитать вес термина в тематической подборке документов. Основа для построения тезауруса - иерархическая многоуровневая словарная структура (минитезаурус), автоматически формируется путем ранжирования терминов словника по значимости, выбора на основе оценки их веса заглавных «ядерных» терминов, нормализации терминов с последующим построением иерархии по принципу включения лексических единиц нормализованного термина вышестоящего уровня.
Построение онтологии объекта предметной области базируется на сведении текста его описания к ограниченному набору основных понятий, задаваемых ключевыми словами, связанных смысловыми отношениями. Онтология строится [12] с помощью статистических и лингвистических процедур обработки текстов (научно-технических публикаций, учебно-методических материалов, глоссариев и т. д.). Выделяются устойчивые словосочетания, каждому слову или словосочетанию ставится в соответствие обозначаемое им понятие, лингвистические отношения разделяются на группу отношений сужения объема понятия (в которой объединение слов приводит к увеличению содержания новых понятий) и группу отношений между понятиями, которые далее приводятся к отношениям функционального типа. Строятся связанные функциональными отношениями пары ключевых слов, на основе которых формируется граф понятий, представленных ключевыми словами. Далее этот автоматически построенный граф редактируется пользователем путем внесения, удаления, изменения терминов и отношений, а также укрупнения/детализации подграфов. Отметим, что построение онтологии основывается на существующей в ПрО понятийно-терминологической системе, но, выявляя новые связи, мы по существу формируем и новые взгляды на понятия.
Анализ состояния и тенденций развития с целью выявления характеристических свойств, общих тенденций и корреляций направлений осуществляется на основе построения срезов и временных рядов для профилированных потоков документов и соответствующей лексики. Для сравнительного количественного анализа формируются с применением компонентов деловой графики различные информационные срезы. Для анализа лексики производится формирование словников по отдельным тематическим направлениям и их представление в виде частотных словарей, а также в форме таблиц и диаграмм с поддержкой функций сортировки, редактирования и вывода. Для анализа тенденций развития направления и выявления характеристических состояний формируются серии временных рядов публикаций, отражающих интенсивность развития направления, и соответствующей лексики, отражающей развитие понятийной системы направления. Выявление характеристических кривых и корреляционный анализ документаль-
ных потоков и динамики понятийных систем позволяет выделять взаимосвязи в предметной области, а в сочетании с анализом представленных онтологией функциональных связей создает условия для выявления проблемных ситуаций, закономерностей и симптомов (признаков наличия) новизны в предметной области.
Средства автоматической классификации документов, выполняемой с помощью матриц тематической близости, построенных на основе пользовательских рубрикаторов и тематических словников для любой ветви когнитивного рубрикатора, позволяют выявлять новые соотношения между классами и формировать новые взгляды на классификацию.
Задача информационной среды - это распределенное формирование и синхронизированная поддержка как общего информационного пространства, так и индивидуального представления ПрО, свойственного отдельному пользователю. Для этого есть все предпосылки: все генерируемые сегодня практически значимые документальные ресурсы доступны через Интернет, развивается среда поддержки метаинформации SemanticWeb и технологии социальных сетей, а внедрение распределенной технологии подготовки и использования аналитических составляющих и поддержки понятийно-терминологических систем обеспечивает оперативную актуализацию компонентов знания в информационной среде.
Заключение
Характеристика познавательных процессов на основе системного подхода показала их тесную взаимосвязь с процессами информационной деятельности. Использование при подготовке научной публикации, а также при создании электронных учебных курсов специализированных информационных технологий подготовки информационных продуктов (систематизации, реферирования, индексирования) может быть основой для эффективной реализации гибкой технологической среды, обеспечивающей в итоге возможность формирования и управления индивидуальной траекторией познания.
Интерактивные человеко-машинные процедуры в этом случае реализуют принцип дополнительности: представление знания в виде извлекаемых из текста понятий и отношений автоматизированная ИС осуществляет с точки зрения «устоявшейся» системы понятий (статистической значимости), а человек, внося изменения и дополнения в построенный системой образ, фиксирует «отличия», характеризующие новизну и специфику по отношению к устоявшемуся и усредненному представлению знаний.
Именно технология интеграции распределенных процессов основной и информационной деятельности в общей среде, с одной стороны, и использование описаний объектов и результатов ОД в качестве информационных ресурсов - с другой, позволяют создать технологические и методологические условия формирования не только информационной среды генерации, обработки и хранения знаний, обеспечивающей преемственность и развитие информационной поддержки познавательного процесса на всех этапах его жизненного цикла, но также и «распределенного» экспертного сообщества.
Литература
1. Savery J. R., Duffy T. M. Problem based learning: an instructional model and its constructivist framework // Educational Technology, 1995. Vol. 35. P. 31-38.
2. Князева Н. Н., Курдюмов С. П. Основания синергетики. Человек, конструирующий себя и свое будущее. - М.: КомКнига, 2006. - 232 с.
3. Дружинин В. В., Конторов Д. С. Проблемы системологии. - М.: Советское радио, 1976. - 296 с.
4. Чернавский Д. С. Синергетика и информация. - М.: Едиториал УРСС, 2004. - 288 с.
5. Максимов Н. В. Информация и знания: природа, концептуальная модель // НТИ. Сер. 2, 2010. № 7. С. 1-10.
6. Урманцев Ю. А. Общая теория систем: Состояние, приложения и перспективы развития // Система, Симметрия, Гармония. - М.: Мысль, 1988. С. 38-124.
6. Скороходько Э. Ф. Лингвистические проблемы обработки текстов в автоматизированных информационно-поисковых системах // Вопросы информационной теории и практики. - М.: ВИНИТИ, 1974. № 25. - 126 с.
7. Roget P. M. The Original Roget's Thesaurus of English Words and Phrases (Americanized edition). -New York, NY, USA: Longmans, Green & Co./Dell Publishing Co., Inc., 1962.
8. Максимов Н. В., Голицына О. Л. Об архитектуре и программно-информационных средствах поддержки когнитивных процессов // Информационные технологии в образовании: Сборник трудов XIX Международной конференции-выставки. Ч. II. - М.: МИФИ, 2009. С. 22-25.
9. Попов И. И., Романенко А. Г. Моделирование информационных систем (теория и приложение) // Итоги науки и техники. Сер. Информатика. Т. 5. - М.: ВИНИТИ АН СССР, 1980. - 285 с.
10. Василенко Н. В., Слободин М. Ю., Ковалев И. В., Кустов Д. В., Тихонов А. Н. Об одном подходе к формированию персонализированной образовательной среды // Открытое образование, 2006. № 4. С. 52-62.
11. Максимов Н. В., Васина Е. Н., Голицына О. Л. и др. Документальная информационно-аналитическая система хШШБ: Программа для ЭВМ. Свидетельство о гос. регистрации № 2008611511 от 25.03.2008.
12. Окропишин А. Е., Окропишина О. В. Дескриптивное представление знаний // Информационные технологии в образовании: Сборник трудов XIX Международной конференции-выставки. Ч. II. - М.: МИФИ, 2009. С. 25-28.
УДК 1082 ВАК 08.00.05 ISSN 1818-4243
КАПИТАЛИЗАЦИЯ ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ ВУЗА
Д. Ю. Бусыгин, к. э. н., доцент, зав. кафедрой бухгалтерского учета и финансов Тел.: (+37529) 331-01-22, e-mail: [email protected] С. Н. Мальченко, к. х. н., профессор, директор МФ МЭСИ Тел.: (+37529) 668-75-37, e-mail:[email protected] А. П. Якимахо, к. т. н., ученый секретарь МФ МЭСИ Тел.: (+37529) 197-07-92, e-mail:[email protected] Минский филиал ГОУ ВПО «Московский государственный университет экономики, статистики и информатики» http://www.mfmesi.ru/
Advantages and disadvantages of capitalization of content, representing intellectual property of a university, are considered. Content accounting in the structure of the university intangible assets enables to set up an intangible assets amortization fund which will serve as the source of financing scientific research and actualization of content at the university.
Рассмотрены преимущества и недостатки капитализации контента - интеллектуальной собственности вуза. Бухгалтерский учет контента в структуре нематериальных активов позволяет создать фонд амортизации нематериальных активов. Этот фонд является источником средств для выполнения научных исследований и актуализации контента в вузе.
Ключевые слова: интеллектуальная собственность; контент; капитализация; нематериальные активы; фонд амортизации.
Keywords: intellectual property; content, capitalization, intangible assets, amortization fund.
Введение
не зависимости от размеров и специфики ее деятельности сталкивается с проблемой пополнения или поддержания на необходимом уровне величины оборотных средств. Задача чаще всего решается за счет привлечения заемных средств. Преимущество в борьбе за привлечение заемного капитала имеет та компания, которая обладает в глазах потенциальных инвесторов большей инвестиционной привлекательностью, при определении которой важнейшим фактором является уровень капитализации организации. В последние годы сложилась тенденция все большего признания и усиления роли нематериальных активов в развитии бизнеса, формировании финансовых показателей и результатов деятельности организации [1].
Особое место среди хозяйствующих субъектов занимают организации образования. В конце прошлого - начале текущего столетия
Любая организация