Научная статья на тему 'Концептуальная модель научно-образовательной информационной системы'

Концептуальная модель научно-образовательной информационной системы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1043
161
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНЦЕПТУАЛЬНАЯ МОДЕЛЬ / ИНФОРМАЦИОННАЯ СИСТЕМА / НАУЧНО-ОБРАЗОВАТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ / CONCEPTUAL MODEL / INFORMATION SYSTEM / SCIENTIFIC AND EDUCATIONAL ACTIVITIES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Федотов Анатолий Михайлович, Абделиева Меруерт Нуржанкызы, Байдавлетов Амангелды Токенович, Бапанов Арсений Ауданбекович, Самбетбаева Мадина Аралбаевна

Работа посвящена созданию концептуальной модели информационной системы для поддержки научно-образовательной деятельности. Обсуждаются информационные потребности современного пользователя и информационные объекты, которые описывают основные сущности научного информационного пространства такие, как публикация, документ, персона, словарная статья, функция и пользователь, а также связи между ними.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Федотов Анатолий Михайлович, Абделиева Меруерт Нуржанкызы, Байдавлетов Амангелды Токенович, Бапанов Арсений Ауданбекович, Самбетбаева Мадина Аралбаевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CONCEPTUAL MODEL OF SCIENTIFIC AND EDUCATIONAL INFORMATION SYSTEM

The work dedicated to the creation of a conceptual model of an information system for support scientific and educational activities. Discussed the information needs of modern users and data objects, which describe basic entities of the scientific information space such as the publication of the document, the person, the dictionary entry, the function and the user, as well as the relationships between them.

Текст научной работы на тему «Концептуальная модель научно-образовательной информационной системы»

УДК 004.912

А. М. Федотов 1 2, М. Н. Абделиева 2, А. Т. Байдавлетов 2 А. А. Бапанов 3, М. А. Самбетбаева 2, О. А. Федотова 4

1 Институт вычислительных технологий СО РАН пр. Акад. Лаврентьева, 6, Новосибирск, 630090, Россия

2 Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия

3 Евразийский национальный университет им. Л. Н. Гумилева ул. К. Мунайтпасова, 5, Астана, 010000, Республика Казахстан

4 Государственная публичная научная библиотека СО РАН ул. Восход, 15, Новосибирск, 630200, Россия

fedotov@sbras.ru, abdelieva@gmail.com, baidauletov.at@gmail.com ar_win@mail.ru, madinajgfu@mail.ru, o4f8@mail.ru

КОНЦЕПТУАЛЬНАЯ МОДЕЛЬ НАУЧНО-ОБРАЗОВАТЕЛЬНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ

Работа посвящена созданию концептуальной модели информационной системы для поддержки научно-образовательной деятельности. Обсуждаются информационные потребности современного пользователя и информационные объекты, которые описывают основные сущности научного информационного пространства такие, как публикация, документ, персона, словарная статья, функция и пользователь, а также связи между ними.

Ключевые слова: концептуальная модель, информационная система, научно-образовательная деятельность.

Введение

Современные информационные технологии существенным образом влияют практически все этапы научно-образовательного процесса, что сказывается на изменении информационных потребностей обучающихся, ученых и преподавателей. Современный обучающийся, вооруженный компьютером, не может быть удовлетворен традиционным режимом учебного процесса и обычными форматами учебных материалов, будь это: учебники, книги или даже простые текстовые файлы. Кроме обеспечения обучающихся учебными материалами, необходимо также снабдить их различными поисковыми и классификационными сервисами. Систематизация и классификация имеющихся информационных ресурсов в соответствии с потребностями пользователя является одной из важнейших задач поддержки как научной, так и образовательной деятельности [1; 2].

В процессе научной, а особенно образовательной, деятельности много времени и сил отнимает работа с литературными источниками, разного рода материалами и документами: поиск необходимых документов, систематизация и классификация документов в соответствии с решаемой задачей. Для удовлетворения информационных потребностей современных пользователей необходима поддержка задачи систематизации ресурсов, для решения которой

Федотов А. М., Абделиева М. Н., Байдавлетов А. Т., Бапанов А. А., Самбетбаева М. А., Федотова О. А. Концептуальная модель научно-образовательной информационной системы // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2015. Т. 13, вып. 3. С. 52-67.

ISSN 1818-7900. Вестник НГУ. Серия: Информационные технологии. 2015. Том 13, выпуск 3 © А. М. Федотов, М. Н. Абделиева, А. Т. Байдавлетов, А. А. Бапанов, М. А. Самбетбаева, О. А. Федотова, 2015

необходимо четко определить состав логико-семантических категорий (фасетов) и ключевых терминов (понятий), покрывающих избранную достаточно узкую предметную область, интересующую пользователя. Как правило, предметная область ограничивается изучаемым учебным курсом или конкретной темой курса.

В настоящее время существуют достаточно мощные информационные системы, которые в той или иной степени удовлетворяют информационные потребности пользователей [3]. Однако основными недостатками большинства систем являются ограниченность возможностей проведения аналитической работы с ресурсами и обеспечения интеграции ресурсов как внутри каждой из систем, так и с внешними системами (низкая интероперабельность) [4]. Это крайне неудобно в сфере научно-образовательной деятельности, поскольку одна из главных потребностей пользователя состоит в том, что ему необходимо найти конкретный научный факт и установить связи между конкретными научными фактами (например, «что означает термин кибернетика» или «кто автор данного результата») и другими сущностями информационной системы (персоны, факты, документы, публикации и т. п.). Во-вторых, он испытывают потребность в информации содержащей учебный материал (монографии, статьи, учебники, учебные и методические пособия). На третьем месте справочная литература (различные виды справочников, словарей, энциклопедий). Причем многие их обучающихся отдают предпочтение электронным документам и ресурсам.

В монографии [5], изданной ВИНИТИ в еще 1976 г. и содержащей подробный обзор теоретических проблем информационного обслуживания пользователей, вне зависимости от статуса выделяются два типа информационных потребностей - потребности в сведениях об источниках необходимой научной информации и потребности в самой необходимой научной информации. Для удовлетворения информационных потребностей первого типа предназначены информационные системы, получившие название документальных, второго типа - фактографических. В настоящее время наиболее востребованным средством информационного обеспечения научно-образовательной деятельности становятся интеллектуальные информационные системы (ИИС), сочетающие возможности информационных систем обоих названных типов и позволяющие удовлетворять информационные потребности квалифицированного пользователя в соответствии со схемой «документ - факт - знание» [4, 6]. У обучающего возникает информационная потребность в знании, обретаемом путем обращения к существующей информации.

Концептуальная модель

Концептуальная модель ИС должна описывать то, какие сущности могут быть представлены в ИС, а также должна фиксировать правила и связи, что в частности предполагает классификацию сущностей, абстрагирование, обобщение. Основной целью разработки концептуальной модели научно-образовательной информационной системы является разработка модели с конкретной архитектурой для последующей ее реализации в виде программной системы.

В настоящий момент в мире разработан целый ряд моделей, описывающих информационные ресурсы в научной сфере, в области электронных библиотек, культурного и научного наследия. Наибольший интерес представляют эталонные модели 1, поскольку они дают абстрактное представление сущностей и отношений, составляющих информационное наполнение системы. Перечислим наиболее популярные из них (неплохой обзор таких моделей представлен в работах [7; 8]).

• DELOS DLRM (DELOS Digital Library Reference Model) - эталонная модель электронной библиотеки разработана группой специалистов ассоциации в сфере ЭБ DELOS в 20062007 гг., основываясь на анализе имеющихся библиотечных систем. Большое внимание в модели уделяется функциональным возможностям электронной библиотеки. Последнее описание датируется 2011 г. [9].

1 Эталонная модель (reference model) - это абстрактное представление понятий и отношений между ними в некоторой проблемной области. На основе эталонной строятся более конкретные и детально описанные модели, в итоге воплощённые в реально существующие объекты и механизмы.

• CIDOC CRM («Committee on Documentation» «Conceptual Reference Model») - представляет собой формальную онтологию, предназначенную для описания информации в области культурного наследия. Разработка модели началась в 1996 году, а в 2006 она стала стандартом (новая версия стандарта ISO 21127:2014 2) - «Эталонная онтология для обмена информацией культурного наследия» (A reference ontology for the interchange of cultural heritagein formation)[10].

• OAIS RM — эталонная модель OAIS 3 (стандарт IS0-14721:2012 4) — эта модель была использована многими организациями для разработки наборов метаданных и организации крупных хранилищ цифровых объектов. На основе данной модели создана концепция «институционального репозитория» как системы долговременного хранения, накопления информации и обеспечения надежного доступа к цифровым объектам, представляющим собой результат интеллектуальной деятельности научного или образовательного учреждения [11].

• FRBR — «Функциональные требования к библиографическим записям» (Functional Requirements for Bibliographic Records, FRBR) — разработка международной федерацией библиотечных ассоциаций и учреждений (International Federation of Library Associations and Institutions, IFLA) — ER-модель документальной системы, работающей с библиографической информацией [12].

• CERIF - Общеевропейский исследовательский информационный формат (Common European Research Information Format) [13]. Модель CERIF предназначена для поддержки управления научно- исследовательской информацией, а также настройки и взаимодействия между исследовательскими информационными системами и научными электронными библиотеками.

• ЕНИП (ИСИР) РАН - Единое научное информационное пространство (Интегрированная система информационных ресурсов) представляет модель документальной ИС [14], реализованной в виде системы управления электронными библиотеками [15]. Выделено четыре основных группы сущностей: участники научной деятельности, научная деятельность, результаты научной деятельности, документы и публикации.

• ИРИС СО РАН — Интегрированная распределенная информационная система [16—18] представляет модель документальной ИС, реализованной в виде системы управления электронными библиотеками. Основные сущности: документ, персона, организация, событие, факт.

Существует достаточно много технологических разработок ИС, в той или иной степени использующие эти модели, так или иначе ориентированные на поддержку научно-образовательной деятельности и направленные на удовлетворение информационные потребности пользователей.

Разработки можно разбить на два класса. Большая часть из них представлена библиотечными системами (в том числе электронными каталогами), удовлетворяющими информационные потребности, по определению, лишь частично. Однако среди них имеются чисто документальные системы, разработанные без учета модели и стандартов, играющие большую роль в научно-образовательной деятельности, такие как:

• eLIBRARY 5 — крупнейшая в России электронная библиотека научных публикаций, обладающая возможностями поиска и получения информации. Система имеет собственную модель данных. Аналогами системы являются: Google Scholar (Google), Scopus (Elsevier), Web of Science (Thompson Reuters);

• Информика (Единое окно 6) - информационная система «Единое окно доступа к образовательным ресурсам» создана для предоставления свободного доступа и обеспечения эффективной навигации и поиска учебно-методических и информационно-справочных ресурсов для всех уровней общего и профессионального образования [19]. Имеет свой «стандарт»

2 http://www.iso.org/iso/catalogue_detail?csnumber=57832

3 Open Archival Information System

4 http://www.iso.org/iso/catalogue_detail.htm?csnumber=57284

5 http://elibrary.ru/

6 http://window.edu.ru/

на представление информации, на рубрикаторы и метаописания образовательных ресур-

7

сов .

Ко второму классу относятся системы, разработанные в рамках концептуальных моделей. В качестве примеров приведем следующие:

• ИСТИНА - интеллектуальная система тематического исследования научно-технической информации. Основной целью проекта является сбор, систематизация, хранение, анализ и выдача по запросу информации, характеризующей результаты деятельности научных и образовательных организаций [20]. Система ориентирована для удовлетворения потребностей пользователей (научных сотрудников), в процессе организации научной работы и подготовки отчетных материалов;

• MathNET 8 - общероссийский математический портал, созданный Математическим институтом им. В. А. Стеклова РАН, является документальной системой. В системе содержится информация о российских математиках, база данных публикаций журналов Отделения математики РАН, а также информация о математических организациях [21]. Базовой платформой системы является универсальная информационная система ИСИР (Интегрированная система информационных ресурсов). В качестве основного тематического рубрикатора в системе использованы рубрикатор MSC (Mathematics Subject Classification), созданный Американским математическим обществом (AMS), а также УДК - Универсальная десятичная классификация. Портал содержит следующие разделы: журналы, видеотека, библиотека, персоналии, организации, конференции;

• euroCRIS 9 занимается развитием модели современной научной информационной системы, включая создание комплекса необходимых мер (одним из важнейших здесь является формат научных данных CERIF) для взаимодействия и поддержки сотрудничества между участниками, принадлежащих разным организациям независимо от их национальной принадлежности;

• СОЦИОНЕТ - система информационной поддержки научно-образовательной деятельности первоначально в области общественных наук [22]. Система Соционет ориентирована на ученых, преподавателей и студентов, собирающие информацию по своей тематике и отслеживающие появление новых публикаций, соответствующих их научным интересам. Основная функция системы-накопления метаданных, описывающих научные публикации и другие научные информационные ресурсы (научные отчеты, рабочие записки, тезисы докладов, статистические таблицы, базы данных, сведения о научных организациях, научная персоналия, материалы научных проектов в социально-экономической области и т. д.). Используемая схема метаданных в системе своя, однако поддерживается совместимость с форматом научных данных CERIF.

Каждая из ИС имеет свои достоинства и недостатки, однако авторам статьи не известна ИС, которая в полном объеме удовлетворяла бы информационным запросам пользователей. Как мы уже отмечали, главным недостатком являются отсутствие поддержки аналитической обработки данных, плохая идентификация ресурсов и не развитые сервисы таксономии.

Информационный ресурс

Информационный ресурс - наиболее общее понятие, включающее любую сущность информационной системы (ИС). В информационном пространстве все информационные ресурсы: документы, публикации, персоны, события, факты, программы и любые другие сущности реального или виртуального мира - существуют только в форме некоторых информационных объектов. Ресурс - это абстрактное понятие, выражаемое экземплярами одной из своих специализаций. В частности, экземплярами понятия ресурса являются экземпляры информационного объекта любого типа

7 Метаданные информационных образовательных ресурсов для интернет-каталогов // ГНИИ ИТТ «Информи-ка», 2004

8 http://www.mathnet.ru/

9 http://www.eurocris.org/

Каждый ресурс в соответствии с эталонной моделью (например, DELOS DLRM или OAIS RM) (рис. 1):

• имеет идентификатор;

• организован в соответствии с описанием ресурса. Ресурс может быть сложным и структурированным, поскольку он, в свою очередь, может состоять из меньших ресурсов и иметь связи с другими ресурсами. С организационной точки зрения, ресурсы могут группироваться в наборы ресурсов, которые рассматриваются как единая сущность;

• может регулироваться функциями, управляющими его жизненным циклом, характеризуется набором присущих ему атрибутов и методов, характеризующих его свойства и связи с другими ресурсами;

• выражается через информационный объект.

В информационной системе каждому Ресурсу соответствует Информационный объект, который является традиционным вторичным информационным объектом, содержащим описание первичного ресурса, т. е. информационный объект - это объект, который хранит информацию об объектах ИС (физических объектах, ресурсах, информационных объектах).

Поскольку информационный объект является ресурсом, то он наследует все вышеперечисленные свойства ресурса, т. е. имеет идентификатор (рис. 2).

Г i Идентификатор ( '

имеет

Ресурс Щ.--" 1

выражается через Информационный; обьект

Рис. 1. Определение ресурса ИС

/ ^^ \ - Информ ационный объект Ж состоит из объектов 1 ^ Идентификатор / '-------------' имеет у

Метаданные Ипформ ац1Ю11 goe содержание ( \ Аннотация t J

*

Рис. 2. Информационный объект

Каждый информационный объект в ИС состоит из следующих объектов:

• метаданных - объект, главная цель которого состоит в том, чтобы дать информацию о ресурсе;

• аннотаций - объект, главная цель которого состоит в том, чтобы аннотировать ресурс или его часть. Примеры таких аннотаций включают примечания, структурированные комментарии и связи. Объекты аннотации помогают интерпретировать ресурс, содержат детальные объяснения, либо информацию о том, как можно использовать ресурс [17].

• информационного содержания - объект, который может отсутствовать и может использоваться самостоятельно, как первичный ресурс.

Информационный объект - наиболее общее понятие в системе, представляющий произвольную единицу информации в ИС. Информационные объекты также могут быть сложными объектами и могут быть сгруппированы в коллекции информационных объектов. Коллекции, в свою очередь, тоже являются информационными объектами, они наследуют все аспекты моделирования информационных объектов и средства их обслуживания, например, они могут аннотироваться. Информационные объекты описывают основные сущности научного информационного пространства такие, как публикация, документ, персона, словарная статья, функция и пользователь, а также связи между ними.

Основные сущности ИС

Базовые сущности. Основу или ядро модели информационной системы составляют базовые сущности, с которыми оперирует ИС. К базовым сущностями относятся: Документ, Пользователь и Функция (рис. 3). Каждая из базовых сущностей имеет свой набор атрибутов. Экземпляры базовых сущностей могут быть связаны именованными отношениями между собой как внутри одной сущности, так и со всеми остальными сущностями.

Рис. 3. Сущности ИС

Документ - основной «объект», с которым оперирует информационная система - это целостный информационный объект, представлявший структурированное описание реальной сущности (объекта, субъекта, факта или понятия), совокупность которых составляют информационное наполнение системы. Документ имеет некоторый стандартный набор атрибутов, описываемый метаданными, и функций, зависящий от класса и типа документа, и допускает однозначную идентификацию.

Мы будем различать следующие классы документов: публикация, словарная статья, персона, ключевой термин (рис. 4). Каждый класс документов может иметь множество типов и подтипов. Например, класс документов «публикация» может иметь типы: монография, статья, препринт и т. д.

Рис. 4. Классы документов в ИС

Коллекция - это набор документов определенного класса, объединённых по смысловому признаку и имеющих одинаковую структуру метаданных. Например, множество ключевых терминов, определяющих состав логико-семантических категорий (рубрик - фасетов), покрывающих избранную предметную область, интересующую пользователя, может являться коллекцией. Коллекций будет также управляемый словарь, составленный из описаний организаций.

Пользователь содержит все объекты, которые являются внешними по отношению к ИС и взаимодействуют с ней: люди и неодушевленные объекты (программы или физические инструменты или даже другая ИС может быть среди пользователей ИС). По правам и функциональным возможностям пользователи подразделяются на администраторов и конечных пользователей (рис. 5).

Функция - специфическая задача обработки, которая может быть реализована на наборе ресурсов или одном ресурсе в результате действий отдельного пользователя. Функции представляет наиболее объемную и наиболее открытую часть модели, поскольку охватывает всю обработку ресурсов, а также действия пользователей в ИС (рис. 6).

Рис. 5. Типы пользователей в ИС

* — Функция имеет вид деятельности Г Л

Доступ к ресурсу Г Управление ресурсом Управление И С - Конфигурация И С

Рис. 6. Функции ИС

В данной модели функции определяют четыре вида деятельности: Доступ к ресурсу, Управление ресурсом, Управление ИС, Конфигурация ИС.

Метаданные

Описание сущностей в данной модели представлено метаданными. Метаданные - структурированная информация, которая описывает, поясняет и указывает местоположение информационного ресурса [23]. Метаданные необходимы для решения следующих задач:

• предоставление сведений об объекте, о его содержании, структуре, способах использования и т. д.;

• сбор и систематизация информации об объектах, классификация объектов;

• выбор из множества объектов определенного подмножества по формальным признакам и сопоставление объектов по формальным признакам;

• внутрисистемные технологические задачи, связанные с обеспечением подготовки объектов, размещением объектов и т. п.;

• внешние технологические задачи, связанные, прежде всего, с обменом данными с внешними информационными системами.

Рис. 7. Типы метаданных

Основные типы метаданных:

• описательные метаданные - метаданные, которые описывают содержание и свойства ресурса, например, библиографические данные, аннотацию, идентификаторы ресурса, ос-

новная задача которых однозначное представление цифрового объекта для внешнего мира и в различных приложениях.

• структурные метаданные - метаданные, которые характеризуют общую структуру ресурса и его компоненты, объем и другие свойства ресурса;

• системные, или административные, метаданные - служат для обеспечения системы управления информационными ресурсами и администрирования информационных ресурсов, например, даты создания или модификации ресурса, идентификатор владельца и т. п.

Схема метаданных - это набор элементов метаданных, каждый из которых обладает некоторым именем и семантикой, принимает значения с установленной семантикой или значения из управляемого словаря. В соответствии с рекомендациями Dublin Core информационный объект должен обладать базовым набором атрибутов [2]. Набор атрибутов объекта расширяется в зависимости от его типа.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Особым типом метаданных является метаданные, описывающие отношения и связи между ресурсами - документами.

Отношение - связь между экземпляром некоторой сущности и тем, что с ней соотнесено. По Аристотелю, «есть то, что оно есть», лишь «в связи с другим или находясь в каком-то ином отношении к другому». Количество типов отношений в информационной системе определяется, исходя из конкретных целей. В реальном мире их число стремится к бесконечности. С позиций удовлетворения информационных потребностей пользователей нас будут интересовать отношения только между документами, например, «Публикация - Публикация», «Публикация - Персона», «Публикация - Словарная статья», «Публикация - Ключевой термин», «Персона - Словарная статья» и т. д. Связи существуют между всеми классами документов.

Рис. 8. Типы отношений

В зависимости от условий использования отношения между документами подразделяются на следующие типы: тезаурусные отношения, семантические отношения и ассоциативные отношения (рис. 8):

• тезаурусные отношения - отношения, применяемые в описании информационно-поисковых тезаурусов - это иерархические отношения и отношение ассоциации. Основным иерархическим отношением является родовидовое отношение (родитель - потомок, шире -уже, выше - ниже, часть - целое). Основное назначение установления ассоциативных отношений между документами - указание на дополнительные связи. [24; 25] Тезаурусные отношения специфичны для отношений между ключевыми терминами, значительно реже используются при задании отношений между публикациями и словарными статьями. Для реализации тезаурусных отношений была выбрана схема данных [25] как самая

продвинутая из стандартных схем [26].

• семантические отношения - именованные отношения между документами, например, «Персона является автором Публикации»; «Публикация посвящена Персоне»; «Публикация посвящена Факту, описанному в Словарной статье».

• отношения ассоциации - отношения между двумя документами которые близки по содержанию, например, ключевые слова в описании Публикации, Персоны, Словарной статьи.

Рис. 9. Связи между документами

В ИС представлено два способа реализации связей (отношений) между документами: жесткие и мягкие. Жесткие связи реализованы средствами ИС путем ссылок на первичные ключи записи. К сожалению, такой тип связи не защищен от нарушения целостности (в случае неправильного изменения или удаления записи). Мягкие связи реализуются через процедуру поиска соответствий. Такой способ установления связей защищен от любых нарушений целостности БД и достаточно удобен пользователям, поскольку для указания на необходимость связи используются наглядные мнемонические определения. Соответствия устанавливаются следующими способами:

• ссылка на идентификатор документа - уникальный, в пределах одной коллекции, текстовый код, формируемый в рамках конкретной коллекции по определенным правилам.

• ссылка на ключевой термин - особый вид метаданных, выбираемый из словаря ключевых терминов, по существу представляющий собой тезаурус предметной области коллекции. Ссылка определяет запись, в которой данный ключевой термин присутствует в метаданных [17].

Документы

Ключевые термины

Ключевые термины используются не самостоятельно, а в составе коллекций. Используется два типа коллекций ключевых терминов: Тематические словари - Тезаурусы и Контролируемые словари - особая сущность, которая предназначена для заполнения некоторых атрибутов (метаданных) других документов (названия городов, стран, названия организации, названия предметных рубрик). Ключевые термины связаны между собой тезаурусными от-

ношениями. Одной из отличий данной информационной системы от других систем является поддержка словарей-классификаторов, которые являются основой системы.

Идентификация ключевых терминов при помощи идентификатора, который уникален в пределах одной коллекции и при помощи квалификаторов, вычисляемых из имени термина, его языка, аннотации и имени термина в нормальной форме, его языка, аннотации.

Каждый ключевой термин связан со словарной статьей, в которой дается его подробное описание и разграничение полисемии.

Публикация - воплощение результатов интеллектуальной реализации произведения в форме алфавитно-цифровой записи, которое имеет выходные данные (библиографическое описание). Основная цель публикации - распространение содержащейся в ней информации. [12].

Основные типы публикаций: Книга, Статья, Нормативный документ (например, стандарт, законодательный акт) и т. п. В свою очередь, тип публикации может иметь подтип (например, тип статья имеет подтип: в сборнике, статья в журнале, статья в газете и т. д.). Наиболее полный перечень типов публикаций приведен в ГОСТ 7.19-2001 [27] и в [12].

Публикация имеет базовый набор атрибутов, основанный на схеме данных Dublin Core, расширенный в соответствии с требованиями МЕКОФ [27]. От типа публикации зависит набор обязательных к заполнению описательных метаданных и правила их отображения. Публикация - это единственный класс документов, который может иметь информационное содержание (см. рис. 2). Как правило, информационное содержание (полный текст) является внешним объектом по отношению к ИС, хранимым в цифровом репозитории [1; 2], и в метаданных системы представлен ссылкой на ресурс.

Публикации могут иметь связь со следующими классами: персоны, словарные статьи и ключевые термины. Публикация может иметь именованные отношения с классом персона: авторство и персонаж.

Помимо связей с различными коллекциями ключевых терминов, составляющих управляемые словари, у публикации всегда присутствует связь с тематической коллекцией (тезаурусом), причем трижды: ключевые слова, поставленные авторами; ключевые слова, найденные в публикации алгоритмом индексации; ключевые слова, характеризующие публикацию, поставленные экспертом.

Персоны - действующие лица / индивидуумы (как живые, так и умершие). Персоны имеют идентификатор и имеют метаданные. Некоторые персоны могут иметь свойство, быть авторами публикаций, быть автором факта, описанного в словарной статье или просто иметь какое-либо отношение к понятию (например, как Платон к понятию онтология). Персоны также связаны тематическим тезаурусом, причем дважды: ключевые слова, найденные в публикациях персоны алгоритмом индексации; ключевые слова, характеризующие персону, поставленные экспертом.

Словарная статья - документ, содержащий описание ключевого термина, понятия или факта. Словарные статьи также содержат ссылки (связи) на описания персон, публикаций, связи с ключевыми терминами. Отношения с персонами - семантические или ассоциативные, отношение с публикациями - ассоциативные (например, дополнительное описание). Отношения с ключевыми терминами: ключевые слова, найденные в описании (тексте) словарной статьи алгоритмом индексации; ключевые слова, характеризующие словарную статью, поставленные экспертом.

Пользователи

Пользователь является информационным объектом (ресурсом) и, следовательно, наследует все его свойства, т. е. каждый пользователь снабжен уникальным идентификатором и имеет метаданные.

Для характеристики пользователей, взаимодействующих с информационной системой, разделим пользователей на два класса:

• конечные пользователи;

• администраторы.

Конечные пользователи используют функциональные возможности ИС в целях предоставления, получения и управления документами и некоторыми другими ее составляющими. Конечные пользователи могут быть дополнительно разделены на два: владельцев и читателей содержания. В свою очередь читатели могут быть зарегистрированными пользователями и незарегистрированными.

Основные функции владельцев является ввод (импорт из других систем) и редактирование метаданных конкретного документа. Читатели же могут просматривать эти метаданные, строить различного сорта выборки (например, с использованием протокола 239.50).

Администраторы - субъект информационной системы, создающий условия для работы конечных пользователей в ИС. Пользователи могут быть и неодушевленными (например, программы, физические инструменты или даже другая ИС).

Основными функциями администраторов является конфигурирование (настройка) системы, обеспечение работоспособности профилей системы, а также слежение за соблюдением правил и регламентов в работе с системой.

Функции

В данной модели функции подразделены на четыре типа: доступ к ресурсам управление ресурсами, управление ИС, конфигурация ИС.

Доступ к ресурсам охватывает все виды деятельности, связанные с запросом, определением местоположения, извлечения, преобразованием и, наконец, сохранением ресурсов. Ключевой характеристикой концепции доступа к ресурсам является то, что она представляет функции, которые не изменяют ИС, но помогают в идентификации ресурсов, предназначенных для просмотра пользователем. Таким образом, центральной функцией доступа к ресурсам является идентификация, которая действует на наборы ресурсов, а также для извлечения (преобразования) требуемых ресурсов в виде затребованным пользователем.

Управление ресурсами включает все действия, связанные с созданием новых ресурсов, вставляя их в ИС, удаление старых ресурсов, и обновление существующих, а также применение преобразования. Это преобразование может привести к новым ресурсам, которые могут быть представлены в ИС или просто применяться при обращении к ресурсу. Они могут быть специализированы для отдельных функций каждого типа ресурса.

Некоторые функции могут применяться на других ресурсах и на метаданных, описывающих эти ресурсы. Основные функции, которые могут применяться на все ресурсы, связанны: с созданием, обновлением, проверкой допустимости и аннотацией ресурсов.

Управление информационным объектом содержит функции, которые охватывают концепций создания, обработки и преобразования вторичных информационных объектов.

Функции управления пользователем содержит функции, необходимые для управления отдельными пользователями в ИС, включая их регистрацию, их вход в систему и персонализа-цию.

Функция управление ИС охватывают все действия, связанные с системой в целом и ее управлением. Управление ИС включает в себя широкий спектр функций, которые поддерживают оперативное управление ИС относительно всех сущностей ИС. Она включает управление контентом, пользователями, а также общим управлением функциональности.

Функция конфигурации ИС содержит функции, связанные с настройкой ИС, созданием и модификацией схем метаданных, созданием и модификацией коллекций, поддержку ссылочной целостности ИС.

Заключение

В работе описана концептуальная модель информационной системы для поддержки научно-образовательной деятельности. Приведен краткий обзор моделей, описывающих научные информационные ресурсы и технологические разработки, которые так или иначе связаны с научно-образовательной деятельностью.

Выделены и подробно рассмотрены основные сущности, используемые в модели, а также их классы и подклассы, типы метаданных и отношений. Модель базируется на понятии до-

кумента как основной сущности научного информационного пространства, которое включает в себя такие сущности как публикация, персона, организация, факт, ключевой термин и др., а также связи (отношения) между ними. Преимуществом данной модели является языковая независимость, поддержка многоязычного тезауруса и возможность использования различных классификационных схем. Предложенная модель создания и поддержки информационных ресурсов кроме работы с научными коллекциями с успехом была реализована в научно-образовательной сфере на примере ИС научной школы Алексея Андреевича Ляпунова -основателя теоретического программирования и российской кибернетики, а также в виде электронных учебных пособий 10 по курсам «Современные проблемы информатики и вычислительной техники», «Вычислительные системы», «Информатика» и «Экология» и др.

Список литературы

1. Федотов А. М., Федотова О. А. Модель информационной системы для поддержки научно-образовательной деятельности // Вычислительные и информационные технологии в науке, технике и образовании ВИТ-2013: Материалы Международной конференции. 2013. Т. 2: Вычислительные технологии: Восточно-Казахстанский государственный технический университет. С. 249-265.

2. Федотов А. М., Барахнин В. Б., Жижимов О. Л., Федотова О. А. Модель информационной системы для поддержки научно-педагогической деятельности // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2014. Т. 12, № 1. С. 89-101.

3. Барахнин В. Б., Федотов А. М. Исследование информационных потребностей научного сообщества для построения информационной модели описания его деятельности // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2008. Т. 6, № 3. С. 48-59.

4. Шокин Ю. И., Федотов А. М., Барахнин В. Б. Проблемы поиска информации. Новосибирск: Наука, 2010.

5. Михайлов А. И., Черный А. И., Гиляревский Р. С. Научные коммуникации и информатика. М.: Наука, 1976.

6. Жижимов О. Л., Федотов А. М., Федотова О. А. Построение типовой модели информационной системы для работы с документами по научному наследию // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2012. Т. 10, № 2. С. 5-14.

7. Резниченко В. А., Проскудина Г. Ю., Кудим К. А. Концептуальная модель электронной библиотеки // Тр. XI Всерос. науч. конф. «RCDL'2009», Россия, г. Петрозаводск (Карелия) 17-21 сентября 2009 г. Петрозоводск, 2009. С. 23-31.

8. Резниченко В. А., Проскудина Г. Ю., Овдий О. М. Концептуальная модель научной публикации // Труды 14-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL-2012. Переславль-Залесский, 2012. С. 43-54.

9. D3.2bThe Digital Library Reference Model // Funded under the Seventh Framework Programme, ICTProgramme - "Cultural Heritage and Technology Enhanced Learning" Project Number: 231551. April 2011. http://www.dlorg.eu

10. Definition of the CIDOC Conceptual Reference Model // Produced by the ICOM/CIDOC Documentation Standards Group, Continued by the CIDOC CRM Special Interest Group Version 5.0.4 November 2011. http://www.cidoc-crm.org/docs/cidoc_crm_version_5.0.4.pdf.

11. Reference Model for an Open Archival Information System (OAIS), Recommended Practice, Issue 2, CCSDS 650.0-М-2 (Magenta Book) June 2012.

12. Functional Requirements for Bibliographic Records, Final Report / IFLA Study Group on the Functional Requirements for Bibliographic Records. - München: K.G. Saur, 1998. (UBCIM Publications, New Series; v. 19). http://archive.ifla.org/VII/s13/frbr/frbr.htm. Русский перевод: Функциональные требования к библиографическим записям: концептуальная модель: окончат. отчет // - Рос. библ. ассоц., Рос. гос. б-ка; пер. с англ. [В. В. Арефьев]; науч. ред. пер. Т. А. Бахтурина, Н. Н. Каспарова, Н. Ю. Кулыгина. М.: Российская государственная библиотека, 2006. 150 c.

10 http://fedotov.nsu.ru/lecture.php

13. CERIF 2008 - 1.2 Full Data Model (FDM). Introduction and Specification http:// www.eurocris.org/üploads/Web%20pages/CERIF2008/Release_1.2/CERIF2008_1.2_FDM.pdf

14. Бездушный А. Н., Бездушный А. А., Серебряков В. А., Филиппов В. И. Интеграция метаданных Единого научного информационного пространства РАН. М.: Вычислительный Центр им. А. А. Дородницына РАН, 2006. 238 с.

15. Захаров А. А., Серебряков В. А. Система управления электронными библиотеками LibMeta // Труды 12-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL'2010. Казань, Россия, 2010. С. 28-37.

16. Федотов А. М. Методологии построения распределенных систем // Вычислительные технологии. 2006. Т. 11. С. 3-17.

17. Шокин Ю. И., Федотов А. М., Жижимов О. Л., Федотова О. А. Эволюция информационных систем: от Web-сайтов до систем управления информационными ресурсами // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2015. Т. 13, № 1. С. 117134.

18. Шокин Ю. И., Федотов А. М., Жижимов О. Л., Федотова О. А. Система управления электронными библиотеками в ИРИС СО РАН // Инфраструктура научных информационных ресурсов и систем: Сб. науч. ст. Четвертого Всероссийского симпозиума / Под ред. Е. Б. Ку-дашева, В. А. Серебрякова. М.: Вычислительный центр РАН, 2014. Т. 1. С. 11-39.

19. Абрамов А. Г., Булакина М. Б., Сигалов А. В. Электронная библиотека портала «Единое окно доступа к образовательным ресурсам»: концепция и реализация проекта, достижения и проблемы // Библиотечные, музейные, архивные учреждения в век электронных коллекций и библиотек: Материалы VI науч.-практ. семинара «Электронные ресурсы библиотек, музеев, архивов», 28-29 октября 2010 г., Санкт-Петербург / ЦГПБ им. В. В. Маяковского; ред. сост. И. Е. Прозоров. СПб.: Северная звезда, 2010. С. 172-178.

20. Интеллектуальная система тематического исследования научно-технической информации (ИСТИНА) / С. А. Афонин и др. Под ред. В. А. Садовничего. М.: Изд-во Моск. ун-та, 2014. 262 с.

21. Аджиев А. C., Бездушный А. Н., Серебряков В. А. О реализации веб-системы математической информации [Электронный ресурс] / Российский научный электронный журнал Электронные библиотеки. 2004. Т. 7. Вып. 1. Режим доступа: http://www.elbib.ru/ in-dex.phtml?page=elbib/rus/journal/2004/part1/ABS

22. Паринов С. И., Ляпунов В. М., Пузырев Р. Л. Система Соционет как платформа для разработки научных информационных ресурсов и онлайновых сервисов // [Электронный ресурс] / Российский научный электронный журнал Электронные библиотеки. 2003. Т. 6, вып. 1. URL: http://www.elbib.ru/ index.phtml? page=elbib/rus/ journal/ 2003/ part1/ PLP

23. Когаловский М. Р. Метаданные, их свойства, функции, классификация и средства представления // Труды 14-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL-2012. Переславль-Залесский, Россия, 2012.

24. Соловьев В. Д., Добров Б. В., Иванов В. В., Лукашевич Н. В. Онтологии и тезаурусы: Учебное пособие. Казань, Москва, 2006.

25. ANSI/NISO. Z39.19: 2005 Guidelines for the construction, format and management of monolingual controlled vocabularies. NISO Press: Bethesda, MD, 2005.

26. Федотов А. М., Идрисова И. А., Самбетбаева М. А., Федотова О. А. Использование тезауруса в научно-образовательной информационной системе // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2015. Т. 13, № 2. С.86-102.

27. ГОСТ 7.19-2001 Формат для обмена данными. Содержание записи // Госстандарт России. M.: ИПК Издательство стандартов, 2002. 58 c.

Материал поступил в редколлегию 18.08.2015

66

A. M. OeflOTOB ë flp.

A. M. Fedotov, M. N. Abdelieva, A. T. Baidavletov, A. A. Bapanov M. A. Sambetbayeva, O. A. Fedotova

Institute of Computational Technologies SB RAS 6 Acad. Lavrentjev Ave., Novosibirsk, 630090, Russian Federation

Novosibirsk State University 2 Pirogov Str., Novosibirsk, 630090, Russian Federation

L. N. Gumilyov Eurasian National University 5 Munaytpasova Str., Astana, 010000, Kazakhstan

State Public Scientific Technological Library SB RAS 15 VoskhodStr., Novosibirsk, 630200, Russian Federation

fedotov@sbras.ru, abdelieva@gmail.com, baidauletov.at@gmail.com ar_win@mail.ru, madina_gtu@mail.ru, o4f8@mail.ru

CONCEPTUAL MODEL OF SCIENTIFIC AND EDUCATIONAL INFORMATION SYSTEM

The work dedicated to the creation of a conceptual model of an information system for support scientific and educational activities. Discussed the information needs of modern users and data objects, which describe basic entities of the scientific information space such as the publication of the document, the person, the dictionary entry, the function and the user, as well as the relationships between them.

Keywords: conceptual model, information system, scientific and educational activities.

References

1. Fedotov A. M., Fedotova O. A. A model of information system to support scientific and educational activities. Computational and Informational Technologies in Science, Engineering and Education CIT 2013: Proceedings of the International Conference. Ust'-Kamenogorsk, 2013, vol. 2: Computing technology: East Kazakhstan State Technical University, p. 249-265.

2. Fedotov A. M., Zhizhimov O. L., Fedotova O. A., Barakhnin V. B. A model of information system to support scientific and educational activities. Vestnik of Novosibirsk State University. Series: Information Technologies, 2014, vol. 12, № 1, p. 89-101.

3. Barakhnin V. B., Fedotov A. M. Studying the information needs of scientific community for constructing the information model of its activity. Vestnik of Novosibirsk State University. Series: Information Technologies, 2008, vol. 6, № 3, p. 48-59.

4. Shokin Yu. I., Fedotov A. M., Barakhnin V. B. Problems of information retrieval. Novosibirsk, Nauka, 2010.

5. Mikhailov A. I., Chernyi A. I., Gilyarevskyi R. S. Scientific Communications and Informatics. Moscow: Nauka,1976.

6. Zhizhimov O. L., Fedotov A. M., Fedotova O. A. Building a generic model of information system for working with documents on the scientific heritage. Vestnik of Novosibirsk State University. Series: Information Technologies, 2012, vol. 10, № 2, p. 5-14.

7. Reznichenko V. A., Proskudina G. Yu, Kudim K. A. Conceptual Model of Digital Library // Digital Libraries: Advanced Methods and Technologies, Digital Collections: Proceedings of the XI All-Russian Research Conference RCDL'2009. Petrozavodsk: KRC RAS, 2009, p. 23-31.

8. Reznichenko V.A., Proskudina G.Yu., Ovdii O.M. Conceptual Model of Research Publication // Digital Libraries: Advanced Methods and Technologies, Digital Collections: Proceedings of the XIV All-Russian Research Conference RCDL'2012. Pereslavl-Zalesskij, Russia, October 15-18, 2012. p.43-54.

9. D3.2bThe Digital Library Reference Model // Funded under the Seventh Framework Programme, ICTProgramme - "Cultural Heritage and Technology Enhanced Learning" Project Number: 231551. April 2011. http://www.dlorg.eu

10. Definition of the CIDOC Conceptual Reference Model // Produced by the ICOM/CIDOC Documentation Standards Group, Continued by the CIDOC CRM Special Interest Group Version 5.0.4 November 2011.

http://www.cidoc-crm.org/docs/cidoc_crm_version_5.0.4.pdf.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11. Reference Model for an Open Archival Information System (OAIS), Recommended Practice, Issue 2, CCSDS 650.0^-2 (Magenta Book) June 2012.

12. Functional Requirements for Bibliographic Records, Final Report / IFLA Study Group on the Functional Requirements for Bibliographic Records. - München: K.G. Saur, 1998. (UBCIM Publications, New Series; v. 19). http://archive.ifla.org/VII/s13/frbr/frbr.htm. CERIF 2008 - 1.2 Full Data Model (FDM). Introduction and Specification http://www.eurocris.org/Uploads/ Web%20pages/CERIF2008/Release_1.2/CERIF2008_1.2_FDM.pdf

13. CERIF 2008 - 1.2 Full Data Model (FDM). Introduction and Specification http://www. eurocris.org/Uploads/Web%20pages/CERIF2008/Release_1.2/CERIF2008_1.2_FDM.pdf

14. Bezdushnyi A. N., Bezdushnyi A. A., Serebryakov V. A., Filippov V. I. Integration of metadata of the Unified Scientific Information Space of the Russian Academy of Sciences. Moscow, 2006. 238 p.

15. Zakharov A. A., Serebryakov V. A. Digital library management system LibMeta. Proceedings of the RCDL 2010. Kazan, 2010, p. 28-37.

16. Fedotov A. M. Methodologies of the distributed systems buildup. Computational Technologies: Special Issue. 2006, vol. 11, p. 3-16.

17. Shokin Yu. I., Fedotov A. M., Zhizhimov O. L., Fedotova O. A. The evolution of information systems: from websites to information resource management system. Vestnik of Novosibirsk State University. Series: Information Technologies, 2015, vol. 13, № 1, p. 117-134.

18. Shokin Yu. I., Fedotov A. M., Zhizhimov O. L., Fedotova O. A. The control system of digital libraries in IRIS SB RAS. Infrastructure scientific information resources and systems: Collection of scientific articles of the Fourth All-Russian Symposium. E. B. Kudasheva, V. A. Serebryakov (eds.). Moscow, 2014, vol. 1, p. 11-39.

19. Abramov A. G., Bulanov M. B., Sigalov A.V. Digital Library portal «Single window access to educational resources»: the concept and implementation of the project, achievements and problems // Library, museum, archival institutions in the age of digital collections and libraries: the VI scientific-practical seminar «Electronic resources of libraries, museums and archives», October 2829, 2010, St. Petersburg / CCPL after Mayakovsky V. V.; Ed. Comp. Prozorov I. E. - SPb .: North Star, 2010. p. 172-178.

20. Intelligent system of case research scientific and technical information (ISTINA) / S. A. Afonin et al., Ed. academic V. A. Sadovnichy. - M .: Publishing house of the Moscow University, 2014. p. 262

21. Adzhiev A. S., Bezdushnyi A. A., Serebryakov V. A., Implementation of web-based system of mathematical information [Electronic resource] / Russian Scientific electronic journal Digital Libraries - .2004. Vol. 7. №1 - URL: http://www.elbib.ru/ index.phtml?page=elbib/rus/ jour-nal/2004/part1/ABS

22. Parinov S. I., Lyapunov V. M., Puzyrev R. L. Socionet as a platform for the development of scientific information resources and online services // [Electronic resource] / Russian Scientific Electronic Library Electronic Libraries. 2003 Vol. 6, №1 URL: http://www.elbib.ru/ index.phtml? page=elbib/rus/ journal/ 2003/ part1/ PLP

23. Kogalovskii M. R. The metadata, their properties, functions, classification and presentation tools // Proceedings of the 14th Scientific Conference «Digital Libraries: Advanced Methods and Technologies, Digital Collections» - RCDL-2012 Pereslavl-Zaleski, Russia, 15-18 October 2012

24. Solovyev V. D., Dobrov B. V., Ivanov V. V., Lukashevich N. V. Ontologies and thesaurus-es: Book. - Kazan, Moscow: Kazan State University, Moscow State University after Lomono-sov M. V. 2006.

25. ANSI/NISO. Z39.19: 2005 Guidelines for the construction, format and management of monolingual controlled vocabularies. NISO Press: Bethesda, MD, 2005. ISBN:1 880124 65 3.

26. Fedotov A. M., Idrisova I. A., Sambetbayeva M. A., Fedotova O. A. Using the thesaurus in the scientific and educational information system. // Vestnik of Novosibirsk State University. Series: Information Technologies, 2015, vol. 13, № 2, p. 86-102. ISSN 1818-7900. - ISSN 2410-0420

27. GOST 7.19-2001 Format for data interchange. Contents of record - 2002. - 58 c.

i Надоели баннеры? Вы всегда можете отключить рекламу.