ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА
2011 История Выпуск 2 (16)
УДК 004.9+93+378
ИСТОРИКО-ОРИЕНТИРОВАННЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ: ОПЫТ РЕАЛИЗАЦИИ «ПЕРМСКИХ» ПРОЕКТОВ*
Д. А. Гагарина, И. К. Кирьянов, С. И. Корниенко
На примере проектов, реализованных в Пермском госуниверситете, рассматриваются существующие подходы к созданию и внедрению историко-ориентированных информационных систем. Анализируются возможности и ограничение применения различных подходов. Особое внимание уделено системам, содержащим собственный исследовательский инструментарий. Выявлены направления использования систем в образовании.
Ключевые слова: историко-ориентированные информационные системы, источникоориентированный подход, проблемно-ориентированный подход, историческая информатика, информационно-образовательная среда.
Введение
Информационные системы становятся сегодня значимым способом организации исторической информации и находят все более широкое применение в исторической науке. Этот тип ресурсов является одной из важнейших составляющих современной информационной среды в исторической науке, а их создание и использование - одним из ведущих направлений исторической информатики. Интерес историков к данной теме подтверждается как большим количеством создаваемых систем, так и ростом публикаций о них.
Историко-ориентированные информационные системы - особый класс систем, предназначенных для хранения, организации исторической информации, обеспечения доступа к ней и ее аналитической обработки в соответствии с потребностями исторических исследований и (или) образования [Кирьянов и др., 2010, с. 83-86]. Можно выделить следующие основные функции таких систем: сохранение и документирование исторических источников, исторических знаний; организация и визуализация исторической информации; предоставление инструментария для поисковоаналитических операций; обучение. Конкретная система может быть предназначена для реализации отдельных функций или их сочетания, что определяет подходы к ее созданию и информационную модель. Наибольший интерес представляют системы, содержащие помимо собственно исторической информации исследовательский инструментарий.
Разработка историко-ориентированных информационных систем - ведущее направление деятельности лаборатории исторической и политической информатики Пермского государственного университета. Завершенные и продолжающиеся проекты поддержаны грантами РГНФ и РФФИ. На сегодня созданы или находятся в стадии разработки следующие системы: «Российские парламентарии начала XX века» (грант РГНФ № 03-01-12012-в, рук. И. К. Кирьянов); «Журналы губернских земских собраний (II половина XIX - начало XX века)» (грант РФФИ № 04-07-90283-в, рук. С. И. Корниенко); «Пермские губернские ведомости» (гранты РГНФ № 05-01-82102-а/У, 08-01-82101-а/У, рук. С. И. Корниенко); «Стенографические отчеты Государственной Думы, 1906-1917» (грант РГНФ № 08-01-12108-в, рук. И. К. Кирьянов); «Программный комплекс для распознавания рукописных и старопечатных текстов» (грант РФФИ № 09-06-00254-а, рук. С. И. Корниенко); «Пермские газеты колчаковского периода» (грант РГНФ № 11-11-59003-а/У, рук. С. И. Корниенко); «Научно-образовательный интернет-портал “Парламентская история дореволюционной России”» (грант РГНФ № 11-01-12006-в, рук. И. К. Кирьянов).
Опыт реализации «пермских» проектов позволяет решить ряд теоретических и прикладных задач, связанных с созданием и использованием информационных систем в истории, некоторые из них будут рассмотрены в данной статье.
Подходы к созданию систем: принципы, возможности, ограничения
К созданию историко-ориентированных информационных систем и баз данных традиционно
© Д. А. Гагарина, И. К. Кирьянов, С. И. Корниенко, 2011
* Исследование выполнено при финансовой поддержке РГНФ: гранты № 11-01 -12006-в, 11-11-59003-а/У, 11-36-00379-а2 - и РФФИ: грант № 09-06-00254-а.
выделяется два подхода - источнико-ориентированный и проблемно-ориентированный. В первом случае основой системы является, как правило, массив одного источника, а структура источника становится информационной моделью системы. Во втором случае разработка системы ведется «от проблемы» - модель системы строится на основе модели рассматриваемой предметной области. Кроме того, возможно соединение названных подходов в рамках одной системы. Каждый из подходов имеет свои преимущества и ограничения.
Большинство перечисленных «пермских» систем создано на основе источникоориентированного подхода. Максимально сохраняя внешний вид, структуру и содержание источника, этот подход позволяет, с одной стороны, решить проблему собственно сохранения и расширения доступа к нему, с другой - использовать систему как источниковую основу научных исследований.
Между тем применение данного подхода имеет ограничения, связанные с источниковой базой. Для подобных систем требуется массив однотипных источников - схожих по структуре и тематике. Такому требованию удовлетворяют, например, коллекции номеров газеты за некий период, что и стали основой систем «Пермский губернские ведомости» и «Пермские газеты колчаковского периода». Информационные модели систем соответствуют структуре выпусков газеты. Трудности могут возникнуть, если структура источника меняется во времени или есть группа схожих, но не одинаковых источников. Так, в случае с «Пермскими губернскими ведомостями» потребовалась адаптация к газетам 1840-х гг. информационной модели системы, разработанной изначально для выпусков 1900-х гг. [Пигалева и др., 2008, с. 72-76]. Что касается пермских газет колчаковского периода, то проект предусматривает объединение в одной системе четырех изданий - «Освобождение России», «Свободная Пермь», «Современная Пермь», «Отечество», что предполагает необходимость разработки единой информационной модели описания и хранения выпусков, которая подойдет для всех перечисленных изданий.
Использование данного подхода требует и предварительного источниковедческого анализа, в частности, формально-логического - для разработки информационной модели и предметносодержательного - для определения возможных значений атрибутов, ключевых слов и т.п. Это значительно усложняет процесс создания информационной системы.
Вместе с тем подобный источниковедческий анализ имеет самостоятельную ценность. Так, в настоящее время изучаются пермские коллекции газет колчаковского периода. Они являются памятником материальной и духовной культуры определенной эпохи, значение которого со временем только возрастает. Однако в силу идеологических причин и политической конъюнктуры в советский период эти газеты, например, в Пермском краевом музее не ставились на учет и долгое время хранились спрятанными среди других газет. И сегодня доступ исследователей к данному источнику ограничен, но уже в силу его плохой физической сохранности. Вследствие этого рассматриваемые коллекции до сих пор не введены в достаточной степени в научный оборот. В ходе работы над проектом впервые будет осуществлен комплексный источниковедческий анализ коллекций пермских газет колчаковского периода, предварительный - традиционными методами, а затем и с помощью методов компьютерного источниковедения. На этой основе будут выявлены предметнотематическая информативность изданий, возможности их использования и значение для исследования проблем периода Гражданской войны. По результатам этой работы будет сделано предметно-тематическое описание коллекции.
Другим методологическим подходом к созданию «пермских» систем является проблемноориентированный. Такой подход положен в основу системы «Российские парламентарии начала XX века», которая разрабатывалась как инструмент для изучения социокультурных характеристик и деятельности депутатов Государственной Думы [Кирьянов, Корниенко, 2005, с. 50-55].
Данный подход позволяет «строить» систему на основе различных по происхождению и структуре источников, объединенных, как правило, общей предметной областью. В основе такой системы может быть и один источник, но для системы важны лишь отдельные элементы его содержания, а не структура, или необходимость максимально полно сохранить его. Проблемноориентированный подход более эффективен при решении конкретной задачи или выполнении серии схожих исследований, чем источнико-ориентированный.
Основное ограничение применения проблемно-ориентированного подхода связано с узостью выполняемых системой задач. Выборочное сохранение информации источников приводит к тому, что для решения новой задачи в той же предметной области может понадобиться создание новой
системы (а в некоторых случаях - повторная оцифровка). Одним из вариантов преодоления этого ограничения является хранение в системе электронных версий всех источников.
Объединить преимущества обоих подходов и частично избавиться от их недостатков позволяет их сочетание. В этом случае для создания одних компонентов системы применяется проблемно-ориентированный подход, а для других - источнико-ориентированный. Модель системы в целом создается, как правило, проблемно-ориентированной.
Именно такой подход используется при создании портала по парламентской истории дореволюционной России. В основу портала легла информационная модель предметной области, включающая такие важнейшие объекты, как источники, публикации, персоналии, учреждения, события. Для разработки информационных моделей перечисленных объектов и портала в целом применен проблемно-ориентированный подход. Он позволяет объединить разрозненную информацию, относящуюся к парламентской истории дореволюционной России, в одном ресурсе и использовать инструменты поиска и анализа сразу относительно целого массива различных типов данных. Так, установленные между объектами связи дают возможность получить о каждом экземпляре одного объекта всю связанную с ним информацию из других объектов. Например, найти для каждой персоналии учреждения, к которым она относится, публикации, посвященные ей, источники, содержащие информацию о ней и ей деятельности. Источнико-ориентированный подход в рамках данного проекта используется для организации информации отдельных массивов источников (в частности, стенографических отчетов Государственной Думы и Государственного Совета), что позволяет максимально полно передать облик и структуру изданий, сохранить их содержание. Такой подход обеспечит и определенную универсальность создаваемого портала с точки зрения его научного использования.
Соединение проблемно- и источнико-ориентированного принципов целесообразно и возможно только при работе над достаточно масштабными, комплексными проектами. Сегодня этот подход используется достаточно редко.
Исследовательский инструментарий систем
Информационные системы являются не только средством хранения и представления исторических данных, но и базой научных исследований. Так, извлечение из системы электронных версий исторических источников уже позволяет изучать их традиционными и компьютеризированными методами. Однако историко-ориентированные системы могут содержать и собственный аналитический инструментарий. Именно такие системы представляются наиболее перспективными.
Возможности разработки исследовательского инструментария определяются особенностями информационной модели, ее основными объектами, их метаданными, связями между объектами и их свойствами, программно-технологическими средствами, используемыми для хранения и визуализации цифровых версий исторических источников.
Можно выделить несколько уровней включения исследовательского инструментария в систему.
1. Встроенный инструментарий стандартного программного обеспечения. В большинстве случаев технологической основой информационной системы является СУБД, что позволяет в самой программе осуществлять поиск, сортировку, фильтрацию, создавать запросы различного уровня сложности. Класс таких запросов достаточно широк - запросы на выборки, группировки, создание новых таблиц, обновление данных и др., что является безусловным преимуществом этого подхода. Ограничение же состоит в том, что исследователь в таком случае должен иметь полный доступ непосредственно к базе данных, кроме того, от него требуется высокий уровень владения используемым программным обеспечением. Очевидно, что такое возможно лишь при наличии персональных баз данных и невозможно в системах коллективного доступа, тем более размещенных в Интернете. Вряд ли такой вариант исследовательского инструментария можно считать соответствующим современным информационным системам.
2. Поисково-аналитический инструментарий, реализованный в виде пользовательских приложений. Как правило, в этом случае речь идет о веб-приложениях, созданных на основе все тех же запросов к базе данных информационной системы. При таком подходе от пользователя не требуется знания специального программного обеспечения, а вся работа осуществляется в обычном веббраузере. Однако возможности исследователя ограничены набором разработанных приложений. Если этот набор недостаточно широк, то эффективность использования системы значительно снижается даже в том случае, если исходная информационная модель обладала высоким потенциалом.
Для полноценного функционирования такие системы требуют постоянного «развития», расширения типов приложений.
Именно этот вариант в качестве базового используется при разработке «пермских» систем. Рассмотрим его на примере ресурса «Парламентская история России начала ХХ века» (http://helios.psu.ru/pls/parlament/), объединившего информационные системы «Российские парламентарии начала XX века» и «Стенографические отчеты Государственной Думы, 1906-1917» (позже этот ресурс станет основой портала по парламентской истории дореволюционной России) [Кирьянов и др., 2010, с. 83-86].
Данная система имеет приложения для осуществления запросов информационно-поискового и аналитического характера, ориентированных на исследование структуры и деятельности Государственной Думы. В настоящее время через Интернет доступны приложения системы для обеспечения просопографических исследований, изучения парламентской активности депутатов, деятельности подразделений Думы. Через раздел «Просопографическое исследование» можно получить данные о возрастном составе, региональном представительстве, национальном, религиозном, сословном, профессиональном, образовательном, партийно-политическом распределении депутатов как в целом в Думе, так и по ее отдельным созывам. Аналогичные запросы можно сделать и для получения сведений о группировках депутатов, характеризующихся различным сочетанием указанных признаков. Система обеспечивает изучение на количественном и содержательном уровне взаимодействия депутатов и думских структур с правительственными учреждениями и высшими должностными государственными деятелями, позволяет устанавливать связи между характеристиками депутатов, событиями в сфере думской деятельности, думскими структурами и текстами стенографических отчетов.
3. Специализированный инструментарий как основная функция системы. В этом случае разрабатываемая система изначально ориентируется на выполнение неких специфических задач, что определяет ее модель и логику создания. Среди «пермских» систем таковой является программно-технологический комплекс для распознавания рукописных и старопечатных текстов [Корниенко и др., 2011, с. 35-37]. Эта система представляет инструментарий и соответствующие пользовательские интерфейсы, реализующие достаточно сложные алгоритмы распознавания текстов на основе методов искусственного интеллекта. Подобные проекты достаточно редки в настоящее время и используются, как правило, для реализации специфического инструментария (например, проект «Манускрипт» (http://manuscripts.ru), ориентированный на лингвистический анализ)1.
Информационные системы в историческом образовании
Будучи эффективным средством хранения исторических данных и реализации исторических исследований, информационные системы обладают также значительным образовательным потенциалом. Изучение историко-ориентированных систем как образовательного ресурса является одной из задач проекта «Информационная среда исторического образования: модель, ресурсы, методы обучения» (грант РГНФ № 11-36-00379-а2, рук. Д. А. Гагарина), работа над которым начата в 2011 г. В рамках проекта разрабатываются принципы проектирования подобных образовательных продуктов, методы их использования в учебном процессе, а также выявляется дидактический потенциал существующих систем, созданных изначально в научных целях.
Можно выделить следующие направления внедрения информационных систем при подготовке историков в Пермском государственном университете:
1. Изучение теоретических и прикладных аспектов создания и использования историкоориентированных систем в рамках курсов информатики и исторической информатики, знакомство студентов с существующими разработками.
2. Использование в исторических курсах созданных систем как дополнительного образовательного ресурса [Корниенко, Гагарина, 2009, с. 45-54; Корниенко, и др., 2008, с. 19-23].
3. Привлечение студентов к реализации исследовательских проектов на разных этапах - от оцифровки источников до конкретно-исторических исследований на основе систем, в том числе к написанию соответствующих курсовых и дипломных работ.
4. Создание студентами собственных информационных систем и выполнение на их основе исследований в рамках проектной деятельности, курсовых и дипломных работ.
О популярности последнего направления свидетельствует написание в 2011 г. дипломных работ, выполненных в рамках специализации по исторической информатике. На достаточно высо-
ком уровне студентами созданы источнико- и проблемно-ориентированные информационные системы. Среди наиболее интересных - системы по советско-германским отношениям периода перестройки [Красильщиков, 2010, с. 96-97], археологическим памятникам юга - юго-востока Пермского края (А. С. Круглова), террористической деятельности партии социалистов-революционеров (О. А. Островская). Также была предпринята попытка теоретического обобщения проблем создания и использования историко-ориентированных систем и анализа 200 существующих продуктов [Власова, Гагарина, 2011, с. 32-35].
«Образовательная» составляющая является неотъемлемой частью практически всех «пермских» систем. Наиболее комплексное отражение она получит в процессе создания научнообразовательного интернет-портала «Парламентская история дореволюционной России». В частности, одним из основных его результатов будут разработанные методики использования портала в обучении, включая методы и приемы проведения аудиторных занятий, самостоятельной работы, проектной деятельности по вузовским курсам отечественной истории, исторической информатики, политической истории России, истории государственного управления в России.
Выводы
Начиная с 2003 г. в Пермском университете ведется разработка историко-ориентированных информационных систем. Реализуемые проекты лежат в русле актуальных проблем исторической информатики, используемые подходы и методы создания систем соответствуют мировому уровню в данной области. Тематика и хронология проектов разнообразна, хотя преобладают системы, посвященные отечественной истории XIX-XX вв.
Анализируя завершенные и продолжающиеся проекты, можно отметить тенденцию к их технологическому усложнению и комплексности, в том числе к объединению ранее созданных отдельных систем. Все проекты совершенствуются, на их основе проводятся исследования, что подтверждает их жизнеспособность.
Создание конкретных систем сопровождается разработкой теоретических и методологических проблем, связанных с понятийным аппаратом, классификацией, информационным моделированием, функциональными возможностями, методами и ограничениями их использования в исторической науке и образовании. Сегодня эти проблемы не получили достаточного отражения в отечественной историографии и их решение является актуальной задачей.
Примечания
1 См. об этом статью Баранова В. А. в настоящем выпуске.
Библиографический список
Власова О. В., Гагарина Д. А. Историко-ориентированные информационные системы как элемент информационно-образовательной среды исторической науки // Информ. и коммуникац. технологии в образовании («ИТО-Екатеринбург-2011»): матер. конф. Екатеринбург, 2011.
Кирьянов И. К., Корниенко С. И. Информационная система «Российские парламентарии начала ХХ в.» // Вестн. Перм. ун-та. История. 2005. Вып. 5.
Кирьянов И. К., Корниенко С. И., Гагарина Д. А., Рябухин И. В. Информационный ресурс по парламентской истории России начала XX в. // Власть. 2010. № 12.
Корниенко С. И., Айдаров Ю. Р., Гагарина Д. А. и др. Программный комплекс для распознавания рукописных и старопечатных текстов // Информ. ресурсы России. 2011. № 1.
Корниенко С. И., Гагарина Д. А. Использование источнико-ориентированных информационных систем в историческом образовании // Метод. вюн. ют. ф-ту. Харюв, 2009. Вип. 8.
Корниенко С. И., Гагарина Д. А., Горбачева Н. Г. Базы данных как основа изучения истории земского самоуправления // Преподавание истории в школе. 2008. №. 5. Спец. выпуск.
Красильщиков Г. Г. Советско-германские отношения 1985-1991 гг.: опыт компьютеризированного исследования // История современной России: Проблемы. Документы. Факты (1985-1999): матер. конф. М., 2010.
Пигалева С. В., Корниенко С. И., Гагарина Д. А., Горбачева Н. Г. Газета «Пермские губернские ведомости» (1838-1844 гг.): проблемы сохранения и дальнейшего изучения // Вестн. Перм. ун-та. Сер. История. 2008. Вып. 7(23).
Дата поступления рукописи в редакцию: 07.07.2011