Л.П. Афанасьева
ЭЛЕКТРОННЫЙ НАУЧНО-СПРАВОЧНЫЙ АППАРАТ АРХИВОВ: НОВЫЙ ЭТАП В РАЗВИТИИ
В исследовании рассматривается развитие автоматизированного научно-справочного аппарата архивов, особое внимание уделено современному состоянию архивных автоматизированных информационно-поисковых систем и качественным особенностям разработки справочно-поисковых средств архивов на современном этапе. В качестве источников использованы нормативные и плановые документы архивных учреждений - федеральные, ведомственные, региональные программы, стратегии, концепции информатизации архивов. Делается вывод о том, что архивисты приступили к интеграции разрозненных информационных ресурсов на внутриархивном (межфондовом) уровне с помощью сетевых технологий. Кроме того, особую роль в создании НСА играют технологии оцифрования, с помощью которых формируются полнотекстовые базы данных.
Ключевые слова: архивное дело, информатизация, информатизация архивного дела, информационно-коммуникационные технологии, автоматизированные архивные технологии, автоматизированный научно-справочный аппарат, электронные справочно-поисковые средства архивов, информационно-поисковые системы, базы данных, полнотекстовые базы данных, сетевые технологии в архивах, информационные ресурсы архивов, электронные архивы, электронный фонд пользования, интегрированные информационные системы.
Важнейшим направлением в информатизации архивного дела на всех ее этапах было и остается создание электронного научно-справочного аппарата. Информационно-поисковые системы играют существенную роль в решении основных задач
© Афанасьева Л.П., 2013
Электронный научно-справочный аппарат архивов.
121
архивных учреждений, предоставлении доступа пользователей к документной информации.
Объектом нашего изучения будет автоматизированный (электронный) научно-справочный аппарат (НСА) архивов - совокупность описаний документов, помещенных в базы данных, автоматизированных средств поиска информации и представления результатов поиска. В качестве источников использованы нормативные и плановые документы архивных учреждений - федеральные, ведомственные, региональные программы, стратегии, концепции информатизации архивов, планы информатизации, а также аналитические материалы (отчеты, статьи, интервью руководителей архивных учреждений) затрагивающие проблемы их реализации1. Столь значимое направление работы архивов не могло не привлечь внимания исследователей. Десятки работ посвящены описанию опыта отдельных архивов по созданию поисковых БД2. По мере накопления этого опыта появились также и обобщающие работы, анализирующие основные тенденции в развитии электронного НСА3. Предметом нашего исследования будет рассмотрение качественных изменений в создании электронного НСА архивов на современном этапе, которые позволяют, на наш взгляд, сделать вывод о том, что информационная работа архивов перешла на новый уровень. Справочно-поисковые средства архивов прошли в своем развитии несколько этапов. Практический опыт создания и разработки различных видов справочников (описи, каталоги, памятные книжки, обозрения и т. п.) сменился унификацией правил описания. Важнейшим качественным скачком в развитии традиционного НСА стали 1960-е гг., когда вышли «Основные правила работы государственных архивов» (1962), содержавшие формы поисковых архивных справочников, и началось внедрение системного подхода в теорию и практику создания НСА архивов. Новые принципы построения системы НСА как иерархии классов справочников, четко разделенных по уровням и объектам описания, стали результатом интеграции архивоведения и информатики и возникновения информационного подхода в архивоведении. Этот процесс сопровождался стандартизацией и формализацией требований к составу описательных статей различных видов справочников. Так были созданы предпосылки и для развития электронного НСА по пути интеграции, которая наступила на современном этапе.
Если мы рассмотрим развитие информатизации архивов в сфере создания НСА (ИПС), то этапы этого процесса не будут совпадать с этапами информатизации архивного дела в целом. Изучая
122
Л.П. Афанасьева
изменения ААТ на основе эволюции технического, математического (программного), лингвистического обеспечения информационных систем архивов, а также носителей информации, мы можем условно выделить следующие этапы:
1) с конца XIX в. до 1950-х гг.;
2) период 1950-1970-х гг.;
3) период второй половины 1970-х - первой половины 1980-х гг.;
4) вторая половина 1980 - начало 2000-х гг. Именно на этом этапе начинается стихийная массовая компьютеризация архивов, прикладное ПО разрабатывается по всем направлениям их работы. Под влиянием информатизации изменяется годами складывавшаяся методика работы архивов, что нашло отражение в «Основных правилах работы государственных архивов» и «Основных правилах работы архивов организаций» (2002) - там появляются разделы об автоматизированном учете, автоматизированном НСА и организации внедрения и сопровождения ААТ в архиве. В 1995-1996 гг. принимается первая общеотраслевая Концепция и Программа информатизации архивного дела, начинается работа по внедрению общеотраслевого (типового) программного обеспечения.
Развитие информационных технологий на каждом этапе приводило к изменению роли, которую ААТ играли в архивном деле, изменению масштаба и основных направлений их применения. Однако если рассматривать эволюцию методических основ построения именно справочно-поисковых средств, входящих в систему НСА архивов, то мы можем выделить два этапа в информатизации этого направления работы государственных архивов:
1) 1960-2000 гг. Несмотря на то что в рассматриваемый период техническое обеспечение архивных АИПС дважды сменилось революционным образом, на методику создания поисковых систем это повлияло очень мало.
Она характеризуется преобладанием «аналогового подхода», когда архивисты стремятся перевести в машиночитаемый (электронный) вид уже существующие традиционные архивные справочники. Так, в 1980-е гг. важнейшей задачей стало создание автоматизированного Центрального фондового каталога; в 1990-2000 гг. — создание электронных версий путеводителей по архивам4. Иногда в электронный вид переводятся широко известные у исследователей традиционные справочники, например БД «Каталог военно-ученого архива (ВУА)» в РГВИА или именная
Электронный научно-справочный аппарат архивов.
123
картотека Московского охранного отделения в ГА РФ (совместный проект ГА РФ и МГУ)5, а также указатель «Личные фонды в государственных хранилищах СССР» (опубликован на сайте «Архивы России»).
Еще одна черта в развитии электронного НСА на данном этапе - значительная степень тематической и видовой дифференциации создаваемых справочников, т. е. создание локальных БД по отдельным видам справочников - путеводителям, каталогам, указателям, обзорам, тематическим перечням и т. п.
Соотношение количества баз данных по различным видам справочников выглядит следующим образом.
АИПС по видам справочников
Виды автоматизированных справочников На ПК или в ЛВС архива В Интернете Всего БД Процент к общему количеству БД
Межархивные АИПС 16 17 33 6,8
Путеводители и краткие справочники по фондам архива 19 34 53 10,9
Списки (перечни) фондов архива - 11 11 2
Реестры описей - 1 1 0,2
Описи 24 11 35 7,2
Каталоги 270 10 280 55,7
Указатели, тематические перечни документов 15 6 21 4,3
Обзоры 1 3 4 0,8
Полнотекстовые БД 6 12 20 4,1
Интегрированные поисковые системы 14 1 15 3
Фактографические АИПС 7 1 8 1,6
Прочие АИПС 4 - 4 0,8
ИТОГО 358 126 484 100
124
Л.П. Афанасьева
Тематическая дифференциация объясняется тем, что архивисты идут здесь «за исследователем», создавая тематические БД по наиболее востребованным у пользователей темам, связанным с исполнением запросов, реализацией научных и публикаторских проектов и т. п. Особенно часто создаются тематические каталоги и указатели (59% всех АИПС). Поскольку интерес исследователей в определенный период к определенным документам сохраняется стабильно, темы, по которым создаются электронные справочники, совпадают для разных архивов. По данным И.Н. Киселева и О.Ю. Неждановой, среди зарегистрированных в НТЦ «Информ-регистр» баз данных госархивов 28% составляют БД, включающие сведения о решениях исполкомов и горсоветов, 13% - о домовладениях, домовладельцах, земельные кадастры (заказные), 17% -о военнопленных и узниках лагерей (договорные), 11% - о жертвах политических репрессий (в основном гранты); 7% БД различной тематики создавались в сотрудничестве с научными учреждени-ями6. Это легко объяснить. Особое значение для любого регионального архива имеет фонд исполкома местного Совета, который содержит многоаспектную информацию, часто запрашиваемую исследователями. Некоторые архивы создают базы данных и по фондам современных органов власти и управления - городских, районных администраций. Сложно найти областной или краевой архив, имеющий компьютерную технику, в котором не было бы в 1990-е гг. создано каталога по фондам исполнительного органа власти - исполкома Совета.
В бывших партийных архивах создаются аналогичные каталоги по решениям областных, краевых, городских, районных партийных органов. (Например, БД «Картотека решений партийных органов» в ЦДОО Свердловской области). Наиболее значительным по объему описаний проектом стал электронный каталог решений Государственного Комитета Обороны и высших органов ВКП (б) (Политбюро, Оргбюро и Секретариата), созданный по документам РГАСПИ.
Другими часто встречающимися темами, по которым создаются тематические АИПС в архивах, являются:
- история государственных учреждений региона (БД по истории государственных учреждений 1п1ро1вк в РГАЭ; БД «Офис»: учреждения, предприятия, организации Архангельской губернии и области (ХУП-ХХ1 вв.) в ГА Архангельской области; БД «Каталог по истории госучреждений», «Картотека по истории фабрик и заводов Урала» в ГА Свердловской области; «Ликвидированные учреждения» в ГА Тульской
Электронный научно-справочный аппарат архивов.
125
области; «Справочник по истории предприятий и госучреждений» в ГА Пермской области; БД «Электронный каталог по истории учреждений, организации и предприятий» в ГА Мурманской области);
- строительство, землевладение и домовладение (БД «Жилищ-но-гражданское строительство» в ЦГА НТД Санкт-Петербурга; «Недвижимость Республики Татарстан» - в ЦГА РТ; «Землепользование в Архангельской губернии и области в ХХ-ХХ1 веках» в ГА Архангельской области; БД «Домовладение», БД «Похозяйственные книги Басинского и Лиманско-го районов г. Астрахани» в ГА Астраханского края; «Решения по землепользованию и землевладению» в ГА Краснодарского края; «Частные домовладения» в ГА Нижегородской области; «История домовладения г. Екатеринбурга» в ГА Свердловской области; «Указатели к описям фонда Тверской палаты государственных имуществ» в ГА Тверской области);
- генеалогия (БД «Все для родословной» в ГА Архангельской области включает в себя ревизские сказки (1744-1857), обывательские книги (1785-1870), метрические книги (1780-1900), исповедные книги (1719-1917), БД «Первая Всеобщая перепись населения Российской империи, 1897 год»; БД «Тульская духовная консистория» (метрические книги, исповедные ведомости) в ГА Тульской области; БД по родословным книгам дворян Оренбургской (Уфимской) губернии в ЦГИА Республики Башкортостан); БД ЦГА РТ;
- история религии («Церковь и государство» - ГА РФ; «Культурное наследие духовных учреждений» - Национальный архив республики Карелия; «Церкви, соборы и монастыри Ставропольской (Кавказской) епархии (18431918)» - ГА Ставропольского края; «История религий» в Прикамье - ГА Пермской области; «Справочник по истории религии» в Государственном общественно-политическом архиве Пермской области);
- история репрессий и ГУЛАГа («Спецлагеря НКВД СССР на территории Германии»; «Особые папки в фонде МВД» -ГА РФ; «Преодоление» в ГА Тульской области; «Учет документов личного происхождения и фотодокументов в материалах архивно-следственных дел» в ГА Республики Алтай; «Политические репрессии в Сибири 1917-1951 гг.» в ГА Омской области; БД «Фильтрационно-проверочные
126
Л.П. Афанасьева
дела КГБ»; «Архивно-следственные дела КГБ» в ЦГА исто-рико-политической документации Республики Татарстан);
- история этноса и международных связей («История еврейского народа в России»; «Международные связи России и Дании» - ГА РФ; «Народы Алтая и Горной Шории глазами миссионеров Алтайской духовной миссии и исследователей первой пол. XIX - начала XX в.» - ГА Республики Алтай);
- история административно-территориального деления (БД «Административно-территориальное деление Республики Татарстан» в ЦГА РТ; «Административно-территориальное деление» в ГА Пермской области).
В середине 2000-х гг. процесс создания справочников достиг своего апогея, по нашим подсчетам, в архивах создавалось не менее 50 тематических АИПС ежегодно. Электронные каталоги дробятся по видам - именные, географические, предметно-тематические, систематические. Даже в пределах одного вида каталога - именного мы видим дальнейшую дифференциацию создаваемых БД:
- БД по награжденным (медалями «Ветеран труда», за «За оборону Москвы», «За доблестный труд в Великой Отечественной войне 1941-1945 гг.», «В память 800-летия Москвы», «Мать-героиня», почетными званиями и др.);
- БД по личному составу различных предприятий, учреждений, ведомств (на основе ведомственных картотек);
- БД по репрессированным, реабилитированным, спецпоселенцам, раскулаченным, лишенным избирательных прав, административно-ссыльным;
- БД по военнослужащим, участникам партизанского движения;
- БД по эвакуированным и репатриированным;
- БД по военнопленным;
- БД по членам КПСС и ВЛКСМ, делегатам партийных съездов и конференций (в бывших партийных архивах);
- БД по выдающимся деятелям региона, отрасли.
Из данного перечня ясно, что темы связаны с основными видами социально-правовых запросов, выполняемых архивными учреждениями. По этой же причине важным направлением развития автоматизированного НСА является создание межархивных поисковых систем о местонахождении документов по личному составу.
Именно из-за дифференциации тематические БД составляют абсолютное большинство программ, создаваемых в архивах. Согласно сведениям Концепции информатизации архивного дела 1995 г. информационно-поисковые БД в 1995 г. составляли - 88%
Электронный научно-справочный аппарат архивов... 127
БД, а по федеральным архивам - 98% (по нашим подсчетам, в 2005 г. - 71,2% всех БД).
Еще одной особенностью данного этапа развития НСА была их разработка с учетом публикации БД на однопользовательском компьютере или в локальных сетях.
Формы публикации поисковых БД в архивах
Форма реализации БД Для ПЭВМ или ЛВС Интернет СD-ROM
Кол-во БД (АИПС) 377 107 7
Проценты 77 22 1
Из таблицы видно, что преобладают АИПС, недоступные широкому кругу пользователей документной информации, размещенные в архиве и не опубликованные в глобальной сети или на машиночитаемых носителях.
Однако начиная с середины 2000-х гг. возобладала тенденция к интеграции создаваемых архивами тематических ресурсов.
Движение в направлении интеграции информационных ресурсов архивов началось сверху. В 1995 г. была разработана первая отраслевая Концепция информатизации архивного дела, в которой на основании анализа имеющейся в Росархиве статистики по БД делался неутешительный вывод о том, что информатизация архивов развивается стихийно благодаря отсутствию единой методической и программной базы. Исходя из этого в Концепции ставились задачи использования общероссийских (еще не существовавших к моменту принятия Концепции) и международных стандартов для складывания общероссийского информационного пространства на основе интеграции ресурсов отдельных архивов. При этом Концепция привлекала внимание архивистов к необходимости создания ИПС не для «внутреннего потребления», а для пользователя, что означало главную ориентацию на публикацию БД в Интернете: «предоставление возможности удаленного доступа к базам данных и электронным копиям документов через телекоммуникационные сети и системы». Практически дословно эта задача была повторена в новой «Программе информатизации Федерального архивного агентства и подведомственных ему учреждений на 2011-2020 гг.» от 02.12. 2011 г., где говорится о целях обеспечения доступа граждан и организаций к поисковым средствам и электронным копиям документов Архивного фонда Российской Федерации, в том числе на
128
Л.П. Афанасьева
основе удаленного доступа, при этом акцентируется внимание на преодолении разрозненности государственных информационных ресурсов в области архивного дела путем объединения информационных (тематических, исследовательских и пр.) ресурсов, созданных и функционирующих внутри федеральных архивов, и представление их в сети Интернет. В программе намечены шаги по интеграции:
1) проведение инвентаризации существующих информационных ресурсов федеральных архивов;
2) осуществление в каждом архиве интеграции имеющихся информационных ресурсов в единую для данного архива БД с формированием единого НСА архива в электронном формате;
3) подготовка данного «локального» ресурса к его интеграции в единую для всех федеральных архивов систему информационных ресурсов;
4) разработка единой интеграционной платформы на основе принципа распределенного хранения для объединения информационных ресурсов федеральных архивов7.
Методические основы создания интегрированных ИПС были заложены международным стандартом ISAD (G) (International Standard Archival Description), утвержденным Международным советом архивов (МСА) в 1994 г. В основе данного стандарта лежит принцип многоуровневого описания, предполагающий описание от общего к частному, раскрывающее иерархию комплексов докумен-тов8. Универсальная модель интегрированной информационной системы архива на основе данного стандарта была предложена И.Н. Киселевым. Система должна была соединять в себе три функции: учета, контроля за обеспечением сохранности документов и ведения НСА. При этом учетные и поисковые сведения должны вноситься в базы данных, разделенные по четырем уровням описания:
- фонда;
- описи;
- дела;
- документа.
Возможен также пятый уровень - ввод текста документа. В совокупности все базы данных образуют иерархическую структуру ИС, где все уровни связаны вертикально и горизонтально с помощью БД о переименованиях фонда, биографических справках, сведениях о фондовых включениях и незадокументированных периодах, топографических указателей и файлов ключевых слов и
Электронный научно-справочный аппарат архивов.
129
рубрикаторов9. Эти принципы были положены в основу создания общеотраслевой программы «Архивный фонд». Сходная модель была разработана для единой ИПС «Электронный архив» ГА РФ, в основе которой лежит идея многоуровневого описания (фонд-опись-дело-документ).
Однако все эти разработки остались на теоретическом уровне. Предложить архивам ПО, способное реализовать на практике идею интегрированной системы с многоуровневым описанием, Росархив смог только в 2008 г., когда в архивах началось внедрение четвертой версии общеотраслевой программы «Архивный фонд» (до этого общеотраслевое ПО решало задачу централизованного учета, а не создания интегрированной системы НСА). Да и после внедрения четвертой версии «Архивного фонда» заместитель руководителя Росархива А.Н. Артизов отметил, что формирование межархивного НСА отраслевого масштаба остается делом будущего, когда будет решена задача передачи данных из архивов в автоматизированный центральный фондовый каталог не на уровне фонда, как это происходило в «карточной» системе централизованного госучета, но и на уровне описи и единицы хранения10.
Однако архивы не дождались общеотраслевого ПО, и создание интегрированных систем НСА началось «снизу». Причиной стало накопление критического количества тематических баз данных не только в федеральных и московских, но и в региональных государственных архивах.
Накопление большого количества локальных баз данных создавало проблемы по следующим причинам:
- возрастание затрат на разработку и внедрение программных продуктов;
- невозможность межархивного обмена информацией;
- сложности в обучении архивистов и пользователей работе с большим количеством БД;
- сложности с хранением БД - необходимо поддерживать, т. е. постоянно модифицировать, множество прикладных программ, что означает затраты труда и средств на внедрение их новых версий и конвертацию данных из старых в новые версии;
- сложности с конвертированием данных в формат «Архивного фонда 4.1», с интеграцией в единые системы, с публикацией в Интернете из-за несовместимости форматов.
130 Л.П. Афанасьева
Количество тематических баз данных по архивам
Название архивного учреждения Количество тематических БД (без учета общеотраслевой программы «Архивный фонд» (4 версия) и справочников в формате HTML и doc на сайте архивов) Год
Главархив г. Москвы 105 1996 (до внедрения интегрированной системы)
ГА РФ 32 1999
ГА Курганской области 21 2008
Управление архивами Свердловской области (все госархивы) 20 2005
ГА Смоленской области 18 (из них 5 БД по документам по личному составу) 2007
Комитет Ставропольского края по делам архивов 16 2012
ГА Липецкой области 13 2007
ГА ОПД Курганской области 11 2008
ГА Тверской области 8 2007
ЦДНИ УР (сеть архивных учреждений Удмуртской Республики) 5 2008
ГА Самарской области 5 2011
ГА Ярославской области 4 2007
ГА Орловской области 4 2007
ГА Воронежской области 3 2008
Все это побудило архивы принять меры по разработке собственного интегрированного ПО. Это уже не просто перевод в электронный вид традиционных справочников, это качественно новый продукт, который является результатом возможностей, предоставляемых информационно-коммуникационными технологиями.
Электронный научно-справочный аппарат архивов.
131
Справедливости ради следует заметить, что некоторые архивы изначально строили систему НСА на принципах интеграции. Одной из первых комплексная система электронного НСА, базирующаяся на едином программном обеспечении, была реализована в конце 1980-х - начале 1990-х гг. в Российском научно-исследовательском центре космической документации РНИЦ КД (базы данных «КИНО», «ФОТО», «ФОНО», «НИР» и др.). Одной из первых интегрированных разработок стал программный комплекс «Госархив», созданный в государственном архиве Пермской области (ГАПО) в 1994-1996 гг. и дважды отмеченный на конкурсе научных работ в области архивоведения, документоведения и археографии. Программа позволяет осуществлять: описание на уровне фонда, описи и дела; учет документов, контроль за сохранностью, состоянием НСА. Однако разработка пермских архивистов не претендует на универсальность - помимо данной программы в архиве существует еще 12 баз данных, некоторые из которых, впрочем, интегрированы с программой «Госархив» (например, БД «Картографические документы»).
Однако в большинстве случаев к интеграции архивы приступали, накопив значительное количество ресурсов. Например, в Информцентре Мосгорархива еще в 1996 г. было создано 105 баз данных общим объемом 2 млн записей (700 МВ). В рамках городской программы информатизации, утвержденной Правительством Москвы, в 17 архивных учреждениях Мосгорархива с 1998 г. началось внедрение единой интегрированной системы. Первые подсистемы получили название «Учет архивного фонда» и «Научно-справочный аппарат». Они позволили построить электронный НСА как систему многоаспектного поиска информации на уровне фонда, дела, описи, документа, осуществляющую формирование межфондовых и межархивных справочников, ведение электронного каталога документов, кинофотофоновидеоматериалов. Московские архивисты проделали огромную работу при написании технического задания. К тому же система была многофункциональной, в результате инженерно-внедренческим центром «Инсофт» было создано типовое решение, которое потом было реализовано не только в Москве, но и в архивном отделе Воронежской области на базе двух государственных и 33 муниципальных архивов. В 2006 г. в Воронежской области была разработана «Концепция автоматизации государственных архивов Воронежской области», на основе которой внедрена Комплексная автоматизированная интегрированная система архивных учреждений Воронежской области («Инсофт», Москва), которая представ-
132
Л.П. Афанасьева
ляет систему автоматизированного учета документов, НСА и ведения электронного архива.
Недостатком ПО «Инсофт» было то, что изначально она не была ориентирована на публикацию в Интернете, хотя обмен информацией между архивами осуществлялся через ЛВС, а доступ к БД читателям предоставлялся в читальном зале11. Информационная система «Межархивный поиск» была внедрена в Главархиве Москвы в 2006-2007 гг.12
Аналогичная ситуация несколько позднее сложилась в Государственном архиве РФ (ГА РФ). К 1999 г. в архиве было создано 32 БД объемом свыше 230 тыс. записей, а к 2002 г. - 52 базы данных объемом свыше 450 тыс. записей. С 1999 г. архивом совместно с Институтом проблем передачи информации РАН велись работы по созданию единой ИПС «Электронный архив», которая включала бы в себя как электронные образы документов, так и поисковую систему, созданную на основе интеграции всех созданных в архиве ранее поисковых баз данных13. Отличие от продукта московских архивистов - к информационно-поисковой системе «Электронные описи ГА РФ», совмещающей в себе электронный путеводитель, электронные описи и электронный каталог дел (3 млн описаний ед. хр.), был открыт доступ на сайте архива в день его 90-летнего юбилея ( 2010 г.).
Подобный путь интеграции своих ресурсов на базе единого ПО был проделан и в архиве РАН. В конце 1990-х гг. там была внедрена специальная программа «Архивариус», которая позволяла формировать электронные каталоги отдельных массивов архивных документов. Однако затем разрозненные каталоги удалось соединить в единую БД, в основу интерфейса которой был положен многоуровневый принцип структуры данных, введенный Международным стандартом архивного описания документов (ISAD). Проект был реализован на основе программы «Архив РАН», которая помимо задач многоуровневого поиска решала также задачи учета документов и информационной поддержки комплектования архива. Информационная система пополняется путем включения электронных описей, поступающих из источников комплектования архива (что существенно экономит труд архивистов), а также путем целевой или «попутной» (с обработкой фонда) каталогизации. На следующем этапе была поставлена задача подключения к базе оцифрованных изображений документов и публикации части баз в Интернете.
Таким образом, мы видим, что фактически одновременно в разных архивах решалась задача создания универсальной поиско-
Электронный научно-справочный аппарат архивов.
133
вой системы, реализующей принцип многоуровневого описания. Решалась она, правда, на разном ПО, что затруднит в дальнейшем интеграцию созданных ресурсов.
Наконец было найдено техническое решение, которое удовлетворяло всем требованиям к интегрированной информационной системе архива и поэтому было реализовано в нескольких архивных учреждениях, музеях и НИПЦ «Мемориал» (СПб.). В 2000 г. в Центральном государственном архиве кинофотодокументов Санкт-Петербурга компания «Альт-софт» начала внедрение программно-информационного комплекса «Каисса-архив».
Архивисты оценили такие особенности данной программы как:
- способность реализовать принцип многоуровневого описания («описание с произвольной глубиной вложенности»);
- способность связать цифровые копии документов с электронным НСА как с метаописанием;
- возможность синхронного представления в Интернете единой БД архива (публикации информационно-поисковых справочников и образов документов);
- возможность создать на базе единого ПО многофункциональную систему, обеспечивающую информационную поддержку различных направлений работы архива (учет документов, обеспечение сохранности, комплектование).
Кроме этих функций, которые были присущи и другим программам в разной степени, «Каисса-архив» обладала такими особенностями, как поддержка перевода в электронный формат традиционных описей, возможность настройки на особенности НСА конкретного архива, совместимость с форматами общеотраслевой программы «Архивный фонд» и с международными стандартами ISAD, EAD, OAE, Dublin Code, UNIMARC, RUSMARC и др.
Поэтому программа была внедрена в РГАЛИ, РГА КФД, РГИА, ГА Ленинградской области в г. Выборге, ГА Хабаровского края, ГА Сахалинской области, ряде музеев.
Особенно масштабно «Каисса» была внедрена в РГАЛИ, где на ее основе была реализована комплексная программа информатизации всех направлений деятельности архива и представления его ресурсов в Интернет. Информационная система РГАЛИ с условным названием «Электронный архив» достаточно гибка в плане выбора объекта описания и универсальна в способах поиска информации по всем уровням (фонда, ед. хр., дела, документа, части документа). Помимо поисковых, система имеет еще и учетные функции, предоставляет оцифрованные копии ед. хр. Первоначально была реализована
134
Л.П. Афанасьева
подсистема НСА, затем произошло внедрение автоматизированных рабочих мест для отдела комплектования, архивохранилища, АРМ по работе с исследователями, АРМ посетителя читального зала, АРМ специалиста по подготовке документальных публикаций.
Сетевой программно-информационный комплекс «Архив» (ИКАР), реализованный на базе «Каиссы» в РГА КФД, также универсален, он включает подсистемы: ИКАР-комплектование; ИКАР-сохранность; ИКАР-использование; ИКАР-НСА; ИКАР-ОТК.
В регионах РФ архивные учреждения также стремились в 2000-е гг. решать задачи интеграции созданных информационных ресурсов. Помимо упомянутого выше опыта Воронежской области можно назвать ПО «Научно-справочный аппарат» («Архивные справочники»), внедренное в 2007-2008 гг. в архивных учреждениях Свердловской области14. Далее работа была продолжена в рамках областной государственной целевой программы «Создание АИС по документам АФ РФ, находящимся в государственной собственности Свердловской области» на 2009-2011 гг., в ходе реализации которой решалась задача создания ИПС «Электронные описи» и модернизации существующего ПО с целью включения его в единую систему15. Кроме того, во второй половине 2000-х гг. была внедрена автоматизированная информационная система «Управление архивным делом Ямало-Ненецкого автономного округа», которая представляет собой единый многофункциональный интегрированный комплекс, включающий в себя подсистемы по источникам комплектования, регистрации запросов, а также НСА архивов (электронный каталог, соединенный с образами документов)16.
Помимо столь комплексных и масштабных проектов в архивах создавались и более локальные интегрированные системы. Так, в архиве Курганской области осуществлялось ведение систематического электронного каталога и объединение в одну базу тематических обзоров, перечней и подборок документов17. Примером продуманного комплексного подхода к проблеме интеграции создаваемых информационных ресурсов может служить создание системы электронных каталогов в Национальном архиве Республики Карелия, ныне объединенных в единый систематический каталог. Еще до начала работы по его созданию архивистами было предусмотрено использование для всех электронных каталогов единого ПО (СУБД «Кодекс»), единого информационно-поискового языка дескрипторного типа, который может стать основой схемы классификации документной информации в архивных учреждениях республики, а также унификации полей и правил описания доку-
Электронный научно-справочный аппарат архивов.
135
ментов в информационных системах. Проблемы интеграции ресурсов или внедрения интегрированных информационных систем решались также и в муниципальных архивах.
Однако опыт показывает, что объединить множество разнородных баз данных в единую систему гораздо сложнее, чем изначально вводить данные в единый интегрированный комплекс. Поэтому тот факт, что к моменту создания общеотраслевого ПО, способного воплотить в жизнь информационную систему архива, основанную на принципе многоуровневого описания («Архивный фонд 4.1»), в федеральных и региональных архивах были внедрены интегрированные программы в разных форматах (Delfi, Oracle 9i и 10g и т. п.), существенно затруднит поэтапное объединение этих ресурсов в единую информационную систему архивной отрасли. К тому же следует учитывать проблемы стандартизации лингвистического обеспечения, ведь классификаторы многих архивных ИПС были разработаны до внедрения действующей версии ЕКДИ.
Еще одна особенность развития электронного НСА - повсеместное соединение поисковых систем с оцифрованными образами документов. Работа по поточному оцифрованию и созданию электронных архивов также началась с отдельных тематических проектов и видов справочников. В большинстве государственных архивов были созданы фотокаталоги, соединявшие описание фотодокументов с их цифровым изображением18. Наиболее масштабными проектами в области создания полнотекстовых БД можно назвать следующие проекты:
Название проекта, архив Количество описаний документов, введенных в систему Количество оцифрованных изображений документов
«Электронный каталог документальных фильмов РГАКФД» (1999-2000) 42 200 описаний
«Архив Коминтерна» (РГАСПИ) 1999-2003 250 тыс. записей заголовков ед. хр. 1 млн страниц документов на 90 языках
«Электронный архив СВАГ» в ГА РФ 271 тыс. описаний документов Столько же изображений
БД «Документы Секретариата НКВД-МВД СССР. 1944-1960 гг.» (ГА РФ)19 с 1998 г. 15 700 описаний документов 76 700 страниц
136
Л.П. Афанасьева
Все эти проекты были реализованы до появления программы «Архивный фонд 4.1», которая имеет возможность поддерживать цифровой фонд пользования в любых форматах.
На современном этапе продолжается создание проектов, связанных с оцифрованием отдельных, вызывающих интерес у исследователей, комплексов документов (например, архива Сталина в РГАСПИ)20. Оцифрование проводится в культурно-просветительских целях для создания виртуальных выставок (особенно активно такие тематические проекты реализовал Главархив Москвы)21 и даже виртуального музея Б.Л. Пастернака на DVD-диске.
Однако в 2000-е гг. реализуются масштабные проекты региональных электронных архивов, которые выходят за рамки представления в сети коллекций оцифрованных документов по наиболее интересным для исследователей темам. В Москве, Брянской, Курганской, Липецкой, Нижегородской, Тюменской, Томской, Свердловской областях, Перми, Красноярском, Ставропольском крае, Ямало-Ненецком АО и других регионах осуществляются проекты формирования электронных архивов, часть из них совместно с корпорацией «Электронный архив» (ЗАО «ПроСофт-М»). Цель проектов - обеспечить доступ пользователей к информационным системам и архивным документам в режиме on-line.
О масштабах работы по оцифрованию документов архивов можно судить по следующим данным.
Название архива Объем оцифрованных документов Годы
Архивы Ставропольского края Описи с заголовками 400 тыс. ед. хр., 12 тыс. ед. хр. 2009
ГА Тюменской области Все описи архива и 15,6 млн листов 22 документов22 2006-2008
Архивы Свердловской области 31 тыс. стр. описей, 90 тыс. стр. документов 2011
Ямало-Ненецкий автономный округ 2715 л. описей, 2568 фотографий 2008
При этом, как видно из таблицы, в электронный формат также переводятся описи23. Речь идет, по сути, о создании электронного фонда пользования документами архива, соединенного с поисковой системой24. Если пользователь не обнаружит нужные ему документы в электронном архиве, он, по крайней мере, сможет сделать заказ, зная, благодаря описям, полный шифр дела.
Электронный научно-справочный аппарат архивов.
137
Венцом работы по оцифрованию, согласно «Программе информатизации Федерального архивного агентства ... на 2011-2020 гг.» должно стать создание Центра хранения электронных документов (ЦХЭД). Источниками комплектования ЦХЭД будут являться федеральные органы государственной власти, передающие в ЦХЭД электронные документы, а также федеральные архивы, передающие в ЦХЭД копии электронных образов архивных документов, возникающие в ходе планомерной оцифровки фондов в рамках наполнения программного комплекса «Архивный фонд» - «Фондовый каталог» - «Центральный фондовый каталог» и создания НСА архивов. При этом предполагается, что на местах будут сохраняться комплекты электронных копий документов, созданных в архивах, т. е. будет создана система электронных архивов распределенной структуры, связанных через портал «Архивы России». Такова модель грандиозной межархивной поисковой системы, соединенной с электронным фондом пользования.
Наконец, еще одной чертой современного этапа информатизации создания НСА является совершенно иная роль, которая отводится в этом процессе сетевым технологиям. Количество справочников, опубликованных в Интернете, существенно возросло.
На заре развития архивного Рунета Е.В. Боброва отмечала разнообразие форм представления справочников в сети25. Архивные ИПС помещались на сайте в текстовом формате *Лос; *.1!1 , и др.); в НТМЬ-формате; в виде базы данных. Огромный разрыв в качестве представленных в сети информационных ресурсов архивов выявил и мониторинг сайтов федеральных архивов, органов управления архивным делом и государственных архивов субъектов РФ, осуществленный в 2008 г. Архивные ИПС рассредоточены по разным сайтам, существенно отличаются интерфейсом и поисковыми качествами. Все эти проблемы остаются и на современном этапе.
Однако качественным изменением ситуации можно назвать то, что большинство создаваемых БД на современном этапе ориентировано именно на публикацию в Интернете. Нет ни одного региона, где программа информатизации архивного дела не предполагала бы публикацию НСА в сети. Не все архивы имеют возможность сразу открыть доступ к имеющимся ресурсам, зачастую на первом этапе ИПС выставляются в единую локальную сеть архивных учреждений, к которой исследователи имеют доступ через читальный зал. Но публикация НСА в сети рассматривается как ближайшая перспектива.
138
Л.П. Афанасьева
В «Программе информатизации Федерального архивного агентства ... на 2010-2020 гг.» ставятся задачи, связанные с развитием сетевых технологий в архивах:
- организация доступа к электронным ресурсам документов Архивного фонда РФ, размещенным на портале «Архивы России», в том числе «Центральному фондовому каталогу», «Реестру уникальных документов»;
- создание на базе портала «Единой интеграционной платформы информационных ресурсов» (для объединения в общую поисковую систему поисковых БД отдельных архивов).
Доступ к электронным образам Центра хранения электронных документов тоже, по-видимому, будет осуществляться через Интернет.
Итак, мы можем сделать вывод, что со второй половины 2000-х гг. наступает новый этап в создании научно-справочного аппарата архивов и всей информационно-поисковой деятельности архивов. Данный этап характеризуется:
- переходом от создания локальных БД, дифференцированных по видам и разновидностям справочников и темам, к созданию интегрированных систем на уровне архива, основанных на принципе многоуровневого описания (либо путем интеграции в специальное ПО всех созданных ранее БД, или путем изначального внедрения единой информационной системы на основе «Архивного фонда 4.1» или специально разработанного ПО);
- созданием электронного фонда пользования, т. е. поточным оцифрованием наиболее востребованных фондов архива и соединения оцифрованных образов документов с поисковыми системами в составе полнотекстовых БД;
- размещение созданных поисковых систем и оцифрованных образов документов в локальной вычислительной сети или Интернете для обеспечения удаленного доступа пользователей к ним.
В перспективе - общеотраслевая интеграция поисковых систем архивов и электронного фонда пользования с помощью сайта «Архивы России» и автоматизированного Центрального фондового каталога.
Таким образом, роль архивиста в процессе использования информации качественно меняется. Участвуя самым активным образом в создании эффективной поисковой системы, он затем отступает в сторону, перестает быть передаточной инстанцией, предоставляет пользователю возможность самостоятельно выстраивать логику запроса и корректировать ход поиска по мере анализа
Электронный научно-справочный аппарат архивов.
139
полученных результатов. На наш взгляд, есть повод задуматься об изменении профессиональной подготовки архивиста в направлении более углубленного изучения основ проектирования информационных систем, в создании которых его роль возрастает с каждым днем, особенно в условиях интеграции ресурсов архивов в единое информационное пространство.
Примечания
1
Информация управления архивами Свердловской области на коллегии Управления архивами 15.02. 2007 «О состоянии и итогах работы Управления архивами, архивных органов и учреждений Свердловской области по созданию ААТ» // Информационный бюллетень управления архивами Свердловской области. Екатеринбург, 2007. № 27. С. 68-75; Материалы семинара специалистов архивных учреждений Уральского федерального округа по теме «Внедрение автоматизированных архивных технологий в практику работы архивных учреждений. Опыт создания и использования программно-аппаратного комплекса «Электронный архив Тюменской области». 24-25 апреля 2008 г. г. Тюмень // Там же. 2008. № 2. С. 111-142; Областная государственная целевая программа «Создание АИС по документам АФ РФ, находящимся в государственной собственности Свердловской области» // Там же. 2008. № 31. С. 10-31; Любимова И.А. Реализация ведомственной целевой программы «Информатизация управления архивным делом в Ямало-Ненецком АО на 2006-2008 гг.» // Информационный бюллетень научно-методического Совета архивных учреждений Уральского федерального округа. Екатеринбург, 2007. № 1. С. 48-49; Шестакова ГА. Информатизация архивных учреждений Нижегородской области: современное состояние и перспективы развития // Материалы практического семинара «Вопросы внедрения ААТ» 27 апреля 2011 г., г. Ижевск [Электронный ресурс] /Комитет по делам архивов при Правительстве Удмуртской Республики; Перспективы внедрения архивных технологий в деятельность архивных учреждений Удмуртской республики // СИФ ВНИИДАД. № 13131. С. 75-81; Богданец И.А. Использование автоматизированных технологий в работе архивных учреждений Приморского края: выступление ведущего специалиста архивного отдела аппарата администрации Приморского края от 28 марта 2007 г. // Информационно-методический бюллетень архивного отдела аппарата администрации Приморского края. Владивосток, 2007. № 79. С. 18-28; Приказ № 4 от 21.09.2009 «О концепции информатизации Управления государственной архивной службы Самарской области до 2012 года» // Информационно-методический бюллетень ЦГА Самарской области. 2009. № 15. С. 6-25; Ивановская Е.В. Ведомственная целевая
140
Л.П. Афанасьева
программа «Развитие информационных систем и систем хранения в архивной отрасли Новосибирской области на 2011-2013 гг. // Новосибирский архивный вестник. 2010. № 32. С. 231-239; Маныкин В.А. Деятельность Главного архивного управления города Москвы по совершенствованию нормативно-правовой базы архивного дела в столице и внедрению автоматизированных архивных технологий 2004-2011 // Вестник архивиста. 2011. № 1. С. 3-16 и др. Варухина Т.А. Информационные технологии в создании научно-справочного аппарата и использовании архивных документов Национального архива Республики Карелия. (1995-2005 гг.): автореф. дис. ... канд. ист. наук. 05.25.02 / ИАИ РГГУ. М., 2006. 30 с.; Комарова О.М. Применение информационных технологий в работе коллегии Архивного отдела Пензенской области / О.М. Комарова, И.В. Усманова // Делопроизводство. 2006. № 4. С. 53-61; Баталин В.Н. Компьютеризация - опыт РГАКФД // Вестник архивиста. 2006. № 6 (96). С. 138-151. (К 80-летию РГАКФД); Савина Г.А. Информационные технологии в Архиве РАН: итоги и перспективы // Там же. 2006. № 6 (96). С. 255-261; Фофанова О.А. О внедрении в практику работы Областного государственного учреждения «Государственный архив Липецкой области» автоматизированных технологий // Липецкий вестник архивиста. Научно-информационный бюллетень. 2007. Вып. 1. С. 14-18; Старых Т.Н. Информатизация архивного дела в Орловской области / Т.Н. Старых, Л.В. Конюхова // Делопроизводство. 2008. № 1. С. 45-48; Одинецкий А.В. Передовые технологии: [о переходе к автоматизированным архивным технологиям архивных учреждений Томской области] // Информационно-методический бюллетень / АУ Томской области. 2008. № 21. С. 23-24; Кузин К.И. Информационные технологии в Государственном архиве Воронежской области: опыт и перспективы// Воронежский вестник архивиста. 2008. Вып. 6. С. 67-71; Киселев МЮ. Электронный научно-справочный аппарат к документам Архива Российской академии наук: этапы создания // Отечественные архивы. 2008. № 4. С. 42-46; Приютов А.В. Создание информационно-поисковой системы по фотодокументам РГВИА «Российская Императорская армия: модернизация, личный состав, быт (середина XIX - начало XX в.)» // Вестник архивиста. 2008. № 1. С. 58-64; Терехина Т.А. База данных «Генеалогия» в Историческом архиве Омской области// Отечественные архивы. 2010. № 6. С. 124-125; Ларичев А.А. Автоматизированные технологии в работе архива (на примере ГУСО «Центральный государственный архив Самарской области») / А.А. Ларичев, А.А. Мякотин // Делопроизводство. 2011. № 4. С. 46-594. Ларина В.Г. Система НСА государственных архивов как основа формирования общего архивно-информационного пространства // Отечественные архивы. 2002. № 3. С. 14; Киселев И.Н. Архивные информационные технологии на современном этапе // Отечественные архивы. 2008. № 4. С. 24-31; Савин В.А.
2
3
Электронный научно-справочный аппарат архивов.
141
Архивные электронные информационные ресурсы Российской Федерации: идентификация и классификация // Отечественные архивы. 2008. № 4. С. 3138; Ульяницкий К.Б. Единая архивно-информационная среда в контексте информатизации общества // Отечественные архивы. 2009. № 3. С. 31-37. Реализованы в виде БД «Путеводители по российским архивам» (http:// guides.rusarchives.ru), размещенной на портале «Архивы России», которая содержит структурированную информацию 60 путеводителей по федеральным и региональным архивам общим объемом 103 тыс. описаний фондов. Копылова О.Н., Котлова Т.Н., Луначарский Е.Л., Широкова В.Г. Делопроизводственные картотеки учреждений политического сыска России конца XIX - начала XX века, хранящиеся в ГАРФ. Опыт реконверсии // Вестник архивиста. 2005. № 1. С. 75-81.
Киселев И.Н., Волкова И.В., Нежданова ОЮ. Современное состояние и перспективы развития НСА к документам государственных архивов // Отечественные архивы. 2000. № 5. С. 12-24.
В докладе заместителя руководителя Росархива О.В. Наумова на VII заседании Совета по архивному делу при Федеральном архивном агентстве приведен пример такого интегрированного ресурса - межархивный проект «Документы советской эпохи», включающий в себя базы данных и оцифрованные документы федеральных архивов, а также академические документальные публикации, монографии (Наумов О.В. Информатизация архивного дела в РФ: Доклад на Совете по архивному делу 15.09. 2011. Казань // Отечественные архивы. 2011. № 5. С. 5).
Артизов А.Н. О внедрении ПК «Архивный фонд» (4 версия) - основы системы автоматизированного централизованного государственного учета документов Архивного фонда Российской Федерации: Выступление на расширенной коллегии 12 февраля 2009 г. // Вестник архивиста. 2009. № 2. С. 102-104. Кузин К.И. Информационные технологии в Государственном архиве Воронежской области: опыт и перспективы // Воронежский вестник архивиста. 2008. Вып. 6. С. 67-71.
Маныкин В.А. Деятельность Главного архивного управления города Москвы по совершенствованию нормативно-правовой базы архивного дела в столице и внедрению автоматизированных архивных технологий. 2004-2011 // Вестник архивиста. 2011. № 1. С. 3-16.
«Задача сегодняшнего дня - компьютеризация всех привычных архивных процессов»: Интервью С.В. Мироненко и О.Н. Копыловой к 90-летию Государственного архива Российской Федерации // Отечественные архивы. 2010. №. 5. С. 95.
Гринфельд П.А. Информатизация по-новому организует работу основных служб архива: Сотрудничество ЗАО «Альт-софт» с рядом крупнейших архивохранилищ // Отечественные архивы. 2011. № 3. С. 81-84.
4
5
6
7
8
9
10
11
12
142
Л.П. Афанасьева
Злобина Г.Г. Об информатизации системы научно-справочного аппарата РГАЛИ // Международная конференция «Программа ЮНЕСКО "Информация для всех. Всеобщий доступ к информации"»: Материалы конференции 23-25 июня 2004 г. СПб., 2004 // СИФ ОЦНТИ ВНИИДАД. № 1155-6. Информационный бюллетень Управления архивами Свердловской области. Екатеринбург, 2007. № 27. С. 68-75.
Информационно-методический бюллетень Управления архивами Свердловской области. Екатеринбург, 2008. № 31. С. 10-31.
Любимова И.А. Реализация ведомственной целевой программы «Информатизация управления архивным делом в Ямало-Ненецком АО на 2006-2008 гг.» // Информационный бюллетень научно-методического совета архивных учреждений Уральского федерального округа. Екатеринбург, 2007. № 1. С. 48-49. Информационный бюллетень научно-методического совета архивных учреждений Уральского федерального округа. Екатеринбург, 2007. № 2. С. 138-149. См., например: «Коллекция фотодокументов РГА НТД» - содержит изображения 3 тыс. фотографий (URL: http://rgantd.ru.); фотокаталог ЦГАКФФД СПб. содержит 12281 фотодокумент и 1734 персоналии (URL:http://www.photoarchive. spb.ru/photo/index); фотокаталоги ЦДНИ Удмуртской Республики; ГАПО; Государственный архив Новосибирской области - содержит изображения 1044 фотографий и аннотации к ним.
Роговая Л.А. Опыт Государственного архива РФ по созданию электронного архива СВАГ: доклад на международ. научн. конф. «Электронный документооборот и электронные архивы» // Материалы международных научно-практических конференций «Современное архивное наследие и национальные архивные фонды», «Электронный документооборот и электронные архивы» 21-22 мая 2012 г., Одесса / Евро-Азиатское регион. отделение МСА (Евразика). Киев, 2011. С. 115-120.
Андерсон К., Амианто Ю.Н., Наумов О.В. Электронная версия архива И.В. Сталина // Вестник архивиста. 2008. № 2. С. 134-139. Маныкин В.А. Указ. соч. // Вестник архивиста. 2011. № 1. С. 3-16.
22 Фролова Е.В. Электронный архив Тюменской области // Отечественные архивы. 2009. № 6. С. 43-46.
23 С легкой руки специалистов корпорации «ЭЛАР» этот процесс получил название «ретроконверсии» - сканирование описей, оптическое распознавание символов, проверка правильности распознавания, включение данных в массив поисковой БД, возможно, последующая публикация в Интернете.
24 В проектах, реализуемых корпорацией «ЭЛАР», при этом создается поисковая система «Электронный архив» (Назарова М.В. ЭЛАР готов выполнять самые сложные задачи // Отечественные архивы. 2008. № 4. С. 138).
25 Боброва Е.В. Архивный гипертекстовый справочник в Рунете: опыт и перспективы // Отечественные архивы. 2003. № 1. С. 16-24.
21