Н.Г. Суровцева
Электронный документ: к проблеме идентификации
В статье рассматривается развитие подходов к идентификации электронных документов и их классификации в сфере делопроизводства и архивного дела. Возможность передавать на постоянное хранение в архив документы, которые никогда не существовали на бумаге, заставляет по-новому идентифицировать отсканированные документы как электронные копии документов. Также в статье рассматриваются современные подходы к идентификации баз данных и веб-документов в качестве электронных документов в условиях их архивного хранения.
Ключевые слова: документ, электронный документ, классификация электронных документов, делопроизводство, архивное дело.
Вопросам изучения электронного документа посвящено значительное количество работ специалистов в области управления документами и архивного дела. Однако подавляющее большинство из них касаются практических аспектов функционирования электронных документов в системах электронного документооборота или вопросов оцифровки и последующего хранения и использования электронных копий документов на традиционных носителях в архивах.
По-прежнему остаются актуальными два вопроса: во-первых, какие именно документы должны быть отнесены к электронным, то есть сохраняется проблема идентификации электронного документа, и, во-вторых, какое определение следует дать электронному документу1. Последнее будет напрямую зависеть от решения первой проблемы.
Как известно, данный термин начал наиболее активно использоваться в России с конца 1990-х гг. Использовавшийся до этого времени термин «машиночитаемый документ» и прочие производные от него термины стали совершенно непригодны ввиду принципиального изменения технологии работы с документами, обеспеченной использованием персонального компьютера.
© Суровцева Н.Г., 2017
Компьютеры как средства вычисления, обработки и сохранения информации (ЭВМ) практически не повлияли на сложившиеся процессы документирования и организации работы с документами: результатом их внедрения стала унификация формы документа на бумажном носителе, обеспечивающая считывание информации средствами вычислительной техники. Только технологии, обеспечившие визуализацию документа человеком и возможности его передачи без потери содержания и внешнего вида с использованием персонального компьютера, позволили открыть новую страницу в автоматизации работы с документами, позволили создавать, передавать и хранить документ без использования бумажного носителя.
Итак, электронный документ самим своим появлением обязан созданию и использованию в управлении современных информационно-коммуникационных технологий и информационных систем, к каковым относится и система электронного документооборота (СЭД). Введение термина потребовало его определения, а следовательно, идентификации его сущности: что же такое электронный документ? Особый тип документа или всего лишь форма документа, документ на машинном носителе? Характеризуя сложившуюся ситуацию в решении данной проблемы еще в конце XX в., М.В. Ларин отмечал, что термин «электронный документ» возникает с появлением персонального компьютера как документ, обладающий новыми, отличными от традиционных, характеристиками, но соответствующего определения не появилось. Не было такого единого понятия и за рубежом2.
С нашей точки зрения, в этой фразе заключается вся сущность проблемы: попытки дать определение электронному документу через его характеристики, отличающие его от традиционного документа, неизбежно приводят исследователя в сферу информационных технологий, благодаря которой и возникает электронный документ. Например, М.П. Бобылева к числу характеристик, отличающих электронный документ от бумажного, отнесла требования к оформлению документа, время его транспортировки, возможности справочно-поисковой работы, удобство восприятия информации, возможность работать с несколькими документами одновременно и при этом выделять нужный фрагмент, возможность сделать копию документа, обеспечить сохранность и доступность документа, защиту информации и пр. Это позволило автору сделать вывод о наличии многоаспектных, системных различий бумажного и электронного документов и необходимости рассматривать электронные документы и электронный документооборот как качественно новое системное явление3. Все эти характеристики существенны, но главным образом именно
для электронного документооборота, поскольку являются особенностями технологии работы с документами, а не сущностными характеристиками электронного документа.
Учитывая неразрывную связь появления электронного документа с современными информационно-коммуникационными технологиями, наиболее распространенным является опыт изучения электронного документа через изучение особенностей технологии работы с электронными документами в СЭД, через изучение электронного документооборота. Так появился целый ряд определений, в которых нашли отражение особенности носителя и формальнологической структуры документа и пр. технологические характеристики, но все они оказались слабоприменимы для сферы управления документами4.
Между тем определение электронного документа, как мы уже говорили, напрямую будет зависеть от того, какие информационные объекты будут называться этим термином. Таким образом, одной из важнейших проблем на пути становления теоретических подходов к изучению электронного документа является проблема типологии или, по крайней мере, систематизации и классификации электронных документов. Примечательно, что актуальность данной проблемы четко осознавалась исследователями и специалистами в области делопроизводства и архивного дела еще в конце XX в. Неслучайно при определении программы перспективных научных исследований на период с 2001 по 2010 г., подготовленной ВНИИДАД в 1999 г., была предусмотрена тема «Типология электронных документов»5. Несмотря на то что появление понятия «электронный документ» связано с возникшей потребностью в термине, позволяющем определить документы, проходящие все стадии своего жизненного цикла - от создания до уничтожения или передачи на вечное архивное хранение - в электронном виде6, очевидно, что данный термин использовался (и используется до сих пор) для обозначения не только таких информационных объектов, но и для копий документов на традиционных носителях, отсканированных или оцифрованных и переведенных в электронный вид.
Первыми обратились к вопросам классификации электронных документов архивисты. На рубеже ХХ-ХХ1 вв. появился целый ряд работ, в которых были предложены классификационные схемы для электронных документов архива или рассматривались особенности работы с отдельными видами электронных документов в архиве7. Немного позже к этому вопросу подключились и специалисты в области управления документами, рассматривая особенности управления различными видами электронных докумен-тов8. Первым обобщающим теоретическим трудом, позволяющим
рассмотреть различные вопросы работы с электронным документом на протяжении его жизненного цикла, стала вышедшая в 2005 г. работа Ларина М.В. и Рыскова О.Н. «Электронные документы в управлении». Анализ использования термина «электронный документ» в зарубежной и российской практике позволил авторам отнести к электронным документам следующие категории информационных объектов:
- собственно электронные документы, жизненный цикл которых протекает только в электронной среде;
- электронные (цифровые) копии документов на бумажной основе и других носителях информации;
- базы данных (реестры, списки, кадастры и др.);
- веб-документы9.
Следует отметить, что основой построения этих классификаций, отнесения того или иного информационного объекта к электронному документу во многом было изучение зарубежного опыта, рекомендаций Международного совета архивов по работе с электронными документами. В сферу управления документами многими нормативными актами зарубежных стран предлагалось включать управление сообщениями электронной почты, базами данных, в которые трансформировались реестры, картотеки и книги записей на бумажных носителях, что говорит о необходимости сохранения информации различных сайтов и информации в социальных сетях.
Кроме того, идентификация в качестве электронных документов вышеуказанных информационных объектов соответствует принятому в российском документоведении понятию «документ» как информации, зафиксированной на носителе с реквизитами позволяющими ее идентифицировать, а также понятию «архивный документ».
Таким образом, в России на основе изучения международного опыта в начале нашего столетия была сформирована непротиворечивая для сферы делопроизводства и архивного дела классификация электронных документов, к числу которых могли быть отнесены не только те документы, весь жизненный цикл которых протекает в электронной среде, но и электронные копии документов на традиционных носителях, базы данных, которые можно рассматривать как сложный электронный документ в случае их преобразования в совокупность файлов, и, к примеру, веб-сайты организаций - источников комплектования. Такие подходы к классификации электронных документов сохранялись до настоящего времени10. Однако принятие новых нормативных документов в сфере организации работы с документами потребовало более четкого выделения группы электронных документов из состава вышеперечисленных информационных объектов.
Ранее и в делопроизводстве, и в архиве специалисты работали не столько с документами, весь жизненный цикл которых проходит в электронной среде, сколько с отсканированными или оцифрованными копиями документов11. При этом и документоведы, и архивисты создавали такие электронные документы (электронные копии документов) в своей информационной системе и самостоятельно решали проблемы их дальнейшего хранения и функционирования.
Исключение составляют аудиовизуальные документы, создание, передача и хранение которых на цифровых носителях не вызывает столько проблем, поскольку они не имеют связи с информационной системой (как текстовые и графические документы), и для них фактически произошла просто смена типа носителя, а также научно-техническая документация, специфику которой мы не рассматриваем в данной статье.
Подход, позволяющий отнести электронную копию документа к электронным документам, был актуален и на первых этапах развития автоматизированных систем электронного документооборота, когда в подавляющем большинстве случаев на протяжении жизненного цикла документ из электронной среды перетекал на бумагу в момент его подписания, и наоборот. Если бы мы не считали электронные копии бумажных документов электронными документами, у нас были бы системы электронного документооборота без электронных документов. При этом текстовые управленческие документы продолжали поступать на хранение в государственные и муниципальные архивы на бумажных носителях.
Подобная практика смешанного жизненного цикла документа сохраняется и сегодня. Однако, возможно, мы оказались готовы, по крайней мере на уровне государственного управления, к реализации такой модели электронного документооборота, которая позволяет полностью отказаться от бумажного документа. Этому способствовали и развитие современной нормативной правовой базы в сфере электронного документооборота, и качество информационной инфраструктуры, и уровень функциональных возможностей современных СЭД.
С принятием изменений к Правилам делопроизводства в федеральных органах исполнительной власти12 в делопроизводстве выделены два объекта, включаемых в СЭД: электронный документ и электронная копия документа. При этом термин «электронный документ» оказался жестко связан с безбумажной технологией создания документа в информационной системе и наличием электронной подписи. В том же аспекте понимается электронный документ (текстовый) и в принятых в 2015 г. Правилах работы архивов организаций,
передача которого на хранение должна осуществляться в формате контейнера, в состав которого включены контент и метаданные электронного документа, файлы электронных подписей и визуализированная копия текстового электронного документа в формате PDF/A13.
В этом случае на архивное хранение будут передаваться текстовые управленческие электронные документы, которых нет на бумаге и которые ранее передавались в архив только на бумаге. В связи с этим и для архивистов сегодня уточнение термина «электронный документ» становится актуальным.
В сложившейся ситуации было бы, на наш взгляд, целесообразным в отношении текстовых управленческих документов использовать термин «электронный документ» только применительно к документам, весь жизненный цикл которых протекает в электронной среде, а в отношении отсканированных или оцифрованных копий документов на традиционных носителях использовать термин «электронная копия документа», как это закреплено Правилами делопроизводства. В противном случае нам каждый раз придется уточнять, о каких именно электронных документах идет речь: изначально созданных в качестве электронного документа или отсканированных (оцифрованных), поскольку технологии работы с ними будут иметь некоторые различия14.
Несколько слов следует сказать о других группах информационных объектов, которые выше были нами отнесены к электронным документам.
Как мы помним, к электронным документам предположительно были отнесены и базы данных. Причинами, обусловившими возможность такой идентификации, являются, на наш взгляд, два фактора. Во-первых, базы данных «выросли» из списков, реестров, картотек и пр., которые ранее велись на бумажном носителе и признавались документами. Надо сказать, что это признание было вполне обоснованным, несмотря на то что такие документы постоянно дополнялись новыми записями. Поскольку создание таких документов носило дискретный, то есть разделенный, прерывистый характер, в данный конкретный момент времени они обладали всеми признаками документа: достоверностью, целостностью, аутентичностью и пригодностью для использования.
Во-вторых, хранение документированной информации на машинных носителях началось именно с хранения машиночитаемых данных, часто числовых, статистических. Их передача на долговременное хранение осуществлялась вместе с соответствующим аппаратно-программным обеспечением. То есть речь шла о передаче баз данных в полном смысле этого слова с соответствующей СУБД. Такая технология еще в прошлом веке была признана неэффективной. В результате была
принята технология хранения данных в отрыве от СУБД без всяких структурных и логических отношений, как комплекс файлов15.
Таким образом, хранение базы данных целесообразно рассматривать как хранение комплекса документов, состав которых во многом определяется списком формируемых отчетов, а создание такого комплекса документов возможно на любой интересующий момент времени. Но в этом случае речь будет идти уже о хранении не базы данных, а комплекса отдельных документов (копий), которые могут быть созданы и на бумажном носителе, и как электронные документы.
Теперь обратимся к так называемым веб-документам, к числу которых относятся документы, размещенные на страницах сайтов в сети Интернет. С нашей точки зрения, для сферы оперативного управления документами или делопроизводства управление документами официального сайта организации вообще не является актуальной проблемой, поскольку вся представленная на нем информация будет отражена в документах организации, а управление сайтом является функцией организации. На сайт информация будет переноситься из какого-либо документа. Официальный сайт - это виртуальный информационный стенд, максимально приближенный к потребителю и содержащий информацию справочного характера, которая должна постоянно актуализироваться.
Проблема сохранения информации с сайтов, представленных в сети Интернет, была поднята международным архивным и библиотечным сообществами на рубеже ХХ-ХХ1 вв.16 Практическое ее решение теми и другими осуществлялось разными путями, обусловленными разницей подходов к комплектованию архивов и библиотек. Для архивиста приемы и методы сохранения «виртуальной реальности» не должны сломать «принципы организации архивного дела, утвержденные вековым опытом и традици-ей»17. Одним из основных таких принципов является проведение экспертизы ценности при отборе документов на архивное хране-ни, в то время как основой комплектования библиотек является поступление обязательного экземпляра документа. Эта разница имеет решающее значение для развития данного направления в библиотеках и архивах.
Значительный опыт отбора на хранение информации сайтов был накоплен в начале нашего столетия Центральным архивом документов на электронных носителях г. Москвы (ЦАДЭНМ). Очень показательным, на наш взгляд, опытом хранения информации веб-сайтов является формирование и описание коллекции интернет-документов «Захват заложников в Москве в Театральном центре на Дубровке 23-26 октября 2002 г.»18. Целью этой
работы были отбор, сохранение и описание комплекса документов, опубликованных в Интернете по теме. Были намечены сайты, виды и тематика документов для коллекции, основные принципы систематизации, создана рабочая группа из 2-х человек - работников архива, «которые поочередно в течение всего рабочего дня формировали коллекцию». При этом при скачивании документов с форума, например, сразу проводилось редактирование текста (удаление нецензурных выражений, ненормативной лексики). Параллельно велась работа по разработке процедур сохранения и описания. Авторы подробно описывают те трудности, с которыми они столкнулись, применяя к веб-сайтам традиционные подходы к систематизации документов, которые им в полной мере так и не удалось реализовать, а также все технические проблемы, связанные с миграцией с носителя на носитель. Таким образом, становится очевидным, что речь идет не о коллекции веб-документов, а о создании нового информационного продукта на основе информации сайтов сети Интернет. В результате этой работы был создан новый авторский информационный ресурс.
Отбор сайтов очень напоминает выполнение тематического запроса, подготовка которого при отсутствии конкретного пользователя или целевой аудитории является очень сложным, затратным и, главное, в большой степени субъективным процессом. А для исследователя важна полнота информации, ведь на сайте, не соответствующем критериям внешних особенностей (стандарт web-дизайна, стилевое единство, качество изображения и пр.)19, может оказаться необходимая информация.
Совершенно иначе складывается ситуация в системе библиотечных информационных ресурсов. Национальные библиотеки многих стран с помощью специального программного обеспечения собирают информацию всех сайтов, имеющих в составе URL-адреса национальный домен (для России - .ru или .рф). Участие в этой деятельности национальных архивов обусловлено их включением в структуру государственной системы информационных ресурсов и характерно в большей степени для англоязычных стран, где интеграция архивной и библиотечной сферы значительно больше, чем в Российской Федерации.
Веб-архивирование в такой форме на государственном уровне осуществляется в рамках ответственности за сохранение обязательного экземпляра документа20. При этом используются разные стратегии сбора информации (харвестинга):
- массовый сбор (Bulk Harvesting);
- выборочный сбор (Selective Harvesting);
- сбор информации о событии (Event Harvesting)21.
Важно отметить, что это стратегии отбора материалов, а не формирования специальных информационных ресурсов. Выборочный сбор применяется по отношению к динамичным сайтам с часто меняющейся информацией; когда массовый сбор провести невозможно, он осуществляется с частыми промежутками. А сбор информации о событиях осуществляется применительно к сайтам, которые предположительно исчезнут, как только закончится событие. Результатом такого сбора является совокупность файлов, как текстовых, так и графических, являющихся статическим представлением интернет-страниц, как правило, только первого и второго уровня. После их систематизации и обработки (описания) они могут быть предоставлены пользователям. Таким образом, формируется новый информационный ресурс.
В Российской Федерации данные технологии практически еще не получили развития22 и только начинают использоваться. Возможность и, главное, целесообразность их применения в архиве является отдельной темой и не может быть рассмотрена в рамках данной статьи. Для нас важно, что веб-документ (интернет-сайт) при хранении опять приобретает дискретный вид и становится комплексом файлов, то есть отдельных электронных документов (копий), причем документов в самом широком понимании, как документированной информации, которая если и попадет в архив, то не из системы оперативного управления документами.
Таким образом, сегодня нам не удается выстроить непротиворечивую единую для делопроизводства и архивного дела классификацию электронных документов. В делопроизводстве это юридически значимые документы, изначально созданные в электронном виде, в архиве - это документированная информация в цифровой среде, которая в конечном счете тоже может быть сведена к трем группам: документ, изначально созданный в электронном виде, копия электронного документа или электронная копия документа на традиционном носителе. Вместе с тем в условиях единого жизненного цикла электронного документа в делопроизводстве и в архиве существует необходимость однозначной его идентификации как документа, весь жизненный цикл которого от создания до хранения в государственном (муниципальном) архиве протекает в электронной среде.
Примечания
1 Ларин М.В. Проблемы архивного хранения цифровых документов в интересах гражданина, общества, государства // Сохранение электронной информации в информационном обществе: Сб. материалов междунар. конф. (Москва, 3-5 октября, 2011 г.). М.: МЦБС, 2012. С. 166.
2 Ларин М.В. Некоторые проблемы эволюции управленческого документа // Вестник архивиста. 1999. № 6. С. 43.
3 Бобътева М.П. Управленческий документооборот: от бумажного к электронному. М.: Изд. дом МЭИ, 2010. С. 21-32.
4 Янковая В.Ф. Электронный документ как объект документоведения // Вестник Волгогр. гос. ун-та. Сер. 2: Языкознание. 2013. № 3 (19). С. 229-235.
5 Электронные документы: Программа научных исследований (2001-2010 гг.) / Росархив, ВНИИДАД; рук. темы М.В. Ларин. М., 2000. 35 с. Деп. в ОЦНТИ по документоведению и архивному делу № 10595.
6 Документоведение: Учеб. для студентов учреждений высшего образования / М.В. Ларин, Е.А. Плешкевич, В.Ф. Янковая и др.; Под ред. М.В. Ларина. М.: Академия, 2016. С. 50-51.
7 Залаев Г.З. Анализ и классификация электронных документов // Вестник архивиста 1999. № 2-3. С. 62-65; Он же. Проблемы классификации электронных документов // Электронные документы и архивы: Теория и практика: Материалы конф. (г. Москва. 8-9 апр. 1999 г.). М., 1999. С. 1-4; Он же. Некоторые вопросы создания электронных архивов // Архивоведение и источниковедение отечественной истории: Проблемы взаимодействия на современном этапе: Тезисы докл. и выст. на третьей Всероссийской конф. 25-26 февр. 1999 г. М.: Научная книга, 1999. С. 258-261; Тихонов В.И. Сущностные характеристики, состав и классификация электронных документов // Документация в информационном обществе: Электронное делопроизводство и электронный архив: Докл. и сообщ. на VI Междунар. науч.-практ. конф. 24-25 ноября 1999 г. М., 2000. С. 214-218; Юшин И.Ф. Документирование виртуальной реальности и взгляд на этот процесс с точки зрения источниковеда // Архивоведение и источниковедение отечественной истории... С. 236-241.
8 Сокова А.Н. Электронный документ и электронный архив // Делопроизводство. 1999. № 1. С. 6-10; Кулешов С.Г. О понятии «электронный документ» // Документация в информационном обществе: электронное делопроизводство и электронный архив: Докл. и сообщ. на VI Междунар. науч.-практ. конф. С. 54-57; Рысков О.И. Базы данных как особая группа электронных документов организаций и важнейший информационный ресурс страны // Делопроизводство. 2004. № 2. С. 40-43; Еремченко В.А. О проблеме электронных документов // Секретарское дело. 2001. № 3. С. 31-33; и др.
9 Ларин М.В, Рысков О.И. Электронные документы в управлении: Метод. пособие. М.: ИПО «У Никитских ворот», 2008. С. 72-73.
10 Ларин М.В. Электронные документы: Вопросы теории и практики // Вестник РГГУ. Серия: Документоведение и архивоведение. Информатика. Защита информации и информационная безопасность. 2015. № 2. С. 54.
11 Исключение составляли аудиовизуальные и научно-технические документы.
12 Постановление правительства Российской Федерации от 26 апреля 2016 г. № 356 «О внесении изменений в Правила делопроизводства в федеральных органах исполнительной власти».
13 Правила организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в органах государственной власти, органах местного самоуправления и организациях, утв. Приказом Министерства культуры РФ от 31 марта 2015 г. № 526 (зарегистрирован Минюстом России 7 сентября 2015 г., рег. № 38830), п. 4.34.
14 Данное положение нецелесообразно распространять на аудиовизуальные документы, поступающие сегодня на хранение в государственные архивы на физически обособленных носителях, поскольку почти все они будут являться копиями.
15 См. об этом: Тихонов В.И., Юшин И.Ф. Электронные документы и архивы: Международный опыт и российская действительность: Аналит. записка // Электронные документы и архивы: Теория и практика. С. 33-86.
16 См.: Афанасьева Л.П. Проблемы экспертизы ценности Интернет-ресурсов на примере сайтов // Вестник архивиста. 2005. № 4. С. 118-119; Рысков О.И. Управление веб-документами // Делопроизводство. 2004. № 7. С. 41-44.
17 Юшин И.Ф. Документирование виртуальной реальности... С. 237.
18 Из опыта формирования и описания коллекции интернет-документов «Захват заложников в Москве в Театральном центре на Дубровке 23-26 октября 2002 г.» / ЦАДЭНМ. М., 2004. 16 с. СИФ ОЦНТИ ВНИИДАД № 11601.
19 Афанасьева Л.П. Указ. соч. С. 127.
20 Ряд российских архивов аудиовизуальных документов несет ответственность за хранение документов по Федеральному закону от 29.12.1994 г. № 77 «Об обязательном экземпляре документа».
21 Якобсен Г. Веб-архивирование в Дании // Международная конференция (Москва, 3-5 октября, 2011 г.) М.: МЦБС, 2012. С. 112-113.
22 Кий М.И. Веб-архивирование: Современное состояние и перспективы развития в России // Научно-техническая информация. Серия 1: Организация и методика информационной работы. 2014. № 10. С. 9-1.