5.6.5. ИСТОРИОГРАФИЯ, ИСТОЧНИКОВЕДЕНИЕ,
МЕТОДЫ ИСТОРИЧЕСКОГО ИССЛЕДОВАНИЯ (ИСТОРИЧЕСКИЕ НАУКИ) HISTORIOGRAPHY, SOURCE STUDIES, AND METHODS OF HISTORICAL RESEARCH
УДК 930:004 ГРНТИ 03.81.37 EDN: EHMFCI
DOI: 10.33693/2658-4654-2024-6-3-21 -28
Электронные исторические источники: определение, классификация, физическая сущность, специфические характеристики
©Юмашева Юлия Юрьевна
ООО «ДИМИ-ЦЕНТР», г. Москва, Российская Федерация e-mail: [email protected], [email protected]
Аннотация. В статье рассматриваются проблемы, связанные с современным состоянием методологии источниковедения, ее развитием в контексте информационной эпохи. Автор сосредотачивает свое внимание на анализе созданной за последние 70 лет историографии изучения электронных документов, электронных файлов и иных видов и разновидностей цифровой информации, объединяемой термином «электронные исторические источники» (ЭИИ). При этом в рамках исследования рассматриваются как изначально цифровые (born-digital), так и преобразованные и смешанные электронные исторические источники, составляющие современную источниковую базу большинства исторических и источниковедческих исследований. В статье формулируется определение понятия «электронные исторические источники»; определяется их место в источниковедческих классификациях (ЭИИ позиционируются как самостоятельный тип исторических источников); описываются их общие физические характеристики и специфические отличительные черты, требующие разработки новых методов и методик научной критики источников данного типа, а также расширения исследовательских навыков и инструментария за счет широкого использования информационных технологий. Автор анализирует опыт документоведения и архивоведения — близких источниковедению дисциплин, которые первыми столкнулись с электронными документами и файлами и к настоящему времени уже выработали определенные подходы и методы работы с данными объектами. Опираясь на результаты изучения обширной отечественной и зарубежной историографии, автор приходит к выводу о необходимости интеграции в современное источниковедение методов и методик упомянутых дисциплин с целью обогащения инструментария источниковедческой критики и ее адаптации к условиям и специфике информационной эпохи и новым типам и видам исторических источников.
Ключевые слова: источниковедение, электронные исторические источники, классификация исторических источников, подлинник, аутентичность, целостность, метаданные, носители информации, программное обеспечение, форматы файлов.
ДЛЯ ЦИТИРОВАНИЯ: Юмашева Ю. Ю. Электронные исторические источники: определение, классификация, физическая сущность, специфические характеристики//История и современное мировоззрение. 2024. Т. 6. № 3. С. 21-28. DOI: 10.33693/2658-4654-2024-6-3-21-28. EDN: EHMFCI
V_/
DOI: 10.33693/2658-4654-2024-6-3-21 -28
Electronic Historical Sources: Definition, Classification, Physical Essence, Specific Characteristics
©Julia Yu. Yumasheva
DIMI-CENTER, LLC, Moscow, Russian Federation e-mail: [email protected], [email protected]
Abstract.The article discusses the problems related to the current state of the methodology of source studies, its development in the context of the information age. The author focuses on the analysis of the historiography created over the past 70 years for the study of electronic documents, electronic files and other types and varieties of digital information, combined by the term «electronic historical sources» (Ell). At the same time, the research examines both initially digital (born-digital) and transformed and mixed electronic historical sources that make up the modern source base of most historical and source studies. The article formulates the definition of the concept of «electronic historical sources»; their place in source classifications is determined (Ell are positioned as an independent type of historical sources); their general physical characteristics and specific distinguishing features are described, reguiring the development of new methods and technigues for scientific criticism of sources of this type, as well as the expansion of research skills and tools through the widespread use of information technology. The author analyzes the experience of document management and archival science, disciplines close to source studies, which were the first to encounter electronic documents and files and have already developed certain approaches and methods of working with these objects. Based on the results of studying extensive domestic and foreign historiography, the author comes to the conclusion that it is necessary to integrate the methods and technigues of these disciplines into modern source studies in order to enrich the tools of source criticism and its adaptation to the conditions and specifics of the information age and new types and types of historical sources.
Key words: source studies, electronic historical sources, classification of historical sources, original, authenticity, integrity, metadata, hardware, software, file formats.
c " - - ---
FOR CITATION: Yumasheva J. Yu. Electronic Historical Sources: Definition, Classification, Physical Essence, Specific Characteristics //HISTORY AND MODERN PERSPECTIVES. 2024. Vol. 6. № 3. P. 21-28. (in Russ.)
DOI: 10.33693/2658-4654-2024-6-3-21-28. EDN: EHMFCI
^_■_)
ВВЕДЕНИЕ
Компьютерная революция, развернувшаяся во второй половине XX в. и переросшая в «цифровой поворот» рубежа тысячелетий, в определенном смысле застала историков и источниковедов врасплох. Появление новых типов и видов источников, перевод содержания традиционных (аналоговых) источников в цифровой вид, создание метаисточников и электронных копий, сложных по составу компонентов и примененных технологий информационных ресурсов (мультимедиа, ин-тернет/интранет, продуктов, созданных с помощью Cognitive Science1), катастрофическое нарастание объемов цифровой и оцифрованной информации и возможность бесконтрольной изменяемости электронных объектов без наличия механизмов верификации содержания — все это представляет непреодолимые проблемы для классического источниковедения.
Однако перечисленные процессы, ускорившиеся во времени, логичны, естественны и в полной мере отражают эволюцию исторических источников, характерной чертой которой является не столько исчезновение тех или иных видов
1 Cognitive Science (когнитивистика) в рамках настоящей статьи — подраздел Data Science (науки о данных) как части информатики, изучающий возможности создания программных средств, имитирующих интеллектуальные возможности человека. Наиболее известным примером Cognitive Science являются методы и алгоритмы искусственного интеллекта (ИИ; Artificial intelligence, Al).
источников, сколько «появление новых их видов и разновидностей, что обусловлено усложнением по мере исторического прогресса общественной жизни, появлением все новых и новых общественных функций»2.
К сожалению, большинство историков сознательно избегают необходимости обсуждения проблем методологического характера3, теории источниковедения и историографии, осмысления происходящих процессов, сосредотачиваясь либо на создании масштабных информационных ресурсов, либо на разработке методов анализа электронного контента, оставляя за границами своего внимания теоретические и практические проблемы, связанные со спецификой источников, существующих в электронной среде, хотя давно известно, что «источниковедческая подготовленность историка становится одним из главных критериев в оценке его профессионализма и гарантией верности его научных выводов»4.
2 Ковальченко И. Д. Методы исторического исследования. М.: Наука. 2003. С. 137.
' И. Д. Ковальченко. Научные труды, письма, воспоминания (из личного архива академика): Сборник материалов / Составление, подготовка текста и примечания Т. В. Ковальченко,Т. А. Кругловой, А.Е. Шикло. М.: РОССПЭН. 2004. С. 427; Источниковедение новейшей истории России: теория, методология, практика / Под общ. ред. А. К. Соколова. М.: РОССПЭН. 2004. С. 50.
4 Владимиров В. Н., Цыб С. В. Источниковедение в век компьютера (вместо предисловия) // в кн.: Источник. Метод. Компьютер: сб. науч. тр. Барнаул. 1996. С. 5.
ПОСТАНОВКА ПРОБЛЕМЫ
В этой статье автор ставит вопросы, относящиеся к тем изменениям, которые должно претерпеть источниковедение, развивающееся в условиях глобального цифрового общества и изменений источниковой базы, и пригласить специалистов к дискуссии о будущем источниковедения как научной дисциплины, основными направлениями которой, как отмечал еще в конце 1970-х гг. ИД. Ковальчен-ко, являются «разработка общих теоретико-методологиче-ских проблем» и «развитие исторически-типологического источниковедения», а «главной практической задачей — повышение информативной отдачи источников»5.
Рассмотрение этих проблем целесообразно начать с выяснения природы электронных исторических источников (далее — ЭИИ), формулирования их определения и разработки классификации.
Постановка этих вопросов не нова. Впервые они были сформулированы в конце 1960-х — начале 1970-е гг., когда отечественные историки столкнулись с необходимостью освоения новых — машиночитаемых — источников. В то время «был поставлен вопрос о необходимости разработки методики использования «больших комплексов документов, создающихся в результате внедрения АСУ»6, при этом подчеркивалось, что ученый, изучающий новейшие этапы истории СССР, обязан «...уметь обращаться с техническими носителями информации», в противном случае ему будет «...все труднее работать с первоисточником, что всегда было прерогативой профессии историка»7.
За последующие полвека эти вопросы поднимались неоднократно, однако, к сожалению, так не получили общепринятых решений8.
В архивоведении и источниковедении, во многом совпадающих в части внешней критики объектов хранения/ изучения дисциплинах, до настоящего времени не сформировалось единого представления и определения электронного архивного документа/электронного исторического источника, и в различных работах в качестве синонима ЭИИ на равных основаниях используются разные термины: «машиночитаемый документ», «электронный документ», «электронная копия», «метаисточник», «файл», «информационный ресурс» и т. п., заимствованные из информатики и из сопредельных дисциплин исторического профиля и определяющие разные объекты.
Между тем, очевидно, что главной характеристикой ЭИИ является то, что они существуют только в электронной среде, т. е. их возникновение, бытование и использование невозможно без применения специализированных технических средств и фиксации информации на специализированных носителях.
5 Ковальченко И. Д. Методы исторического исследования. М.: Наука. 2003. С. 119-120.
6 Ковальченко И. Д., Дробижев В.З., Воронкова С. В. Научная организация массовой документации и ее использование в интересах исторической науки // Материалы Всесоюз. науч. конф. «Архивы СССР». М.: Наука. 1979. ч. 1. С. 51.
7 Дробижев В.З., Мошков Ю. А. Предисловие// в кн.: Массовые источники по социально-экономической истории советского общества. Отв. ред. чл.-кор. АН СССР И. Д. Ковальченко. М.: Изд-во МГУ. 1979. С. 5-6.
3 Залаев Г.З. Анализ и классификация электронных документов // Вестник
архивиста 1999. N° 2-3. С. 62-65; Злобин Е.В. Машиночитаемые документы как исторический источник. М.: Военный ун-т Мин-ва обороны РФ. 1999. 168 е.; Боровкова О.В. Электронный исторический источник: проблемы и возможности // Исторические, философские, политические и юридические науки, культурология и искусствоведение. Вопросы теории и практики. Тамбов: Грамота. 2014. N2 9 (47): в 2-х ч. Ч. I. С. 26-28.
КЛАССИФИКАЦИЯ
Дальнейшее рассмотрение характеристик и ответ на вопрос о сущности ЭИИ будет:
а) хронологически детерминирован и определяем разными этапами:
а.1) эволюции самого объекта: от «машинно-ориентированных» документов (источников), при создании которых машине отводилась подчиненная роль инструмента фиксации информации, до современных «электронных», «цифровых» документов, файлов, баз данных/наборов данных, информационных ресурсов, при создании которых применяются технологии блокчейн или методы Cognitive Science, а в качестве «создателя» выступает компьютер:
а.2.) эволюции носителей и способов передачи информации: от традиционного «бумажного» (перфокарты, перфоленты, листинги) до специализированных систем хранения информации (в том числе облачных): от физически обособленного носителя до передачи информации только в цифровой среде непрерывным и инкрементальным образом (без передачи конкретного носителя):
б) спецификой предметной области, существующей в трех сопредельных дисциплинах: для документоведов ЭИИ (электронный документ) — это, прежде всего, юридически значимая управленческая (делопроизводственная) документация, возникающая в процессе документацион-ного обеспечения управления. Для архивистов, сотрудников музеев и библиотек — все типы и виды электронной информации, которая может быть передана на хранение и сохранена (электронный файл или совокупность файлов). Для источниковедов и историков — любой электронный носитель с электронной исторической информацией, независимо от того, является ли он юридически значимым электронным документом или существует в иной электронной форме. Таким образом, понятие «электронного источника» значительно шире, чем понятия «электронного документа» или «электронного файла».
Учитывая вышесказанное, автор предлагает следующее определение ЭИИ: «электронный (цифровой) исторический источник — материальный носитель исторической информации, возникшей и существующей в электронной (цифровой) среде, как продукт определенных общественных отношений и непосредственно отражающий ту или иную сторону человеческой деятельности».
Опираясь на это определение, можно предложить источниковедческую классификацию электронных исторических источников9, в основу которой положены три критерия:
1.1. способ кодирования информации (фиксирования социальной информации) — цифровой — как основной признак выделения электронных источников в качестве самостоятельного класса источников (синтаксический аспект информации, предложенный И. Д. Ковальченко, выделявшим четыре типа источников: вещественные, изобразительные, письменные и фонические). Нетрудно заметить, что в рамках этого подхода «цифровые» источники уместны и объяснимы и могут стать пятым типом исторических источников:
1.2. отношение ЭИИ к объектам реального мира — в качестве выделения «групп» ЭИИ внутри «типа»:
1.3. способ представления ЭИИ на воспроизводящих устройствах, адаптированных к человеческому восприятию
9 Юмашева Ю. Ю. Актуальные проблемы источниковедения информационной эпохи // Документ. Архив. История. Современность: Сб. науч. тр. / Гл. ред. Л.Н. Мазур. Вып. 23. Екатеринбург: Уральский фед. ун-т им. первого Президента России Б. Н. Ельцина. 2023. С. 109-140.
и определяющий их соотнесение с привычными типами источников реального мира («виды»).
Предложенная классификация охватывает все известные на сегодняшний день разновидности ЭИИ на всем протяжении их существования (примерно с середины 1940-х гг.). а ее базовыми особенностями являются определение ЭИИ как самостоятельного типа исторических источников, а также подразделение всех известных ЭИИ на три группы, для каждой из которых выявлена характерная черта.
Так, в группу изначально цифровых (born-digital) включены ЭИИ, не имеющие аналогов в традиционной (аналоговой) форме:
в группу преобразованные — ЭИИ, представляющие преобразованную в электронный вид информацию традиционных источников:
в группу смешанных — ЭИИ, состоящие из изначально цифровых источников и преобразованных источников.
Анализируя физическую сущность ЭИИ, следует отметить, что она определяется тремя аспектами: носителями информации, программными средствами и форматами.
Главный аспект — носители информации могут быть физически обособленными или сетевыми. Первые бывают традиционными (например — бумажные носители: перфокарты, перфоленты, листинги и т. п.) или электронными (ленты, диски, дискеты, сервера, системы хранения данных и т. п.10): вторые — только электронными (серверы, системы хранения данных, облачные хранилища11 т. п.), подключенными к локальным, региональным или глобальным информацион-но-коммуникационным сетям, как средствам обмена информации при комплектовании и обеспечении доступа и т. п.
Любой носитель электронной информации является материальным, однако специфика информационных технологий и электронных источников, в частности быстрое развитие техники и технологий и смена технологических платформ, не позволяют навечно связывать информацию с конкретным носителем — материальным объектом, что выражается в процессах миграции информации на новые носители.
Реализация процедур миграции информации без сохранения оригинального носителя чрезвычайно затрудняет идентификацию электронного источника как физического объекта12.
Второй аспект, характеризующий сущность ЭИИ, — программное обеспечение, с помощью которого они созданы. Следует отметить, что программные средства играют ключевую роль на всех этапах жизненного цикла ЭИИ, поскольку от них зависит процессы создания, представления и их функционирования в оперативной деятельности, а также возможность обеспечения их сохранности и использования во времени.
Носители электронной информации, программные и аппаратные средства создания и воспроизведения ЭИИ в глобальном информационном мире не утратили своего значения в качестве основных источников получения информации о датировке, авторстве, обстоятельствах создания и подлинности электронных исторических источников (т. е. проведения внешней критики).
Как показывает зарубежный опыт, максимально долгое сохранение оригинальных носителей и аппаратно-программных средств, использованных для создания и обеспечения функционирования ЭИИ в активной фазе, рассматривается
111 Залаев Г.З. Носители для архивного хранения электронных документов: состояние и перспективы //Самарский архивист. 2019. N9 4. С. 5-9.
11 Сабенникова И. В. Облачные сервисы хранения цифровых документов: законодательная база и существующие риски // История и архивы. 2022. №2. С. 73-82.
12 Сабенникова И. В. Электронные документы в системе информацион-
ного обмена архивов // Вестник архивиста. 2021. N9 2. С. 520-531.
как важнейшая задача архивов по обеспечению цифровой непрерывности, целостности и подлинности (аутентичности) архивных ЭИИ (т. н. «цифровой сохранности»), которая является основой для их использования в качестве исторических источников, однако практическая реализация подобного подхода требует огромных усилий и затрат.
Третий аспект, который тесно связан с возможностью использования ЭИИ, — формат файлов, обеспечивающий возможность представления электронной информации на экране монитора в «человековоспринимаемом» виде, т. е. в привычной для человека форме текста/цифры, статичного или динамического изображения, звука или комбинации этих сред (мультимедиа). Значение этого аспекта с точки зрения источниковедческой критики переоценить сложно, поскольку формат файлов позволяет исследователям с большей или меньшей точностью определять время создания документа13.
К сожалению, неизбежные процессы конвертации файлов из устаревающих форматов в новые14 не дают возможности использования этих сведений в полном объеме. Практика хранения электронных источников, выработанная многими фондодержателями, предполагает постоянное обсуждение проблемы жизнестойкости форматов и развивается в двух направлениях.
Первое заключается в определении приоритетов и планов действий по сохранению файлов различных форматов. Второе направление предполагает регулярную публикацию перечней устаревающих форматов и списка критериев для определения устаревания форматов, а также списков рекомендуемых форматов файлов, предназначенных для долгосрочного хранения с целью проведения своевременных конвертаций.
Основная цель этих разработок — максимально долгое сохранение исходного формата, носителя и программного обеспечения (или хотя бы информации о них), с помощью которого создан электронный источник, что является смыслом существования любого архива в отношении любых (в том числе и электронных) документов.
К сожалению, даже при реализации описанных усилий процессы миграции и конвертации неизбежны. Они приводят к изменениям исходного исторического источника, что ставит вопрос о том, что является подлинником ЭИИ (оригиналом), как обеспечивается его аутентичность и целостность, и с чем в итоге будет работать исследователь.
МЕТОДОЛОГИЧЕСКИЕ ПОДХОДЫ: ПОДЛИННОСТЬ ДОКУМЕНТА
В настоящее время вопрос о том, что является подлинником (оригиналом) электронного источника, не имеет однозначного ответа и разнится в источниковедении, документо-ведении, информатике и в законодательстве.
Так, в исторической науке в целом и в источниковедении в частности подлинником (оригиналом) считается объект, созданный автором (авторами), возникший в том месте, времени и при тех обстоятельствах, какие ему приписывают авторы. Подлинники (оригиналы) любых исторических источников существуют в единственном экземпляре и представляют собой наибольшую ценность для историка, а установление различий между подлинником и копией («отпуском», «списком», тиражным предметом) часто осуществляется методами внешней критики источника.
Тихонов В. И. Наступитли время «компьютерной палеографии»?// Ин-формац. бюллетень Ассоциации «История и компьютер». 2002. N9 30. С. 114-116.
14 ГОСТ Р ИСО 13008-2015. Информация и документация. Процессы конверсии и миграции электронных документов.
В нормативно-методическом поле РФ, регламентирующем делопроизводство и архивное дело определение подлинного документа и подлинника близко источниковедческому15.
В информатике подлинником (оригиналом) считается полностью завершенный файл, сохраненный в единственном экземпляре в постоянной памяти компьютера, на котором он был создан (в электронном делопроизводстве — подписанный электронной цифровой подписью).
Таким образом все дисциплины сходятся на том, что подлинник — это единственный экземпляр объекта, не подверженный изменениям, в том числе переносу на другие носители или в другие программные среды.
В этой связи следует признать, что использование термина «подлинник» в значении первого или единственного экземпляра применительно к ЭИИ, работы с которыми предполагают их неоднократную миграцию и конвертацию, является, «неуместным и нецелесообразным», как указывалось в Научном докладе, подготовленным ВНИИДАД еще в 1999 г.
Для работы с ЭИИ авторитетный канадский архивист JI. Дюранти, руководитель многолетнего международного проекта InterPARES, посвященного изучению электронной документации, предложила другой термин — «аутентичная копия»16, отметив, что исследователь всегда будет работать с копией ЭИИ, а вот степень ее аутентичности каждый раз необходимо будет устанавливать заново.
Следующая проблема — аутентичность — синонимична понятию «подлинность исторического источника», принятому в источниковедении и подразумевающему свойство источника быть тем, о чем заявлено в нем самом, т. е. содержать информацию, подтверждающую его происхождение, и делать это таким образом, чтобы гарантировать источник от подделок. Аутентичность традиционных источников устанавливается с помощью комбинации методов внешней и внутренней критики.
В информационную эпоху процесс подтверждения аутентичности (подлинности17) разных групп и видов ЭИИ на разных этапах их жизненного цикла18 осуществляется по-разному.
К примеру, в активной фазе жизненного цикла изначально цифрового документа, создаваемого средствами систем электронного документооборота, для обеспечения его аутентичности в момент его создания применяются специализированные процедуры аутентификации авторов, подписание документа электронной подписью19.
Кроме этого, использование электронного документа в процессе выполнения его основной социальной функции должно проходить в условиях так называемой «доверенной среды», которая призвана обеспечить сохранение и неизменность содержания и формы документа, а также его неизменяемость при передаче из одной информационной системы в другую.
Подтверждение аутентичности ЭИИ, созданных в различных программных приложениях, не обеспеченных средствами аутентификации пользователя, электронными
15 ГОСТ Р 7.0.8-2013. СИБИД. Делопроизводство и архивное дело. Термины и определения.
lb Duranti L. The Impact of Technological Change on Archival Theory // Acts of the 14th International Congress on Archives. September 16, 2000. Seville, Spain. Paris. 2001. P. 5; URL: http://www.interpares.org/ documents/ld_sevl lla_2000.pdf.
17 Тихонов В. И. Наступитли время «компьютерной палеографии»?// Ин-
формац. бюллетень Ассоциации «История и компьютер». 2002. № 30.
С. 114-116.
13 Понятия «жизненного цикла» и его этапов уместны для большинства
типов и видов исторических источников, но наиболее полно теоретически проработаны для письменных (документальных) источников и описаны в работах В.П. Козлова, см., например: Козлов В.П. Жизнь
документа // Делопроизводство. 2013. N9 1. С. 11-17, N9 2. С. 6-12.
1У Астахова Т. С., Чадаева Е. П. Электронная цифровая подпись как фактор сохранения целостности и аутентичности документа // Известия Томского политехнич. ун-та. 2012. N9 6. С. 153-157.
подписями и доверенной средой, делают подтверждение подлинности ЭИИ практически невозможным.
ЭЛЕКТРОННЫЕ ИСТОЧНИКИ И ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
Серьезную проблему также представляют электронные источники, созданные с помощью инструментов Cognitive Science: искусственного интеллекта, генеративных нейросе-тей и иных средств создания контента. При этом пропорция использования результатов работы ИИ в общем объеме подготовленного материала не играет роли, поскольку в принципе ставит под сомнение авторство, аутентичность, оригинальность и достоверность созданного содержания.
К сожалению, единственным подтверждением применения ИИ в процессе создания ЭИИ являются метаданные, в которых автор-человек сознательно указал информацию о степени использования средств ИИ в творческом/рабочем процессе. Однако этот этический подход не является действенным, поэтому проблема подтверждения аутентичности (подлинности) изначально цифровых ЭИИ (в том числе выявления дипфейков (deepfakes) — глубоких подделок) будет оставаться одной из ключевых для исследователей и требовать от них изучения современных технологий и разработки все более совершенных методов исследования.
Обеспечение аутентичности, изначально цифровых (born-digital) ЭИИ, в фазах архивного покоя и архивного бытования не имеет принципиальных проблем, поскольку архивы (так же, как и музеи и библиотеки), во-первых, являются гарантами неизменности поступивших на хранение объектов, а во-вторых, ЭИИ (в идеале) должны храниться в специализированной архивной информационной системе, обладающей свойствами «доверенной среды»20.
Вместе с тем, не стоит забывать, что определенные изменения ЭИИ (включая возможные потери информации), снижающие степень их аутентичности, неизбежны в результате проведения процедур миграции и конвертации, применяемых как для физически обособленных носителей, так и для серверных (в том числе облачных) систем хранения данных. Подтверждение аутентичности ЭИИ при миграции и конвертации требует разработки жестких регламентов проведения данных процедур, контроля за их исполнением и формирования метаданных, описывающих возникающую разницу между исходными и конвертированными файлами.
Применительно к преобразованным ЭИИ (электронным копиям, машиночитаемым источникам (введенным вручную или распознанным с помощью систем оптического распознавания (OCR), метаисточников) понятие аутентичности имеет две трактовки.
В первой — аутентичность (подлинность) преобразованного источника подтверждается изначально, поскольку преобразованный ЭИИ — результат авторской работы, и, как правило, информация, подтверждающая его происхождение (авторство, время и место создания и т. п.), известны и/или хорошо документированы. В этом случае подтверждение подлинности преобразованного ЭИИ имеет смысл только в процессе его архивного хранения и вторичного использования, а процедура подтверждения аутентичности не отличается от аналогичных процедур, реализуемых в работе с изначально цифровыми источниками, и основывается на анализе зафиксированной в метаданных информации.
20 Электронное хранилище: доверять ли надежности долгосрочного хранения электронных документов?// Вестник ВНИИДАД. 2020. N91. С. 83-96.
Во второй — аутентичность преобразованного электронного источника устанавливается в отношении исходного преобразуемого (аналогового) оригинала и подразумевает идентичность ЭИИ аналоговому первоисточнику, который ни по форме, ни по содержанию не изменяется21.
Такая трактовка наиболее понятна источниковедам, но в архивной, библиотечной и музейной практике создания копий архивных документов, книг из редких библиотечных фондов и «цифровых двойников» музейных предметов используется редко, поскольку является комплексной и требует большой многоэтапной работы по обоснованию (доказательству) степени идентичности ЭИИ первоисточнику.
Определение аутентичности смешанных ЭИИ, к которым в первую очередь относятся информационные ресурсы, размещенные в Интернет, должно совмещать уже описанные выше методы удостоверения аутентичности изначально цифровых и преобразованных ЭИИ и учитывать специфику, присущую сетевым технологиям, в том числе:
- сложный, составной характер ресурсов, участие в их создании большого числа авторов (иногда анонимных):
- постоянную изменчивость (обновляемость) ЭИИ без фиксации изменений:
- широкое использование гипертекстовых технологий, устанавливающих взаимосвязь с другими ресурсами и тем самым, «размывающими» границы ЭИИ, с одной стороны, и не обеспечивающими обновление ссылочного аппарата при изменении адреса ресурса («гниение ссылок»22), с другой:
- отсутствие всех вариантов ЭИИ (бэкапов23), существовавших в разные хронологические периоды и т. п. Таким образом, смешанные ЭИИ представляют, пожалуй, самый сложный тип электронных источников с точки зрения подтверждения их подлинности.
ПРОБЛЕМА ЦЕЛОСТНОСТИ ИСТОЧНИКА
Не меньшую проблему, чем аутентичность, в работе с ЭИИ представляет характеристика целостности, которая чаще всего используется применительно к изначально цифровым ЭИИ (делопроизводственным документам) и подразумевает, что в документ после его создания (подписания и регистрации в СЭД) не вносились никакие изменения.
Для обеспечения целостности электронных документов применяются электронные цифровые подписи, системы криптозащиты и контрольные суммы (хеш-функции), фиксирующие размер документа.
Целостность иных изначально цифровых, преобразованных и смешанных ЭИИ до их поступления на архивное хранение специально подтверждается крайне редко. Это обстоятельство создает проблемы при источниковедческом анализе этих источников, поскольку в архив, как правило, попадает последняя версия ЭИИ, что не означает, что между созданием и передачей на хранение в содержании и форме ЭИИ не происходили значимые изменения, следы которых навсегда утрачены для исследователей.
Целостность ЭИИ в фазе архивного покоя обеспечивается соответствующими процедурами информационной безопасности, созданием резервных копий, миграцией и конвертаци-
21 Суровцева Н. Г. Аутентичность и идентичность электронного документа. 2020. № 2. С. 467—477. DOI: 10.28995/2073-0101-2020-2-467-477.
22 Гниение ссылок — исчезновение из сета или перенос на другой сетевой адрес информационного ресурса, на который ведет гиперссылка изтек-ста. В результате ресурс оказывается недоступным для пользователей.
11 Бэкап (backup) — создание и сохранение резервной копии ресурса / данных на локальном или удаленном носителе.
ей, а также постоянными проверками отсутствия несанкционированного доступа к ЭИИ и нарушения их целостности. Все перечисленные процедуры фиксируются в метаданных.
Таким образом, в отличие от традиционного источниковедения, в котором целостность является характеристикой физического состояния исторического источника и вместе с аутентичностью призвана подтвердить его подлинность, в цифровой среде целостность — это не стабильная характеристика, а свойство ЭИИ, который постоянно изменяется.
МЕТАДАННЫЕ, ИХ РОЛЬ В СУЩЕСТВОВАНИИ ЭЛЕКТРОННЫХ ИСТОЧНИКОВ ИНФОРМАЦИИ
Переходя к рассмотрению такой характеристики ЭИИ как метаданные, следует подчеркнуть их выдающуюся роль в источниковедении информационной эпохи, поскольку они призваны стать частью описания, компенсирующего исследователю невозможность проведения внешней критики источника в случае миграции и конвертации электронной информации.
Изначально термином «метаданные» обозначалась информация технического характера об электронном объекте (файле), автоматически генерируемое «описание» его свойств и характеристик, позволяющее искать и управлять ими в больших информационных массивах.
С увеличением разнообразия видов и разновидностей ЭИИ понятие «метаданных» расширилось, масштабировалось и в настоящее время охватывает «биографию» цифрового объекта (ЭИИ) целиком: от условий и обстоятельств его создания до хранения и использования24.
В настоящее время единых схем метаданных для описания всего разнообразия электронных файлов на всех этапах их жизненного цикла не существует, и каждое государство предпринимает попытки разработки собственных схем.
В Российской Федерации также идет процесс разработки и совершенствования схем метаданных. К примеру, в конце 2022 — начале 2023 гг. в России проводилось обсуждение проекта отечественного ГОСТ Р (проект, первая редакция). «СИБИД. Информация и документация. Управление документами. Логическая структура, состав метаданных документов и требования к их содержанию»25. К настоящему времени ГОСТ не утвержден, его обсуждение продолжается.
Изучив схемы и проекты стандартов отметим, что под термином «метаданные» на сегодняшний день понимается обширный с точки зрения информационного наполнения ресурс, который включает в себя не только формируемые автоматически сведения об ЭИИ, но и информацию, создаваемую людьми в определенные моменты времени и при определенных обстоятельствах, что превращает метаданные в своеобразный исторический источник, отмеченный рядом специфических особенностей, к числу которых относятся:
- постоянная пополняемость новыми сведениями (нестатичность):
- тесная взаимосвязь с внешними информационными системами (если к ЭИИ организован удаленный доступ), информация которых также должна аккумулироваться в метаданных.
Перечисленные особенности метаданных со временем приведут к тому, что их объем будет значительно превышать объемы всей накопленной цифровой документации и сделают работу с ЭИИ практически невозможной. Не следует также забывать, что любая цифровая информация (в том
24 ГОСТ Р ИСО 15489-1-2019, СИБИД. Управление документами. Общие требования.
25 URL: https://www.normacs.info/projects/10743.
числе и метаданные) не защищена от изменений, что потребует надлежащего контроля и подтверждения подлинности, аутентичности, достоверности уже самих метаданных, их верификации и подробного источниковедческого анализа...
ЗАКЛЮЧЕНИЕ
Завершая рассмотрение проблем современного источниковедения электронных исторических источников, перечислим ключевые особенности, отличающие ЭИИ от традиционных исторических источников: существование только в электронной среде: создание человеком, т. е. ЭИИ — это всегда продукт человеческой деятельности: потенциальная их незащищенность от внесения изменений на любом из этапов жизненного цикла: изменение состава элементов ЭИИ (носитель+информация+метаданные) по сравнению с традиционными историческими источниками (носитель+ин-формация): отсутствие жесткой связи между конкретным материальным носителем, информацией (контентом) и метаданными: требование переноса информации (миграции) с устаревших носителей на новые, как в процессе бытования, так и в условиях архивного хранения. Аналогичное требование — замены ПО на современные версии и конвертации файлов ЭИИ в актуальные форматы.
Фактически данное требование означает зависимость существования ЭИИ от осуществления определенных манипуляций над носителем и информацией ЭИИ, которые (манипуляции) могут привести к изменению или утрате информации. Одновременно происходит дополнение и изменение метаданных, в которых фиксируются сведения о произведенных действиях: опосредованный доступ к ЭИИ пользователя
(исследователя) через экран монитора или иного воспроизводящего устройства: работу исследователя с копией, репликой, дубликатом, а не с подлинником ЭИИ, к тому же подверженной потенциальным изменениям в силу указанных выше причин: и широкие возможности применения информационных методов и технологий к любым типам, группам и видам ЭИИ для извлечения и преобразования их информации в целях научного анализа и синтеза.
ВЫВОДЫ
Подводя краткий итог рассмотрения проблем ЭИИ, следует подчеркнуть, что предложенные формулировки, классификации, описание физической сущности и особенностей ЭИИ являются актуальными для начала 2020-х гг. и по мере появления новых разновидностей электронных исторических источников, развития информационных технологий, аппаратно-программных средств и подходов к долгосрочному сохранению и вторичному использованию цифровой информации их необходимо будет верифицировать.
Источники:
1. ГОСТ Р ИСО 13008-2015. Информация и документация. Процессы конверсии и миграции электронных документов [GOST R ISO 13008-2015. Information and documentation. The processes of conversion and migration of electronic documents],
2. ГОСТ P ИСО 15489-1-2007. СИБИД. Управление документами. Общие требования [GOST R ISO 15489-1-2007. SIBID. Document management. General requirements],
3. ГОСТ P 7.0.8-2013 СИБИД. Делопроизводство и архивное дело. Термины и определения [GOST R 7.0.8-2013 SIBID. Record keeping and archival business. Terms and definitions].
ЛИТЕРАТУРА:
1. Астахова Т. C„ Чадаева Е. П. Электронная цифровая подпись как фактор сохранения целостности и аутентичности документа // Известия Томского политехнич. ун-та. 2012. № 6. С. 153-157.
2. Боровкова О. В. Электронный исторический источник: проблемы и возможности // Исторические, философские, политические и юридические науки, культурология и искусствоведение. Вопросы теории и практики.Тамбов: Грамота. 2014. № 9 (47): в 2-хч. Ч. I. С. 26-28.
3. Владимиров В. Н„ Цыб С. В. Источниковедение в век компьютера (вместо предисловия) // в кн.: Источник. Метод. Компьютер: сб. науч. тр. Барнаул. 1996. С. 3-7.
4. Залаев ГЗ. Носители для архивного хранения электронных документов: состояние и перспективы // Самарский архивист 2019. № 4. С. 5-9.
5. Залаев ГЗ. Анализ и классификация электронных документов // Вестник архивиста. 1999. № 2-3. С. 62-65.
6. Злобин Е.В. Машиночитаемые документы как исторический источник. М.: Военный ун-т Мин-ва обороны РФ. 1999.168 с.
7. Ковальченко И. Д. Методы исторического исследования. М.: Наука. 2003.485 с.
8. Козлов В. П. Жизнь документа // Делопроизводство. 2013. № 1. С. 11-17, №2. С. 6-12.
9. Сабенникова И. В. Облачные сервисы хранения цифровых документов: законодательная база и существующие риски // История и архивы. 2022. № 2. С. 73-82.
10. Сабенникова И. В. Электронные документы в системе информационного обмена архивов // Вестник архивиста. 2021. № 2. С. 520-531.
11. Суровцева Н. Г. Аутентичность и идентичность электронного документа. 2020. № 2. С. 467-477. DOI: 10.28995/2073-0101 -2020-2-467-477.
12. Тихонов В. И. Наступит ли время «компьютерной палеографии»? // Информац. бюллетень Ассоциации «История и компьютер». 2002. № 30. С. 114-116.
REFERENCES:
1. Astakhova T.S., Chadaeva E.R Electronic digital signature as a factor in preserving the integrity and authenticity of a document // News of the Tomsk Polytechnic University. 2012. No. 6. Pp. 153-157.
2 Borovkova O.V. Electronic historical source: problems and opportunities // Historical, philosophical, political and legal sciences, cultural studies and art criticism. Questions of theory and practice. Tambov: Diploma. 2014. No. 9 (47): at 2 p.m. I. Pp. 26-28.
3. Vladimirov V. N„ Tsyb S. V. Source studies in the age of the computer (instead of a preface) // in: Source. Method. Computer. Barnaul. 1996. Pp. 3-7.
4. Zalaev G.Z. Media for archival storage of electronic documents: state and prospects // Samara archivist. 2019. No. 4. Pp. 5-9.
5. Zalaev G.Z. Analysis and classification of electronic documents // Herald of an Archivist. 1999. No. 2-3. Pp. 62-65.
6. Zlobin E.V. Machine-readable documents as a historical source. Moscow: Military University of the Ministry of Defense of the Russian Federation. 1999. 168 p.
7. Kovalchenko I.D. Methods of historical research. M.: Nauka. 2003.485 p.
8. Kozlov V.P The life of the document//Office work. 2013. No. 1. Pp. 11-17, No. 2. Pp. 6-12.
9. Sabennikova I.V. Cloud services for storing digital documents: the legislative framework and existing risks // History and archives. 2022. No. 2. Pp. 73-82.
10. Sabennikova I.V. Electronic documents in the information exchange system of archives // Herald of an Archivist. 2021. No. 2. Pp. 520-531.
/ /. Surovtseva N.G. Authenticity and identity of an electronic document // Herald of an Archivist. 2020. No. 2. Pp. 467-477. DOI: 10.28995/2073-0101-2020-2-467-477.
12. Tikhonov V.I. Will the time of «computer paleography» come? // Information bulletin of the Association «History and Computer». 2002. No. 30. Pp. 114-116.
13. Юмашева Ю.Ю. Актуальные проблемы источниковедения информационной эпохи //Документ. Архив. История. Современность: Сб. науч. тр. / Гл. ред. J1.H. Мазур. Вып. 23. Екатеринбург: Уральский фед. ун-т им. первого Президента России Б. Н. Ельцина. 2023. С. 109-140.
14. Durariti L. The Impact of Technological Change on Archival Theory // Acts of the 14th International Congress on Archives. September 16, 2000. Seville, Spain. Paris. 2001. P. 5 URL: http://www.interpares.org/ documents/ld_sevilla_2000.pdf.
15. Pacheco A., Da Silva C.G., De Freitas M.C.V. A metadata model for authenticity in digital archival descriptions // Archive Science. 2023 №23. Pp.629-673. DOI: 10.1007/S10502-023-09422-W.
16. Sheridan J. Digital archiving: «Context is everything» // 19 April 2018. URL: https://blog.nationalarchives.gov.uk/digital-archiving-context-everything/.
13. Yumasheva Yu.Yu. Actual problems of source studies of the information age//Document. Archive. History. Modernity/Chief editor L.N.Mazur. Issue. 23. Yekaterinburg: Uralsky Fed. University named after the first President of Russia B.N.Yeltsin. 2023. Pp. 109-140.
14. Durariti L. The Impact of Technological Change on Archival Theory // Acts of the 14th International Congress on Archives. September 16, 2000. Seville, Spain. Paris. 2001. P. 5 URL: http://www.interpares.org/ documents/ld_se villa_2000.pdf.
15. Pacheco A., Da Silva C.G., De Freitas M.C.V. A metadata model for authenticity in digital archival descriptions // Archive Science. 2023 № 23. Pp. 629-673. DOI: 10.1007/S10502-023-09422-W.
16. Sheridan J. Digital archiving: «Context is everything» // 19 April 2018. URL: https://blog.nationalarchives.gov.uk/digital-archiving-context-everything/.
Статья проверена программой «Антиплагиат». Оригинальность - 87,3%.
Рецензент: Суржикова Н.В., доктор исторических наук, главный научный сотрудник; Институт истории и археологии Уральского отделения Российской академии наук.
Статья поступила в редакцию 19.07.2024, принята к публикации 09.08.2024 The article was received on 19.07.2024, accepted for publication 09.08.2024
СВЕДЕНИЯ ОБ АВТОРЕ
Юмашева Юлия Юрьевна, доктор исторических наук, заместитель генерального директора по научно-методической работе; ООО «ДИ-МИ-ЦЕНТР»26; г. Москва. Российская Федерация, e-mail: Yumashe-vaw!dimi.ru, Juliayu:g!yandex.ru
ABOUT THEAUTHOR
Julia Yu. Yumasheva, Dr. Sci. (Hist.), Deputy General Director for Scientific and Methodological Work; DIMI-CENTER, LLC; Moscow, Russian Federation, e-mail: [email protected], [email protected]
26 Компания имеет богатый опыт создания микрофильмирующих и сканирующих лабораторий на всей территории России и поставляет любые технические средства для создания архивов на микроформах (рулонная пленка и фиши) и архивов на электронных носителях, а также расходные материалы и запасные части.
28 History and Modem Perspectives Vol. 6. No. 3. 2024 ISSN 2658-4654 (print)
ISSN 2713-2579 (online)