Научная статья на тему 'Проблемные аспекты почерковедческого исследования копий документов'

Проблемные аспекты почерковедческого исследования копий документов Текст научной статьи по специальности «Право»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
копия документа / нейросеть / искусственный интеллект / признаки сгенерированной рукописи / document copy / neural network / artificial intelligence / features of the generated manuscript

Аннотация научной статьи по праву, автор научной работы — Владимир Геннадьевич Грякалов, Ольга Александровна Диденко, Максим Владимирович Кремлев

Рассматриваются вопросы участия искусственного интеллекта в воспроизведении почерка человека. Отмечается, что на сегодняшний день возможности нейросетей позволяют воссоздавать рукописные записи человека по заданным параметрам, тем самым возникает дополнительный негативный фактор, препятствующий установлению истины по делу при решении судебно-почерковедческих задач. Ретроспективным анализом имеющихся в открытом доступе программ, имитирующих рукописные тексты, установлены признаки, позволяющие выявить факт участия нейросети в воспроизведении почерковой реализации по копии, при этом констатируется тенденция к совершенствованию полученного результата. Авторами высказывается предположение о возможном появлении программного продукта, способного исключить известные маркеры, тем самым приблизив качество исполнения к копиям реальных рукописных текстов. Сформулирован вывод о необходимости уделять достаточное внимание изучению вопроса исследования продуктов, полученных при помощи нейросетей, что позволит учитывать данный аспект при анализе изображений рукописных документов с целью дифференциации результата человеческой деятельности от искусственно сгенерированных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Problematic aspects of handwriting research of document copies

The participation of artificial intelligence in the reproduction of human handwriting is being considered. It is noted that today the capabilities of neural networks make it possible to recreate a person’s handwritten notes according to given parameters, thereby creating an additional negative factor that prevents the establishment of the truth in the case when solving forensic handwriting problems. A retrospective analysis of publicly available programs that imitate handwritten texts has identified signs that make it possible to identify the fact of the participation of a neural network in reproducing handwriting from a copy, while a tendency to improve the result obtained is stated. The authors suggest the possible emergence of a software product that can eliminate known markers, thereby bringing the quality of execution closer to copies of real handwritten texts. The conclusion is formulated about the need to pay sufficient attention to studying the issue of studying products obtained using neural networks, which will allow taking this aspect into account when analyzing images of handwritten documents in order to differentiate the result of human activity from artificially generated ones.

Текст научной работы на тему «Проблемные аспекты почерковедческого исследования копий документов»

ЮРИДИЧЕСКИЕ НАУКИ

Научная статья УДК 343.982.4

https://doi.org/10.24412/2414-3995-2024-5-50-55 EDN: https://elibrary.ru/fpnlwr NIION: 2015-0066-5/24-105 MOSURED: 77/27-011-2024-05-304

Владимир Геннадьевич Грякалов1, Ольга Александровна Диденко2,

Максим Владимирович Кремлев3

1,3 Кузбасский институт Федеральной службы исполнения наказаний России, Новокузнецк, Россия

1 [email protected]

3 [email protected]

2 Московский университет МВД России имени В.Я. Кикотя, Москва, Россия, [email protected]

Аннотация. Рассматриваются вопросы участия искусственного интеллекта в воспроизведении почерка человека. Отмечается, что на сегодняшний день возможности нейросетей позволяют воссоздавать рукописные записи человека по заданным параметрам, тем самым возникает дополнительный негативный фактор, препятствующий установлению истины по делу при решении судебно-почерковедческих задач. Ретроспективным анализом имеющихся в открытом доступе программ, имитирующих рукописные тексты, установлены признаки, позволяющие выявить факт участия нейросети в воспроизведении почерковой реализации по копии, при этом констатируется тенденция к совершенствованию полученного результата. Авторами высказывается предположение о возможном появлении программного продукта, способного исключить известные маркеры, тем самым приблизив качество исполнения к копиям реальных рукописных текстов. Сформулирован вывод о необходимости уделять достаточное внимание изучению вопроса исследования продуктов, полученных при помощи нейросетей, что позволит учитывать данный аспект при анализе изображений рукописных документов с целью дифференциации результата человеческой деятельности от искусственно сгенерированных.

Ключевые слова: копия документа, нейросеть, искусственный интеллект, признаки сгенерированной рукописи

Для цитирования: Грякалов В. Г., Диденко О. А., Кремлев М. В. Проблемные аспекты почерковедческого исследования копий документов // Вестник экономической безопасности. 2024. № 5. С. 50-55. https://doi.org/10.24412/2414-3995-2024-5-50-55. EDN: FPNLWR.

Original article

Vladimir G. Gryakalov1, Olga A. Didenko2, Maxim V. Kremlev3

12 Kuzbass Institute of the Federal Penitentiary Service of Russia, Novokuznetsk, Russia

1 [email protected]

3 [email protected]

2 Moscow University of the Ministry of Internal Affairs of Russia named after V.Ya. Kikot', Moscow, Russia,

[email protected]

Abstract. The participation of artificial intelligence in the reproduction of human handwriting is being considered. It is noted that today the capabilities of neural networks make it possible to recreate a person's handwritten notes according to given parameters, thereby creating an additional negative factor that prevents the establishment of the truth in the case when solving forensic handwriting problems. A retrospective analysis of publicly available programs that imitate handwritten texts has identified signs that make it possible to identify the fact of the participation of a neural network in reproducing handwriting from a copy, while a tendency to improve the result obtained is stated. The authors suggest the possible emergence of a software product that can eliminate known markers, thereby bringing the quality of execution closer to copies of real handwritten texts. The conclusion is formulated about the need to pay sufficient attention to studying the issue of

Проблемные аспекты почерковедческого исследования копий документов

Problematic aspects of handwriting research of document copies

© Грякалов В. Г., Диденко О. А., Кремлев М. В., 2024

studying products obtained using neural networks, which will allow taking this aspect into account when analyzing images of handwritten documents in order to differentiate the result of human activity from artificially generated ones. Keywords: document copy, neural network, artificial intelligence, features of the generated manuscript For citation: Gryakalov V. G., Didenko O. A., Kremlev M. V. Problematic aspects of handwriting research of document copies. Bulletin of economic security. 2024;(5):50-5. (In Russ.). https://doi.org/10.24412/2414-3995-2024-5-50-55. EDN: FPNLWR.

Возможности судебно-почерковедческого исследования доказали свою состоятельность в вопросах установления некоторых свойств и качеств личности исполнителя, а также ее идентификации [1, с. 113]. До недавнего времени рукописные реализации выступали относительно надежным способом подтверждения участия конкретного лица в общественных отношениях, чтобы дополнительно заручиться в этом, было предусмотрено создание ряда удостоверительных процедур (например, при составлении отдельных документов предусмотрено собственноручное написание фамилии, имени, отчества и подписи). При возникновении спорных ситуаций, в установленном законом порядке, назначается соответствующий вид исследования, в ходе которого изучаются не только общие и частные признаки почерка, но и способы внесения текста в документ. Так при положительной версии о тождестве исполнителя в ходе анализа рукописи эксперт должен убедиться в отсутствии признаков выполнения в необычных условиях письма и исключить факт предварительной подготовки с применением различных технических приемов и средств или монтажа.

С развитием цифровых технологий появилась возможность создания дубликатов документов с применением соответствующей техники, получившей широкое распространение в нашей жизни. Однако, с учетом совершенствования возможностей отдельных графических редакторов, использование которых нельзя исключить при создании копий документов, без завери-тельных процедур [2, с. 65] последние утрачивают свой юридический вес. А в отдельных случаях эти услуги реализуются ненадлежащим образом.

Вышеизложенное, в свою очередь, порождает появление новых способов изготовления неподлинных документов, создавая благодатную почву для преступных махинаций. При этом изготовление копий зачастую применяется с целью маскировки следов неправомерных действий, явно заметных в оригинале документа. Последний может быть намеренно утрачен. Кроме того, все чаще в качестве объектов исследования предоставляются изображения рукописи, направленные посредством электронной почты и различных мессен-джеров. В результате не всегда возможно установить способ внесения записей в оригинал документа, поставив под сомнение одно из обязательных требований, предъявляемых к доказательствам - достоверности его происхождения.

Современные научно-технические достижения все чаще вызывает недоверие человека в правдивости увиденного и услышанного им. Степень объективности

средств цифровой фото-, аудио- и видеофиксации снижается с катастрофической скоростью по той причине, что современные нейросети научились имитировать или даже создавать по заданным человеком (или другой ней-росети) требованиям звуки, фото, видео [3, с. 445]. При этом область применения таких технологий постоянно совершенствуется и качество продуктов, сгенерированных нейросетями, существенно повышается.

Технический прогресс, сопровождаемый стремительным развитием компьютерных технологий и внедрением искусственного интеллекта в различные сферы деятельности нашего общества, не дает возможности на современном этапе адекватно и объективно оценить масштабы происходящего с точки зрения нежелательных последствий рассматриваемого явления. На это потребуется время...

Обратимся к вопросу участия искусственного интеллекта в воспроизведении почерка человека. На сегодняшний день возможности нейросетей настолько велики, что позволяют воссоздавать рукописные записи человека по заданным параметрам. В качестве способа материализации сгенерированного текста выступает копировально-множительная техника, принтеры и др. Следовательно, на этом этапе мы можем говорить о появлении дополнительного негативного фактора, препятствующего установлению истины по делу, в частности, при решении судебно-почерковедческих задач.

При этом наличие соответствующих программных продуктов, пока еще констатирует возможность дифференциации почерка человека и результата деятельности нейросети. Ведь качество текста, созданного с применением искусственного интеллекта, на сегодняшний день не достигло уровня, позволяющего сымитировать почерк максимально идентично исходной рукописи -продукту человеческой деятельности, и на этом этапе позволяет установить факт участия нейросети в воспроизведении почерковой реализации по копии.

Так, среди множества нейросетей, нацеленных на работу с изображениями, выделяют две системы, имитирующие почерк человека.

1. Сервис CaШgrapherai [4] (2018 г.), созданный исследователем машинного обучения Шоном Васкесом. Указанный продукт позволяет генерировать рукописный текст на основе напечатанного пользователем. Условная рукопись формируется в 9 «стилях» с различной «скоростью» и степенью «разборчивости». Основой программы являются оцифрованные почерка разных лиц (в количестве 221 рукописи), выполненных латиницей. Эта нейросеть не способна создавать многострочные тексты, а также тексты с количеством символов, превы-

ЮРИДИЧЕСКИЕ НАУКИ

Н* r\dvjf \ Н-&У* hoincAwnlmj

¡fandbjrtffen handb/rih**

У

IjMoj^riWiA \ллмЯлл)Г[

Рис. 1. Образцы краткой записи «Handwritten handwriting», сгенерированной c помощью нейросети Calligrapher

шающим 50 знаков (ограничения, установленные разработчиками приложения, которые объясняются тем, что нейросеть при кодировке значительного по объему текста может выдавать серьезные ошибки) (рис. 1).

Визуальным осмотром записей, сгенерированных нейросетью «CaШgrapheI"», можно выделить следующие особенности, отличающие созданный ей текст от оригинальной рукописи:

- отсутствие дифференцированного нажима;

- наличие тупых начал и окончаний штрихов;

- сплошное и равномерное распределение красящего вещества на протяжении всего штриха;

- использование красящего вещества исключительно черного цвета;

А л- й h

• _ /

- в отдельных случаях наблюдается:

- отсутствие логики построения знака (проявляющееся в том, что отдельные письменные знаки и их элементы могут иметь чрезмерную вариационность, выражающуюся в вычурности и неограниченном и необоснованном многообразии вариантов конструктивного строения одноименных букв, а также нарушении последовательности движений, которая реализуется весьма странным способом, зачастую не свойственным человеку) (рис. 2).

Вышеобозначенные признаки аналогичным образом проявляются (не видоизменяясь) и при постановке перед нейросетью задачи выполнить запись в быстром темпе и при конкретно заданном варианте («стиле») письма.

(¿4 А ^ А

Рис. 2. Варианты различного конструктивного строения латинских прописных букв «А», сгенерированных c помощью нейросети CaШgrapher

2. Сервис «My Text in Your Handwriting», созданный в University College London Tom S.F. Haines, Oisin Mac Aodha и Gabriel J. Brostow (2016 г.), имеет ряд отличий от вышеописанного сервиса «Calligrapher». Ней-росеть создана группой разработчиков при поддержке «University College London». Изучаемый проект по фотографии или отсканированной копии документа имитирует почерк исполнителя, который в дальнейшем можно использовать для «написания» иного по содержанию или аналогичного текста (рис. 3).

Визуальным осмотром представленных образцов можно отметить более сложные алгоритмы, позволяющие подражать стилю написания и структуре штрихов пишущего прибора. Однако в отличие от первого проекта, сервис «My Text in Your Handwriting» не полностью автономен и требует участия человека с углубленными навыками программирования, а также знаниями в обла-

г

сти судебного почерковедения и судебно-почерковедче-ской экспертизы при «обучении» нейросети.

Для этого пользователь предоставляет программе изображение исходного почерка, после чего алгоритмы получают с оригинала необходимую информацию, которая и будет применяться в процессе создания сгенерированной «рукописи». На данном этапе оператор должен устранить неточности и ошибки нейросети.

Следует отметить, что «My Text in Your Handwriting» обновлялась до 2020 года, в результате апдейта удалось учесть ряд недостатков и устранить их. Например, в созданной с ее помощью почерковой реализации отсутствуют тупые начала и окончания штрихов, появилась возможность имитации дифференцированного нажима, наряду с возможностью имитации почерка конкретного лица, при этом количество строк и в целом объем рукописи не ограничены.

...........i£ù 5Ы1С£...........

few Wie- Ыь vf K^af ГоаМ Oa ^fct fazj

rôtobè. Ш6, Ufo^-W [r^Cb, СШЪТЬ, (W.,

Рис. 3.1- Подлинный почерк самого исполнителя; 2 - образец сгенерированного почерка

-ОзК/

Рис. 4. Фрагмент исходной рукописной записи, выполненной человеком (слева) и фрагмент изображения почерка, имитированного с применением нейросети «My Text in Your Handwriting» (справа)

ЮРИДИЧЕСКИЕ НАУКИ

Если оператор на предыдущем этапе должным образом внес правки, нейросеть «скопирует» не только специфику написания (общие и значительную часть частных признаков почерка), но и воспроизведет визуально различаемые особенности подложки максимально приближено к оригиналу (посторонние штрихи, загрязнения поверхности и проч.), скопирует и с определенным визуальным сходством отобразит признаки пишущего прибора в штрихах (цвет, структуру) (рис. 4).

Существенным недостатком рассматриваемой системы являются высокие требования к оператору машинного обучения при загрузке почерка, на основе которого происходит генерация текста, а также по сравнению с «Calligrapher», при работе с нейросетью «My Text in Your Handwriting» конечный продукт требует от оператора, помимо высоких знаний и навыков, большего объема времени, необходимого для ее обучения.

Вместе с тем изображения почерка, полученные с применением алгоритмов нейросети «My Text in Your Handwriting», имеют и прочие недостатки, в их числе:

1. Нарушение логики построения знаков и элементов, выраженное в нехарактерном (в отдельных случаях крайне неудобном для выполнения человеком) направлении движений и упрощении или усложнении конструкции знака в целом (чаще встречаются при формировании значительного по объему текста, а также длинных слов);

2. Нарушение координации движений второй группы;

3. Абсолютное повторение некоторых букв или их элементов (вплоть до идентичности пиксельного построения, обнаруживаемое при их увеличении). Признак наиболее ярко выражен при малом количестве исходных данных (образцов почерка), а также при поверхностной настройке программы.

В связи с этим важно понимать, что количественный критерий проявления приведенных признаков не бесконечен, а возможности обучения нейросети безграничны. Следовательно, есть основания спрогнозировать появление программного продукта, созданного на основе обработки и анализа ранее полученных результатов, исключающего известные специалистам недочеты.

Отметим, что исследователи из Университета искусственного интеллекта Мухаммада ибн Заида (MBZUAI, Mohamed bin Zayed University of Artificial Intelligence) разработали нейросеть «HWT» и продемонстрировали ее общественности на конференции по компьютерному зрению (ICCV) в декабре 2023 года. Эта нейросеть имитирует почерк человека на более высоком уровне [5]. Особенность технологии состоит в том, что для обучения модели используется небольшой фрагмент рукописного текста.

Приведенная нейросеть функционирует с текстами на английском и французском языках. Создателями заявляется, что для обучения модели достаточно всего несколько абзацев текста. Это означает, что данная система менее требовательна к оператору.

Исходные коды нейросетей «Calligrapher» и «My Text in Your Handwriting» находятся в свободном доступе в отличие от коммерческого продукта «HWT», созданного в ОАЭ.

В заключение важно отметить, что большое многообразие изображений почерковых реализаций, образы которых запечатлены на электронных носителях информации, а также копии, полученные различными способами, все чаще встречается в экспертно-криминалисти-ческой практике в качестве объектов судебно-почерко-ведческого исследования. В процессе анализа подобных рукописей необходимо в обязательном порядке решать вопрос, применялось ли в конкретной экспертной ситуации соответствующее программное обеспечение или имело ли место участие искусственного интеллекта для их создания. Если эта версия не будет должным образом проработана, то заключение эксперта чревато ошибочным выводом. Кроме того, при положительном ответе, специфика изучения таких объектов потребует комплексного подхода.

Таким образом, проведенная нами работа позволила продемонстрировать, что задача экспертов-почерковедов по исследованию копий и электронных образов документов с каждым годом существенно усложняется. Это связано с внедрением в нашу жизнь искусственного интеллекта, используемого повсеместно, в том числе, для создания сгенерированных по типу рукописных текстов. Именно поэтому особенно важно своевременно уделять достаточное внимание изучению вопроса исследования продуктов, полученных при помощи нейросе-тей, что позволит учитывать данный аспект при анализе изображений рукописных документов с целью дифференциации результата человеческой деятельности от искусственно сгенерированных.

В условиях современных реалий решение подобной задачи хоть и сложно, но пока возможно.

Однако прогнозирование дальнейших перспектив с учетом стремительного развития и совершенствования технологий не исключает того факта, что при профессиональном подходе и целенаправленной совместной деятельности специалистов разных областей в указанном направлении, документы, образованные нейросетью, могут достичь такого уровня исполнения, при котором нивелируются обозначенные здесь признаки и возможность дифференциации искусственно созданных объектов от почерковой реализации человека сведется к минимуму.

Список источников

1. Бобовкин М. В., Ручкин В. А. Судебно-почерко-ведческая экспертиза в правоохранительной деятельности Российской Федерации // Правовая парадигма. 2018. Т. 17. № 3. С. 113-120.

2. Казакова А. В. Является ли копия документа доказательством в российском уголовном процессе? // Российское право: образование, практика, наука. 2021. № 4. С. 64-71.

3. Петерс С. В. Нейросети для генерации изображений: области применения и юридические проблемы эксплуатации // Международный научный журнал «Вестник науки». № 3 (72). Том 1. Март 2024 г. С. 442-447.

4. URL: https://www.calligrapher.ai/ (дата обращения: 01.09.2024).

5. URL: https://mbzuai.ac.ae/news/transformers-of-the-handwritten-word/ (дата обращения: 01.09.2024).

References

1. Bobovkin M. V, Ruchkin V A. Forensic handwriting examination in law enforcement activities

of the Russian Federation // Legal paradigm. 2018. V. 17. № 3. P. 113-120.

2. Kazakova A. V Is a copy of a document considered evidence in Russian criminal proceedings? // Russian law: education, practice, science. 2021. № 4. P. 64-71.

3. Peters S. V. Neural networks for image generation: areas of application and legal problems of operation // International scientific journal «Bulletin of science». № 3 (72). Vol. 1. March 2024. P. 442-447.

4. URL: https://www.calligrapher.ai/ (accessed: 01.09.2024).

5. URL: https://mbzuai.ac.ae/news/transformers-of-the-handwritten-word/ (accessed: 01.09.2024).

Информация об авторах

В. Г. Грякалов - преподаватель юридического факультета Кузбасского института Федеральной службы исполнения наказаний России;

О. А. Диденко - заместитель начальника кафедры исследования документов учебно-научного комплекса судебной экспертизы Московского университета МВД России имени В.Я. Кикотя, кандидат юридических наук, доцент;

М. В. Кремлев - начальник кафедры оперативно-розыскной деятельности Кузбасского института Федеральной службы исполнения наказаний России, кандидат юридических наук.

Information about authors

V. G. Gryakalov - Teacher of the Faculty of Law of the Kuzbass Institute of the Federal Penitentiary Service of Russia;

O. A. Didenko - Deputy Head of the Department of Document Research of the Educational and Scientific Complex of Forensic Expertise of the Moscow University of the Ministry of Internal Affairs of Russia named after V.Ya. Kikot', Candidate of Legal Sciences, Associate Professor;

M. V. Kremlev - Head of the of the Department of Operational-Investigative Activities of the Kuzbass Institute of the Federal Penitentiary Service of Russia, Candidate of Legal Sciences.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вклад автора: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.

Contribution of the authors: the authors contributed equally to this article. The authors declare no conflict of interest.

Статья поступила в редакцию 13.09.2024; одобрена после рецензирования 01.11.2024; принята к публикации 03.12.2024.

The article was submitted 13.09.2024; approved after reviewing 01.11.2024, accepted for publication 03.12.2024.

i Надоели баннеры? Вы всегда можете отключить рекламу.