УДК 343.63
Кусов Геннадий Владимирович
кандидат филологических наук,
старший преподаватель кафедры социологии
и правоведения
Кубанского государственного технологического
университета
ВЫРАБОТКА РЕКОМЕНДАЦИЙ ПО СОВЕРШЕНСТВОВАНИЮ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ПРАКТИКЕ ПРОИЗВОДСТВА СУДЕБНОЙ ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТИЗЫ
Kusov Gennadiy Vladimirovich
PhD in Humanities, Senior Lecturer of the Sociology and Jurisprudence Department, Kuban State Technological University [email protected]
DEVELOPMENT OF GUIDELINES FOR THE IMPROVEMENT OF INFORMATION TECHNOLOGIES IMPLEMENTATION IN FORENSIC LINGUISTIC EXPERTISE
Аннотация:
Статья посвящена анализу генезиса теории судебной лингвистической экспертизы и выработке рекомендаций по совершенствованию новых исследовательских технологий. Обоснование направлений теоретического осмысления лингвистической экспертизы послужит для исследователей ориентиром в научных изысканиях ближайшего будущего. Решение поставленных в статье задач сможет повысить научную обоснованность и достоверность научно-практических выводов судебной лингвистической экспертизы, назначаемой в соответствии с нормой процессуального права. Создание единого терминологического аппарата судебной лингвистической экспертизы позволит избежать субъективности и вариативности в принятии юридического решения.
Ключевые слова:
судебная лингвистическая экспертиза, теория судебной лингвистической экспертизы, вербальная агрессия, иллокутивный речевой акт, оскорбление, инвектива, коммуникативная перверсия, коммуникативная мишень, вербальная платформа коммуникативной мишени, эксперно-правовой дискурс.
Summary:
The article analyzes genesis of the forensic linguistic examination theory and develops guidelines for new research technologies improvement. Substantiation of the theoretic comprehension of the linguistic examination should guide researchers in their study in the near future. Solution of the problems set in the article may improve scientific validity and reliability of the academic and practical results of the forensic linguistic examination, determined by the procedural law regulations. Formation of the single terminology of the forensic linguistic examination may allow specialists to avoid subjectivity and variability in judgments.
Keywords:
forensic linguistics expertise, theory of forensic linguistics expertise, verbal aggression, illocutionary speech act, insult, invective, communicative perversion, target of communication, verbal platform of the communication target, legal expertise discourse.
Экспертное лингвистическое исследование, являясь разновидностью познания конкретного факта, основано на тех же принципах, что и любой другой вид познания в ходе расследования и судебного рассмотрения дела, отличаясь, однако, своей процессуальной формой, а также средствами и методами в ходе выполнения задачи выявления и познания скрытой сути явлений и вещей с научным их истолкованием.
Особое место среди этих средств и методов принадлежит информационным технологиям, вследствие чего возникли некоторая трансформация экспертного исследования как процесса познания - и одновременно расширение возможностей, повышение научной обоснованности результатов экспертного анализа, что определяется целым рядом теоретических и практических закономерностей информатизации судебно-экспертных исследований [1, с. 433].
Так, любая методика экспертного исследования, имеющая в своей основе использование компьютера, всегда ориентирована на решение конкретной задачи (например, программа, автоматически выявляющая признаки экстремизма в текстах, размещенных в Интернете). Несмотря на такую специфичность, эти методики имеют ряд общих свойств:
- принцип системной организованности объекта анализа, количественных показателей, функциональный и алгоритмический подход к исследованию и объекту исследования;
- предварительное математическое моделирование объекта и выбор алгоритма процесса его познания, что предполагает, кроме построения модели решения определенной задачи, создание модели объекта анализа (модели сравнительного анализа признаков), которые, в
значительной мере являясь содержательными, создаются не математиками-программистами, а экспертами-лингвистами;
- обязательное наличие таких элементов, как постановка задачи с определением цели исследования, разделение на частные подзадачи, выбор средств и приемов их реализации, результат и его оценка, принятие решения;
- все методики по использованию компьютерных технологий являются дополнением к основной методике экспертного лингвистического исследования и не охватывают всего процесса решения экспертной задачи. Использование компьютерной программы обычно объективизирует и автоматизирует только определенную операцию (несколько операций) в процессе анализа текста или оценки полученных результатов. Использование компьютерных технологий, освобождая эксперта от трудоемких операций и ускоряя процесс исследования, никак не исключает необходимости качественного подхода к объекту познания.
Нужно заметить, на данном этапе проблема «человек или машина» решается таким образом: это проблема границ, задач и условий, определяющих использование компьютерных технологий в процессе судебно-экспертной деятельности, и, кроме того, субъектов, их роли и функций в автоматизированных системах решения правовых задач. Несмотря на неоднозначность решения этого вопроса, превалирует концепция, требующая передачи ЭВМ любого количества формализуемых операций с оставлением эксперту только частей исследования, требующих его творческих способностей.
Бесспорно, имевший место ранее вопрос о допустимости в принципе использования ЭВМ при производстве собственно судебно-экспертных исследований и об условиях, при которых это становится возможным, не требует дальнейшего обсуждения, так как практика показала и правомерность использования информационных технологий, и повышение эффективности работы при этом.
По нашему мнению, еще один вопрос, связанный с тем, насколько практикующий эксперт владеет знанием механизма работы компьютера, когда он использует компьютерную программу, облегчающую или полностью освобождающую его от определенных операций, в действительности большого значения не имеет. Важность представляет лишь надежность работы машины в техническом смысле и получение верных результатов, например, при анализе количественных характеристик выделенных признаков. Эксперт при использовании компьютерной программы должен понимать и правильно оценивать технологические правила процесса обработки важной для него информации, а не сам их механизм, хотя утверждения о том, что эксперт-лингвист не в состоянии объяснить ни характер работы компьютера, ни принципы формирования выводов машины, несостоятельны, так как компьютер работает по четким и однозначным алгоритмам, и любой специалист-предметник вполне может разобраться в принципиальной его структуре (в дальнейшем, с развитием компьютерных технологий и повышением потребности в компьютерных лингвистических программах, потребуются и специалисты-лингвисты со знанием компьютерного программирования). Известно, что машина выполняет только то, что ей предписано человеком. Кроме того, пользователь или оператор всегда могут сделать распечатку всех промежуточных результатов для проверки хода анализа. Обязательным для эксперта нужно считать одно условие - это умение работать на персональных компьютерах, в том числе в режиме диалога. При этом процессуальных ограничений по применению ЭВМ не существует с 1982 г., когда Верховный суд СССР признал использование в качестве доказательств документов и экспертных заключений, подготовленных средствами ЭВМ.
Далее, сложившиеся в настоящее время направления компьютеризации судебноэкспертной деятельности можно подразделить по ряду оснований:
- методики, основанные на данных метрологии, теории вероятностей и математической статистики, проективной геометрии и т.п., то есть отличающиеся по характеру математического аппарата - основы для построения компьютерных технологий и конкретных методик судебноэкспертных исследований;
- методики, основанные на применении математического аппарата и вычислительной техники при решении диагностических задач (когда требуется, например, установить факт написания текста намеренно измененным почерком), при решении классификационных задач (установление пола по почерку), при решении идентификационных задач;
- направление, связанное с оптимизацией и повышением эффективности решения экспертных задач конкретного вида или экспертной деятельности в целом: автоматизация измерений и первичной обработки данных, создание и эксплуатация автоматизированных банков данных, создание и эксплуатация программ для логического анализа данных, сбора статистических данных в области судебной экспертизы [2, с. 113].
Повышение эффективности любого из указанных направлений обязательно связано с повышением уровня автоматизации их информационного обеспечения, что определяют такие моменты:
- множество объектов экспертного исследования, характеризующихся разнообразием свойств и признаков, а следовательно, информацией о них;
- только использование различных современных автоматизированных систем и комплексов дает возможность получения оперативной информации (и ее анализа) о конкретном объекте исследования, на базе чего разработаны методики для решения широкого круга экспертных задач;
- организационно-управленческая деятельность в области судебной экспертизы также подвержена автоматизации информационного обеспечения, так как не только эксперт, но и администрация судебно-экспертного учреждения оперируют большим количеством не только криминалистической, но и вспомогательно-справочной информации, для чего создаются информационно-поисковые системы (ИПС) [3, с. 49].
Как известно, появление компьютерной техники почти одновременно вызвало ее практическое применение, однако, несмотря на огромный скачок в процессе многолетнего развития ИТ и смежных дисциплин, большинство практических задач обработки текста не решены до сих пор. Этим занимается наука компьютерная лингвистика, которая изучает применение математических моделей для описания лингвистических закономерностей. Она подразделяется на две части, первая из которых занимается изучением способов применения электронной техники для лингвистических исследований с применением математических методов для выявления закономерностей (например, статистическая обработка). Далее выявленные закономерности используются для другой части исследования - изучения проблем осмысления текстов путем создания математических моделей для решения лингвистических задач и разработки программ на основе этих моделей. В этом отношении как часть науки компьютерной лингвистики существует ее раздел «Искусственный интеллект», предмет которой - разработка систем обработки текстов на естественном языке [4, с. 2].
Итак, этими проблемами (использование естественного языка в системах автоматической обработки информации) занимается наука компьютерная лингвистика, возникновение которой относится к 50-60 гг. ХХ в. Однако, несмотря на значительные научные и практические результаты компьютерной лингвистики, системы автоматического анализа и синтеза устной речи (и многие другие) совершенства до настоящего времени не достигли. При решении задач автоматической обработки информации (например, автоматического анализа и синтеза устной речи, автоматического перевода текстов с одних языков на другие, общения с ЭВМ на естественном языке) главные научные проблемы компьютерной лингвистики - это проблема моделирования процесса понимания смысла текста (то есть переход от текста к формализованному представлению его смысла), а также проблема синтеза речи (то есть переход от формализованного представления смысла к текстам).
Условное разделение лингвистических средств, создаваемых и применяемых в компьютерной лингвистике, на декларативную часть и процедурную часть происходит таким образом: декларативная часть - это словари единиц языка и речи, тексты и грамматические таблицы; процедурная часть - это средства манипулирования единицами языка и речи, текстами и грамматическими таблицами.
В частности, единицы языка и речи представляют собой морфемы, слова, словосочетания, фразы, сверхфразовые единства (единицы различного уровня), представляющие собой иерархическую систему, где смысловое значение единиц более высокого уровня не сводится полностью к смысловому значению составляющих их единиц более низкого уровня. А средствами манипулирования единицами языка и речи и текстами становятся процедуры морфологического, семантико-синтаксического и концептуального анализа и синтеза.
При этом успешное решение прикладных задач компьютерной лингвистики находится в зависимости от полноты и точности заложенных в памяти компьютера декларативных средств и качества процедурных средств, что в дальнейшем обязательно приведет к необходимому уровню решения таких задач.
Кроме того, требует решения такая задача компьютерной лингвистики, как построение лингвистических процессоров, которые должны оптимально обеспечивать общение пользователей с автоматизированными интеллектуальными информационными системами (мы имеем в виду экспертные системы) на естественном или близком к естественному языке. Лингвистические процессоры, как посредники между человеком и машиной (по той причине, что информация в интеллектуальных системах хранится в формализованном виде), решают такие задачи:
- переход от текстов входящих информационных запросов и сообщений на ЕЯ к передаче их смысла на формализованном языке. Концептуальный анализ представляет собой выявление понятийной структуры и перевод ее на формализованный язык, что осуществляется после морфологического и синтаксического анализа запросов и сообщений;
- переход от формализованного оформления смысла выходных сообщений к выдаче информации на естественном языке. Концептуальный синтез представляет собой переход от
представленных элементов структуры на формализованном языке к словесному представлению с необходимым синтаксическим и морфологическим оформлением.
По существу, в данном исследовании для нас важна компьютерная лингвистика постольку, поскольку она востребована при производстве судебной лингвистической экспертизы в ходе судебного разбирательства. Приведем пример, как это происходит при производстве экспертизы по установлению автора текста. Здесь используется тот факт, что любой человек владеет своим типичным набором слов, идиом, словесных штампов, в связи с чем возможно построение уникальной марковской матрицы человека, которая отслеживает особенности лексикона конкретного человека, характерные орфографические или пунктуационные ошибки [5, с. 203]. При сопоставлении получившейся матрицы с эталонной делается вывод, является ли автором исследуемого текста подозреваемый в этом человек. Другой вариант этого исследования помогает найти, кто из эмитентов, матрицы которых имеются в банке данных, является автором данного сообщения [6, с. 2].
Ко всему сказанному добавим, что хотя по структуре системы обработки связных текстов с применением компьютерных программ имеют различия, однако объединяет их широкое использование технологий представления знаний. Роль этих систем - понимание текста и ответы на вопросы по содержанию текста. Понимание необходимо рассматривать не в качестве универсальной категории, а в виде процесса извлечения информации из текста с определением конкретной коммуникативной цели. Таким образом, текст анализируется (прочитывается) только с той точки зрения, что представляет важность для пользователя, а это доказывает, что системы обработки связных текстов являются не универсальными, а проблемноориентированными.
Так, к специфическим проблемам при взаимодействии субъект-компьютер нужно отнести следующие:
1. Ограниченность интерфейса взаимодействия (клавиатура и мышь).
2. Несоответствие знаний компьютера о знаковой системе входящей информации и знаний субъекта об этой знаковой системе ЕЯ. В связи с этим разработка и дальнейшее совершенствование методов понимания компьютером естественного языка - важнейшая проблема при решении задачи получения нужной информации в результате использования компьютерных программ.
3. Ограниченность знаний компьютера о предметной области [7, с. 1].
Таким образом, неудовлетворительная ситуация с разрешением неоднозначности в системах компьютерной обработки текста имеет общий характер и не зависит от лингвистической модели, которая находится в основе текстового анализатора. Причина в том, что человек в процессе понимания текста при интерпретации неоднозначных элементов опирается на здравый смысл, знания о мире и свой опыт коммуникации, что пока недоступно компьютерным системам, так как не поддается сколько-нибудь масштабной формализации. Достигнутая в компьютерной лингвистике в настоящее время степень формализации чисто языковой семантики также далека от совершенства и недостаточна для эксплицирования тех нетривиальных сведений о смысле высказывания, которыми нужно располагать для разрешения неоднозначности текста.
В заключение мы предлагаем конкретные меры, которые, по нашему мнению, будут способствовать совершенствованию использования информационных технологий в практике экспертно-лингвистических исследований, что показано в таблице 1.
Таблица 1 - Использование информационных технологий в практике экспертно-лингвистических исследований
№ п/п Совершенствование использования информационных технологий в практике экспертно-лингвистических исследований
1 2
I Обучение работе с лингвистическими программами
1 Необходимость деятельного подхода к обучению с включением заданий тренировочного и контролирующего характера, обеспечивающего систематическую самостоятельную работу с языковым материалом при работе с лингвистическими программами.
2 Разработать системы обучающих компьютерных упражнений для получения практических знаний особенностей и возможностей компьютера, опыта в умении структурировать материал, формировать нелинейную гипертекстовую среду.
3 Выработать концептуальные подходы к организации учебного материала мультимедиа комплекса на гипертекстовой основе; методически обосновать место каждой составляющей среды мультимедиа (звука, иллюстраций, анимаций, видео) в структуре комплекса; определить виды и формы работы с учебным материалом; разработать механизм управления работой в гипертекстовой среде, предложить оптимальную форму разработки компьютерных материалов, стандартизированный сценарий, обеспечивающий работу цепочки: «методика - программное обеспечение - мультимедиа учебник».
Продолжение таблицы 1
4 - Обучение лингвистов-экспертов пользованию редактором. - Проанализировать материал пособия с точки зрения типизации заданий, модернизации, сбалансированности с возможностью редактирования. - Каждое задание обучающей программы необходимо снабдить помощью, желательно вариативной, учитывающей индивидуальные трудности. - Выработать концептуальный подход к осуществлению контроля и критериев оценки работы. - Увеличить интенсивность каждого упражнения с целью создания более совершенного средства самостоятельной работы в сравнении со сборником упражнений учебного пособия.
II Повышение компьютерной грамотности лингвистов
1 Совершенствование в умении вести диалог «пользователь - компьютер».
2 Обеспечение вузов новейшими техническими средствами. Заменить устаревшие компьютерные обучающие программы, созданные в 90-х гг., на новые.
III Сертификация программных лингвистических комплексов
1 Выбрать свой принцип сертификации лингвистических компьютерных программ, например, на основе западного стандарта сертификации для LSI (Latent Semantic Indexing) ISO 9001 : 2008. Чтобы получить эту сертификацию, LSI должен продемонстрировать: - набор процедур, которые охватывают все ключевые процессы в работе; - мониторинг процессов, чтобы обеспечить их эффективность; - надлежащий учет; - проверка на предмет наличия ошибок с возможностью корректировки; - регулярное тестирование отдельных процессов и качества самой системы на предмет эффективности; - содействие постоянному совершенствованию.
IV Открытие новых специальностей, в том числе лингвист-программист
1 В целях оптимальной подготовки специалистов для работы с помощью компьютерных технологий необходимо совмещение компьютерной грамотности с лингвистической грамотностью, для чего имеет смысл готовить специалистов-универсалов, например, лингвистов-программистов, так как эти знания будут востребованы при создании методик для лингвистической экспертизы.
2 В связи с большим спросом на специалистов в области компьютерной лингвистики предлагаем готовить компьютерных лингвистов не только в Москве в Высшей школе экономики, но и в других вузах страны.
V Финансирование новых компьютерных лингвистических разработок.
1 В настоящее время разработка лингвистических компьютерных программ держится на энтузиазме его участников, так как финансирование не соответствует уровню поставленной задачи и трудозатратам. Решение этих проблем требует соответствующего финансирования.
VI Изучение зарубежных лингвистических программ на предмет их использования в РФ
1 Поток зарубежных публикаций по вопросам компьютерной лингвистики огромен. Выходит много монографий, сборников, издаются журналы «Компьютерная лингвистика» (США), «Искусственный интеллект» (Нидерланды) и ряд других. Раз в два года проводится Международная конференция по компьютерной лингвистике (сокращенно - КОЛИНГ) Ежегодно проводится не менее десятка международных научных симпозиумов по прикладной лингвистике, по машинному переводу и т.д.
2 Сделать перевод всех учебных и служебных текстов на язык пользователей.
VII Обеспечение государственных экспертных учреждений и вузов необходимой техникой и методической литературой
1 Проблема нехватки специальной учебной и методической литературы (приходится искать информацию в Интернете, обрабатывать ее и составлять методические материалы) тормозит как обучение, так и работу в области экспертных лингвистических исследований.
Итак, судебная лингвистическая экспертиза - это сложная система различного рода элементов, включающая и нормативное регулирование, и статусы функции субъектов деятельности, а также систему технических средств, научных основ, методов и методик проведения экспертных исследований. Эта динамически развивающаяся система, которая относится к области практической деятельности, не может игнорировать использование технических средств, среди которых особое место принадлежит информационным технологиям, что ведет к определенной трансформации экспертного исследования как процесса познания и одновременно к значительному расширению его возможностей, к повышению научной обоснованности получаемых результатов. В связи с этим повышение эффективности решения задач в судебной экспертизе напрямую связано с уровнем и качеством подготовки специалистов юридического и лингвистического профиля, с освоением ими современных информационных технологий.
Ссылки:
1. Кусов Г.В. Генезис и современное состояние теории судебной лингвистической экспертизы, закономерности формирования и развития: монография. Краснодар, 2012.
2. Полевой Н.С. Криминалистическая кибернетика. Теория и практика математизации и автоматизации информационных процессов и систем в криминалистике. М., 1989.
3. Новые информационные технологии в судебной экспертизе: учебное пособие / Э.В. Сысоев, А.В. Селезнев, И.П. Рак, Е.В. Бурцева. Тамбов, 2006.
4. Селезнев К. Обработка текстов на естественном языке // Открытые системы. 2003. № 12. URL:
http://www.linter.ru/ru/press-centre/publications/74 (дата обращения: 08.08.2012).
5. Беллман Р. Введение в теорию матриц / под ред. В.Б. Лидского; пер.: В.Я. Катковник, Р.А. Полуэктов, М.С. Эпель-ман. М., 1969.
6. Прэнс Б. Компьютерная лингвистика // Газета «Компьютерные Вести». 1999. № 26. URL: www.kv.by/index.htm (дата обращения: 08.08.2012).
7. Проскурнин А.А. Автоматизированное извлечение декларативных знаний субъекта на основе когнитивного тезауруса. URL: http://it-claim.ru/Persons.pdf (дата обращения: 08.08.2012).
References (transliterated):
1. Kusov G.V. Genezis i sovremennoe sostoyanie teorii sudebnoy lingvisticheskoy ekspertizy, zakonomernosti formirovaniya i razvitiya: monograph. Krasnodar, 2012.
2. Polevoy N.S. Kriminalisticheskaya kibernetika. Teoriya i praktika matematizatsii i avtomatizatsii informatsionnykh protsessov i sistem v kriminalistike. M., 1989.
3. Novie informatsionnie tekhnologii v sudebnoy ekspertize: manual / E.V. Sysoev, A.V. Seleznev, I.P. Rak, E.V. Burtseva. Tambov, 2006.
4. Seleznev K. Obrabotka tekstov na estestvennom yazyke // Otkrytie sistemy. 2003. № 12. URL:
http://www.linter.ru/ru/press-centre/publications/74 (date of access: 08.08.2012).
5. Bellman R. Vvedenie v teoriyu matrits / ed. by V.B. Lidskiy; transl. of: V.Y. Katkovnik, R.A. Poluektov, M.S. Epel'man. M., 1969.
6. Prens B. Komp'yuternaya lingvistika // Gazeta «Komp'yuternie Vesti». 1999. № 26. URL: www.kv.by/index.htm (date of access: 08.08.2012).
7. Proskurnin A.A. Avtomatizirovannoe izvlechenie deklarativnykh znaniy sub"ekta na osnove kognitivnogo tezaurusa. URL: http://it-claim.ru/Persons.pdf (date of access: 08.08.2012).