С.В.БАЗАРНОВА, С.О.ШЕВЦОВА* ИНФОРМАЦИОННО-ПОИСКОВЫЙ ТЕЗАУРУС ИНИОН РАН ПО ПРАВОВЕДЕНИЮ
Тезаурус ИНИОН РАН по правоведению представляет собой дескрипторный словарь, используемый для содержательной обработки документов и ведения поиска в Автоматизированной информационной библиографической системе ИНИОН. Он является средством унификации описания содержания как документов, так и запросов, поскольку его использование обеспечивает единообразное описание одного и того же содержания.
Тезаурус содержит два типа лексических единиц: 1) дескрипторы — лексические единицы, разрешенные для использования в Системе; 2) недескрипторы (аскрипторы) — лексические единицы, запрещенные для использования, причем каждый недескриптор содержат отсылку к соответствующему дескриптору (дескрипторам), который заменяет его при индексировании.
В Информационной системе ИНИОН Тезаурус выполняет функцию терминологического контроля при индексировании документов и запросов. Его применение позволяет решить все проблемы неоднозначности используемых лексических единиц, поскольку в
*
Базарнова Светлана Васильевна - старший научный сотрудник Отдела электронных информационных технологий Центра информатизации ИНИОН РАН; Шевцова Светлана Орестовна - кандидат юридических наук, старший научный сотрудник, заведующая Сектором по социальным наукам Отдела научнобиблиографической информации Фундаментальной библиотеки ИНИОН РАН.
нем устранены синонимия, полисемия и омонимия лексических единиц, выступающих в качестве дескрипторов, и потому все дескрипторы в рамках Системы имеют стандартное значение.
Другой важной функцией Тезауруса является представление семантических отношений между дескрипторами, с одной стороны, позволяющих более точно описать содержание дескриптора благодаря представлению места дескрипторов в понятийной системе отрасли, а с другой стороны, способствующих выбору эффективной стратегии поиска.
Тезаурус содержит около 8100 лексических единиц, из них около 3500 дескрипторов, т.е в нем представлено около 3500 понятий по правоведению, по которым можно вести поиск в Информационной системе ИНИОН. Это количество оказывается вполне соизмеримым с отраслевыми словарями и энциклопедиями. Например, в Юридическом энциклопедическом словаре (6) содержится около 1 тыс. словарных статей. При этом надо отметить, что Тезаурус не содержит узких понятий, которые, как правило, не являются объектами исследования. Таким образом, можно говорить о широком охвате научной проблематики правоведения в Тезаурусе.
Включение в Тезаурус около 4600 недескрипторов значительно повышает его семантическую силу, обеспечивает однозначность индексирования документов и запросов. В правоведении, как и в любой общественной науке, используемая терминология отличается своей неоднозначностью и широким употреблением синонимов. Это становится очевидным при знакомстве со словарными статьями отраслевых энциклопедий и энциклопедических словарей. Для устранения этого недостатка и для повышения эффективности Информационной системы и включены в Тезаурус недескрипторы. Их наличие обеспечивает переход от синонимов или многозначных терминов к соответствующим дескрипторам.
Объем Тезауруса позволяет говорить о том, что в нем довольно полно представлена существующая понятийная система правоведения, и потому его вполне можно использовать — полностью или частично — и в других информационных системах по правоведению. При этом степень специфичности понятий, представленных в Тезаурусе, оказывается вполне достаточной, чтобы использовать отдельные его части (преимущественно — отрасли права) для
формирования как локальных или предметно ориентированных, так и персональных баз данных.
Тезаурус существует как в печатной форме, так и в Интернет-версии, а также на дискетах и на СБ-ЯОМ. Существование всех этих форм Тезауруса отвечает современным требованиям и обеспечивает возможность его использования в самых разных режимах — от традиционного библиотечного обслуживания до его использования в разных типах автоматизированных информационных систем. Кроме того, Тезаурус может быть использован и в качестве отраслевого словаря, специфической особенностью которого является форма словарной статьи, представляющая собой заглавный термин и перечень лексических единиц, связанных с ним, и тип этой связи.
ЦЕЛЬ СОЗДАНИЯ И ОБЛАСТЬ ПРИМЕНЕНИЯ
Тезаурус используется для обработки всего документопотока, вводимого в Информационную библиографическую базу данных ИНИОН по правоведению, а также для ведения в ней поиска. Фонды Фундаментальной библиотеки ИНИОН и, соответственно, доку-ментопоток ориентированы на обслуживание специалистов-право-ведов, как изучающих общеметодические и теоретические проблемы, так и специализирующихся в самых разных отраслях права, — от уголовного до международного права включительно.
Содержание базы данных по правоведению описывается Отраслевым рубрикатором ИНИОН по правоведению, который является частью Рубрикатора автоматизированной информационной системы по общественным наукам (4). Поэтому первый уровень Отраслевого рубрикатора содержит собственно название отрасли — «Правоведение», а второй уровень уже содержит основные разделы этой отрасли, а именно:
Общие вопросы.
Общая теория государства и права.
История государства и права.
История политических и правовых учений.
Государственное (конституционное) право.
Административное право.
Финансовое право.
Хозяйственное право. Предпринимательское право.
Гражданское право.
Гражданско -процессуальное право (Гражданский процесс).
Изобретательское и рационализаторское право. Патентное право. Лицензионное право.
Авторское право.
Наследственное право.
Семейное право.
Аграрное право.
Правовые проблемы охраны окружающей среды.
Экологическое право.
Земельное право.
Лесное право.
Водное право.
Горное право.
Трудовое право.
Право социального обеспечения.
Правоохранительные органы.
Уголовное право.
Уголовно-процессуальное право (Уголовный процесс).
Криминология.
Уголовно-исполнительное право. Пенитенциария.
Криминалистика.
Судебная статистика.
Международное право.
Международное частное право.
Государство и право отдельных стран.
Приведенный перечень рубрик, по сути дела, является списком предметных полей Тезауруса, которые отражают всю тематику отрасли.
В то же время, каждое предметное поле или совокупность нескольких полей (например, комплекс отраслей, включающий уголовное и уголовно-процессуальное право, криминологию и криминалистику) можно рассматривать как отдельный микротезаурус со своей понятийной структурой, представленной дескрипторами и связями между ними. Такой микротезаурус может быть использован и в соответствующей локальной информационной системе, содержащей документы лишь по одной отрасли права (или совокупности нескольких отраслей). Если требуется большая степень
специфичности, то такой микротезаурус может стать основой для разработки специализированного тезауруса. В соответствии с задачами системы и конкретным документопотоком его структура должна быть изменена, причем это изменение должно идти главным образом в сторону углубления за счет введения более специфичных по значению дескрипторов. Однако благодаря наличию большого количества недескрипторов в Тезаурусе такое расширение легко может осуществляться и за счет перевода недескрипторов в статус дескрипторов. Этот подход позволяет существенно сократить материальные, временные и интеллектуальные издержки при создании узкоотраслевых или специализированных тезаурусов.
Тезаурус является также и хорошим вспомогательным средством для всех, кто создает свои фонды документов по правоведению или обращается к разным базам данных по правоведению.
Создание тезауруса
В 1981 г. в ИНИОН АН СССР была введена в эксплуатацию Автоматизированная информационная система по государству и праву (с 1999 г. она называется Информационной системой по правоведению и политологии). На первом этапе содержание вводимых документов описывалось с помощью ключевых слов, которые брались преимущественно из текста документа, но в случае необходимости индексатор мог приписывать любые нужные ключевые слова, отсутствующие в документе. При этом средняя глубина индексирования составила пять лексических единиц на документ. Эта глубина индексирования предварительно была определена эмпирически, и, как показала практика эксплуатации Системы, она оказалась достаточной в рамках поставленных в Информационной системе задач для эффективного функционирования Системы с точки зрения полноты и точности.
Через пять лет функционирования Системы было проведено редактирование накопленного массива ключевых слов, в результате чего был создан Список нормализованной лексики, содержащий дескрипторы и недескрипторы, т.е. выделены разрешенные и запрещенные для индексирования лексические единицы и зафиксированы отношения синонимии (в том числе и условной) между ними. Кроме того, в случае необходимости уточнения семантики в словарные
статьи дескрипторов могли включаться различные семантические пометы, примечания, методические указания по использованию дескрипторов, дефиниции и т.п.
Этот Список использовался при индексировании документов и запросов, однако в то же время по-прежнему было разрешено и применение ключевых слов для обозначения нужных, но отсутствующих в Списке понятий. Такой подход позволил обеспечить, с одной стороны, точность и однозначность описания содержания документа, поскольку Список еще не содержал весь необходимый набор дескрипторов, а с другой стороны, возможность дальнейшего совершенствования лексического состава Списка на основе анализа использованных при индексировании ключевых слов.
В течение 15 лет функционирования Системы проводилось постоянное редактирование Списка, что позволило обеспечить его адекватность документопотоку. В ходе последней редакции на основе семантических отношений между понятиями были установлены и зафиксированы парадигматические отношения между дескрипторами, т.е. был создан Тезаурус.
Документопоток
Документопоток по правоведению включает разные виды изданий, а именно: монографии, сборники, статьи из журналов и сборников, материалы съездов и конференций, тексты нормативных актов и законов, документы государственных и правоохранительных органов, справочная и библиографическая литература, учебная литература и учебные пособия, рецензии, авторефераты, депонированная литература и т.д. При этом книги составляют около 40%.
Документопоток содержит как отечественную (около 40%), так и зарубежную литературу по правоведению. Среди документов на иностранных языках большую часть, естественно, составляют документы на английском языке.
В правоведении, как и в других отраслях науки, существуют различные научные школы и направления, а поскольку в документопоток включается вся литература вне зависимости от принадлежности к определенной школе и направлению, то для Тезауруса должна была быть решена проблема совмещения различных понятийных систем отрасли. Только в этом случае возможно
адекватное представление в Системе всех документов. Такая работа была проведена, и потому можно говорить о том, что Тезаурус содержит интегрированную понятийную систему отрасли в целом.
Отбор лексики и структура лексического состава
Основной источник лексики Тезауруса — ключевые слова, использованные при индексировании документов. Естественно, что при редактировании и особенно при выделении из всего массива ключевых слов дескрипторов и установлении парадигматических отношений между ними широко привлекались и вторичные источники лексики, а именно:
— тезаурусы по правоведению и смежным отраслям социальных наук (отечественные и зарубежные);
— классификации (Отраслевой рубрикатор ИНИОН, ББК);
— юридические энциклопедии, энциклопедические словари, терминологические словари;
— учебные и методические пособия.
Поскольку Тезаурус формировался на основе ключевых слов, непосредственно взятых из документов, удалось добиться адекватности его лексического состава документопотоку и обеспечить нужную степень специфичности (с точки зрения Информационной системы ИНИОН) используемых в нем лексических единиц. С другой стороны, использование различных вторичных терминологических источников позволило устранить пробелы в интегрированной понятийной системе отрасли и тем самым добиться полноты ее представления в Тезаурусе. Кроме того, вторичные источники позволили уточнить значение включенных в него лексических единиц, обеспечить однозначность и точность семантики дескрипторов, а также установить семантические отношения между терминами, существующими в понятийной системе отрасли, и отразить их в виде парадигматических отношений между соответствующими дескрипторами.
Правоведение как отрасль науки включает в свой состав как теорию и историю права и правовых учений, методику научных исследований, проблемы функционирования правоохранительной системы и т.д., так и отрасли права. Это и обусловливает специфику лексического состава, включающего:
— узкоотраслевую лексику, которая используется только в одной отрасли права (например: агентский договор — только в обязательственном праве, добрососедства принцип — только в международном праве, преступления против военной службы — только в уголовном праве);
— многоотраслевую лексику, которая используется в двух и более отраслях права (например: банкротство — в хозяйственном, гражданском, гражданско-процессуальном, международном частном праве, арест — в административном, гражданско-процессуальном и уголовно-процессуальном праве);
— межотраслевую лексику, которая используется в правоведении и не относится к определенной отрасли права (например: делегирование полномочий, институционализация, компетенция, прекращение полномочий).
Такая ситуация приводит к необходимости фиксировать понятия в виде дескрипторов таким образом, чтобы их семантика была ясна для всех пользователей, а не только для специалистов в одной отрасли права. При этом специалист-отраслевик может принимать во внимание только интересующую его часть семантики и выбирать только соответствующие парадигматические связи.
Правоведение, как и любую отрасль науки, нельзя рассматривать изолированно ни от других отраслей науки, ни от жизни вообще, поскольку, с одной стороны, любой объект окружающей жизни может стать и объектом правового регулирования, а с другой стороны, лексика правоведения является составной частью общелитературного языка. Это отражается и в лексическом составе Тезауруса, который кроме собственно юридической лексики включает:
— терминологию и терминологическую лексику других социальных и гуманитарных наук (например: история, лингвистический анализ);
— терминологию и терминологическую лексику естественных и технических наук (например: компьютеризация, клонирование);
— общенаучную лексику (например: методология, лекции, понятие);
— общелитературную лексику (например: влияние, народ, действие).
Если проанализировать лексику Тезауруса с содержательной точки зрения, то в самом общем виде можно выделить следующие категории:
— отрасли права и понятийный аппарат различных отраслей права (например: авторское право, судебно-баллистическая экспертиза, гражданские дела);
— субъекты и объекты права (например: акционеры, Архипелаги, произведения архитектуры, банковская деятельность);
— общественные процессы и явления общественно-политической жизни (например: социалистические партии, политическая элита, экологическое движение);
— правоохранительные органы и их деятельность (например: адвокатура, государственный арбитраж, борьба с преступностью, административный порядок производства дел);
— государственное устройство, органы государственной власти и управления и их деятельность (например: валютная политика, министерства и ведомства, представительные органы власти);
— договоры и их действие (например: договор аренды транспортного средства, стороны договора, пролонгация договора);
— законодательство и его отрасли (например: подзаконные акты, законопроекты, аналогия закона, жилищное законодательство);
— история, теория и методология права (например: всеобщая история государства и права, феодальное право, сравнительноправовой метод, теория государства и права).
Надо особо отметить, что в Тезаурус не включены имена собственные, а именно названия конкретных органов государственной власти и управления и правоохранительных органов, общественных организаций и политических партий, конкретных нормативных актов и законов, международных организаций, международных договоров и соглашений и т.д., а также географические названия. Эти категории лексики разрешено использовать при индексировании в режиме ключевых слов.
Форма лексических единиц
В Тезаурус включены только имена нарицательные, за исклюю-чением лишь нескольких дескрипторов, связанных с деятельностью ООН (например: Вооруженные силы ООН).
Лексические единицы — это имена существительные в именительном падеже. Имена существительные в косвенном падеже, а также другие части речи — имена прилагательные, причастия, предлоги, союзы, могут входить только в качестве компонентов дескрипторов-словосочетаний (например: незаконный оборот нарко-тиков, лицо, отбывшее наказание, наказание без лишения свободы, политические права и свободы граждан).
Лексические единицы выступают в Тезаурусе и в единственном, и во множественном числе. При этом множественное число в основном используется для обозначения либо родового понятия (например: международно-правовые акты, банковские операции, химические вещества, органы государственной безопасности), либо совокупности конкретных объектов (например: авторские дела, административные реформы, атомные электростанции, беженцы). Слова и словосочетания, используемые в языке только во множественном числе, сохраняют, естественно, эту форму и в Тезаурусе (например: отпуск по беременности и родам, массовые беспорядки, социальные болезни, внутренние морские воды).
В ряде случаев для устранения многозначности в Тезаурус включаются и единственное, и множественное число одной и той же лексической единицы, но при этом за каждой формой закрепляется разное значение. В этом случае они снабжаются справками, где описано значение, закрепленное за каждой формой. Например: вещи
исп. для обозначения конкретных объектов и имущественных правоотношений; для обозначения объекта права исп. вещь. вещь
исп. для обозначения объекта права; для обозначения конкретных объектов имущественных правоотношений исп. вещи.
Лексические единицы взяты непосредственно из отраслевого языка науки, и потому в нем представлены все типы словообразования. Это могут быть простые и производные слова (например: вред,
отцовство, деидеологизация, законность, конституционализм), сложные и сложносокращенные слова (например: правопреемство, наркобизнес, градостроительство, профсоюзы), словосочетания (например: въезд и выезд, договор подряда на выполнение проектных и изыскательских работ), заимствования (с разной степенью языковой ассимиляции) (например: джихад, мониторинг, диссидент, офшор), аббревиатуры (только в качестве недескрипторов) (например: вуз).
Словосочетания в качестве дескрипторов включаются в обычной неинвертированной форме. Исключение составляют лишь небольшое количество дескрипторов. Так, например, дескрипторы, относящиеся к международному праву, включающие в свой состав в качестве компонента слово «принцип»: единогласия принцип, неприкосновенности принцип, субсидиарности принцип и т.д. В случае использования инвертированной формы в качестве дескриптора для обеспечения удобства пользования в Тезаурусе представлена и обычная форма с отсылкой к инвертированной форме. Например:
принцип субсидиарности
USE субсидиарности принцип.
Словарные статьи
Понятийная структура отрасли отражена в Тезаурусе в виде совокупности дескрипторов, представляющих эти понятия, и парадигматических связей между дескрипторами. С одной стороны, в Тезаурусе в силу его специфики представлена не вся понятийная структура отрасли, а только та ее часть, которая релевантна задачам Информационной системы ИНИОН. Она создана путем обобщения понятий слишком специфичных или малозначимых для Информационной системы. С другой стороны, ввиду существования различных научных школ и направлений в правоведении вообще не существует единой понятийной системы отрасли. Ситуация осложняется и комплексным характером отрасли, включающей в свой состав большое количество отдельных отраслей права, каждая из которых обладает собственной понятийной структурой при едином методическом аппарате отрасли. Это вызвало необходимость разработки для Тезауруса единой интегрированной понятийной системы, которая и представлена в нем.
Созданная таким образом понятийная система представлена в словарных статьях дескрипторов. Значение каждого дескриптора, зафиксированное в словарной статье, является стандартным в рамках Информационной системы ИНИОН. Это обеспечивает единообразие отражения одного и того же содержания в документах и запросах, что является условием эффективного функционирования Системы.
Анализ ключевых слов, использованных при индексировании, явился основой для выявления релевантных понятий. При этом для каждого понятия был сформирован так называемый класс условной эквивалентности, т.е. сгруппированы вместе все лексические единицы, обозначающие одно понятие или группу более или менее близких понятий. Все лексические единицы одного такого класса связаны между собой отношением синонимии. В каждом классе была выбрана одна лексическая единица для обозначения этого класса, которая и получила статус дескриптора, а все остальные — статус недескриптора. Недескрипторы приводятся в словарной статье дескриптора после символа ИЕ
Отношения синонимии в таком классе могут иметь
— либо абсолютный характер (языковая синонимия), например:
антиобщественное поведение ИЕ антисоциальное поведение асоциальное поведение
Очевидно, что все три термина являются абсолютными синонимами и различаются только с точки зрения словообразования.
— либо относительный характер (условная синонимия), например:
алкоголизм
ИЕ алкоголики злоупотребление алкоголем злоупотребление спиртными напитками пьянство
В этом случае вместе объединены близкие по смыслу термины, которые синонимами в собственном смысле слова не являются, но с точки зрения задач Системы их можно объединить вместе.
Надо отметить, что природа условной синонимии в правоведении весьма разнообразна, но в принципе можно выделить в качестве самых главных следующие типы:
— объединение всего круга родственных понятий, например: коллективные трудовые споры
ИЕ коллективные трудовые конфликты представитель работников представитель работодателей примирительная комиссия трудовой арбитраж
— объединение видовых понятий или понятий, являющихся составными частями понятия, обозначенного дескриптором, например:
консульские представители
ИЕ вице-консул генеральный консул консул
консульский агент нештатный консул
Однако чаще всего отношения условной синонимии сложно классифицировать, да и такая классификация в принципе может иметь какое-то значение только на стадии разработки Тезауруса, а с точки зрения функционирования системы это оказывается несущественным.
При выборе из класса условной эквивалентности лексической единицы в качестве дескриптора учитывается много критериев, а именно: терминологичность, частота встречаемости, идиоматич-ность, краткость, распространенность, наличие внутренней формы, словообразовательная продуктивность и т.д. Однако эти критерии имеют лишь рекомендательный характер, а единственным обязательным критерием является эффективность использования выбранной лексической единицы в Системе.
Большинство дескрипторов Тезауруса являются словосочетаниями. Они включаются в Тезаурус, если:
— сумма значений компонентов, составляющих словосочетание, не равна значению словосочетания, а значит, использование вместо него суммы двух дескрипторов приведет к искажению значения и информационному шуму, например:
личность и общество или личность + общество
Личность и общество — понятие, обозначающее их взаимодействие, взаимовлияние, а сумма будет относится также и к документам, где просто идет речь и о личности, и об обществе. право на информацию или право + информация Дескриптор обозначает один из видов прав человека, а сумма допускает любые толкования: информация в праве, правовая информация, правовые аспекты информации и т.д.
— в качестве дескриптора используется устойчивое словосочетание, например: валюта денежных обязательств, выморочное имущество, ненадлежащее врачевание;
— словосочетание можно передать суммой дескрипторов, но тем не менее его целесообразно включить в Тезаурус в качестве обозначения элемента понятийной структуры и, соответственно, для фиксации связей с другими дескрипторами, например:
аренда земли
ВТ аренда
ЯТ договор аренды
земельная собственность
земельное законодательство
земельное право
землепользование
крестьяне
фермеры
ИЕ земельная аренда крестьянин-арендатор
В принципе это понятие можно передать суммой двух дескрипторов аренда + земля, но отсутствие этого дескриптора в Тезаурусе привело бы к сокращению соответствующего фрагмента понятийной структуры, а это, в свою очередь, сказалось бы на возможности ведения поиска и его качестве. В данном случае один из компонентов словосочетания неинформативен, и потому его нецелесообразно вводить в качестве дескриптора, чтобы использовать лишь в качестве компонента для формирования сумм дескрипторов, например: военная доктрина, кодификация международного права, принципы международного права.
Кроме отношений синонимии в Тезаурусе в качестве парадигматических отношений фиксируются еще два типа отношений — иерархические отношения выше— ниже и ассоциативные отношения.
Отношения выше-ниже (соответственно обозначение — ВТ и КТ) объединяют самые разные типы иерархических отношений: род-вид, целое—часть, общее-частное и т.д. В общественных науках такая дифференциация вообще вряд ли возможна, и потому целесообразно лишь констатировать наличие такого типа отношений. При этом довольно часто встречаются случаи, когда между дескрипторами устанавливаются иерархические отношения, но основания деления при этом принципиально различаются, например:
предприятия
КТ арендные предприятия государственные предприятия иностранные предприятия капиталистические предприятия крупные предприятия малые предприятия муниципальные предприятия промышленные предприятия сельскохозяйственные предприятия совместные предприятия средние предприятия строительные предприятия торговые предприятия транспортные предприятия унитарные предприятия частные предприятия
В этом случае при установлении иерархических отношений можно определить, по крайней мере, пять оснований деления и, соответственно, выделить следующие группы предприятий: 1) арендные, государственные, муниципальные, унитарные, частные; 2) крупные, малые, средние; 3) промышленные, сельскохозяйственные, строительные, торговые, транспортные; 4) иностранные, совместные; 5) капиталистические. Конечно, предложенное здесь деление нижестоящих дескрипторов на некие группы не имеет абсолютного характера. В принципе вполне можно предложить и другие основания для деления и, соответственно, выделить и другие группы дескрипторов, что также говорит о неоднозначности классификации иерархических отношений по логическим типам. Для прагматических же задач, решаемых с помощью Информационной системы, вполне
достаточно зафиксировать лишь само наличие иерархических отношений.
Ассоциативные отношения (обозначение — RT) включают самые разные типы отношений, кроме иерархических отношений выше-ниже. Как и иерархические отношения дескриптора, ассоциативные вряд ли можно однозначно классифицировать. В принципе на стадии создания Тезауруса подобная классификация несомненно была бы полезна при выявлении отношений между дескрипторами, но интеллектуальные затраты и явная неоднозначность выделения типов ассоциативных отношений между терминами в общественных науках делают такую задачу совершенно нерентабельной. Поэтому в Тезаурусе просто фиксируются те ассоциативные отношения, которые полезны как для представления понятийной системы в целом, так и для поиска. Например: генетическая экспертиза RT генетика
криминалистическая экспертиза
медицинское право
независимая медицинская экспертиза
права человека
судебная экспертиза
судебно-медицинская экспертиза
международное медицинское право
отцовство
материнство
Вся система отношений в дескрипторной статье — синонимия (в том числе и условная), отношения выше-ниже и ассоциативные отношения — фиксирует положение дескриптора в понятийной системе отрасли, представленной в Тезаурусе, и тем самым позволяет описать его значение. Однако в тех случаях, когда словарная статья в целом не обеспечивает однозначность дескриптора в Системе, могут дополнительно использоваться и различные текстовые справки (после обозначения SN — Scope Note). Это — дефиниции особого рода, которые ограничивают значение дескриптора в Системе, выступают в качестве методического указания по использованию дескриптора и т.д. Например:
дотации
ассигнования из бюджета для покрытия запланированных убытков или сбалансирования нижестоящих бюджетов законопроекты
исп. для обозначения конкретных законопроектов в сочетании с объектом регулирования, для обозначения теоретического понятия исп. законодательный процесс
Особенностью словарных статей дескрипторов является дополнительное описание их значения с помощью двух классификационных языков — Отраслевого рубрикатора по правоведению ИНИОН и соответствующих отраслевых таблиц Библиотечнобиблиографической классификации. В каждой словарной статье дескриптора приведены индексы рубрик, к которым он отнесен в этих двух классификациях. Рубрики приводятся в дескрипторной статье только в буквенно-цифровой форме, и потому для понимания их значения необходимо обратиться соответственно к Систематическому или Классификационному указателю, где при буквенноцифровых индексах приведены их словесные формулировки. Например:
обвинение
исп. для обозначения процессуальной деятельности уполномоченных законом органов или лиц по доказыванию виновности лица, привлекаемого к уголовной ответственности, и для обозначения формулы обвинения
ВТ судебное разбирательство уголовный процесс КТ государственное обвинение общественное обвинение частно-публичное обвинение частное обвинение ЯТ вина защита (юрид.) обвинитель
обвинительное заключение обвиняемые
презумпция невиновности
состязательность
ИБ формула обвинения
РУБ А10792135; А10792155; А10792163;
ББК 67.411,
где А10792135 — прокурор, А10792155 — потерпевший, А10792163 — общественный обвинитель и общественный защитник, 67411 — уголовно-процессуальное право.
Таким образом, словарная статья дескриптора описывает его место в понятийной системе отрасли, представленной в Тезаурусе, благодаря фиксации его связей с другими элементами этой системы — другими дескрипторами. Каждый дескриптор многомерен сам по себе, так как он, с одной стороны, выступает в окружении других дескрипторов, а с другой стороны, эта многомерность может быть легко расширена уже и за пределами словарной статьи посредством движения по связям с другими дескрипторами. Каждый дескриптор является как бы центром одного семантического поля, а Тезаурус состоит из таких пересекающихся между собой полей. Место дескриптора в этом поле и место этого поля в Тезаурусе дефинируют значение дескриптора. Можно говорить о Тезаурусе как об особом словаре, содержащем при каждом понятии словарные статьи особого типа. При этом такая словарная статья отличается от традиционной словарной статьи в энциклопедиях и энциклопедических словарях в первую очередь формой. Что касается семантики, то здесь все зависит от поставленных задач. В принципе можно создать и словарную статью дескриптора, содержащую все семантические элементы словарной статьи энциклопедического словаря, а с другой стороны, ряд словарных статей энциклопедического словаря может включать в себя меньше содержательных элементов, чем дескрипторная статья. Можно сравнить, например, словарную статью приведенного выше дескриптора со словарной статьей этого же понятия в «Юридической энциклопедии» (5, с.272):
«Обвинение 1) в уголовном процессе деятельность уполномоченных законом органов и лиц, заключающаяся в доказывании виновности лица, привлекаемого к уголовной ответственности; 2) содержание обвинительного тезиса (так называемая формула обвинения), сформулированного в постановлении о привлечении в качестве обвиняемого, обвинительном заключении, определении о предании суду, обвинительном приговоре суда; формулировка обвинения, предложенная обвинителем и излагаемая в его речи. В этом значении закон (ст. 314 УПК) определяет обвинение как
описание преступного деяния, признанного доказанным (см. также Обвинительное заключение)».
Таким образом, словарная статья дескриптора является описанием его значения в Тезаурусе, и это значение является стандартным в Тезаурусе, а значит, и в Системе. За счет такой стандартизации в ряде случаев значение термина в отрасли и его значение в качестве дескриптора могут в определенной степени различаться.
Недескрипторы для удобства пользования Тезаурусом выделе -ны курсивом. Словарная статья недескриптора содержит отсылку к тому дескриптору (или дескрипторам), который должен быть использован вместо него при индексировании. В Тезаурусе представлены три типа недескрипторов и каждому из них соответствует свой тип словарной статьи.
1. Словарная статья простого недескриптора состоит из самого недескриптора и отсылки к соответствующему дескриптору после обозначения USE. Например:
договор на ремонт
USE договор на выполнение работ
2. Словарная статья сложного недескриптора, который при индексировании передается суммой дескрипторов, состоит из недескриптора и заменяющей его суммы после отсылки USE. Включение таких недескрипторов обеспечивает правильное представление соответствующего понятия в Системе, поскольку в противном случае при индексировании возможно сведение такого понятия к одному дескриптору, использованию неправильных дескрипторов или использованию неправильной суммы. Для обеспечения обозримости Тезауруса такие недескрипторы включа-ются в него лишь в том случае, если возможна неоднозначность представления такой суммы. Например:
незаконное хранение огнестрельного оружия USE оружие + преступления против общественного порядка Эти недескрипторы представлены как синонимы после ссылки UF при соответствующих дескрипторах со знаком +. Тем самым их можно легко отличить от простых дескрипторов. Например: оружие
UF незаконное хранение огнестрельного оружия + преступления против общественного порядка
UF незаконное хранение огнестрельного оружия +
3. Словарная статья сложного недескриптора, который при индексировании может быть передан одним из нескольких Альтернативных дескрипторов, состоит из этого недескриптора и после отсылки USE перечня альтернативных дескрипторов. Обычно это — полисемичные (многозначные) термины, а в ряде случаев и омонимичные. Такие термины приобретают однозначность лишь в контексте научных работ, и потому при индексировании на основании контекста документа определяется его значение и из перечня альтернативных дескрипторов выбирается нужный. Включение этих недескрипторов, как и в предыдущем случае, обеспечивает однозначность представления многозначного понятия в Системе. Например: агент
USE агентский договор/органы внутренних дел/разведка/шпионаж
Эти недескрипторы представлены как синонимы при всех соответствующих дескрипторах после ссылки UF с пометой /. Тем самым их можно отличить от простых недескрипторов и недескрип-торов, передаваемых суммой дескрипторов. Например: агентский договор UF агент/
органы внутренних дел
UF агент/ разведка UF агент/ шпионаж
UF агент/
СТРУКТУРА ТЕЗАУРУСА
Тезаурус состоит из четырех указателей:
1. Алфавитный лексико-семантический указатель
Это — основной указатель Тезауруса. В нем представлены все дескрипторы с полными словарными статьями, а также все недеск-рипторы (как простые, так и сложные). Для удобства пользования недескрипторы приведены курсивом. Упорядочение всех лексических единиц производится по алфавиту. Поиск релевантных дескрипторов соответственно также ведется по алфавиту.
Наличие недескрипторов существенно увеличивает семантическую силу любого тезауруса, поскольку, с одной стороны, недеск-рипторы при дескрипторе позволяют более точно и однозначно описать его семантику, а с другой стороны, наличие недескрипторов в Тезаурусе позволяет пользователю по известным ему терминам получить отсылку к соответствующему дескриптору. Особенно важным это оказывается в тех случаях, когда релевантный термин является недескриптором, который должен передаваться либо суммой дескрипторов, не являющейся очевидной (например: перемена фамилии USE акты гражданского состояния + имя), либо одним дескриптором из перечня альтернативных дескрипторов, (например: депозитарий USE международный договор/рынок ценных бумаг/ депозитарный договор). Отсутствие таких недескрипторов в Тезаурусе затрудняет поиск релевантных дескрипторов, приводит к ошибкам или к неоднозначности отражения одного и того же содержания, что, в свою очередь, влияет на качество индексирования и поиска.
Поскольку только в Алфавитном указателе полностью представлены дескрипторные статьи, в тех случаях, когда дескриптор найден в других указателях Тезауруса, целесообразно проверить здесь его семантику. Например, для соответствующего объекта авторского права в Пермутационном указателе найден дескриптор «перевод произведения на другой язык». Но при обращении к Алфавитному указателю оказывается, что за ним закреплено иное значение, а поиск соответствующих документов нужно вести по другому дескриптору — «производные произведения»:
перевод произведения на другой язык
SN как вид работы; для обозначения объекта авторского права исп. производные произведения
Или другой пример: в других указателях найден дескриптор «дефект вещи», а в словарной статье в Алфавитном указателе при этом дескрипторе приводится словарная статья, которая позволяет сразу же уточнить запрос и выбрать оптимальную стратегию поиска. дефект вещи RT вещь
качество продукции качество товара
недоброкачественная продукция обязательственное право
UF недостатки вещи
Фрагмент Алфавитного лексико-семантического указателя: консерватизм
BT история политических учений
политические взгляды
политические учения
NT неоконсерватизм
RT консервативные партии
РУБ А100723 / А10110931 / А10155541
ББК 67.0 / 66.1
консигнация
USE договор комиссии
консолидированные долги
USE государственные долги
консолидированный баланс
USE бухгалтерская отчетность
консорциумы
RT банки
банковская политика конкурентоспособность международная торговля монополии
предпринимательская деятельность солидарная ответственность хозяйственные организации РУБ А10216125 / А10272141 ББК 67.404.2 / 67.404 / 67.412
Таким образом, Алфавитный указатель используется в Системе для поиска релевантного дескриптора или для уточнения значения дескриптора, найденного во вспомогательных указателях, а при поиске он служит средством для изменения стратегии поиска.
2. Систематический указатель
Этот указатель содержит только дескрипторы без словарных статей. Дескрипторы упорядочены по рубрикам Отраслевого рубрикатора ИНИОН по правоведению. Основная функция этого Рубрикатора — упорядочение документов при подготовке ежемесячного библиографического указателя «Новая литература по социаль-
ным и гуманитарным наукам. Правоведение. Политология», и потому глубина иерархии невелика — до пяти уровней. При этом первый уровень — название отрасли, а второй — название отрасли права. Например:
А10 Государство и право
А1057 Лесное право А105701 Общие вопросы А105721 Право собственности на леса А105741 Право лесопользования
А105751 Государственное регулирование лесопользования А105765 Ответственность за лесонарушение А105791 Лесное право отдельных стран А1059 Водное право
Использование Отраслевого рубрикатора в качестве средства упорядочения лексического состава Тезауруса по иерархическому признаку имеет свои положительные и отрицательные стороны. С одной стороны, этот Рубрикатор используется в системе около 20 лет и доказал на практике свою эффективность для упорядочения отраслевого массива документов в ежемесячных библиографических указателях по правоведению. С другой стороны, при разработке Рубрикатора не предполагалось использовать его в качестве средства для создания Систематического указателя Тезауруса, и потому он не всегда подходит для упорядочения лексического состава. Так, некоторая часть лексики вообще не может быть отнесена ни к одной рубрике в силу слишком общего значения (например: анализ, дифференциация, конфликты), а определенная часть лексики лишь условно может быть отнесена к некоторым рубрикам (например: к рубрике «Право и общественные науки» отнесены дескрипторы: биоресурсы, генетика, метеорология) и т.д. В то же время в силу специфики отрасли целый ряд дескрипторов может быть отнесен к большому количеству рубрик, но для сохранения обозримости Систематического указателя это не делалось. Лишь в некоторых случаях дескриптор отнесен к пяти и более рубрикам. Следствием такого подхода является отсутствие всех релевантных дескрипторов под соответствующей рубрикой. Однако тем не менее в принципе
Рубрикатор можно использовать в качестве средства иерархического упорядочения лексики.
Отраслевой рубрикатор представляет собой перечень рубрик, где каждая рубрика имеет две формы — буквенно-цифровую и словесную. При индексировании и при поиске используется только буквенно-цифровая форма, в библиографическом указателе — словесная. В Систематическом указателе Тезауруса используются и буквенно-цифровая, и словесная формы рубрик, а при дескрипторах используется только буквенно-цифровая форма. Каждый дескриптор в Лексико-семантическом указателе может быть отнесен к одной или к нескольким рубрикам (например: уголовное дело А107901/ А108641/А10875133). В Систематическом указателе под каждой рубрикой приводятся все дескрипторы, которые были отнесены к ней в Алфавитном указателе. Упорядочение рубрик в Систематическом указателе производится в порядке возрастания их цифровых индеек-сов, а внутри рубрики дескрипторы упорядочиваются по алфавиту. Фрагмент систематического указателя:
А103135 Доказательства
доказательства
доказательственное право
А10075341 Общее учение о доказательствах
обязанность доказывания А10313551 Виды доказательств
вещественные доказательства заключение эксперта письменные доказательства показания свидетелей показания сторон экспертиза
Систематический указатель используется для поиска релевантной рубрики при отсутствии четкого и конкретного запроса, для получения большого массива документов или для расширения запроса при неэффективном поиске по дескрипторам, а также для поиска дескриптора в рамках релевантной рубрики.
3. Пермутационный указатель
Данный указатель, как и Алфавитный указатель, содержит все дескрипторы и все недескрипторы, но без словарных статей. Для удобства пользования недескрипторы напечатаны курсивом. Упо-рядочение лексических единиц производится по алфавиту каждого значимого слова, входящего в состав дескриптора или недескриптора. Словосочетания в зависимости от количества значимых слов фиксируются в двух и более местах Пермутационного указателя. В результате общего упорядочения всех слов по алфавиту в Пермута-ционном указателе формируются словарные гнезда, где можно легко отыскать релевантные дескрипторы, если известно какое-то более или менее близкое обозначение. Так, дескриптор «международное авторское право» будет представлен в трех местах Пермутационного указателя, точнее — в трех словарных гнездах:
охрана авторских прав
передача авторских прав объекты авторского права авторское право международное авторское право
авторское свидетельство
субъект международного права теория международного права международное авторское право международное атомное право
медицинское право международное право международное авторское право международное атомное право
Таким образом, при обращении к любому из трех словарных гнезд будет найден указанный выше дескриптор.
Пермутационный указатель используется для поиска нужного дескриптора в рамках релевантного словарного гнезда. Особенно он удобен в тех случаях, когда пользователь лишь приблизительно
представляет название интересующего его объекта исследования или хочет убедиться в наличии определенного дескриптора в Тезаурусе.
4. Классификационный указатель
Этот указатель аналогичен Систематическому указателю. Он также содержит только дескрипторы без словарных статей, которые упорядочены по иерархическому признаку в соответствии с рубриками отраслевых таблиц Библиотечно-библиографической классификации (ББК). Рубрики также имеют словесную и цифровую формы. В Классификационном указателе эти рубрики приводятся в обеих формах, в Алфавитном — только в цифровой. Упорядочение рубрик производится в порядке возрастания индексов, а внутри рубрик дескрипторы упорядочиваются по алфавиту. Надо отметить, что рубрики ББК имеют более общий характер, чем рубрики Отраслевого рубрикатора ИНИОН. Он служит вспомогательным средством для перехода от дескрипторов к рубрикам ББК или для поиска нужного дескриптора в релевантной рубрике ББК при обращении к базе данных ИНИОН.
Список литературы
1. Большая советская энциклопедия: В 30 т. / Гл. ред. А.М.Прохоров. - 3-е изд. - М.:
Сов. Энциклопедия, 1969- 1978.
2. Большой юридический словарь / Белов В.А., Бойцова В.В., Бойцова Л.В. и др.; Под
ред. Сухарева А.Я., Крутских В.Е. - 2-е изд., перераб. и доп. - М.: ИНФРА- М, 2000. - 703 с. - (Б-ка словарей «ИНФРА-М»).
3. Российская юридическая энциклопедия / Абова Т. Е., Авакьян С.А., Агамов Г.Д. и
др.; Гл. ред. Сухарев А.Я. - М.: ИНФРА-М, 1999. - 1110 с.
4. Рубрикатор автоматизированной информационной системы по общественным наука
(АИСОН): Классификационная таблица / РАН ИНИОН. Фундам. б-ка. Отд. каталогизации и электрон. каталогов. Отд. науч. библиогр. информ.; Сост. Антонюк Г.С. и др.; Отв. ред. Глинский В.А., Слива А.И. - М., 2000. - 192 с.
5. Тихомирова Л.В., Тихомиров М.Ю. Юридическая энциклопедия. - М.: Тихомиров,
1997.- 525 с.
6. Энциклопедический юридический словарь / Додонов В.Н., Пиголкин А.С., Панов В.П. и др.; Под общ. ред. Крутских В.Е. - 2-е изд. - М.: ИНФРА-М, 1999. -368 с. - (Б-ка словарей «ИНФРА-М»).
7. Юридический энциклопедический словарь / Гл. ред. Сухарев А.Я. Редкол.: Богуславский М.М. и др. - М.: Сов. энциклопедия, 1984. - 415 с.