«СЛОВАРЬ АКАДЕМИИ РОССИЙСКОЙ»
В ФОНДЕ ЛИНГВОГРАФИЧЕСКИХ ИСТОЧНИКОВ XVIII — ПЕРВОЙ ПОЛОВИНЫ XIX ВЕКА
В Казанском университете ведется работа по формированию компьютерного фонда словарей русского языка XVIII — первой половины XIX века1. Основное внимание в настоящее время уделяется академическим словарям данного периода, среди которых особое место занимает «Словарь Академии Российской» (первое издание 1789-1794 гг., далее — САР1) — главное и наиболее важное достижение русской лексикографии XVTTT века.
Свидетельством интереса исследователей к первому, а также ко второму изданию «Словаря Академии Российской» являются, в частности, фототипическое и наборное переиздания указанных академических лексикографических источников в России и за рубежом. Однако эти издания недоступны многим специалистам. Размещение САР1 в рс^-формате в Интернете расширяет круг пользователей, но указанный формат без соответствующей лингвоинформационной поддержки не позволяет исследователю осуществлять необходимые процедуры по оперативному автоматическому поиску, отбору и сравнению различных словарных материалов.
Как показывает анализ, одно из перспективных и эффективных направлений информатизации лингвографии2 — создание комплексных фондов, объединяющих различные словарные ресурсы.
1 Работа поддержана Российским гуманитарным научным фондом (грант № 11-04-12076в «Комплексный справочный фонд словарей русского языка XVIII — первой половины XIX века»).
2 Лингвография — междисциплинарная область языкознания, теория и практика создания языковых справочников, словарей (о лингвографии см.: [Замов, Галиуллин 1995: 5-9]; подразделами лингвографии являются лексикография, фразеография, морфемография, паремиография и др.).
Анализ тенденций развития словарного дела и информационного потенциала языковых справочников показывает, что наиболее перспективной формой существования словаря является интернет-версия, среди «плюсов» которой:
1) широкий круг пользователей; благодаря обогащению компьютерных технологий интернет-технологиями, что представляет собой очередную информационную революцию, достигается глобальная обобществленность языковых справочников;
2) широкие возможности установления связи со сходными сетевыми справочниками и формирования лингвографических интернет-комплексов на основе ресурсов, размещенных как на одном, так и на разных порталах (сайтах) [Галиуллин 2009: 635-639].
Несмотря на значительное число публикаций, посвященных САР1, материалы его, как показывает анализ, еще не в полной мере введены в историко-лингвистический оборот. Одним из показателей этого являются, в частности, сведения о количестве описываемых в САР1 единиц, представленные в лингвистической литературе; см., например: «св. 40 тыс. слов» [Белоусова 1998: 563]; «43257 слов» [Лутовинова 2009: 101] и др. Однако первичный анализ материалов САР1 в рамках фонда показывает, что число описанных единиц превышает 60 0 003; более точные данные будут получены после завершения обработки материалов САР1, представленных в компьютерной базе, после анализа, вычленения и определения статуса как словарных, так и несловарных форм в статьях САР1 — личных форм глаголов, форм множественного числа существительных, кратких форм прилагательных и т. п.
Работа с материалами САР1 существенно усложняется из-за гнездового расположения материала в словаре; определение исходного слова (вершины гнезда) нередко вызывает затруднения, причем словообразовательные и этимологические связи некоторых слов, представленные в гнездах, вызывают на современном этапе сомнения и возражения (см., например, чеботы в статье
3 Мнение об условности числа 43 257 и предположение о большем количестве слов в САР1 высказывалось в лингвистических публикациях: «По-видимому общее число учтенных в САР слов не менее 55 000 слов» [Биржакова 2001: 109].
боты и др.), к тому же алфавитные указатели не отражают многих единиц, зафиксированных в САР1.
Компьютерный фонд разрабатывается как комплексная информационная система, особым образом организующая и структурирующая словарные данные источников XVIII XІX веков, обеспечивающая оптимальные возможности отбора, систематизации и сравнения описываемых в них материалов в соответствии с поставленными задачами [Галиуллин, Каримуллина 2005: 314-318].
Материалы словарного фонда планируется разместить на сайте «Казанский лингвографический фонд» (http://www.klf.ksu.ru) портала Казанского федерального университета в качестве информационного интернет-ресурса со свободным доступом для всех пользователей сети.
На данном этапе ставится задача инвентаризации всех описываемых единиц, которые представлены в заголовочных частях словарных статей САР1, включая и внутригнездовые статьи.
С целью ускорения поиска при работе со словарем все включаемые в фонд единицы снабжаются точным адресом, содержащим:
а) номер части САР1 (от 1 до 6);
б) номер столбца (в ч. I — от 1 до 1150, в ч. II — от 1 до 1200, в ч. III — от 1 до 1388, в ч. IV — от 1 до 1272, в ч. V — от 1 до 1084, в ч. VI — от 1 до 1068);
в) номер абзаца (словарной статьи) в столбце; см., например, чай — 6-658:9 (далее в тексте статьи компоненты адреса передаются следующим образом — [ч. VI, стлб. 658: 9]).
Омонимы разводятся с помощью кратких пояснений, помещенных в круглых скобках и взятых, как правило, из текста словарной статьи, — указание на часть речи, на место ударения (для омографов), синоним, гипероним, толкование: алътъ (голос) и алътъ (скрипка), возъ (сущ.) и возъ (предл.), навозить (о’) и навозить (и’) и т. п.
Наряду со словами фиксируются также и различного рода сверхсловные единицы, формируется подфонд устойчивых словосочетаний, пословиц, поговорок, присловиц и др., описанных в словаре-источнике. Подфонд сверхсловных единиц снабжен указателем слов, зафиксированных в этих единицах. При обработке пользовательских запросов наряду с данными основного словни-
ка анализируются и материалы этого указателя, что способствует расширению информационного потенциала фонда. Так, например, благодаря подключению указателя пользователь получит данные о наличии присловицы На смирнаго Богъ нанесешь, а різвой самъ набіжить при обращении не только к глаголу набігать {набігаю), после статьи которого приведена данная паремия [ч. I, стлб. 421:3-4], но и к другим словам, зафиксированным в ее составе.
Ряд словарных статей дают сведения о некоторых морфемах русского языка (как правило, префиксальных, соотносимых с предлогами и описанных в САР1 в статьях предлогов); см., например, статьи безъ\ «Предл. (...) въ сложности же словъ употребляется вмЬсто отрицательной частицы не» [ч. I, стлб. 121: 1]; возъ: «Предлогъ никогда раздельно съ падежемъ нєсочиняющійся, но всегда слитно, и означаетъ или напряжете въ верхъ, или обратное дЬяніе (...) » [ч. I, стлб. 805: 1]; чрезъ: «Предлогъ (...) 5) Прибавляется къ именамъ сущест: прилагательн. и къ нарЬч: для означенія превозходнаго степени. Чрезмірпьш (...)» [ч. VI, стлб. 804: 1] и др.
Таким образом, в фонде решаются задачи лексикографического, фразеографического, паремиографического, а также морфемографического описания материалов САР1.
Регистрируются в фонде все единицы, стоящие в начале словарных статей, в том числе и несловарные (в современном понимании) формы: глагольные форма 1-го лица единственного числа (например, втаскиваю, стачиваю и т. п.), краткая форма прилагательных (аленекъ, алешенекъ и т. п.), формы множественного числа существительных (акриды, антиподы и т. п.) и др. Подобные формы сопровождаются в фонде специальными обозначениями.
Из материалов, находящихся в заголовочной части не в первой позиции (во второй и последующих), фиксируются словарные единицы различного типа:
а) варианты — алкоголь/алкооль, алмазной!алмазный, апофегма/апофтегма, бішь/бишь и др.;
б) синонимы — багрилыцикъ и багрячей, гуделыцикъ и гудило, равноботй и равнобочный, скупецъ и скупяга и др.;
в) производные слова — азбука, азбучка; азямъ, азямецъ, азям-чпкъ и др.
Значительную часть непервопозиционных словарных единиц в фонде составляют инфинитивы глаголов, которые, как правило, не регистрируются в алфавитных указателях (где обычно фиксируются только форма 1-го лица единственного числа, стоящая в заголовке словарной статьи), что, как уже было отмечено выше, значительно усложняет поиск. Кстати, количество инфинитивов во многих глагольных статьях более одного, в подобных случаях мы имеем дело со словарными единицами, непосредственно не соотносящимися с заголовочной личной формой; см., например, в гнезде багоръ ‘железный крюк’ статью багрю: «Багрю, ришь, забагрилъ, выбагрилъ, багрить, багривать, забагрить, выбагрить» [ч. I, стлб. 76: 2] или в гнезде бЪгъ статью избйгаю: «Избегаю, га-ешь, изб'Ьгъ, избегнуть, избЬжалъ, изб'Ьгу, гнуть, гать, жать» [ч. I, стлб. 420: 1], где приведены четыре (три) инфинитива, ни один из которых (!) не отмечен в алфавитных указателях.
Ряд сложностей сводной регистрации связан со случаями неоднотипного описания сходных материалов, с неединообразием подачи и описания единиц одного лингвографического класса4.
Сказанное относится:
а) как к отбору и подаче заголовочных единиц; ср.: «белобородый, русобородый, рыжебородый, седобородый, и пр.» [ч. I, стлб. 311: 6] и «бЬло, желто, черно, пестро, сизобрюх!й» [ч. I, стлб. 364: 4],
б) так к описанию включаемых единиц; ср.:
(1) «А. (А) Начерташе первыя буквы азбуки Славено-Рос-С1ЙСК1Я и первыя изъ гласныхъ, называемыя Азъ.
А. Въ числахъ церковныхъ съ титлою значить единицу, или 1.е; а со слЬдующимъ знакомь (...) внизу подписаннымъ означаетъ 1000» [ч. I, стлб. 1: 1-2].
(2) «В. Вторая буква изъ числа согласныхъ азбуки Славеиоросайсмя, по чину же азбучному третш, выговаривается в'Ьдщ въ щот1> церковномъ под титлою (...) означаетъ число 2 е; а когда съ правой стороны прибав-
4 Под лингвографическим классом понимается совокупность языковых единиц, которые вследствие наличия у них общих признаков имеют (или должны иметь) сходную интерпретацию в языковом справочнике (словаре) [Замов, Галиуллин 1995: 68].
ляется къ нему I, значить 12: когда же подъ нею пишется черта съ двумя поперечниками (...) означаетъ 2000» [ч. I, стлб. 451: 3].
Как видим, описание сходной информации в (1) дано в рамках двух словарных статей, в (2) — в рамках одной.
В перспективе компьютерная база пополнится и единицами, представленными внутри словарных статей, см., например, статью аангичъ: «(...) инако она въ СибирЬ называется Савкою или Саут-кою» [ч. I, стлб. 2: 4]; одно из указанных слов (савка) зафиксировано на своем алфавитном месте в отдельной отсылочной словарной статье, другое (саутка) отсутствует среди заголовочных единиц и упоминается только в словарных статьях аангичъ (пример см. выше) и савка.
Материалы, относящиеся к другим языкам, не регистрируются в фонде; см., например, сведения об употреблении лексических единиц в тюркских языках в статье аракъ\ «(...) Татары и Турки всякое горячее вино называютъ Аракы илиракы» [ч. I, стлб. 43: 3].
Паремии различного типа (пословицы, поговорки, прислови-цы) в САР1 обычно толкуются в рамках отдельных словарных статей (подстатей), однако в отдельных случаях отмечаются и другие способы подачи и описания паремических единиц. Так, в гнезде вода четыре пословицы описываются в четырех словарных статьях [ч. I, стлб. 793: 1-4], а в гнезде волкъ две пословицы толкуются внутри одной статьи [ч. I, стлб. 811: 6]. В гнезде гужъ статус паремии указан внутри словарной статьи («Тотъ тужи, у кого ременные гужи. Поговорка означающая (...)» [ч. II, стлб. 424: 5]), а в гнезде вгю разновидность паремии обозначена в самом начале статьи (абзаца) «Поговорка. Обуть кого изъ сапоговъ въ лапти (...)» [ч. I, стлб. 736: 1]). Ср. также: «Послов: Артель атаманомъ крЬпка(...)» [ч. I, стлб. 48: 5], «Пословица. Попалъ какъ сомъ въ вершу (■■■)» [ч. I, стлб. 658: 4] и «Взявшись за гужъ, не говори что не дюжъ. Послов. (...) » [ч. II, стлб. 424: 4] и др.
Помимо паремий-заголовков словарных статей фонд пополняется и единицами, описанными внутри словарных статей; см., например, в гнезде алтынъ присловицы, данные внутри статей соответствующих слов — алтынникъ и алтынный: «Алтынникъ (...) о такихъ говорится присловицею: Онъ взросъ на алтынахъ, т. е.
привыкъ съ малолетства брать взятки» [ч. I, стлб. 24: 1]; «Алтынный (...) Стоющш три коп%йки. Алтынная св'Ьча, алтынный ка-лачъ; отсюда присловица означающая скупягу: у него каждая ко-пЬйка алтыннымъ гвоздемъ прибита» [ч. I, стлб. 24: 3].
Особую группу формируют единицы, прямо не указанные в САР1, но восстанавливаемые на основании представленных форм (кстати, подобных единиц немало):
«Близехонекъ, нька, нько. прил. ум. Весьма близкш, недалек!й» [ч. I, стлб. 225: 5]; с учетом приведенной краткой формы прилагательного, а также находящегося в соседней статье наречия близехонько в словник фонда включается словарная форма прилагательного близехонъкш.
«Извозничаю иИзвогцичаю, чаешь, чаль, чать [ч. I, стлб. 574:1]; на основании последнего элемента восстанавливаются два инфинитива — извозничать и извогцичать.
В процессе сбора и обработки материала выявляются различного рода ошибки, описки, неточности в описаниях языковых единиц; см., в частности, некоторые примеры в первой части САР1: анффраксъ вместо анфраксь/шфураксь [стлб. 38: 3], арифметически вм. арифметически [стлб. 46: 3], пгребЬгъ вм. перебЬгъ [стлб. 423: 6], вбаживаю вм. вваживаю [стлб. 458: 9], избаживаю вм. изваживаю [стлб. 459: 5], взварвиаю вм. взвариваю [стлб. 497: 1], муроварица вм. муроварница [стлб. 500: 8], воз-плыцнкъ вм. возилыцикъ [стлб. 569: 4], провинятся вм. провиняться [стлб. 705: Х^р'Ьдковалосый ти. р'Ьдковолосый [стлб. 762: 3], воло-сиикъ вм. волосникъ [стлб. 763: 4] и др. Во многих случаях ошибочность подобных форм очевидна, нередко она подтверждается материалами данного гнезда (родственными словами, примерами употребления и т. д.) или материалами других словарных статей; например, на форму муроварница (вместо ошибочноймуроварица, приведенной в первой части [ч. I, стлб. 500: 8]) указывают материалы гнезда муро в четвертой части САР1 [ч. IV, стлб. 460: 4].
Для прояснения более сложных случаев, с целью идентификации «темных» единиц, уточнения сведений о них привлекаются материалы исторических словарей (в первую очередь «Словаря русского языка XVIII века», а также «Словаря русского языка
Х1-ХУП веков», «Словаря обиходного русского языка Московской Руси ХУ1-ХУП веков»), словарей различного типа ХУ1П-Х1Х веков (второго издания «Словаря Академии Российской», «Словаря церковнославянского и русского языка» и др.). Ссылки на словари и другие источники включаются в справочную зону фонда.
Нередки ошибки в нумерации значений, см. например, статьи адовъ [ч. I, стлб. 10: 5], аптека [ч. I, стлб. 42: 6], ароматы [ч. I, стлб. 47: 3], снабдйваю [ч. I, стлб. 117: 8], боръ [ч. I, стлб. 134: 5], выбираюсь [ч. I, стлб. 135: 4] и др.
Встречаются ошибки в номерах столбцов (особенно в алфавитных указателях). Так, над последним столбцом в 1-й части словаря ошибочно проставлен номер 1150 (должно быть 1140: предыдущие столбцы имеют номера ... 1138, 1139); это стало причиной неправильной адресации трех слов в алфавитном указателе, приложенном к изданию (эта ошибка повторяется и в указателе к современному (наборному) переизданию САР1).
Информация о подобных недочетах с включением также представленной в других публикациях, которые посвящены САР1 (см., например, приложения к современному переизданию словаря, содержащие сведения о различного типа исправлениях), регистрируется в компьютерном фонде в примечаниях к словарным статьям.
Программное обеспечение фонда позволяет пользователю оперативно выходить на конкретные страницы оригинального издания 1789-1794 годов, при этом предоставляются различные возможности поиска и отбора единиц:
а) путем ввода конкретного слова;
б) путем ввода условного образца (с учетом количества символов, их позиции в слове); например, по запросу «без*ный» выдается список слов типа безумный; запрос «\атъ» позволяет получить список четырехбуквенных слов с финалью -ать; а запрос «*-*» — перечень слов с дефисом и т д.;
в) путем ввода количества букв (символов);
г) путем ввода количества слогов.
Возможности формирования запросов расширяются за счет подключения сведений о количестве значений, о частеречной и стилистико-функциональной принадлежности слов, их происхождении и о других параметрах, зафиксированных в словарной базе.
В фонде пользователю предоставляется возможность организовать поиск как с использованием, так и без использования специфических букв старой кириллической азбуки (в последнем случае с заменой их соответствующими буквами современного алфавита), а также без указания конечных букв ъ и ъ, таким образом, пользователь может набирать аксюма и аксиома, арифметика и арифметика, базарь и базар, в Ъкъ и век, мхро и миро и др.
Для оптимизации, облегчения поиска и работы с материалами фонда в справочной части для ряда единиц приводятся их современные соответствия (варианты), что предоставляет возможность поиска и по современным соответствиям; см.: акула > аккула, акциз > акцызъ, асбест > азбестъ, абрикос > априкосъ, олифа > али-фа, весьма > веема и др.
Формирование компьютерного фонда языковых единиц, которые зафиксированы в САР1, позволит расширить, уточнить квантитативные данные, касающиеся различных характеристик этих единиц, например, получить сведения о количестве:
а) всех единиц, описанных в словаре,
б) однозначных и многозначных слов,
в) слов той или иной части речи,
г) слов той или иной стилистико-функциональной принадлежности,
д) единиц с определенной буквой (или буквосочетанием),
е) слов определенной длины (в буквах или слогах) и др.
Включение в состав фонда других лингвографических источников существенно увеличивает информационный потенциал фонда, в частности, расширяет возможности для сравнительного анализа словарных материалов различного типа.
На основе компьютерного фонда планируется создание традиционных (бумажных) словарных продуктов, в частности, обратных словарей (которые являются важным источником для историко-словообразовательных и историко-грамматических исследований), сводного указателя единиц, зафиксированных в словарях-источниках, и др.
Как показывает анализ, возможности применения фонда достаточно широки, особенно в разнообразных историко-лингвистических и историко-лингвографических исследованиях и раз-
работках; в частности, материалы фонда смогут способствовать расширению круга показаний лексикографических источников в «Словаре русского языка XVIII века» и Картотеке, пополнению сведений о словарной фиксации тех или иных языковых явлений.
В настоящее время, когда решается важная задача академического описания истории словарного состава русского языка, возрастает актуальность формирования сводов лексики разных периодов. Для XVIII века в качестве основного и крупнейшего собрания выступают фундаментальный «Словарь русского языка XVTTT века» и его Картотека. Однако, как показывает анализ, важные сведения содержатся и в других источниках, в том числе и в словарях, среди которых для данного периода, безусловно, наиболее ценным является «Словарь Академии Российской».
Литература
Белоусова 1998 — Белоусова А. С. Толковые словари // Русский язык Энциклопедия / Гл. ред. Ю. Н. Караулов. М.: Большая Российская энциклопедия : Дрофа. 1998. С 653-565.
Биржакова 2001 — Биржакова Е. Э. Словарь Академии Российской (1789— 1794 гг.) // История русской лексикографии / Под ред. Ф. П. Сороко-летова. СПб.: Наука. 2001. С. 98-126.
Галиуллин 2009 — Галиуллин К. Р. Интернет-лингвография: русские текстоописывающие словари // Проблемы истории, филологии, культуры 2(24). 2009. С. 635-639.
Галиуллин, Каримуллина 2005 — Галиуллин К. Р., Каримуллина Р. Н. Сводный фонд словарей русского языка XVIII века // Актуальные вопросы исторической лексикографии и лексикологии: Материалы Всероссийской Академической школы-семинара / Под ред. С. Св. Волкова, О. А. Старовойтовой. СПб: Наука, 2005. С. 314-317.
Замов, Галиуллин (ред.) 1995 — Компьютерная лингвография / Под ред. Н. К. Замова, К. Р. Галиуллина. Казань: Изд-во Казан, ун-та. 1995 [Электронная версия коллективной монографии доступна для скачивания по адресу: http://www.ksu.ni/flO/publications/1995/Kl.php]. Лутовинова 2009 — Лутовинова И. С. Толковые словари // Лексикография русского языка / Под ред. Д. М. Поцепни. СПб.: Факультет филологии и искусств СПбГУ. 2009. С. 94-177.