Научная статья на тему '«Словарь Академии Российской» в фонде лингвографических источников XVIII — первой половины XIX века'

«Словарь Академии Российской» в фонде лингвографических источников XVIII — первой половины XIX века Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
339
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РУССКИЙ ЯЗЫК / XVIII ВЕК / ЛЕКСИКА / ЛИНГВОГРАФИЯ / СЛОВАРЬ / СЛОВАРЬ АКАДЕМИИ РОССИЙСКОЙ / ИНТЕРНЕТ-ФОНД / RUSSIAN LANGUAGE / XVIII CENTURY / VOCABULARY / LINGUOGRAPHY / DICTIONARY / RUSSIAN ACADEMY DICTIONARY / ONLINE COLLECTION

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Галиуллин Камиль Рахимович

Рассматриваются вопросы, формирования интернет-фонда лингвографических источников русского языка XVIII — первой половины XIX века, особенности включения и подачи материалов важнейшего источника XVIII века — «Словаря Академии Российской»; раскрываются принципы регистрации и описания словарных данных, их обработки, пользовательские возможности, предоставляемые фондом, его информационный потенциал.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Russian Academy Dictionary in the Collection of Linguographic Sources (XVIII — the first half of the XIX Century)

The paper addresses problems related to the formation of an online collection of Russian linguographic sources (the XVIII Century — the first half of the XIX Century), especially those of including and presenting the Russian Academy Dictionary, the most important XVIII Century dictionary of Russian. It also outlines the principles underlying dictionary data registration, description, and processing, as well as the opportunities offered by the collection and its information potential.

Текст научной работы на тему ««Словарь Академии Российской» в фонде лингвографических источников XVIII — первой половины XIX века»

«СЛОВАРЬ АКАДЕМИИ РОССИЙСКОЙ»

В ФОНДЕ ЛИНГВОГРАФИЧЕСКИХ ИСТОЧНИКОВ XVIII — ПЕРВОЙ ПОЛОВИНЫ XIX ВЕКА

В Казанском университете ведется работа по формированию компьютерного фонда словарей русского языка XVIII — первой половины XIX века1. Основное внимание в настоящее время уделяется академическим словарям данного периода, среди которых особое место занимает «Словарь Академии Российской» (первое издание 1789-1794 гг., далее — САР1) — главное и наиболее важное достижение русской лексикографии XVTTT века.

Свидетельством интереса исследователей к первому, а также ко второму изданию «Словаря Академии Российской» являются, в частности, фототипическое и наборное переиздания указанных академических лексикографических источников в России и за рубежом. Однако эти издания недоступны многим специалистам. Размещение САР1 в рс^-формате в Интернете расширяет круг пользователей, но указанный формат без соответствующей лингвоинформационной поддержки не позволяет исследователю осуществлять необходимые процедуры по оперативному автоматическому поиску, отбору и сравнению различных словарных материалов.

Как показывает анализ, одно из перспективных и эффективных направлений информатизации лингвографии2 — создание комплексных фондов, объединяющих различные словарные ресурсы.

1 Работа поддержана Российским гуманитарным научным фондом (грант № 11-04-12076в «Комплексный справочный фонд словарей русского языка XVIII — первой половины XIX века»).

2 Лингвография — междисциплинарная область языкознания, теория и практика создания языковых справочников, словарей (о лингвографии см.: [Замов, Галиуллин 1995: 5-9]; подразделами лингвографии являются лексикография, фразеография, морфемография, паремиография и др.).

Анализ тенденций развития словарного дела и информационного потенциала языковых справочников показывает, что наиболее перспективной формой существования словаря является интернет-версия, среди «плюсов» которой:

1) широкий круг пользователей; благодаря обогащению компьютерных технологий интернет-технологиями, что представляет собой очередную информационную революцию, достигается глобальная обобществленность языковых справочников;

2) широкие возможности установления связи со сходными сетевыми справочниками и формирования лингвографических интернет-комплексов на основе ресурсов, размещенных как на одном, так и на разных порталах (сайтах) [Галиуллин 2009: 635-639].

Несмотря на значительное число публикаций, посвященных САР1, материалы его, как показывает анализ, еще не в полной мере введены в историко-лингвистический оборот. Одним из показателей этого являются, в частности, сведения о количестве описываемых в САР1 единиц, представленные в лингвистической литературе; см., например: «св. 40 тыс. слов» [Белоусова 1998: 563]; «43257 слов» [Лутовинова 2009: 101] и др. Однако первичный анализ материалов САР1 в рамках фонда показывает, что число описанных единиц превышает 60 0 003; более точные данные будут получены после завершения обработки материалов САР1, представленных в компьютерной базе, после анализа, вычленения и определения статуса как словарных, так и несловарных форм в статьях САР1 — личных форм глаголов, форм множественного числа существительных, кратких форм прилагательных и т. п.

Работа с материалами САР1 существенно усложняется из-за гнездового расположения материала в словаре; определение исходного слова (вершины гнезда) нередко вызывает затруднения, причем словообразовательные и этимологические связи некоторых слов, представленные в гнездах, вызывают на современном этапе сомнения и возражения (см., например, чеботы в статье

3 Мнение об условности числа 43 257 и предположение о большем количестве слов в САР1 высказывалось в лингвистических публикациях: «По-видимому общее число учтенных в САР слов не менее 55 000 слов» [Биржакова 2001: 109].

боты и др.), к тому же алфавитные указатели не отражают многих единиц, зафиксированных в САР1.

Компьютерный фонд разрабатывается как комплексная информационная система, особым образом организующая и структурирующая словарные данные источников XVIII XІX веков, обеспечивающая оптимальные возможности отбора, систематизации и сравнения описываемых в них материалов в соответствии с поставленными задачами [Галиуллин, Каримуллина 2005: 314-318].

Материалы словарного фонда планируется разместить на сайте «Казанский лингвографический фонд» (http://www.klf.ksu.ru) портала Казанского федерального университета в качестве информационного интернет-ресурса со свободным доступом для всех пользователей сети.

На данном этапе ставится задача инвентаризации всех описываемых единиц, которые представлены в заголовочных частях словарных статей САР1, включая и внутригнездовые статьи.

С целью ускорения поиска при работе со словарем все включаемые в фонд единицы снабжаются точным адресом, содержащим:

а) номер части САР1 (от 1 до 6);

б) номер столбца (в ч. I — от 1 до 1150, в ч. II — от 1 до 1200, в ч. III — от 1 до 1388, в ч. IV — от 1 до 1272, в ч. V — от 1 до 1084, в ч. VI — от 1 до 1068);

в) номер абзаца (словарной статьи) в столбце; см., например, чай — 6-658:9 (далее в тексте статьи компоненты адреса передаются следующим образом — [ч. VI, стлб. 658: 9]).

Омонимы разводятся с помощью кратких пояснений, помещенных в круглых скобках и взятых, как правило, из текста словарной статьи, — указание на часть речи, на место ударения (для омографов), синоним, гипероним, толкование: алътъ (голос) и алътъ (скрипка), возъ (сущ.) и возъ (предл.), навозить (о’) и навозить (и’) и т. п.

Наряду со словами фиксируются также и различного рода сверхсловные единицы, формируется подфонд устойчивых словосочетаний, пословиц, поговорок, присловиц и др., описанных в словаре-источнике. Подфонд сверхсловных единиц снабжен указателем слов, зафиксированных в этих единицах. При обработке пользовательских запросов наряду с данными основного словни-

ка анализируются и материалы этого указателя, что способствует расширению информационного потенциала фонда. Так, например, благодаря подключению указателя пользователь получит данные о наличии присловицы На смирнаго Богъ нанесешь, а різвой самъ набіжить при обращении не только к глаголу набігать {набігаю), после статьи которого приведена данная паремия [ч. I, стлб. 421:3-4], но и к другим словам, зафиксированным в ее составе.

Ряд словарных статей дают сведения о некоторых морфемах русского языка (как правило, префиксальных, соотносимых с предлогами и описанных в САР1 в статьях предлогов); см., например, статьи безъ\ «Предл. (...) въ сложности же словъ употребляется вмЬсто отрицательной частицы не» [ч. I, стлб. 121: 1]; возъ: «Предлогъ никогда раздельно съ падежемъ нєсочиняющійся, но всегда слитно, и означаетъ или напряжете въ верхъ, или обратное дЬяніе (...) » [ч. I, стлб. 805: 1]; чрезъ: «Предлогъ (...) 5) Прибавляется къ именамъ сущест: прилагательн. и къ нарЬч: для означенія превозходнаго степени. Чрезмірпьш (...)» [ч. VI, стлб. 804: 1] и др.

Таким образом, в фонде решаются задачи лексикографического, фразеографического, паремиографического, а также морфемографического описания материалов САР1.

Регистрируются в фонде все единицы, стоящие в начале словарных статей, в том числе и несловарные (в современном понимании) формы: глагольные форма 1-го лица единственного числа (например, втаскиваю, стачиваю и т. п.), краткая форма прилагательных (аленекъ, алешенекъ и т. п.), формы множественного числа существительных (акриды, антиподы и т. п.) и др. Подобные формы сопровождаются в фонде специальными обозначениями.

Из материалов, находящихся в заголовочной части не в первой позиции (во второй и последующих), фиксируются словарные единицы различного типа:

а) варианты — алкоголь/алкооль, алмазной!алмазный, апофегма/апофтегма, бішь/бишь и др.;

б) синонимы — багрилыцикъ и багрячей, гуделыцикъ и гудило, равноботй и равнобочный, скупецъ и скупяга и др.;

в) производные слова — азбука, азбучка; азямъ, азямецъ, азям-чпкъ и др.

Значительную часть непервопозиционных словарных единиц в фонде составляют инфинитивы глаголов, которые, как правило, не регистрируются в алфавитных указателях (где обычно фиксируются только форма 1-го лица единственного числа, стоящая в заголовке словарной статьи), что, как уже было отмечено выше, значительно усложняет поиск. Кстати, количество инфинитивов во многих глагольных статьях более одного, в подобных случаях мы имеем дело со словарными единицами, непосредственно не соотносящимися с заголовочной личной формой; см., например, в гнезде багоръ ‘железный крюк’ статью багрю: «Багрю, ришь, забагрилъ, выбагрилъ, багрить, багривать, забагрить, выбагрить» [ч. I, стлб. 76: 2] или в гнезде бЪгъ статью избйгаю: «Избегаю, га-ешь, изб'Ьгъ, избегнуть, избЬжалъ, изб'Ьгу, гнуть, гать, жать» [ч. I, стлб. 420: 1], где приведены четыре (три) инфинитива, ни один из которых (!) не отмечен в алфавитных указателях.

Ряд сложностей сводной регистрации связан со случаями неоднотипного описания сходных материалов, с неединообразием подачи и описания единиц одного лингвографического класса4.

Сказанное относится:

а) как к отбору и подаче заголовочных единиц; ср.: «белобородый, русобородый, рыжебородый, седобородый, и пр.» [ч. I, стлб. 311: 6] и «бЬло, желто, черно, пестро, сизобрюх!й» [ч. I, стлб. 364: 4],

б) так к описанию включаемых единиц; ср.:

(1) «А. (А) Начерташе первыя буквы азбуки Славено-Рос-С1ЙСК1Я и первыя изъ гласныхъ, называемыя Азъ.

А. Въ числахъ церковныхъ съ титлою значить единицу, или 1.е; а со слЬдующимъ знакомь (...) внизу подписаннымъ означаетъ 1000» [ч. I, стлб. 1: 1-2].

(2) «В. Вторая буква изъ числа согласныхъ азбуки Славеиоросайсмя, по чину же азбучному третш, выговаривается в'Ьдщ въ щот1> церковномъ под титлою (...) означаетъ число 2 е; а когда съ правой стороны прибав-

4 Под лингвографическим классом понимается совокупность языковых единиц, которые вследствие наличия у них общих признаков имеют (или должны иметь) сходную интерпретацию в языковом справочнике (словаре) [Замов, Галиуллин 1995: 68].

ляется къ нему I, значить 12: когда же подъ нею пишется черта съ двумя поперечниками (...) означаетъ 2000» [ч. I, стлб. 451: 3].

Как видим, описание сходной информации в (1) дано в рамках двух словарных статей, в (2) — в рамках одной.

В перспективе компьютерная база пополнится и единицами, представленными внутри словарных статей, см., например, статью аангичъ: «(...) инако она въ СибирЬ называется Савкою или Саут-кою» [ч. I, стлб. 2: 4]; одно из указанных слов (савка) зафиксировано на своем алфавитном месте в отдельной отсылочной словарной статье, другое (саутка) отсутствует среди заголовочных единиц и упоминается только в словарных статьях аангичъ (пример см. выше) и савка.

Материалы, относящиеся к другим языкам, не регистрируются в фонде; см., например, сведения об употреблении лексических единиц в тюркских языках в статье аракъ\ «(...) Татары и Турки всякое горячее вино называютъ Аракы илиракы» [ч. I, стлб. 43: 3].

Паремии различного типа (пословицы, поговорки, прислови-цы) в САР1 обычно толкуются в рамках отдельных словарных статей (подстатей), однако в отдельных случаях отмечаются и другие способы подачи и описания паремических единиц. Так, в гнезде вода четыре пословицы описываются в четырех словарных статьях [ч. I, стлб. 793: 1-4], а в гнезде волкъ две пословицы толкуются внутри одной статьи [ч. I, стлб. 811: 6]. В гнезде гужъ статус паремии указан внутри словарной статьи («Тотъ тужи, у кого ременные гужи. Поговорка означающая (...)» [ч. II, стлб. 424: 5]), а в гнезде вгю разновидность паремии обозначена в самом начале статьи (абзаца) «Поговорка. Обуть кого изъ сапоговъ въ лапти (...)» [ч. I, стлб. 736: 1]). Ср. также: «Послов: Артель атаманомъ крЬпка(...)» [ч. I, стлб. 48: 5], «Пословица. Попалъ какъ сомъ въ вершу (■■■)» [ч. I, стлб. 658: 4] и «Взявшись за гужъ, не говори что не дюжъ. Послов. (...) » [ч. II, стлб. 424: 4] и др.

Помимо паремий-заголовков словарных статей фонд пополняется и единицами, описанными внутри словарных статей; см., например, в гнезде алтынъ присловицы, данные внутри статей соответствующих слов — алтынникъ и алтынный: «Алтынникъ (...) о такихъ говорится присловицею: Онъ взросъ на алтынахъ, т. е.

привыкъ съ малолетства брать взятки» [ч. I, стлб. 24: 1]; «Алтынный (...) Стоющш три коп%йки. Алтынная св'Ьча, алтынный ка-лачъ; отсюда присловица означающая скупягу: у него каждая ко-пЬйка алтыннымъ гвоздемъ прибита» [ч. I, стлб. 24: 3].

Особую группу формируют единицы, прямо не указанные в САР1, но восстанавливаемые на основании представленных форм (кстати, подобных единиц немало):

«Близехонекъ, нька, нько. прил. ум. Весьма близкш, недалек!й» [ч. I, стлб. 225: 5]; с учетом приведенной краткой формы прилагательного, а также находящегося в соседней статье наречия близехонько в словник фонда включается словарная форма прилагательного близехонъкш.

«Извозничаю иИзвогцичаю, чаешь, чаль, чать [ч. I, стлб. 574:1]; на основании последнего элемента восстанавливаются два инфинитива — извозничать и извогцичать.

В процессе сбора и обработки материала выявляются различного рода ошибки, описки, неточности в описаниях языковых единиц; см., в частности, некоторые примеры в первой части САР1: анффраксъ вместо анфраксь/шфураксь [стлб. 38: 3], арифметически вм. арифметически [стлб. 46: 3], пгребЬгъ вм. перебЬгъ [стлб. 423: 6], вбаживаю вм. вваживаю [стлб. 458: 9], избаживаю вм. изваживаю [стлб. 459: 5], взварвиаю вм. взвариваю [стлб. 497: 1], муроварица вм. муроварница [стлб. 500: 8], воз-плыцнкъ вм. возилыцикъ [стлб. 569: 4], провинятся вм. провиняться [стлб. 705: Х^р'Ьдковалосый ти. р'Ьдковолосый [стлб. 762: 3], воло-сиикъ вм. волосникъ [стлб. 763: 4] и др. Во многих случаях ошибочность подобных форм очевидна, нередко она подтверждается материалами данного гнезда (родственными словами, примерами употребления и т. д.) или материалами других словарных статей; например, на форму муроварница (вместо ошибочноймуроварица, приведенной в первой части [ч. I, стлб. 500: 8]) указывают материалы гнезда муро в четвертой части САР1 [ч. IV, стлб. 460: 4].

Для прояснения более сложных случаев, с целью идентификации «темных» единиц, уточнения сведений о них привлекаются материалы исторических словарей (в первую очередь «Словаря русского языка XVIII века», а также «Словаря русского языка

Х1-ХУП веков», «Словаря обиходного русского языка Московской Руси ХУ1-ХУП веков»), словарей различного типа ХУ1П-Х1Х веков (второго издания «Словаря Академии Российской», «Словаря церковнославянского и русского языка» и др.). Ссылки на словари и другие источники включаются в справочную зону фонда.

Нередки ошибки в нумерации значений, см. например, статьи адовъ [ч. I, стлб. 10: 5], аптека [ч. I, стлб. 42: 6], ароматы [ч. I, стлб. 47: 3], снабдйваю [ч. I, стлб. 117: 8], боръ [ч. I, стлб. 134: 5], выбираюсь [ч. I, стлб. 135: 4] и др.

Встречаются ошибки в номерах столбцов (особенно в алфавитных указателях). Так, над последним столбцом в 1-й части словаря ошибочно проставлен номер 1150 (должно быть 1140: предыдущие столбцы имеют номера ... 1138, 1139); это стало причиной неправильной адресации трех слов в алфавитном указателе, приложенном к изданию (эта ошибка повторяется и в указателе к современному (наборному) переизданию САР1).

Информация о подобных недочетах с включением также представленной в других публикациях, которые посвящены САР1 (см., например, приложения к современному переизданию словаря, содержащие сведения о различного типа исправлениях), регистрируется в компьютерном фонде в примечаниях к словарным статьям.

Программное обеспечение фонда позволяет пользователю оперативно выходить на конкретные страницы оригинального издания 1789-1794 годов, при этом предоставляются различные возможности поиска и отбора единиц:

а) путем ввода конкретного слова;

б) путем ввода условного образца (с учетом количества символов, их позиции в слове); например, по запросу «без*ный» выдается список слов типа безумный; запрос «\атъ» позволяет получить список четырехбуквенных слов с финалью -ать; а запрос «*-*» — перечень слов с дефисом и т д.;

в) путем ввода количества букв (символов);

г) путем ввода количества слогов.

Возможности формирования запросов расширяются за счет подключения сведений о количестве значений, о частеречной и стилистико-функциональной принадлежности слов, их происхождении и о других параметрах, зафиксированных в словарной базе.

В фонде пользователю предоставляется возможность организовать поиск как с использованием, так и без использования специфических букв старой кириллической азбуки (в последнем случае с заменой их соответствующими буквами современного алфавита), а также без указания конечных букв ъ и ъ, таким образом, пользователь может набирать аксюма и аксиома, арифметика и арифметика, базарь и базар, в Ъкъ и век, мхро и миро и др.

Для оптимизации, облегчения поиска и работы с материалами фонда в справочной части для ряда единиц приводятся их современные соответствия (варианты), что предоставляет возможность поиска и по современным соответствиям; см.: акула > аккула, акциз > акцызъ, асбест > азбестъ, абрикос > априкосъ, олифа > али-фа, весьма > веема и др.

Формирование компьютерного фонда языковых единиц, которые зафиксированы в САР1, позволит расширить, уточнить квантитативные данные, касающиеся различных характеристик этих единиц, например, получить сведения о количестве:

а) всех единиц, описанных в словаре,

б) однозначных и многозначных слов,

в) слов той или иной части речи,

г) слов той или иной стилистико-функциональной принадлежности,

д) единиц с определенной буквой (или буквосочетанием),

е) слов определенной длины (в буквах или слогах) и др.

Включение в состав фонда других лингвографических источников существенно увеличивает информационный потенциал фонда, в частности, расширяет возможности для сравнительного анализа словарных материалов различного типа.

На основе компьютерного фонда планируется создание традиционных (бумажных) словарных продуктов, в частности, обратных словарей (которые являются важным источником для историко-словообразовательных и историко-грамматических исследований), сводного указателя единиц, зафиксированных в словарях-источниках, и др.

Как показывает анализ, возможности применения фонда достаточно широки, особенно в разнообразных историко-лингвистических и историко-лингвографических исследованиях и раз-

работках; в частности, материалы фонда смогут способствовать расширению круга показаний лексикографических источников в «Словаре русского языка XVIII века» и Картотеке, пополнению сведений о словарной фиксации тех или иных языковых явлений.

В настоящее время, когда решается важная задача академического описания истории словарного состава русского языка, возрастает актуальность формирования сводов лексики разных периодов. Для XVIII века в качестве основного и крупнейшего собрания выступают фундаментальный «Словарь русского языка XVTTT века» и его Картотека. Однако, как показывает анализ, важные сведения содержатся и в других источниках, в том числе и в словарях, среди которых для данного периода, безусловно, наиболее ценным является «Словарь Академии Российской».

Литература

Белоусова 1998 — Белоусова А. С. Толковые словари // Русский язык Энциклопедия / Гл. ред. Ю. Н. Караулов. М.: Большая Российская энциклопедия : Дрофа. 1998. С 653-565.

Биржакова 2001 — Биржакова Е. Э. Словарь Академии Российской (1789— 1794 гг.) // История русской лексикографии / Под ред. Ф. П. Сороко-летова. СПб.: Наука. 2001. С. 98-126.

Галиуллин 2009 — Галиуллин К. Р. Интернет-лингвография: русские текстоописывающие словари // Проблемы истории, филологии, культуры 2(24). 2009. С. 635-639.

Галиуллин, Каримуллина 2005 — Галиуллин К. Р., Каримуллина Р. Н. Сводный фонд словарей русского языка XVIII века // Актуальные вопросы исторической лексикографии и лексикологии: Материалы Всероссийской Академической школы-семинара / Под ред. С. Св. Волкова, О. А. Старовойтовой. СПб: Наука, 2005. С. 314-317.

Замов, Галиуллин (ред.) 1995 — Компьютерная лингвография / Под ред. Н. К. Замова, К. Р. Галиуллина. Казань: Изд-во Казан, ун-та. 1995 [Электронная версия коллективной монографии доступна для скачивания по адресу: http://www.ksu.ni/flO/publications/1995/Kl.php]. Лутовинова 2009 — Лутовинова И. С. Толковые словари // Лексикография русского языка / Под ред. Д. М. Поцепни. СПб.: Факультет филологии и искусств СПбГУ. 2009. С. 94-177.

i Надоели баннеры? Вы всегда можете отключить рекламу.