ТЕОРИЯ ЯЗЫКА
УДК 81
РАСПРЕДЕЛЕНИЕ СЛОВА ПО ГРУППАМ ТЕКСТОВ И ЕГО СТИЛИСТИЧЕСКАЯ ОКРАСКА*
А. А. Кретов
Воронежский государственный университет
Поступила в редакцию 19 марта 2017 г.
Аннотация: статья посвящена поиску формальных показателей стилистической окраски слова на примере стилистически сниженной лексики, представленной в «Частотном словаре русского языка» под редакцией Л. Н. Засориной (М.: Рус. яз., 1977). Исследуются слова, встретившиеся (1) только в текстах драматургии, (2) в текстах драматургии и одного из трех остальных множеств текстов, (3) в текстах драматургии и двух других множествах, и, наконец, (4) слова, встречающиеся во всех четырех множествах текстов, но преобладающие в текстах драматургии. Делается вывод, что 1-й ранг частоты предлога В (ВО) может служить формальным показателем разговорности текста. Другим маркером неофициальной ситуации общения является высокая частота местоимений ТЫ и ТВОЙ. Лексику, маркирующую сферу обиходно-бытового общения, предложено подразделить на антуражную - описывающую обстановку, в которой обычно происходит непринужденное общение, и индикаторную - употребляющуюся преимущественно в процессе такого общения.
Ключевые слова: русский язык, стилистическая окраска слова, обиходно-бытовая лексика, язык драматургии, формальные признаки обиходно-бытового общения.
Abstract: the paper discusses formal markers of stylistic properties of a word. The research is based on the analysis of colloquialisms taken from the "Frequency Dictionary of the Russian Language" ed. by L. N. Zasori-na (Moscow: Russkij jazyk, 1977). The author looks at words which occurred (1) in the set of texts of plays only, (2) in the set of texts ofplays and in one of the other three sets of texts, (3) in the set of texts ofplays and in the two of the other three sets of texts, and, finally, (4) the words which occurred in all four sets of texts, but mostly in the texts ofplays. The research shows that the 1st position of the preposition V (VO) in the frequency list can be a marker of colloquial speech in the text. Another marker of unofficial situation of communication is high frequency of pronouns TY and TVOJ. Colloquial words can be divided in two groups: entourage words which describe the setting in which unofficial communication typically occurs, and indicator words, i. e., words which are used predominantly in such situations.
Key words: Russian language, stylistic colouring of a word, colloquialisms, language of drama, formal markers of colloquial communication.
Гипотеза настоящего исследования - пребывая в тех или иных текстах, слово «пропитывается» их стилистикой, получая соответствующую стилистическую окраску (СО) [1].
Цель исследования - найти формальные показатели СО слова.
Объект исследования - ЧаСРЯ-77 [2].
Предмет исследования - СО слова, оцениваемая по его тяготению к той или иной группе текстов.
Метод исследования - дистрибутивно-статистический.
* Статья выполнена в рамках проекта «Лингвистическая подготовка и создание электронного "Живого стилистического словаря русского языка"», поддержанного грантом РФФИ № 17-04-00421.
© Кретов А. А., 2017
Обоснование выбора объекта исследования
ЧаСРЯ-77 - единственный из доступных нам в виде компьютерной базы данных словарей, в котором дана не сводная статистика по тексту или корпусу текстов, а указано распределение частот слова по четырем группам текстов (табл. 1).
Т а б л и ц а 1
Функционально-речевая сфера % ко всей выборке
Художественная проза 25,4
Драматургия 27,2
Научные тексты, публицистические тексты 23,6
Газетные тексты, журнальные тексты 23,8
Аргументация такого деления следующая: «Схема функционально-речевых сфер для словаря разра-
ботана известным лексикологом, академиком Б. А. Лариным. По его мнению, современные нормы русского языка складываются под влиянием по крайней мере четырех самостоятельных сфер употреблении лексики: художественной литературы, разговорной речи, научной и публицистической, а также деловой речи. Исходя из этого установлены четыре равновесные группы текстов: художественная проза, драматургия (как отображение разговорной речи), научно-публицистические и газетно-журнальные тексты» [2, с. 8].
Мнение Б. А. Ларина, не будучи оригинальным, является общепринятым. В любом учебнике стилистики русского языка можно прочитать про разговорно-бытовой, научный, публицистический, официально-деловой и художественный стили речи. А вот замещать пять функциональных стилей четырьмя группами текстов, объединяя принципиально разнородные научный и публицистический стили и приравнивая разнородные газетные тексты и журнальные репортажи «на ... научные, политические, экономические» (!) темы к официально-деловому стилю - по меньшей мере, спорное решение. Для исследования официально-делового стиля лучше было бы расписать нормативно-правовые документы (кодексы и законы), начиная с Конституции.
Таким образом, перед нами источник, в котором за образец разговорно-обиходного стиля можно (не без оговорок) принять тексты драматургии, за источник данных о художественном стиле тексты художественной прозы (при этом мы абстрагируемся от деления художественных текстов на два статистически разнородных подмножества: авторская речь, в которой и реализуется собственно художественный стиль, и диалоги, тяготеющие к разговорно-обиходному стилю; эпизодические же вкрапления фрагментов научного, официально-делового, религиозного и публицистического стилей можно игнорировать). За (сомнительный, но всё же) источник информации о научном стиле - научные тексты, к сожалению, объединенные в один корпус с публицистическими1. А вот газетно-журнальные тексты целесообразно считать представляющими публицистический стиль, а не официально-деловой: доля официально-деловых текстов в этой выборке неизвестна, да и в редком
1 Научному или научно-популярному стилю принадлежит шесть текстов: С. И. Вавилова «Глаз и солнце», Н. Н. Качалова «Стекло», Е. В. Тарле «Наполеон», К. А. Тимирязева «Жизнь растения» и А. Е. Ферсмана «Занимательная минералогия», взятых фрагментарно. Публицистика (идеология) представлена целостными текстами В. И. Ленина, М. И. Калинина, Н. Н. Грибачева, Л. М. Леонова, А. Н. Толстого, М. А. Шолохова, Материалами XXII и XXIII съездов КПСС (фрагментарно).
номере газеты официально-деловые тексты будут преобладающими2.
Таким образом, мы имеем четыре группы текстов, в большей или меньшей степени представляющие следующие функциональные стили: ИДЕОЛОГИЧЕСКИЙ (И) (публицистический), ОБИХОДНО-БЫТОВОЙ (ОБ), НАУЧНЫЙ (Н) и ХУДОЖЕСТВЕННЫЙ (Худ).
Одно из достоинств ЧаСРЯ-77 - указание на ко -личество текстов, в которых встречается то или иное слово, что позволяет оценивать равномерность его распределения, а следовательно - судить о его типичности для группы текстов или для конкретного текста.
Вооруженные этим знанием, приступим к выявлению лексики, встречающейся только в одной из четырех групп текстов.
Начнем с ОБИХОДНО-БЫТОВОГО (ОБ) стиля, противопоставленного всем остальным по признаку среды общения: официальная : неофициальная.
Сначала выделим слова, встретившиеся только в ОБ. Таких слов 3513 (табл. 2).
Т а б л и ц а 2
Слово Частота Кол-во текстов
1. Вбегать 48 16
2. Прапорщик 27 2
3. Хм-хм 24 1
4. Ай-ай 21 6
5. Аккордеон 21 2
6. Заизолировать 21 1
7. Да-да 19 9
8. Торговка 18 1
9. Следовательница 17 1
10. Беспризорник 16 1
11. Игуменья 16 1
12. Шеф-повар 16 1
13. Дежурка 13 1
14. Искренно 12 7
15. Обыскать 12 2
Первое же слово указывает на принципиальную ошибку, допущенную при расписывании текстов драматургии: наряду с прямой речью расписывались и авторские ремарки, чего категорически не стоило делать, коль скоро тексты драматургии мыслились как представляющие обиходно-бытовую речь. В 16 пьесах (из 21) есть слово вбегать. При этом ни в художественных, ни в газетно-журнальных текстах оно не представлено вообще. Такая частотность и регуляр-
2 Разве только - в номере, публикующем материалы очередного съезда КПСС. Однако в ЧаСРЯ-77 это не так: взяты газеты за 5 января 1968 г., когда с избрания А. Дубчека Первым секретарем КПЧ началась Пражская весна.
ность слова в пьесах объяснима его присутствием в типичной для ремарок формуле «Вбегает К№».
Слова прапорщик, аккордеон, обыскать, хм-хм, заизолировать, торговка, следовательница, беспризорник, игуменья, шеф-повар, дежурка ставят еще одну проблему: первые три встречаются лишь в двух пьесах из 16, а остальные - только в одной. Следовательно, эти слова отражают специфику конкретных пьес, а никак не разговорной речи. Особенно сомнительна «разговорность» слов прапорщик, аккордеон, игуменья и шеф-повар.
Лишь в одной пьесе встретилось междометие хм-хм, явно разговорное. В единственном тексте встретились и многие другие междометия: м, ик, о-о, го, мм, ти, буль, бр-р, и-эх, бишь, гей, геть, и-их, н-не, ф-фа, ф-фу, хны, х-хо, ей-ей, ля-ля, не-е, не-не, те-те, эх-ма. Представленность этих междометий в одном из текстов может говорить как об их периферийности, так и недостаточности (неполноте) выборки.
Так, наряду с хм-хм, встретившимся в одном тексте, представлено более распространенное междометие гм, встретившееся в двух текстах. В данном случае мы имеем дело не столько с различными междометиями, сколько с авторскими предпочтениями в способе его условного обозначения на письме.
Поможет ли выявлению собственно разговорной лексики сортировка по количеству текстов, свидетельствующая о равномерности-неравномерности ее распределения?
Для этого отсортируем слова по количеству текстов, в которых они встретились. Получаем следующий результат (табл. 3).
Т а б л и ц а 3
Распределение «драматургических» слов по числу текстов [2]
Кол-во текстов Кол-во слов СлОтн., % Накопл. НакОтн., %
16 1 0,03 1 0,03
9 1 0,03 2 0,06
7 2 0,06 4 0,11
6 7 0,20 11 0,31
5 9 0,26 20 0,57
4 19 0,54 39 1,11
3 86 2,45 125 3,56
2 395 11,24 520 14,80
1 2993 85,20 3513 100,00
Как видим, более 85 % предположительно «разговорных» слов встретилось в одном тексте, тогда как в двух и более текстах встретилось менее 15 % слов. Слова, встретившиеся в трех и более текстах, составляют менее 4 %. Слова же, встретившиеся в четырех
и более текстах, составляют чуть более 1 %. В абсолютном выражении - 125 слов. Вывод - подсчет по количеству текстов слишком жесткий: ячейки этой сети столь велики, что удерживают самую крупную рыбу. О качестве отбора можно судить по следующему списку, содержащему все 39 слов, встретившихся в четырех и более текстах: вбегать, да-да, искренно, увидеться, благодарствовать, разозлиться, усаживать, кушетка, ай-ай, клоун, ай-яй, аккомпанировать, кривляться, приютить, сумочка, шутник, пятеро, нате, дуться, падаль, комплимент, ошеломленно, погорячиться, голубушка, чудовищно, отставлять, раскиснуть, покормить, сударыня, чокаться, газетка, загубить, печенка, так-таки, милая, опешить, пороть, потише, чать (= чай, вводн. сл. нар.-разг.) '1) для выражения предположения, допущения; вероятно, пожалуй, по-видимому; 2) употр. для подчеркивания достоверности высказывания в зн.: все-таки, ведь'.
Выделенные полужирным курсивом слова, строго говоря, разговорными не являются, но ситуации (среды общения), обозначаемые глаголами погорячиться, увидеться и покормить, предполагают известную неформальность и неофициальность. Аналогично приобретают разговорный ареол сами по себе нейтральные слова: усаживать, кушетка, клоун (видимо, в переносном употреблении: 'разыгрывающий в обществе роль шута'), шутник, отставлять, чокаться.
Слово пороть, само по себе разговорным не являющееся, встретилось, по-видимому, в разговорных оборотах типа пороть чушь (вздор, ахинею, ерунду); пороть горячку. Тут мы сталкиваемся с еще одной проблемой: проблемой выделения стилистических единиц, отнюдь не ограничивающихся универбами, а включающих широкий круг фразеосочетаний.
В связи с этим представляется целесообразным предварительное извлечение стилистически маркированных фразеосочетаний из фразеологических и больших толковых словарей.
У слов сумочка и газетка разговорность выражена уменьшительно-ласкательными суффиксами (ср. сумка, газета).
Исчерпав возможности ЧаСРЯ-77, связанные с исключительной встречаемостью слов в текстах пьес, перейдем к следующей возможности - выделению слов, преимущественно встречающихся в драматургии.
Сделаем это в следующей последовательности: сначала - слова, встречающиеся в двух группах текстов, затем - слова, встречающиеся в трех группах текстов, и, наконец, слова, встречающиеся во всех четырех группах текстов.
Рассмотрим слова, преимущественно встречающиеся в драматургии, но также встретившиеся и какой-то другой группе текстов (рис. 1).
1800 1600 1400 1200
Драм.-Худ.; 1575
« 1000 н о <и
Ч £
800 600 400 200 о
Драм.-Наука(Публ);
828
Драм.-ГазЖурн; 615
_
Группы гекстов
Рис. 1. Количество обшдх слов в группах текстов (по [2])
То, что больше всего общих слов у обиходно-бытового стиля и художественного, вполне ожидаемо.
А вот то, что на втором месте по близости к разговорной речи оказывается научный стиль - неожиданно и объяснимо лишь тем, что научный стиль перемешан с публицистическим. Максимальная удаленность газетно-журнальных текстов от драматургических объяснима лишь 1968 годом: современная речь газет и журналов ближе к разговорной, чем полвека тому назад.
Среди этих слов в выборке Д.-Х. преобладают следующие ОБ слова (в порядке возрастания ОБ-спе-цифичности): топать, ой, замерзнуть, поплыть, злодей, горевать, надумать, смущенно, подружка, покойник, закуривать, взлететь, выздороветь, перец, гадость, мороженое, катить, обиженно, озабоченно, атласный, терпеться, прихожая, сыпать, обещаться, мычать, ерунда, некого, колбаса, тьфу, поди, хлопчик, рысь, стемнеть, забежать, вкусно, усаживаться, ревнивый, купанье, гимназический, повязать, запевать, наговорить, тетка, мамаша, отвернуться, почудиться, затворить, виноват, мадам, ну-ну, досадно, мужичок, шкафчик, вбежать, рвануть, добре, молочница, повидаться, подручный, потрепать, ребятки, стращать, слухать, леший, отдергивать, разлюбить, одиноко, кликать, опилка, матерь, ощупь, ять, а-а, хам, забавно, окурок, проголодаться, собачка, трошки, поругаться, закипеть, замотать, закусывать, вошедший, потроха, сорочка, шрапнель, укусить, засидеться, повозиться, отслужить, черствый, зажимать, поиграть, ночка, дрессированный, порывистый, присмотреть, приласкать, положено, телятина, взыскать, шуточка, внучек, лентяй, хлебать, умник, похлопать, подсолнух, приоткрыться, докторша, плаванье, смиренно, пыхтеть, кабак, ропот, смирно, передразнивать,
воротиться, кухарка, вспылить, прогуляться, ворчливо, пакость, сынок, дурацкий, обождать, болван, колокольня, злиться, покушать, выучиться, бешенство, зажмуриться, раздумать, озлиться, сука, полотнище, запирать, лазарет, мамин, разнести, черепок, отряхиваться, замужняя, мгновенье, притянуть, сумрачно, чиркнуть, блюдце, скалить, уважить, свои, бак, обрадованно, безучастно, уговориться, чертовщина, нараспев, платьице, подмышка, поплакать, терпенье, шевельнуть, дурочка, замяться, одышка, утирать, нуте, сечь, по-родственному, невнимательный, приглаживать, выталкивать, загадывать, конченный, подставка, свихнуться, спроситься, драпануть, заикаться, затворять, некстати, посветить, прозевать, прозябать, пролиться, схоронить, удавиться, вострый, елочка, мертвец, обнимка, отвыкать, паршиво, сомкнуть, ляпнуть, винцо, лопать, клеш, наши, фал, лыжи, хохот, вышибить, довольствие, попрекать, силенка, духота, выбегать, сигнальщик, коситься, сочиться, обозлиться, пообедать, осматриваться, подбежать, шампанское, врозь, э, гетманский, шляться, помолиться, прихватить, чудно, простудиться, задремать, спалить, боле, заступать, барахло, чумазый, ого-го, умница, срам, фу (фу-у), бриться, усик, машинально, н-да, помирать, завестись, нету, пан, кроватка, чаек, прощение, одолжить, выглянуть, раздраженно, стихать, кастрюля, отворять, прокламация, переставлять, лесенка, уха, православный, сваливать, неприличный, застегивать, постоялец, десантник, накинуться, лишнее, судок, эва, водопроводчик, околачиваться, отвязаться, забижать, подале, спаться, нахал, дале, пришибить, сватать, говеть, кашлянуть, гладь, помахивать, наклонить, интересное, сконфузиться, нараспашку, прискорбно, поясница, провертеть, знакомец, обманщик,
оттеснять, пригубить, раскидать, силосный, складной, семафор, клюнуть, ошалеть, петропавловский, приспособляться, безобразничать, воздерживаться, хозяйствовать, понадежнее, растроганно, безотрывно, большеносый, мелодичный, монограмма, племянница, по-рабочему, вверенный, враждовать, зачеркнуть, мигающий, обыгрывать, пантомима, полюбовно, пустячный, свершиться, сплевывать, стискивать, вознести, глазенки, голенький, доглядеть, кухаркин, мечтаться, микстура, одежонка, припарка, разметить, старикан, статейка, сутолока, хлебушко, чайничек, черкеска, гадалка, гаданье, дамочка, детушки, дивчина, испанец, маненько, молебен, осерчать, отбежать, пасьянс, умолкать, фельдшер, чахотка, черкнуть, бубнить, кираса, отымать, пробой, серость, скидка, сманить, фляжка, замять, лавры, лакать, палаш, буза, ряса, чернь, эдак, хучь, ревность, ха, нема, неполадки, подбегать, неприлично, нонче, дьявольски, миноносец, револьвер, превосходительство, нахмуриться, жинка, житье, черноморец, перевязка, бильярд, киснуть, сопляк, баста, передняя, здороваться, ученье, угодный, шубка, чернильница, чемоданчик, отставить, худенький, степенство, перевязанный, записочка, рогожа, рельса, новоселье, паек, невыносимо, ать, любовник, невзначай, схлопотать, клеенка, пелена, дужка, тихоокеанский, воспаление, нестройный, выпивший, арапник, везенье, свистать, гавкать, минный, эдакий, ворон, орава, крен, торт, шиш, капитан-лейтенант, ветхий, мыло, борщ, дурно, отпереть, ротмистр, опосля, переть, гитара, аль, дезертир, лото, застава, рукомойник, зеркальце, занятно, духи, удав, корь, побыстрее, креслице, зимовье, поручик, браток, казанский, семечко, дедушка, прослезиться, цыганский, барашек, деньжонки, кружева, стручок, плечо, депо, краснофлотец, мужичонка, пергамент, простуда, горничная, благородие, демобилизация, портьера, урядник, приживалка, стахановец, конторщик, будет, выдвиженец, стряпуха, старпом, бронепоезд, поить, беженец, хм, буфет, гетман (выделены слова интуитивно обиходно-бытовые - 438 слов).
Всего ОБ-специфичных слов в этом множестве - 487 из 1575, т. е. 31 %.
Остальные - в равной мере специфичны для обеих выборок.
Среди этих слов в выборке Д-НП преобладают следующие ОБ слова (в порядке возрастания ОБ-спе-цифичности; число указывает долю специфичности слова, которая в ОБ-выборке равна 1, в НП-выборке):
положительно 0,75, застрелиться 0,75, угнетаемый 0,75, остроумно 0,75, просвещать 0,75, подержать 0,75, уживаться 0,75, наследить 0,75, коровка 0,75, пластырь 0,75, торшер 0,75, врезать 0,75, буран 0,75,
вонять 0,75, мяться 0,75, бюст 0,75, возмездие 0,70, побеседовать 0,67, недооценивать 0,67, демократизм 0,67, звеньевая 0,67, камер-лакей 0,67, погорячее 0,67, юнкерский 0,67, большевизм 0,67, оживляться 0,67, воевода 0,67, хвастун 0,67, чайная 0,67, внимать 0,67, жребий 0,67, изверг 0,67, порознь 0,67, силком 0,67, испить 0,67, сыр 0,67, печалиться 0,60, помечтать 0,60, штора 0,56, раздраженный 0,50, благотворный 0,50, офицерство 0,50, перевооружить 0,50, распоясаться 0,50, пересекаться 0,50, меньшевик 0,50, фабрикант 0,50, чертовски 0,50, выключать 0,50, тщеславный 0,50, справный 0,50, замутиться 0,50, коварство 0,50, приучаться 0,50, проезжий 0,50, впускать 0,50, движимый 0,50, павлиний 0,50, угощаться 0,50, физиолог 0,50, авось 0,50, замужем 0,50, кипятить 0,50, меченый 0,50, мушиный 0,50, ренегат 0,50, дикарь 0,50, смета 0,50, косный 0,50, разлом 0,50, немочь 0,50, паста 0,50, кант 0,50, приспособиться 0,42, странствовать 0,40, бармен 0,40, фракция 0,38,рабоче-крестьянский 0,33, диспозиция 0,33, перерождение 0,33, распускаться 0,33, медсестра 0,33, динамит 0,33, микроб 0,33, мачеха 0,33, киргиз 0,33, периодически 0,25, стахановский 0,25, обморок 0,25, вширь 0,25, прикалывать 0,20, полотер 0,18, китаец 0,17, красногвардеец 0,14, двухсотый 0,14, оптимист 0,08, драга 0,08, интервент 0,07, соломка 0,06, пчелка 0,02, окорок 0,02 (выделены слова интуитивно обиходно-бытовые -37 слов).
Всего ОБ-специфичных слов в этом множестве - 101 из 828, т. е. 12 %.
Остальные - в равной мере специфичны для обеих выборок.
Среди этих слов в выборке Д-ГЖ преобладают следующие ОБ слова (в порядке возрастания ОБ-спе-цифичности; число указывает долю специфичности слова, которая в ОБ-выборке равна 1, в ГЖ-выборке):
новгородский 0,89, магистраль 0,88, дальневосточный 0,81, наигрывать 0,80, нечестно 0,80, прописать 0,80, адресок 0,80, глобус 0,78, восприимчивый 0,75, прорабатывать 0,75, стенограмма 0,75, сигарета 0,75, вычеркнуть 0,75, самовольно 0,75, могильный 0,75, отомстить 0,75, печенье 0,75, блюсти 0,75, пижама 0,75, комендатура 0,73, уговаривать 0,70, хулиган 0,69, сиятельство 0,67, отсутствующий 0,67, курсантский 0,67, обмахиваться 0,67, пессимизм 0,67, бунтовать 0,67, бесславно 0,67, обстрелять 0,67, регулятор 0,67, бессильно 0,67, уснувший 0,67, яблонька 0,67, заочный 0,67, продмаг 0,67, ревизор 0,67, прицеп 0,67, зубной 0,67, насухо 0,67, тесть 0,67, той 0,67, архангельский 0,67, болгарский 0,67, актерский 0,67, шахтер 0,67, интернационал 0,60, признательный 0,60, аспирантура 0,60, электричка 0,60, вырезка 0,60, пресс-конференция 0,58, веранда 0,57, мерси 0,57, тахта 0,56, тсс 0,56, зо-
лотоискатель 0,50, генерал-полковник 0,50, предполагаемый 0,50, костюмированный 0,50, прокуратура 0,50, книгохранилище 0,50, очаровательный 0,50, намеренный 0,50, потанцевать 0,50, обсуждаемый 0,50, профилактика 0,50, редколлегия 0,50, задержание 0,50, кислородный 0,50, комплекция 0,50, прогулочный 0,50, включиться 0,50, опробовать 0,50, бунтующий 0,50, грамматика 0,50, индивидуум 0,50, крестовина 0,50, наплакаться 0,50, разминуться 0,50, штудировать 0,50, компаньон 0,50, конспект 0,50, экспромт 0,50, загвоздка 0,50, засыпаться 0,50, инфекция 0,50, колесница 0,50, отчаливать 0,50, пианистка 0,50, позировать 0,50, скончаться 0,50, затолкать 0,50, обступать 0,50, поссорить 0,50, вывесить 0,50, звучный 0,50, канадка 0,50, ткачиха 0,50, торпеда 0,50, ягодка 0,50, егерь 0,50, бочком 0,50, гнести 0,50, завком 0,50, пупсик 0,50, сливки 0,50, фанера 0,50, чужое 0,50, меню 0,50, загиб 0,50, зябко 0,50, комса 0,50, навет 0,50, финка 0,50, пуще 0,50, насморк 0,40, сплясать 0,40, термос 0,40, лгун 0,40, собравшиеся 0,38, станкостроительный 0,33, симпатичный 0,33, либеральный 0,33, посвящаться 0,33, саботажник
0,33, шестеренка 0,33, рассрочка 0,33, градусник 0,33, будильник 0,33, связной 0,33, эсминец 0,33, каскад 0,33, наплыв 0,33, турне 0,33, дыня 0,33, прииск 0,31, часовщик 0,27, глубокоуважаемый 0,25, полеводческий 0,25, фотограф 0,25, швейцар 0,25, картон 0,25, кройка 0,25, фабком 0,25, силос 0,25, туш 0,25, трансляция 0,20, протока 0,20, депеша 0,20, фойе 0,20, тайфун 0,18, шеф 0,17, слива 0,10, комдив 0,08, светлость 0,03 (выделены слова интуитивно обиходно-бытовые - 44 слова).
Обобщение полученных данных представлено в табл. 4.
Кроме того, интуитивно относимые к обиходно-разговорным слова очень плотно концентрируются в паре выборок «Драматургия-Художественная проза» и фрагментарно (на порядок реже) встречаются в остальных парах выборок. Причем особенно редко - в паре «Драматургия - Научные и Публицистические тексты» (рис. 2).
Слова, встречающиеся в трех группах текстов
ОБ-ГЖ-Худ - 754 слова.
ОБ-ГЖ-НП - 550 слов.
800
700
600
500
400
300
200
100
о -
Тройки выборок
□ ОБ-ГЖ-Худ □ ОБ-ГЖ-НП Рис. 2. Размерность троек выборок, содержащих ОБ лексику (по [2])
Т а б л и ц а 4
Наличие специфически обиходно-бытовой (ОБ) лексики в парах выборок
Выборки Д-Худож. Д-ГазетноЖурн. Д-НаучноПубл.
Кол-во обшдх слов в выборках 1575 616 828
Кол-во равноспецифичных 1088 459 727
Кол-во ОБ-специфических 487 157 101
Доля ОБ-специфических 0,31 0,25 0,12
Это соотношение закономерно: объединение наиболее близкой к диалогическим текстам художественной выборки со средней - газетно-журнальной дает большее множество обиходно-бытовых слов, чем объединение максимально удаленной: научно-публицистической со средней (газетно-журнальной).
Рассмотрим ОБ-специфичную лексику в тройках выборок, начиная с большей - Д-ГЖ-Худ.
Среди этих слов в этой выборке преобладают следующие ОБ слова (в порядке убывания ОБ-спе-цифичности; число указывает суммарную долю специфичности слов, которая в ОБ-выборке равна 1, в ГЖ+Худ-выборках): кролик 0,11, виски 0,12, пауза 0,13, вредитель 0,17, пурга 0,18, насыпь 0,20, вихрастый 0,21, тосковать 0,25, лакей 0,26, пирс 0,29, репортер 0,29, пропуск 0,30, связист 0,33, радиола 0,33, рюкзак 0,33, хлопец 0,37, танцующий 0,38, родительский 0,40, шпик 0,40, волость 0,40, кубанский 0,43, мичман 0,44, скуластый 0,45, матрос 0,49, обследование 0,50, развлекать 0,50, запчасть 0,50, вранье 0,50, кашель 0,50, грипп 0,53, ха-ха 0,55, кукла 0,55, кот 0,56, пятнадцатый 0,57, прощальный 0,57, певица 0,57, взволнованный 0,58, сверток 0,58, бюро 0,59, кукуруза 0,61, огорчаться 0,62, тетя 0,62, иллюминатор 0,67, стипендия 0,67, умножение 0,67, бестолково 0,67, хлопотать 0,67, диаграмма 0,67, вытрясти 0,67, дежурить 0,67, ящичек 0,67, укол 0,67, раздеть 0,67, усталь 0,67, пляж 0,67, роба 0,67, мышка 0,67, щепа 0,67, туша 0,67, рубашка 0,70, барышня 0,70, ботинок 0,71, нет-нет 0,71, испуганный 0,72, портсигар 0,73, опровергнуть 0,73, погреться 0,75, вишня 0,75, гимнастерка0,75, гудок 0,76, мусор 0,76, люк 0,77, сметь 0,77, недостойный 0,80, поклонник 0,80, нехватать 0,80, взрывать 0,80, любезно 0,80, дощечка 0,80, толково 0,80, пальчик 0,80, ура 0,81, водоем 0,81, столовая 0,82, неудобно 0,82, замуж 0,82, внучка 0,83, мигнуть 0,83, конек 0,83, облава 0,83, лгать 0,85, отбой 0,86, командировка 0,86, питерский 0,86, меховой 0,86, чего 0,89, эстрада 0,89, актриса 0,90, рубка 0,93, ремонтировать 0,93, курсант 0,93, мамочка 0,94, волевой 0,94, сабля 0,95, мушкетер 1,00, иронически 1,00, безраздельно 1,00, выставляться 1,00, персонально 1,00, условиться 1,00, бензиновый 1,00, по-русски 1,00, зазнаваться 1,00, накрениться 1,00, постареть 1,00, ароматный 1,00, упрашивать 1,00, запоздать 1,00, болтаться 1,00, переполох 1,00, справлять 1,00, перенять 1,00, подметать 1,00, звенящий 1,00, мудреный 1,00, провалить 1,00, проведать 1,00, впустить 1,00, топот 1,00, госпожа 1,00, дочитать 1,00, окликать 1,00, рвение 1,00, спихнуть 1,00, перина 1,00, цыган 1,00, дерзать 1,00, рыскать 1,00, дебош 1,00, скоба 1,00, аз 1,00, бокс 1,00, крем 1,00, земляк 1,00, караул 1,00, сняться 1,00, бланк 1,00, мама 1,03, идиот 1,04, ох 1,05, усмехаться 1,06,
пачка 1,07, трос 1,07, пожениться 1,08, официант 1,09, подлость 1,09, устать 1,09, кусать 1,10, палуба 1,11, паренек 1,11, миленький 1,13, бархатный
1.13, пожимать 1,13, секретарша 1,14, табурет
1.14, по-вашему 1,17, отмахиваться 1,17, неужто 1,17, шальной 1,17, шквал 1,17, адресовать 1,17, сотворить 1,17, разворачивать 1,17, умолять 1,17, ладно 1,18, срочно 1,18, постоять 1,18, суета 1,19, увезти 1,19, помолчать 1,20, стесняться 1,20, втроем 1,20, ничтожество 1,20, оставленный 1,20, папироска 1,20, царица 1,20, дарить 1,20, синяк 1,20, курносый 1,20, беззвучно 1,20, разогреть 1,20, врать 1,21, сборка 1,21, задумчиво 1,22, потянуть 1,22, поцеловать 1,22, огурец 1,23, распрощаться 1,25, успокаивать 1,25, орудийный 1,25, вздыматься 1,25, конверт 1,25, пехотный 1,25, туловище 1,25, ухватить 1,25, мускул 1,25, задрать 1,25, уговор 1,25, шорох 1,25, клумба 1,25, проскочить 1,25, оскорбить 1,25, улететь 1,25, набат 1,25, дежурство 1,25, заказать 1,26, каша 1,28, мрачно 1,29, топить 1,29, слышный 1,29, доноситься 1,30, пугаться 1,30, анкета 1,30, умыться 1,30, рычать 1,31, хмурый
1.32, парнишка 1,33, заиграть 1,33, возбужденно
1.33, возненавидеть 1,33, подготовиться 1,33, завсегдатай 1,33, перепутаться 1,33, разочаровать 1,33, квитанция 1,33, смеющийся 1,33, запутаться 1,33, начистоту 1,33, немолодой 1,33, балалайка 1,33, карманный 1,33, сниматься 1,33, судорога 1,33, ласточка 1,33, неладный 1,33, сгоряча 1,33, стихнуть 1,33, потащить 1,33, шустрый 1,33, уютно 1,33, полутьма 1,33, простыть 1,33, коньяк 1,33, блузка 1,33, укатить 1,33, изумить 1,33, тошно 1,33, смять 1,33, фея 1,33, поповский 1,33, судорожно 1,33, панорама 1,33, барыня 1,33, прорваться 1,33, иронический 1,33, вертеть 1,35, приготовиться 1,35, оживленно 1,35, выговор 1,38, перебивать 1,38, интересно 1,40, виновато 1,40, легкое 1,40, успокоиться 1,41, вскрикнуть 1,42, шумно 1,42, вручить 1,42, пианино 1,42, развестись 1,43, пепельница 1,43, рассеянно 1,44, струсить 1,45, съездить 1,46, мучительно 1,47, денек 1,47, хорошенький 1,47, перелистывать 1,50, вопросительный 1,50, безразличный 1,50, прикидываться 1,50, самокритика 1,50, построиться 1,50, ухаживать 1,50, раздувать 1,50, разливать 1,50, закружить 1,50, кадровый 1,50, кофточка 1,50, трогаться 1,50, входной 1,50, грустить 1,50, напоить 1,50, аккорд 1,50, мигом 1,50, пятница 1,52, вцепиться 1,52, хлестать 1,55, нечаянно 1,56, погрузка 1,56, передник 1,56, ей-бог 1,56, сукно 1,56, консерватория 1,56, исполниться 1,56, бухгалтер 1,56, скромность 1,56, ухватиться 1,56, ситцевый 1,56, сумка 1,56, интересоваться 1,58, осмотреться 1,59, благословлять 1,60, замереть 1,60, опоздание 1,60, потерянный 1,60, по-хорошему 1,60, захлопнуть 1,60, неправый 1,60, потирать
1,60, селедка 1,60, робеть 1,60, ладить 1,60, опровергать 1,60, позабыть 1,62, преувеличивать 1,64, уткнуться 1,65, раздать 1,67, негде 1,67, неудачник
1.67, загородить 1,67, натворить 1,67, вздрогнуть
1.68, радостно 1,70, преподавать 1,71, прелестный 1,71, опуститься 1,73, утешать 1,75, интересовать 1,82, дружно 1,90 (выделены слова интуитивно обиходно-бытовые - 670 слов).
В выборке Д-ГЖ-НП отмечены следующие ОБ-специфичные слова (в порядке убывания их специфичности; число указывает суммарную долю специфичности слов в ГЖ+НП-выборках относительно 1 в ОБ-выборке): японец 0,10, отхватить 0,11, стимул 0,15, скептик 0,15, реклама 0,24, текстильный 0,27, шефство 0,31, миндаль 0,33, гнет 0,33, аспирант 0,38, запугать 0,43, союзный 0,44, микрофон 0,48, мистер 0,48, единомышленник 0,50, формировать 0,50, выкуп 0,50, шитье 0,50, электрификация 0,52, серный 0,57, бар 0,57, этика 0,58, лаборатория 0,59, котлета 0,60, карьерист 0,60, эскадра 0,63, самодельный 0,67, моментально 0,67, измучиться 0,67, вытеснять 0,67, продаться 0,67, разведать 0,67, токарь 0,67, патент 0,67, миллионер 0,67, аквариум 0,69, конкурс 0,71, гость 0,73, скульптура 0,76, плодородие 0,79, кооперация 0,80, кондуктор 0,80, отречься 0,80, опровержение 0,83, тополь 0,83, переодеваться 0,86, покрывало 0,86, довоенный 0,89, комбинат 0,92, технолог 0,94, такси 0,94, обследовать 1,00, избиратель 1,00, демобилизоваться 1,00, переделывать 1,00, пригородный 1,00, юридически 1,00, инстанция 1,00, обанкротиться 1,00, пропитание 1,00, распознавать 1,00, физиология 1,00, проработать 1,00, прекращать 1,00, крепление 1,00, периферия 1,00, перехитрить 1,00, поучительно 1,00, расчистить 1,00, вызванный 1,00, разоружить 1,00, культурно 1,00, дипломант 1,00, смотровой 1,00, оснастка 1,00, сибиряк 1,00, просмотр 1,00, тридевять 1,00, унижать 1,00, ткацкий 1,00, ценитель 1,00, абсурд 1,00, панно 1,00, рейд 1,00, износ 1,00, штраф 1,00, процедура 1,00, губернатор 1,00, воззвание 1,00, модель 1,09, творчески 1,10, экспериментальный 1,12, вооружать 1,13, безусловный 1,13, преданность 1,14, ввод 1,15, персональный 1,17, платеж 1,17, тост 1,17, рекламировать 1,17, гуманность 1,17, обучаться 1,17, публиковать 1,19, ударный 1,19, придумывать 1,20, кремовый 1,20, рушить-
ся 1,20, поликлиника 1,20, провокатор 1,20, ремонтный 1,25, банкир 1,25, пруд 1,25, ванна 1,27, фельетон 1,29, фото 1,33, постесняться 1,33, возвращать 1,33, форсировать 1,33, нахальство 1,33, анатомия 1,33, электрик 1,33, мучение 1,33, спаситель 1,33, гоняться 1,33, откопать 1,33, лестный 1,33, ватник 1,33, кордон 1,33, черед 1,33, ханжа 1,33, виза 1,33, сигара 1,33, герб 1,33, репортаж 1,40, пресса 1,42, холодильник 1,43, умысел 1,43, отрицательно 1,43, улучшить 1,43, произвол 1,44, неслыханный 1,44, равняться 1,46, убедить 1,47, человечность 1,50, исключенный 1,50, положиться 1,50, обязать 1,50, осложнение 1,50, извинение 1,50, веселенький 1,50, испортиться 1,50, заурядный 1,50, отказывать 1,50, выручать 1,50, неинтересно 1,56, дипломат 1,57, закономерность 1,58, плановый 1,60, вооружить 1,60, кусаться 1,60, бомбить 1,60, просчет 1,67, подача 1,67, лизать 1,67, нездоровый 1,67, афоризм 1,67, планировать 1,68, расплачиваться 1,69, бесспорно 1,70, ноябрь 1,71, ударять 1,71, развертывать 1,75, бессильный 1,75 (выделены слова интуитивно обиходно-бытовые - 17 слов).
И в данных триадах выборок количество интуитивно обиходно-бытовой лексики различается на порядок: 670 (Д-Х-ГЖ) против 17 (Д-ГЖ-НП).
Слова, встречающиеся в четырех группах текстов
Рассмотрим, какие из слов, встречающихся во всех четырех выборках, обладают ОБ-спецификой.
Поясним, наконец, как при этом выявляется и вычисляется «специфичность», о которой мы говорили и которой пользовались ранее.
Например, обратимся к табл. 5.
В первых четырех столбцах указана частота слова коммунистический в выборках. Затем указано ко -личество текстов, в которых встретилось данное слово. Разделив частоту в Газетно-журнальной выборке (ГЖ-Ч) на количество текстов в ней, получаем среднюю частоту слова в ГЖ-тексте: 108 : 11 = 9,818182, округленно - 10. Аналогично вычисляется средняя частота слова в других выборках. Сумма этих неокругленных средних = 28,6123. Разделив ее на 4 (число выборок), получаем среднее значение слова в тексте по всему корпусу (СрКорп) - 7,15 (табл. 6).
Т а б л и ц а 5
Слово ГЖ-Ч ДрЧ НП-Ч ХудЧ ГЖ-Т ДрТ НП-Т Х-Т ГЖср ДрСр НПср ХудСр СрКорп
Коммунистический 108 2 260 3 11 1 17 2 10 2 15 2 7,15
Т а б л и ц а 6
Слово СрКорп ГЖотн Дотн НПотн Хотн Макс ГЖнорм Днорм НПнорм Хнорм
Коммунистический 7,15 1,37 0,28 2,14 0,21 2,14 0,64 0,13 1,00 0,10
Разделив среднюю частоту слова в тексте данной выборки на среднюю в корпусе (СрКорп), получаем Относительную частоту слова в данной выборке. Например, ГЖср - 9,818182 делим на СрКорп 7,15 и получаем 1,37.
Максимальная относительная величина - в научно-публицистической выборке (НПотн = 2,14). Для того чтобы нормировать средние относительные частоты в выборках, примем максимальную величину за 1 и, разделив на нее все относительные, получим Нормированную относительную частоту слова в тексте данной выборки.
Именно эти величины (ГЖнорм, Днорм, НП-норм, Хнорм) мы и используем для выявления специфичности слова относительно той или иной выборки (и как следствие - того или иного функционального стиля). Как видим, для слова коммунистический
максимальное значение обнаруживается в выборке НПнорм, следовательно, это слово специфично прежде всего для публицистического (или точнее - идеологического) стиля. Близок к нему и стиль советских газет и журналов - всегда идеологически выдержанных: ГЖнорм = 0,64. Обиходно-бытовому стилю, представленному в художественной литературе и пьесах, это слово чуждо, хотя «правильный» отбор пьес отчасти исправляет ситуацию (Днорм = 0,13). Наименее идеологизированной оказывается художественная литература: (Хнорм = 0,10).
Наглядно описанное соотношение представлено на рис. 3.
Сравнение с суммарной частотой слова в выборках позволяет ответить на вопрос, зачем нужны средние нормированные частоты по текстам (рис. 4 и 5).
НПнорм ГЖнорм Днорм Хнорм
Рис. 3. Распределение нормированной средней частоты слова коммунистический по выборкам (в ЧСлРЯ-1977)
300
260
НП ГЖ Худ Дрм
Рис. 4. Распределение суммарных частот слова коммунистический по выборкам (в ЧСлРЯ-1977)
IНормСрЧ
Рис. 5. Нормированная средняя частота и нормированная суммарная частота слова коммунистический (в ЧСлРЯ-1977)
В главном показатели совпадают, но по мере уменьшения частоты информативность суммарной частоты слова по выборке убывает. Так, при частоте 3 в художественных текстах и 2 - в драматических, получается, что наименее идеологизированным жанром является язык драматургии, что вряд ли справедливо: чем больше факторов учитывается, тем объективнее оценка. По суммарной частоте художественная и драматургическая выборки меняются местами.
Кроме того, по суммарной частоте газетно-жур-нальные тексты предстают менее идеологизированными, что также вряд ли соответствует действительности.
Теперь мы можем обратиться к выявлению обиходно-бытовой лексики среди слов, встретившихся во всех четырех выборках.
Всего слов, у которых только ОБ-слово имеет НормСрЧ = 1, в ЧСлРЯ-1977 обнаружено 937. Среди них интуитивно принадлежащим к ОБ-лексике являются 152 следующих (слова даются в порядке убывания специфичности и возрастания суммы НормСрЧ трех выборок: ГЖ, НП и Худ): отец 0,11, видать 0,13, ширма 0,25, четверка 0,43, фриц 0,57, вихор 0,60, ты 0,78, дверь 0,78, корзина 0,80, ах 0,84, ну 0,87, мошенник 1,00, чай 1,02, эх 1,04, зашуметь 1,04, твой 1,05, кувшин 1,13, ишь 1,17, шарить 1,17, угрюмо 1,18, удрать 1,20, калитка 1,21, рыбка 1,22, вмешаться 1,28, выпить 1,30, неужели 1,32, кресло 1,33, буржуй 1,33, крыса 1,33, поправиться 1,33, раздражение 1,33, спутать 1,33, плакать 1,35, выскакивать 1,36, глупо 1,43, крупа 1,43, зайти 1,44,
жаль 1,45, жена 1,46, тарелка 1,46, хватить 1,46, капуста 1,47, девка 1,47, брат 1,47, глупый 1,47, бутылка 1,48, попросту 1,50, гад 1,50, скакать 1,50, заблудиться 1,50, закоулок 1,50, зареветь 1,50, калека 1,50, метла 1,50, натягивать 1,50, неразбериха 1,50, оговориться 1,50, поровну 1,50, раздевать 1,50, дома 1,54, старичок 1,54, ужинать 1,54, жечь 1,56, бросаться 1,57, обнять 1,59, спичка 1,59, шум 1,60, съесть 1,61, стыдно 1,61, нищий 1,62, пропадать 1,62, обижаться 1,62, наспех 1,67, жулик 1,68, слыхать 1,68, лапоть 1,69, капризный 1,71, оскорблять 1,71, ругаться 1,73, поесть 1,73, нервничать 1,74, надевать 1,74, выслушать 1,75, накинуть 1,75, вещица 1,80, чуять 1,80, посидеть 1,81, кончать 1,81, дьявол 1,82, отстать 1,83, шутливо 1,83, привет 1,83, погасить 1,83, усесться 1,83, ножка 1,85, соображать 1,85, разводить 1,85, подвал 1,86, вскакивать 1,87, уговорить 1,87, пройтись 1,87, в (во) 1,89, проклятый 1,90, отходить 1,91, проситься 1,91, подбирать 1,92, разбег 1,92, болтать 1,92, катиться 1,92, дурной 1,94, посадить 1,96, противный 1,99, братишка 2,00, вышвырнуть 2,00, крошка 2,00, навестить 2,00, подкладка 2,00, портить 2,00, почистить 2,00, шарф 2,00, выходка 2,00, отпускать 2,00, сломать 2,05, вообразить 2,05, чудак 2,05, завтрак 2,07, лихой 2,08, малость 2,10, ступенька 2,10, глупость 2,14, счастливо 2,16, дорогой 2,19, кошка 2,19, стон 2,22, очистить 2,22, лопнуть 2,24, вглядеться 2,25, дескать 2,25, обниматься 2,25, поменьше 2,25, променять 2,25, ага 2,26, мышь 2,28, врываться 2,30, прижиматься 2,32, срывать 2,33,
звездочка 2,34, вдогонку 2,40, машинка 2,40, домашний 2,67, побольше 2,70, успевать 2,75.
Особенно хотелось бы отметить предлог В (ВО): в ЧСлРЯ-1977 это самое употребительное слово, но его перевес над союзом И достигнут только в драматургии и за счет драматургии.
В связи с этим логично предположить, что тексты, в которых частота В (ВО) превышает частоту И, принадлежат обиходно-бытовому стилю.
Таким образом, 1-й ранг частоты предлога В (ВО) может служить индикатором разговорности текста. Удобство этого показателя в том, что его легко вычислять и верифицировать.
Другим маркером неофициальной ситуации общения является наличие (особенно - высокая частота) местоимений ты и твой.
Лексику, маркирующую сферу ОБ общения, можно подразделить на антуражную, описываю-
Воронежский государственный университет
Кретов А. А., доктор филологических наук, заведующий кафедрой теоретической и прикладной лингвистики
E-mail: [email protected]
Тел.: 8 (473) 220-41-49
щую обстановку, в которой обычно происходит непринужденное общение (например, отец, ширма, дверь, корзина, кувшин, чашка, чай, тарелка, рыбка, капуста, крупа, бутылка, стакан, выпить, съесть и т. д.), и индикаторную - слова, употребляющиеся в процессе непринужденного и спонтанного общения (ах, ну, эх, ишь, ага, видать, слыхать, братишка, дескать, малость, удрать, девка, мошенник, гад, дьявол и т. п.).
ЛИТЕРАТУРА
1. Векшин Г. В. Основы стилистической семантики : учеб. пособие / Г. В. Векшин, С. А. Гейченко. - М. : Московский технологический университет (МИРЭА), 2017. - 128 с.
2. Частотный словарь русского языка : ок. 40 000 слов / под ред. Л. Н. Засориной. - М. : Русский язык, 1977. - 936 с.
Voronezh State University
Kretov A.A., Doctor of Philology, Head ofthe Theoretical and Applied Linguistics Department
E-mail: [email protected]
Tel.: 8 (473) 220-41-49