Вестн. Моск. ун-та. Сер. 19. Лингвистика и межкультурная коммуникация. 2011. № 4
ВОПРОСЫ ЛЕКСИКОЛОГИИ И ЛЕКСИКОГРАФИИ
Е.Б. Кротова
КОРПУСНЫЙ ПОДХОД К ФРАЗЕОГРАФИИ
В статье на материале идиом немецкого языка рассматривается вопрос о том, как обращение к машиночитаемым корпусам позволяет решить ряд фразеографи-ческих проблем. Показано, что корпусы могут помочь при формулировке леммы, определении валентностей и морфо-синтаксических ограничений, поиске вариантов идиомы и составлении семантического и прагматического комментариев. Анализ корпусных данных важен для уточнения семантики идиомы и, более того, позволяет обнаружить значения, еще не зафиксированные в словарях. Текстовые электронные корпусы открывают, таким образом, новые возможности перед фра-зеографией.
Ключевые слова: фразеография, корпусный подход, идиомы.
The article deals with the question, how the appliance of computer-readable text-corpora can help to solve a number of phraseographical problems, such as lemma selection, the determination of valency, morpho-syntactic restrictions, idiom's variants and the compiling of semantic and pragmatic commentaries. Illustrative material is taken from the German language. The analysis of corpora data gives an opportunity to define more exactly the meaning of an idiom and, moreover, to detect meanings, which have not yet been fixed in dictionaries. Thus computer-readable text-corpora open new possibilities for the phraseography.
Key words: phraseography, corpus-based approach, idioms.
Словари, созданные с использованием электронных текстовых корпусов1, появились сравнительно недавно. Один из первых, Collins COBUILD English Language Dictionary, вышел в 1987 г. и базировался на данных корпуса "The Bank of English". В настоящее время количество словарей, в большей или меньшей степени использующих корпусы, растет. Так, например, при подготовке нового издания "Duden. Redewendungen..."2 были использованы данные корпуса "Duden-Korpus", содержащего около 2 млрд словоупотреблений.
Кротова Елена Борисовна — аспирант кафедры германских языков и культур факультета иностранных языков и регионоведения МГУ имени М.В. Ломоносова; тел.: 8-916-240-04-49, e-mail: elena_krotova@inbox.ru
1 Корпус некоторого языка — это собрание текстов на данном языке, представленное в электронном виде и снабженное научным аппаратом (разметкой) (см.: Плунгян В.А. Зачем нужен Национальный корпус русского языка? Неформальное введение // Национальный корпус русского языка: 2003—2005. М., 2005. С. 6).
2 Duden. Redewendungen. Wörterbuch der deutschen Idiomatik. Wörterbuch der deutschen Idiomatik. Mannheim, 2008.
Обращение к машиночитаемым корпусам помогает решить целый ряд фразеографических проблем. Х. Бургер3 в статье, посвященной семантическим аспектам немецкой фразеографии, приводит список фразеографических проблем, с которыми сталкиваются при создании как общих, так и фразеологических словарей. Речь идет об одноязычной фразеографии, но многие из перечисленных им проблем касаются и фразеографии контрастивной. Корпусы могут быть использованы при решении следующих из перечисленных в статье проблем: формулировки леммы, определения валентностей и мор-фо-синтаксических ограничений, поиска вариантов идиомы, составления семантического и прагматического комментария.
Говоря о толкованиях, даваемых фразеологизмам в словарях, Х. Бургер подчеркивает, что часто они недостаточно точные ("zu wenig differenziert")4. С этим тесно связана проблема так называемых квази-синонимов. Идиомы, принадлежащие одному семантическому полю, нередко объясняются в одноязычных словарях одинаково. Например, в словаре "Duden. Redewendungen..." можно найти следующие толкования: nicht alle Tassen im Schrank / Spind haben = nicht bei Verstand sein; einen Vogel haben = nicht recht bei Verstand sein; einen Knall haben = (salopp) nicht recht bei Verstand sein; nicht ganz bei Verstand sein = verrückt sein, т.е. первые три идиомы объясняются практически одинаково через четвертую идиому, которой в свою очередь приписывается значение "быть сумасшедшим". Просмотрев толкования, можно прийти к выводу о синонимичности этих идиом, что, однако, не соответствует языковой реальности. Приблизиться к пониманию различия между идиомами можно, проанализировав контексты, в которых эти идиомы употребляются. Предоставить эти контексты могут крупные текстовые корпусы.
Для идиом, указанных выше, мною были составлены словарные статьи для проекта "Moderne Idiomatik: Deutsch-Russisches Wörterbuch"5. Проведенный корпусный анализ помог при определении вариантов идиом и их частотности, а также при составлении комментариев к статьям. Так, оказалось, что идиома nicht alle Tassen im Schrank haben может также использоваться в форме nicht mehr alle Tassen im Schrank haben, а вариант nicht alle Tassen im Spind haben встречается крайне редко. В контекстах со снятой утвердительно-
3 Burger H. Semantische Aspekte der deutschen Phraseographie: die aktuelle Praxis — allgemeine und phraseologische Wörterbücher im Vergleich // Theorie und Praxis der idiomatischen Wörterbücher / Hrsg. M.B. Carmen. Tübingen, 2009. S. 23—44.
4 Ibid. S. 33.
5 Dobrovol'skij D.O., Filipenko T.V. Moderne Idiomatik: Deutsch-Russisches Wörterbuch. Lexikographisches Format und Beschreibungsprinzipien // Das Wort. Germanistisches Jahrbuch GUS. Bonn, 2003. S. 367—380.
стью идиома используется в форме (noch) alle Tassen im Schrank haben. Помимо этого субъект может быть выражен как местоимением du = ты, так и местоимением Sie = Вы.
1. "Haben Sie noch alle Tassen im Schrank?" Als Monika Hauser <...> einem deutschen Diplomaten von ihrem Vorhaben berichtete, schüttelte der nur den Kopf (Hannoversche Allgemeine. 02.10.2008).
"У вас все с головой в порядке?" — спросил немецкий дипломат Монику Хаузер <...> когда она рассказала ему о своем замысле, и лишь покачал головой.
У идиомы einen Vogel haben был найден только один вариант einen Vogel im Kopf haben, встречающийся довольно редко. Контексты также показали, что субъектную валентность может заполнять местоимение Sie.
2. Dass eine so ernsthafte Aufgabe den Helferinnen kein Geld bringt, mag mancher Patient nicht verstehen: "Haben Sie nichts besseres zu tun?" und "Was bekommen Sie dafür — nichts? Sie haben ja einen Vogel!" (Nach: Frankfurter Rundschau. 25.06.1998).
То, что выполнение такой серьезной работы не приносит медицинскому персоналу никаких денег, многие пациенты просто не понимают: "Вам что, делать больше нечего?" и "Сколько вам за это платят? Ничего? Да у вас не все дома!"
Идиома einen Knall haben, в отличие от идиом nicht alle Tassen im Schrank haben и einen Vogel haben, относится к стилистически сниженной лексике и обладает следующими синтаксическими особенностями: именной компонент идиомы может использоваться с прилагательными, указывающими на степень проявления признака, например: einen kleinen Knall haben = "быть немного с приветом".
Наиболее употребительной оказалась последняя идиома bei Verstand sein. Для нее были найдены следующие варианты: bei klarem [vollem] Verstand sein, klar [völlig] bei Verstand sein. Чаще всего идиома употребляется в форме (jmd.) ist bei Verstand либо (jmd.) ist bei klarem Verstand. Помимо прилагательных klar и voll в варианте идиомы (jmd.) ist bei klarem [vollem] Verstand могут использоваться также прилагательные wach, gut, normal, gesund (например, (jmd.) ist bei gesundem Verstand). Наречия klar и völlig в варианте идиомы (jmd.) ist klar [völlig] bei Verstand могут заменять наречия normal и durchaus (например, (jmd.) ist durchaus bei Verstand). Идиома используется не только предикативно, но и атрибутивно в значении "будучи в здравом рассудке".
3. Wenn jemand todkrank ist und bei klarem Verstand entscheidet, nicht länger leben zu wollen, finde ich das legitim, auch wenn man ihm dann dabei hilft (Hamburger Morgenpost. 30.11.2006).
Если смертельно больной человек, будучи в здравом рассудке, решает, что не хочет жить дальше, то, на мой взгляд, вполне допустимо, если ему помогут умереть.
Более того, идиома может сочетаться с наречиями степени einigermaßen и halbwegs в значении "(кто-л.) еще (более-менее) в здравом уме, (у кого-л.) еще не совсем крыша поехала".
4. Niemand, der auch nur einigermaßen bei Verstand ist, wird behaupten, dass Rauchen der Gesundheit förderlich sei (Mannheimer Morgen. 09.09.2003).
Только те, у кого совсем крыша поехала, могут утверждать, что курение полезно для здоровья.
В контекстах с отрицанием идиома употребляется в форме (jmd.) ist nicht bei Verstand = "(кто-л.) с ума сошел, (кто-л.) не в своем уме". Именной компонент Verstand может сочетаться с прилагательным klar (например, (jmd.) ist nicht bei klarem Verstand). Идиома также используется в следующих формах: nicht mehr bei Verstand sein, nicht mehr klar bei Verstand sein, nicht mehr richtig bei Verstand sein, nicht recht bei Verstand sein.
В форме (jmd.) ist nicht ganz bei Verstand идиома выступает в значении "(кто-л.) не совсем понимает, что делает, (кто-л.) не совсем понимает, что происходит (в результате нарушенной мозговой деятельности)".
5. "Ich nahm gegen die Schmerzen die Morphiumtabletten meiner Mutter", sagt der Klagenfurter. "Deshalb war ich nicht ganz bei Verstand" (Kleine Zeitung. 26.04.2000).
"Против боли я принимал мамины таблетки с морфием, — говорит житель Клагенфурта. — Поэтому я не совсем соображал, что делаю".
Таким образом, в случае с данными идиомами с помощью корпусного анализа были найдены их варианты и выявлены их синтаксические особенности. Задача рассмотреть семантические различия между идиомами при составлении словарных статей для данных идиом не ставилась, хотя подобная попытка могла бы быть предпринята при условии наличия достаточного числа контекстов.
Анализ большого количества примеров употребления идиомы помогает, во-первых, уточнить ее семантику, во-вторых, обнаружить значения, еще не зафиксированные в словарях. На факт наличия в корпусах примеров, где идиомы употребляются в значениях, не зафиксированных в словарях, также обращает внимание К. Стати6. В ее статье, в частности, говорится о результатах корпусного анализа идиомы ins Gras beißen, показавшего, что в 25% контекстов
6 Stathi K. Korpusbasierte Analyse der Semantik von Idiomen // Linguistik online 27.02.2006. URL: http://www.linguistik-online.de/27_06/stathi.html
значение идиомы отличалось от указанного в словарях. Подобных примеров немало. Так, для идиомы jenseits von Gut und Böse sein в "Duden. Redewendungen..." даются два значения: 1. so alt sein, dass man keine sexuellen Bedürfnisse mehr hat "быть чуждым плотских удовольствий (о пожилых людях)", 2. weltfremd, naiv sein "быть не от мира сего, быть наивным". Анализ контекстов тем не менее показывает, что субъектная валентность идиомы может заполняться не только обозначениями одушевленных лиц. У идиомы можно выделить четыре значения, при этом в качестве субъекта могут выступать неодушевленные существительные:
1) (jmd.) ist jenseits von Gut und Böse
(кто-л.) чужд плотских удовольствий (часто о пожилых людях);
2) (jmd.) ist jenseits von Gut und Böse
(кто-л.) не от мира сего, (кто-л.) потерял связь с реальностью, (кто-л.) неадекватен (часто о людях, находящихся в состоянии сильного алкогольного опьянения);
3) (jmd., etw.) ist jenseits von Gut und Böse
(кто-л., что-л.) по ту сторону добра и зла;
4) (etw.) ist jenseits von Gut und Böse
(что-л.) выходит за привычные рамки, (что-л.) невероятно (большей частью выражает негативное отношение говорящего; часто о слишком высоких либо слишком низких ценах).
Четвертое значение можно проиллюстрировать следующим примером:
6. Wenn es um Ärzte geht, die Dosen verordnen, die jenseits von Gut und Böse sind, hat die Kripo allerdings kaum eine Handhabe (Nürnberger Nachrichten. 10.09.2008).
По отношению к врачам, назначающим слишком большие дозы, уголовная полиция, однако, мало что может сделать.
Что касается третьего значения идиомы, то к нему понадобилось дать следующий комментарий: в спортивном дискурсе идиома используется в значении (кто-л.) в середине таблицы (часто о командах). В этом значении идиома может употребляться также с глаголами sich befinden, rangieren, stehen.
7. Die beiden Teams befinden sich derzeitig jenseits von Gut und Böse. Mit dem siebten und achten Platz begnügen sie sich derzeit im Mittelfeld der Liga (Braunschweiger Zeitung. 19.10.2007).
Обе команды на данный момент находятся в середине таблицы. Будучи на седьмом и восьмом местах, они являются командами-"середнячками" лиги.
Здесь следует сделать небольшую оговорку про состав корпусов. Для фразеографического исследования на материале немецкого языка подходят корпусы Института немецкого языка в Мангейме. Другие корпусы не обладают достаточным объемом для проведе-
ния исследования. К сожалению, корпусы Института немецкого языка не являются сбалансированными и по большей части состоят из архивов различных немецких, австрийских и швейцарских газет. В большинстве газет много внимания уделяется спорту, а в спортивных контекстах, как показывает анализ, идиомы могут приобретать новые значения. Как было отмечено выше, идиома jenseits von Gut und Böse sein также приобрела новое значение в спортивном контексте.
За счет того, что основной массив корпусов составляют газеты, количество употреблений идиом в "новых значениях" численно может превышать количество употреблений в значениях, уже зафиксированных в словарях. Основываясь исключительно на данных корпусов, было бы логично указывать "новое значение" в качестве первого как наиболее частотного. Однако необходимо учитывать несбалансированность корпусов и тот факт, что они не включают в себя образцов устной речи. Поэтому "новые значения" можно указывать в конце словарной статьи, комментируя их стилевую принадлежность.
Как уже отмечалось многими исследователями (в частности Т.В. Филипенко7, S. Lubensky, M. McShane8), появление текстовых электронных корпусов открывает новые возможности перед лексикографией, и в частности перед фразеографией. С помощью корпусного анализа может быть дан ответ на многие вопросы, возникающие при составлении статей для фразеологических словарей, например: есть ли у идиомы варианты, какой из вариантов наиболее частотен и должен быть вынесен в лемму, какие валентности и морфо-синтаксические ограничения есть у идиомы. Проводимый компьютером статистический анализ лексической комбинаторики помогает также раскрыть особенности сочетаемости идиом либо выявить фразеологические единицы, еще не зафиксированные в словарях. Корпусный анализ, таким образом, делает возможным более полное и верное отражение реального употребления идиом в языке.
Список литературы
Плунгян В.А. Зачем нужен Национальный корпус русского языка? Неформальное введение // Национальный корпус русского языка:
2003-2005. М., 2005.
7 См.: Филипенко Т.В. Использование методов корпусной лингвистики в анализе семантики идиом (на материале немецкого языка) // Вестн. Моск. ун-та. Сер. 19. Лингвистика и межкультурная коммуникация. 2004. №1.
8 Lubensky S., McShane M. Bilingual phraseological dictionaries // Handbücher zur Sprach- und Kommunikationsforschung (HSK) — Handbook of Phraseology. 2. Halbband. Walter de Gruyter, 2007. S. 919—928.
Филипенко Т.В. Использование методов корпусной лингвистики в анализе семантики идиом (на материале немецкого языка) // Вестн. Моск. ун-та. Сер. 19. Лингвистика и межкультурная коммуникация. 2004. № 1.
Burger H. Semantische Aspekte der deutschen Phraseographie: die aktuelle Praxis — allgemeine und phraseologische Wörterbücher im Vergleich // Theorie und Praxis der idiomatischen Wörterbücher. (Lexicographica. Series maior/ Supplementbände zum Internationalen Jahrbuch für Lexikographie 135) / Hrsg. M.B. Carmen. Tübingen, 2009.
Dobrovol'skij D.O., Filipenko T.V. Moderne Idiomatik: Deutsch-Russisches Wörterbuch. Lexikographisches Format und Beschreibungsprinzipien // Das Wort. Germanistisches Jahrbuch GUS. Bonn, 2003.
Duden. Redewendungen. Wörterbuch der deutschen Idiomatik. Wörterbuch der deutschen Idiomatik. Mannheim, 2008.
Lubensky S., McShane M. Bilingual phraseological dictionaries // Handbücher zur Sprach- und Kommunikationsforschung (HSK) — Handbook of Phraseology. 2. Halbband. Walter de Gruyter, 2007.
Stathi K. Korpusbasierte Analyse der Semantik von Idiomen // Linguistik online 27.02.2006. URL: http://www.linguistik-online.de/27_06/stathi. html