ЛИНГВОДИДАКТИКА И МЕТОДИКА ОБУЧЕНИЯ ЯЗЫКУ THEORY AND METHODOLOGY OF TEACHING LANGUAGES
УДК 372.881.111.1
О. Г. Горина O. G. Gorina
Определение словарного запаса обучаемых с помощью корпуса
Using Corpus Evidence to Compile Learner’s Vocabulary
В статье обсуждается один из возможных путей отбора лексического минимума с помощью корпуса предметной области, рассматривается содержание понятия минимум, обсуждается структура лексического минимума, соотношение ключевых слов и других лексических единиц в свете новейших корпусных исследований, посвященных структуре вокабуляра обучаемых. В статье уделяется внимание понятию лексической плотности как количественной меры этих различий между письменной и устной речью, рассматриваются их импликации при обучении отдельным видам речевой деятельности. В статье описывается состав и потенциал корпуса предметной области для определения содержательного ядра словарного запаса обучаемых при обучении профессионально ориентированному иностранному языку.
The article deals with a way of selecting key vocabulary using corpus of texts relevant to learners’ professional needs. Important issues such as core vocabulary size and the proportion of different types of vocabulary items are discussed. The article elaborates on the differences between spoken and written discourse in terms of lexical density. We consider pedagogical implications of corpora-based and discourse approach in teaching and selecting vocabulary.
Ключевые слова: корпус предметной области, ключевые слова, словарный запас, содержание обучения, лексическая плотность, устная речь, письменная речь, речепроизводство, рецепция.
Key words: specialized corpora, keywords, lexical density, learner’s vocabulary, content, written discourse, spoken discourse, productive and receptive skills.
Каждому преподавателю иностранного языка известно, что прежде чем приступить к обучению, необходимо ответить на вопрос «чему учить?». В методической литературе разными авторами высказываются разные точки зрения по этому вопросу. При этом не
© Горина О. Г., 2013
все высказываемые мнения «в равной степени убедительны и бесспорны» [2, с. 5].
Бесспорным, однако, следует признать то, что ожидаемое качество речевой продукции обучаемого напрямую зависит от того насколько грамотно отобраны минимумы - грамматический, лексический, поскольку при конструировании содержания практического курса языка непосредственному отбору подлежат именно минимумы, призванные обслужить тот или иной вид вербальной деятельности [там же, с. 13].
Развитие теоретических положений базисных для лингводидак-тики наук - лингвистики и психологии - постоянно уточняет знания о самом объекте обучения. Дидактически осмыслив эти уточнения и освоив потенциал смежных наук, мы получаем возможности для конструирования содержания обучения, которое лучше соответствующего задачам вуза. И.А. Зимняя отмечала, что «в отличие от многих языковедов, Л.В. Щерба пытался найти для результатов своих языковедческих исследований практическое применение» [3, с. 265]. Именно с этим она связывала точку зрения академика на методику как на прикладное языкознание. В этом не было недооценки методики, а лишь «его стремление, с одной стороны, найти для языкознания выход в практику, а с другой - попытаться научно обосновать методику данными языкознания» [там же].
Западные методисты также определяют принципиальную роль учебной программы для конкретных условий обучения (syllabus) как обеспечение четко обоснованных способов отбора максимально используемых единиц. Более того, отмечается значительная вариабельность «максимально используемых» средств языка, т.к. это свойство не присуще языку в целом, а есть нечто определяемое в рамках конкретного курса, а возможно, и для конкретных обучаемых [5, с. 106]. М. Льюис также указывает на то, что по указанным причинам проект Cobuilt (словарь частотности) не принес максимальной отдачи, несмотря на хорошую теоретическую базу [там же, с. 106-107].
Возможно, с этим фактом связано то, что именно пионеры корпусных лингвистических исследований, создатели больших корпусов первыми стали говорить о диалоге между разработчиками корпусов и преподавателями, помощи в создании преподавателями их собственных специализированных, тематических корпусов, освоении корпусных процедур, чтобы у студента появилась возможность
изучать специфическую для своей профессиональной области лексику [6, с. 563-574].
Ряд вопросов отбора минимумов для любых профессиональных целей, в частности для таких новых, неустоявшихся специальностей, как регионоведение, относятся к числу нерешенных проблем методики.
Лапидус Б.А. под минимумом предлагает понимать «достаточную для обеспечения задач курса в области данного вида речевой деятельности, особым образом отбираемую и обязательную для усвоения совокупность языковых явлений», паралингвистических и
n w w
других единиц. В минимум должен входить такой материал, который «отрабатывается в том или ином объеме» и обязателен для усвоения, поскольку включает «коммуникативно наиболее важные единицы» [5, с. 23]. Следует подчеркнуть, что минимум это «не случайный набор единиц количественно соответствующих целям обучения», а должен быть результатом специального отбора [там же].
При отборе лексических минимумов возникает целый ряд методических переменных, которые необходимо учитывать. В первую очередь это вопросы посильного количества, определения исходных положений отбора, принципов и критериев отбора. Также необходима надежная, выверенная процедура их реализации. Следует также принимать во внимание, что в методике принято проводить различие между пассивным, активным и потенциальным лексическим запасом, соотносимое с продуктивными и рецептивными видами речевой деятельности. Методически оправданная идея различения активного и пассивного языкового материала звучала уже в работах Г. Пальмера и М. Уэста. В трудах Л.В. Щербы было предложено различение активного и пассивного словаря, активной и пассивной грамматики [3, с. 266].
В результате более поздних исследований, в том числе на материале корпусов устной и письменной речи, существенные лингвостатистические различия были обнаружены между письменной и устной речью. Для того чтобы говорить, например, о продуктивном словаре для говорения и письма необходимо разобраться в этих различиях. Для характеристики дихотомии письменная / устная речь было введено понятие лексической плотности (lexical density), удельное количество лексических единиц или содержательных слов на предложение или часть сложного предложения) [8, с. 121-123].
На разную лексическую плотность устной и письменной речи указывают составители новой грамматики английского языка (LGSWE, Longman grammar of spoken and written English), основанной на эмпирических данных специально созданного 40-миллионного корпуса письменной и устной английской речи (LSWE Corpus). Авторы определяют лексическую плотность как процентное соотношение содержательных слов в тексте или на отрезке речи. Все слова в тексте делятся на содержательные (lexical words) такие как: prime, minister, служебные (functional): over,the ,of; включения (inserts): erm, please [4, с. 61]. Сравнивая газетные статьи и разговорную речь, авторы приходят к выводу, что это - абсолютно полярные жанры. Самый высокий процент содержательных слов приходится на новостные тексты, а самый низкий на тексты записи устной диалогической речи [4, с. 62]. Новостные статьи - это тщательно и неоднократно отредактированные тексты, главной целью которых является объективная подача информации, часто от имени официального источника, что и определяет их основные свойства: выверенный, лексически плотный, информативный поток речи. В противоположность этому диалог между участниками разворачивается в «живом эфире», когда нет возможности редактировать грамматические средства, практически нет времени на планирование, корректировка сказанного происходит в последующих репликах, т.к. произнесенное высказывание нельзя удалить. Предметы, окружающие собеседников могут быть вовлечены в ситуацию дейктическими средствами или жестами. В среднем по корпусу LSWE лексические (содержательные) слова составляют 50 % от всех слов корпуса. Типичная дистрибуция содержательных слов по устным (разговорным) и письменным (новостным) источникам составляет: 41 % и 63 % соответственно, количество служебных слов в письменном дискурсе превышает их число в устном: 44 % и 37 %, а включения (erm,right,yeah,please) наблюдаются только в устной речи и составляют 15 % [4, с. 7-8]. Эти результаты, безусловно, имеют большое значение для решения задач по отбору лексических минимумов. Следует отметить, что эти данные получены при сравнении полярных жанров.
Сравнение менее полярных жанров устной и письменной речи тоже дает важное понимание того из каких единиц должен состоять словарный запас специалиста. OKeeffee, McCarthy, Carter сравнивая данные пяти корпусов, репрезентирующих устный бытовой
дискурс, устный академический дискурс, и письменный академический дискурс приходят к выводу, что в устных бытовых диалогах как правило первое место по частотности занимают маркеры интерактивности (markers of interactivity) такие как: I, You, yeah. В функции реакции на высказывание или действие собеседника выступают тоже частотные средства реагирования (response tokens), такие как: like, please, thanks. Однако при анализе устного академического корпуса, несмотря на то, что это корпус устной естественной речи, на первый план выходят не маркеры интерактивности, а те же единицы, которые частотны в письменном корпусе академического дискурса: артикли a, the, означающие высокую встречаемость
сочетаний существительных (noun phrase); предлог of, свидетельствующий о высокой частотности постмодифицированных сочетаний существительных (post-modified noun phrases); союз that, вводящий придаточные предложения в конструкциях с подлежащим «it» и глаголами сообщения (reporting verbs). Также частотны предлоги to, for, in как индикаторы предложных фраз (prepositional phrases). При этом отсутствуют интерактивные местоимения, свойственные устной речи I, you, а также такие слова, как year, like, now [7, с. 11-12].
Если мы обратимся к текстам, составляющим круг профессиональных интересов специалиста-регионоведа, то источники политической коммуникации занимают среди них важное место. Специалисты разграничивают, прежде всего, институциональный политический дискурс, в рамках которого используются только тексты, созданные политиками (парламентские стенограммы, политические документы, публичные выступления, интервью политических лидеров и др.), и массмедийный политический дискурс, в рамках которого используются преимущественно тексты, созданные журналистами и распространяемые посредством прессы, телевидения, радио, Интернета. При широком подходе к отбору источников интерес представляют не только тексты, созданные политиками, но и другие тексты, посвященные политическим проблемам [1, с. 33-35].
Для анализа и оценки лексических характеристик образцов ре-гионоведческой тематики нами был исследован источник устной коммуникации, соотносящейся со сферой политики. Это актуальное интервью американского политического деятеля по вопросам выделения средств для антиправительственного движения в Сирии,
в котором он излагает позицию Америки в отношении сирийского конфликта и путей его урегулирования [http://www.bbc.co.uk/-programmes]. Текст интервью был запротоколирован, отредактирован, конвертирован в простой текстовый формат и проанализирован с помощью программного продукта Wordsmith 6.0 [7]. Был получен список частотности (wordlist). В десятку самых частотных вошли артикли the/a; предлог of в сочетаниях существительных; предлоги to, in в предложных сочетаниях; союзы that и and в сложных предложениях; местоимения we (утверждения от имени организации, которую представляет гость программы) и you (при обращении к говорящему и организации которую он представляет). Статистически значимыми оказались дискурс маркеры: well, you know, right, actually, absolutely, just, mean, как сигналы важных коммуникативных функций смены темы разговора, согласия, подтверждения, дальнейшего объяснения и развития мысли и т.д. Глагол know в 17 из 26 случаев используется как лексический, а в остальных 9 случаях в сочетании you know как дискурс маркер. Лексическая плотность (содержательных слов) составила 48 %.
Таким образом, можно сделать вывод о том, что в ситуациях профессионального общения дискурс регионоведческой направленности будет скорее тяготеть в своих основных чертах к академическому дискурсу в отношении лексической плотности, функциональных единиц, отсутствия разговорно-бытовых интерактивных маркеров, а также обладать некоторыми лексическими и грамматическими особенностями свойственными более формальной, подготовленной речи. Это определяется тем, что в ситуациях профессионального общения, обсуждая темы мировой и региональной политики, региональной и национальной безопасности, экономики, культуры, специалист нечасто оказывается в условиях исключительно спонтанной речи, а пользуется наработками, заготовками, высказывает тщательно продуманную заранее точку зрения организации, которую он представляет.
Тематика в курсе неродного языка призвана очертить границы внеязыковой действительности, которые обучающиеся должны уметь обозначить средствами изучаемого языка. К этому необходимо добавить минимальный набор коммуникативных актов, таких как «выражение согласия» и др., которые им необходимо научиться совершать, выражая свою коммуникативную интенцию [2, с. 10]. Нам
видится, что функциональный набор дискурс-маркеров, детализированный перечень видов коммуникативных актов и средств для реализации функциональной стороны устной продукции: согласия/несогласия, отказа и др., а также средства когезии для письменной продукции разных назначений хорошо представлены в учебной литературе и являются во многом универсальными средствами. Напротив, содержательное ядро лексического запаса как отражение тематики может меняться значительно при переходе от одной профессии к другой. Таким образом, нам необходимо определить процедуру отбора профессионально-значимой лексики.
Поэтому в нашем исследовании мы поставили задачу освоить инструменты корпусной лингвистики для решения методической задачи отбора лексики. Для определения содержательного ядра словарного запаса специалиста регионоведа мы воспользовались корпусной процедурой определения ключевых слов [9, 10].
Для этих целей нами был собран корпус текстов, отражающих тематику специальности Регионоведение. На текстовой базе корпуса применялась корпусная процедура выделения ключевых слов [9, 10] для отбора словаря специальности Регионоведения и других общественно-политических специальностей. Корпус разбит на жанры по тематическому принципу. Коллекция состоит из 277 текстов (файлов) и насчитывает 1 млн 700 тысяч слов(42 000 разных слов). Поскольку в соответствии с ГОС специальности и направления «Регионоведение», профессиональная деятельность выпускника направлена на комплексное изучение соответствующего региона, группы стран или страны: их населения, истории и этнографии, экономики и политики, науки и культуры, религии, языка и литературы, традиций и ценностей [11],тексты собирались по шести крупным темам:
• политический дискурс: выступления политиков, изложение предвыборных платформ, манифестов, тексты Hansard - отчеты о парламентских дебатах в прессе, документы, составленные членами парламента, такие как отчет Лорда Хаттона о вторжении британских войск в Ирак, биографии политиков и другие образцы политического дискурса;
• международные отношения: тексты на темы урегулирования международных конфликтов, проблем связанных с международными переговорами (например, выдержки из книги известного посредника в международном урегулировании, сертифицированного
Международным Институтом Посредничества в Гааге (the International Mediation Institute), миротворца Дага Нола (Doug Noll) «Неуловимый Мир» (Elusive Peace)), терроризмом, эволюцией дипломатии и международной системой; освещение в прессе некоторых международных событий, получивших широкий резонанс, таких как крушение польского правительственного самолета («Польское дело»);
• историко-культурные: выдержки из книги антрополога Кейт Фокс «Наблюдая за англичанами», тексты о Великобритании, включая статьи о текущих событиях, статьи о прессе Великобритании (например, статьи о крушении медиа империи Р. Мердока News of the World: An obituary), статьи страноведческого направления такие как знаменитая статья широко известного историка конституции и телеведущего Дейвида Старки (DavidStarkey), опубликованная в The Sunday Times Chronicle: By 2050 England will have recreated itself. Is this farewell to the bulldog breed?;
• экономика изучаемого региона и Евросоюза: статьи из Financial Times, публикации на сайте Евросоюза, канала BBC, EURONEWS;
• экология: тексты освещающие международные форумы и встречи на высшем уровне по вопросам окружающей среды, такие как Климатический саммит ООН в Копенгагене (так называемые “посткиотские “ переговоры), саммит ООН в ЮАР по проблемам изменения глобального климата, опубликованные результаты экологических исследований, отчеты, прогнозы;
• тексты о России, особенностях российской общественнополитической и экономической жизни, культуры, истории, реалиях (такие как «Доктрина развития Российской Федерации в области международных отношений на ближайшие 10 лет»; Russia for Beginners - серия статей о России написанных известными бизнесменами и журналистами, такими как Владимир Познер, Мишель Берди (What makes the Russians so Russian), статья посла Новой Зеландии в России Стюарта Прайора Negotiations in Russia).
Статистическая обработка корпуса производилась с помощью программного инструмента «УордСмитТулз 6.0» (WordSmithTools 6.0) - набора программ, для исследования лексического поведения на корпусах текстов. К основным функциям инструмента относятся составление списков частотности, конкордансов, вычисление типичной дистрибуции и «ключевых слов», выравнивание параллельных текстов и др. [10]. Некоторые функции данного программного
инструмента такие как «словарные облака» (визуальное изображение статистически значимых слов) и строки конкорданса используются для предъявления, отработки и тестирования отобранных лексических единиц. Корпус может расширяться по мере уточнения тематики специальности. Какие-то жанры корпуса могут исключаться, если они перестали быть актуальными. Следует отметить, что поддержку корпуса профессионально направленных текстов вполне можно осуществлять, обновлять и модернизировать силами кафедры иностранного языка.
Опыт составления и использования корпуса предметной области Регионоведение в учебных целях представит интерес для тех, кто разрабатывает аналогичные проблемы применительно к обучению профессионально ориентированному (неродному) языку в других условиях и для других специальностей.
Список литературы
1. Будаев Э.В., Чудинов А.П. Зарубежная политическая лингвистика. - М.: Наука, 2008. - 352 с.
2. Лапидус Б.А. Проблемы содержания обучения языку в языковом вузе. -М.: Высшая школа, 1986. - 144 с.
3. Основные направления в методике преподавания иностранных языков в Х1Х-ХХ вв. // под ред. Рахманова И.В. - М.: Педагогика, 1972. - 317 с.
4. Biber, D., S. Johansson, G. Leech, S. Conrad and E. Finegan, Longman Grammar of Spoken and Written English. Pearson Education Limited, 1999. - Sixth impression. - 2007. - 1200 p.
5. Lewis M. The lexical approach. the state of ELT and a way forward. - Language Teaching Publications, 1999. - 200 p.
6. McCarthy, Michael. Accessing and interpreting corpus information in the teacher education context. - Language Teaching, 2008: Cambridge University Press.
- P. 563-574.
7. O’Keeffee, A., McCarthy, M., Carter, R. From Corpus to Classroom: language use and language teaching. - 2007. - Cambridge: Cambridge University Press. - 315 p.
8. Pavlovskaya I. Language Teaching Methodology. Modern History of Language Teaching Methods. - Saint-Petersburg: St. Petersburg University Press, 2001.
- 140 с.
9. Scott M. & Tribble C. (2006) Textual Patterns: key words and corpus analysis in language education. Studies in Corpus Linguistics. John Benjamins, - Amsterdam, 2006. - 204 p.
10. WordSmith Tools version 6.0 by Mike Scott.2012. - URL:
http:www.lexically.net (дата обращения: 26.06.2013).
11. Государственный Образовательный Стандарт Высшего Профессионального Образования, специальность 350300 - Регионоведение. - 2000. -URL:http://eduscan.net/standart/080201 (дата обращения: 23.07.2013).