Научная статья на тему 'Основы статистической оптимизации преподавания иностранных языков'

Основы статистической оптимизации преподавания иностранных языков Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
275
69
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕПОДАВАНИЕ ИНОСТРАННЫХ ЯЗЫКОВ / ОПТИМИЗАЦИЯ ОБУЧЕНИЯ / МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА / ТЕРМИНОВЕДЕНИЕ / УЧЕБНАЯ ЛЕКСИКОГРАФИЯ / FOREIGN LANGUAGES TEACHING / OPTIMIZATION OF LANGUAGE TEACHING / COMPUTATIONAL LINGUISTICS / TERMINOLOGY / PEDAGOGICAL LEXICOGRAPHY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лаздинь Т. А.

Формирование иноязычной профессиональной компетенции сопряжено с целым рядом трудностей, среди которых можно выделить проблему научно обоснованного отбора терминологического материала. В данной статье предлагается рассмотреть вопрос об отборе учебных терминологических единиц на основе методов квантитативной лингвистики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The statistic optimization of the foreign languages teaching

The forming of the professional foreign language competence is hampered by a lot of difficulties. One of them is the problem of elaborating scientific procedure of term extraction. This article studies the question of the selection of the terms to be studied on the basis of the computational linguistics methods.

Текст научной работы на тему «Основы статистической оптимизации преподавания иностранных языков»

Т. А. Лаздинь

ОСНОВЫ СТАТИСТИЧЕСКОЙ ОПТИМИЗАЦИИ ПРЕПОДАВАНИЯ ИНОСТРАННЫХ ЯЗЫКОВ

В центре внимания современной методики преподавания иностранных языков стоит задача повышения качества образования путем модернизации его содержания и оптимизации процесса обучения. Особенное значение приобретают проблемы оптимизации профессионально ориентированного обучения иностранным языкам, поскольку именно оно нацелено на реализацию задач будущей профессиональной деятельности выпускников.

Формирование такой иноязычной профессиональной компетенции в настоящее время сопряжено с целым рядом трудностей, среди которых можно выделить проблему научно обоснованного отбора терминологического материала. Широко известно, что отбор терминологических единиц для изучения в рамках профессионально ориентированного языка производится субъективно, с опорой исключительно на личный опыт, компетентность и интуицию преподавателя. Поэтому важно разрабатывать именно объективные методы отбора учебных терминологических единиц.

Для решения задач выделения учебных единиц представляется обоснованным использовать статистико-вероятностный подход. Эта идея впервые была сформулирована в работах группы «Статистика речи», во главе которой в течение многих лет стоит Р. Г. Пиотровский. В ходе своего развития «со времени своего создания в 1957 г. из всесоюзной группа трансформировалась в международную (1991) и сегодня объединяет ученых не только России, но и стран ближнего и дальнего зарубежья»1.

Основные этапы деятельности группы в области оптимизации обучения методами статистики изложены в работах Л. П. Герман-Прозоровой2, В. П. Григорьева, Н. Н. Петрушевской3, О. П. Щепетовой4, Л. М. Сутягиной5 и др. Ученые этой группы в своих исследованиях доказывают, что количественные и качественные характеристики лингвистических явлений тесно взаимосвязаны между собой. Совместное их рассмотрение открывает широкие возможности для исследования языковых процессов и позволяет применить в методике преподавания иностранных языков.

Согласно утверждению М. П. Алексеева, «статистико-вероятностный подход может использоваться для оптимизации на всех основных этапах обучения языку: при отборе учебного материала, при организации материала в учебном процессе, при контроле усвоения»6. Проникновение квантитативных методов в методику преподавания зачастую наблюдается при обработке результатов методических экспериментов, разработке систем машинного перевода и др.

Именно применение методов квантитативной лингвистики позволяет получить объективные лингвистические данные, которые могут быть использованы для решения прикладных задач. Особенно эффективно можно применять эти методы при отборе учебного материала и его организации в учебные терминологические словари и

© Т. А. Лаздинь, 2009

списки терминов. Впоследствии на их основе могут быть разработаны тематические курсы для разных этапов обучения иностранному профессионально ориентированному языку.

Таким образом, статистические методы выделения минимального объема лингвистических единиц, обладающих оптимальным эффектом в процессе коммуникации, могут рассматриваться как средство оптимизации обучения иностранным языкам. Они позволяют выделить единицы, обладающие наибольшим удельным информативным весом, в некий минимум, который будет достаточен для понимания значительной части текста определенной тематики: «Такой минимум может быть выделен путем исследования того, какие языковые факты обладают большей употребительностью, информа-

~ 7

тивностью и важностью для понимания текста, а какие меньшей» .

Отобранные таким статистическим путем терминологические единицы организуются в парадигмы базового языка, представляющие собой обычно сокращенные парадигмы исходного языка какой-либо предметной области знаний. Таким образом, полученный базовый язык представляет собой не просто статистическое, но и структурное построение. Полученные списки выступают в качестве моделей распределений вероятностей употребления терминологических единиц.

Разрабатываемые учебные словари на основе методов статистико-вероятностного анализа по данному методу слов помогают ответить на один из главных вопросов методики преподавания: «Чему обучать?».

Решение этого вопроса с учетом качественных и количественных характеристик языка предоставляет широкие возможности для поиска путей оптимизации обучения иностранному языку.

Вопрос выявления принципов отбора лексических (терминологических) учебных единиц поднимался в работах многих ученых-методистов, среди которых — Е. Бжозонь, Б. А. Бухбиндер, Н. П. Ветлов, Б. А. Лапидус, Р. К. Миньяр-Белоручев, А. А. Миролю-бов, Е. И. Пассов, И. В. Рахманов, И. Д. Салистра, В.Л.Скалкин, Н. Н. Хотяновская, И. И. Халеева, С. В. Шатилов и др. Большинство этих авторов настаивает на необходимости применения в процессе отбора терминов одновременно количественных и качественных методов.

Мы также разделяем точку зрения о необходимости сочетания количественных и качественных критериев отбора терминов в учебный терминологический словарь и предлагаем в роли количественного критерия использовать коэффициент статистической устойчивости, а в роли качественного критерия — семантический.

Семантический критерий отбора терминов предполагает их отнесение к какой-либо понятийной области, что, в свою очередь, требует задания определенного семантического пространства. В нашем исследовании семантическое пространство было сформировано:

a) с помощью определенной совокупности текстов, относящихся к узкой предметной области;

b) с помощью отбора терминов из текстов на основе списка опорных слов, полученного на базе терминологического словаря близкой тематики.

В качестве количественного критерия отбора терминов предлагается использовать коэффициент статистической устойчивости, сочетающий в себе данные о частоте и распространенности термина.

В методической литературе, рассматривающей вопросы отбора лексического материала, в частности в работах Б. А. Лапидуса8, О. Д. Митрофановой9, А. К. Сулеймановой10, выделяются основные количественные параметры, которыми являются ча-

стота и распространенность. Эти параметры могут использоваться как отдельно, так и вместе.

Критерий частотности признается необходимым целым рядом исследователей. В работах Ю. А. Сафьяна, Л. Н. Засориной, П. Н. Денисова, В. В. Морковкина, Р. М. Фрум-киной этот принцип считается самым надежным и объективным по сравнению с другими критериями оценки и отбора слов. Р. М. Фрумкина, в частности, утверждает, что «единственно надежным способом составления словаря-минимума является составление частотного словаря как базы для минимума»11.

Критерий распространенности также является статистической оценкой употребительности термина. Особое внимание ему уделяется в работах П. М. Алексеева, Л. Н. За-сорина, Н. Д. Андреева, А. А. Кретова и др. Они отмечают, что для построения словаря, как и всякой лингвистической модели, недостаточно опираться только на абсолютные (или относительные) частоты. Необходимо знать также, равномерно ли распределена каждая из частот в однородных выборках. Распространенность термина выражается «в количестве текстов, в которых оно зарегистрировано хотя бы один раз»12. Следовательно, идея применения критерия распространенности термина при определении лексического минимума довольно распространена. Более того, Н. Д. Андреев13 выдвигает идею создания словаря, отобранного исключительно на этом критерии частотности (в противовес частотному), который бы содержал информацию о численном распределении встречаемости каждого слова по различным видам текста. По мнению ученого, такой словарь позволил бы формально разграничить нейтральную, полутерминальную и терминальную лексику.

Следует, однако, отметить, что применяемые по отдельности оба параметра имеют свои недостатки. Взятый сам по себе, критерий частотности дает достоверные показания в довольно узких пределах, поскольку зачастую термины распределяются в источниках неравномерно, и это дает неправильную общую картину употребления.

Кроме того, критерий распространенности также обладает ограниченной отборочной способностью, так как он показывает только регулярность появления слова, но не его удельный вес в совокупности исследуемых текстов.

Для получения достоверной количественной характеристики термина необходимо разработать новую методику отбора терминов, в которой бы одновременно совмещалась частота и распространенность. Эти критерии должны использоваться в качестве одного общего показателя употребительности термина, его удельного веса в системе терминов.

В литературе специалистов по математической лингвистике предлагается несколько комплексных показателей значимости термина, в которых тем или иным способом комбинируются частота и распространенность.

Идею одновременного использования критерия распространенности и критерия частотности как общего исходного показателя ценности слова высказывал еще в 1970-е годы знаменитый польский исследователь Е. Бжозонь. Затем наиболее подробно вопрос был изучен в работах М. А. Марусенко. Ученый тщательным образом описывает известные статистические методы отбора терминологических единиц. Особенно много внимания в его исследовании уделено методам, которые были предложены Ш. Миллером и исследователями Р. Ю. Кобриным и Л. А. Пекарской. М. А. Марусенко проанализировал критерий активности термина, выявленный информационной группой во главе с Л. А. Балашовым. Основываясь на этих исследованиях, М. А. Марусенко14 предлагает использовать новую величину для выделения терминов, обладающих наибольшей смысловой силой. В отличие от предложенных ранее она сочетает в одной формуле не абсолютную, а относительную частоту термина и его относительное вхождение.

Такая величина называется коэффициентом статистической устойчивости термина:

if .-JlJL

ycml~ mi-N'

где f i —частота термина; mi —число выборок, в которых наблюдался термин; F — общее число словоупотреблений; N —общее число выборок.

Именно этот показатель предлагается для применения в качестве формального критерия отбора терминов в учебный терминологический словарь.

Согласно разработанному нами алгоритму отбор терминов производится в несколько этапов — сначала отбираются речевые термины, а потом после расчета коэффициента статистической устойчивости по предложенной выше формуле и разбиения многокомпонентных терминов речи по непосредственно составляющим осуществляется переход от терминов речи к терминам языка.

По окончании формирования словника учебного терминологического словаря для выделенных терминов осуществляется подборка эквивалентов на русском языке из корпуса параллельных текстов. Затем для всех терминов пишутся оригинальные определения, которые в учебном словаре выступают в роли педагогического высказывания, передающего профессиональные знания на иностранном языке. Завершает работу над словарем разработка логико-понятийных схем, отражающах понятийную организацию изучаемой области знаний.

В результате применения описанного алгоритма в учебный терминологический словарь предметной области «Права человека» вошло 458 одно- и многокомпонентных учебных терминологических единиц.

Оценка оптимальности учебного терминологического словаря, составленного на основе описанного метода отбора учебных терминологических единиц, может быть подтверждена на практике. Для этого необходимо провести лингвостатистический эксперимент, цель которого — доказать оптимальность полученных результатов и подтвердить применимость разработанного метода в процессе обучения.

Для оценки достоверности словаря предлагается использовать методы математической статистики. Одним из таких способов является сравнение данных словаря с текстами, по общему объему меньшими, чем выборочный корпус, но отражающими те же пропорции, какие преобладают в корпусе. Такая контрольная выборка намного меньше основной выборки. В таком случае определяется, какой процент слов контрольной выборки зарегистрирован в основном словаре. Этот процент называют процентом покрываемости текста, он определяет наличие в словнике словаря терминов, встречающихся в экспериментальном тексте.

Под покрываемостью обычно понимается свойство словаря, которое выражается в способности единиц словаря покрывать определенное количество словоформ в тексте. Например, единица словаря droit покрывет одну словоформу, а единица droit a la securite sociale покрывает 5 словоформ. Чем выше покрываемость текста словоформами, тем более надежным считается словарь.

Данный метод проверки эффективности словаря широко используется в работах Р. Г. Пиотровского, П. М. Алексеева, Л. П. Герман-Прозоровой, О. П. Щепетовой, Е. Н. Санковой, Н. Н. Петрушевской и др.

Е. Н. Санкова считает, что в ходе статистической оптимизации преподавания иностранного языка необходимо проверять покрываемость текстов лексемами соответствующего словаря и отбирать для использования в учебном процессе тексты с необходимой покрываемостью15.

По мнению Л. П. Герман-Прозоровой, при решении задачи количественного и качественного отбора лингвистического материала необходимо исследовать статистикоинформационные характеристики предлагаемого учащимся материала, среди которых особое внимание нужно уделять покрываемости текста, общего количества содержащейся в нем селективной информации16.

Р. Г. Пиотровский также не раз в своих работах отмечал, что частотные словники словоформ, слов, словосочетаний являются наиболее эффективным средством отбора лексического материла при оптимизации иностранных языков. Они важны, поскольку в них содержится информация не только об абсолютных частотах терминологических единиц, но даются также сведения об информационной покрываемости текста массивами лексических или грамматических единиц, содержащихся в этих списках. Зная статистическую покрывемость текста конкретными массивами терминов, а также располагая сведениями о том количестве наиболее частых терминологических единиц, которые позволяют обеспечить необходимый уровень понимания текста, можно достаточно точно определить необходимые для усвоения объем и содержание материала.

Таким образом, проверка словаря на покрываемость текстов является очень распространенной в лингвометодических исследованиях. Опираясь на опыт предшественников, с целью оценки эффективности разработанного нами учебного терминологического словаря предметной области «Права человека» предлагается провести эксперимент по проверке покрываемости этим словарем оригинальных текстов по специальности, использующихся в учебном процессе. Для сравнения была подсчитана покрываемость этих же текстов «Французско-русским юридическим словарем» Г. И. Мачковского17. Средние покрываемости были рассчитаны по следующим формулам:

Ш1 • П1

где Д1 — средняя покрываемость текста толково-переводным учебным терминологическим словарем предметной области «Права человека»; Ш1 —количество словоформ, которые покрываются словарем; П1 — число терминов из словаря, которые встретились в тексте; N1 —объем словаря.

0 т-2 • П2

Й2-ТуГ’

где Д2 — средняя покрываемость текста «Французско-русским юридическим словарем» Г. И. Мачковского; т2 —количество словоформ, которые покрываются словарем; П2 — число терминов из словаря, которые встретились в тексте; N2 — объем словаря.

В результате расчетов была определена средняя относительная покрываемость учебного терминологического словаря, которая равнялась 5226,28, и средняя относительная покрываемость словаря Г. И. Мачковского, которая равнялась 53,31. При сравнении полученных величин был сделан вывод о том, что созданный нами учебный терминологический словарь предметной области «Права человека» покрывает в 9 раз больше словоформ, содержащихся в текстах изучаемой тематической области, по сравнению со словарем Г. И. Мачковского.

Наблюдения за покрываемостью терминами учебных текстов позволили сделать вывод, что разработанный в нашем исследовании словарь покрывал 56% терминов-словосочетаний, тогда как словарь Г. И. Мачковского — лишь 24% терминов-словосочетаний (оставшиеся 76% приходились на однокомпонентные термины), при этом объем нашего словаря составляет 458 единиц, а объем словаря Г. И. Мачковского 35 000 терминов. Таким образом, словарь Г. И. Мачковского в большинстве случаев не регистрирует комби-

наторных контекстных связей представленных терминов. Он имплицитно регистрирует лишь виртуальные, но не актуальные значения терминологических единиц.

В связи с этим, на наш взгляд, особенно важна покрываемость занятий разработкой критериев вычленения именно таких терминов-словосочетаний из текстов.

Кроме того, включение в учебные словари таких терминов позволяет разрешить вопрос межъязыковой идиоматичности. Сущность этой проблемы заключается в том, что существует довольно большое количество многокомпонентных терминов входного языка, которое не может быть корректно переведено на выходной язык с помощью словаря и известных грамматических правил. Правильный с точки зрения лексических, грамматических и стилистических норм русского языка перевод, а также верное понимание при чтении, могут быть достигнуты только в том случае, если учащийся обладает информацией о нерегулярной сочетаемости отдельных единиц входного текста и их нормативных эквивалентов на выходном языке.

Это значит, что включение в учебные словари терминов-словосочетаний, обладающих широкой покрываемостью текстов по специальности, способствует тому, что, встречаясь с сочетаниями указанного типа, учащийся воспринимает и перерабатывает их как терминологические штампы с уже готовым эквивалентом. Для него это представляет несравнимое преимущество, поскольку ему не нужно использовать ни активный словарь, ни грамматические алгоритмы. Вместе с тем эти представленные в учебном словаре термины-словосочетания воплощают в себе укрупненные оперативные единицы, закладываемые в долговременную память учащегося.

Полученные данные о покрываемости текстов терминами учебного терминологического словаря будут использованы для решения задачи оптимизации преподавания иностранного языка. На их основе можно будет использовать наиболее употребительные термины в качестве единиц обучения, что позволит разумно планировать введение лексики в ходе преподавания. Согласно утверждению ученых из группы «Статистика речи», «зная ход статистической покрываемости текста конкретными лексическими массивами, а также располагая сведениями о том количестве наиболее частых лексических единиц, которые могут обеспечить заданный уровень понимания (или активного воспроизведения) текста, можно достаточно точно определить минимальный объем и содержание материала, который необходим для рецептивного или репродуктивного усвоения языка в пределах заданного объема часов. Одновременно можно установить дозировку подачи нового и повторения старого материала на каждом заня-тии»18.

Последующее активное усвоение этих базовых терминов создаст у студентов фундаментальную терминологическую базу, на которой можно последовательно развивать репродуктивный и рецептивный словарь изучаемого языка.

Данные о покрываемости текста могут служить важным инструментом при планировании учебного процесса. Такие списки слов дают возможность выявить наиболее употребительные термины, необходимые для формирования речевых навыков и умений, и принять их за единицы обучения; определить последовательность введения лексических единиц; определить информационную нагрузку, которая ложится на память учащихся при усвоении различных групп терминов.

Следовательно, использование объективного метода отбора учебных терминов, основанного на математико-статистическом аппарате, позволяет отобрать оптимальный по трудности учебный материал, предназначенный для использования в процессе обучения.

Полученные результаты эксперимента показали очень высокую степень покрытия

текстов предметной области «Права человека» терминами созданного нами учебного терминологического словаря. Это позволяет утверждать, что разработанный метод отбора терминов в учебный словарь с применением математико-статистического аппарата может быть рекомендован для практического применения.

1 Горбунов Ю. И. Лингвистическая концепция Р. Г. Пиотровского: от инженерной лингвистики к лингвистической синергетике (к 85-летию со дня рождения) // Актуальные проблемы теоретической и прикладной лингвистики и оптимизация преподавания иностранных языков: К 85-летию Р.Г.Пиотровского: Материалы Всероссийской науч. конф. с международным участием. 9—11 октября 2007 г. Тольятти, 2007. С. 12.

2 Герман-Прозорова Л. П. Оптимизация и интенсификация обучения иностранным языкам взрослых учащихся // Автоматическая переработка текста методами прикладной лингвистики: Материалы II Всесоюзной конф., 6—7 октября 1977. Кишинев, 1977.

3 Петрушевская Н. Н. Формирование рецептивного и потенциального словарей в процессе обучения чтению на иностранном языке в неязыковом вузе (на материале англ. яз. свароч. пр-ва): Автореф. дис. ... канд. пед. наук. Л., 1991.

4 Щепетова О. П. Лингвометодические основы обучения лексике французского языка на 1 курсе факультетов иностранного языка: Автореф. дис. ... канд. пед. наук. Л., 1988.

5 Сутягина Л. М. Оптимизация составления частотного словаря (пробл. стат. однородности выборки): Автореф. дис. ... канд. филол. наук. Л., 1985.

6 Алексеев П. М. Частотные словари. СПб., 2001. С. 94—95.

7 Алексеев П. М., Герман-Прозорова Л. П., Пиотровский Р. Г., Щепетова О. П. Основы статистической оптимизации преподавания иностранных языков // Статистика речи и автоматический анализ текста. Л., 1974. С. 209.

8 Лапидус Б. А. Проблемы содержания обучения языку в языковом вузе: Учебн. пособие. М., 1986.

9 Митрофанова О. Д. Научный стиль речи: проблемы обучения. М., 1985.

10 Сулейманова А. К. Общедидактические принципы отбора специальной лексики в учебный терминологический словарь // Квантитативная лингвистика и семантика. Вып. 3. 2001.

11 Фрумкина Р. М. Рецензия на «Словарный минимум по русскому языку для V—VIII классов хакасских школ» А.И.Геркуса // Русский язык в национальной школе. 1963. № 6. С. 85.

12 Алексеев П. М. Статистическая лексикография (типология, составление и применение частотных словарей). Л., 1975. С. 21.

13 Статистико-комбинаторное моделирование языков: Сб. ст. / Под ред. Н.Д.Андреева. М.; Л., 1965.

14 Марусенко М. А. Системно-сопоставительный анализ функционирования терминосистем (на материале французских радиотехнических терминосистем): Автореф. дис. ... канд. филол. наук. Л., 1981.

15 Санкова Е. И. Статистический анализ и организация учебного материала (в неязыковом вузе) // Автоматическая переработка текста методами прикладной лингвистики: Материалы II Всесоюзной конференции, 6—7 октября 1977. Кишинев, 1977. С. 84.

16 Герман-Прозорова Л. П. Опыт вероятностно-статистической организации обучения иностранному языку в неязыковом вузе: Автореф. дис. ... канд. пед. наук. Л., 1973.

17 Мачковский Г. И. Французско-русский юридический словарь. М., 2002.

18 Пиотровский Р. Г. Компьютеризация преподавания языков. Л., 1988. С. 55—56.

i Надоели баннеры? Вы всегда можете отключить рекламу.