Научная статья на тему 'Особенности машинного перевода'

Особенности машинного перевода Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
6074
898
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННЫЙ ПЕРЕВОД / КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА / ОЦЕНКА КАЧЕСТВА МАШИННОГО ПЕРЕВОДА / АДЕКВАТНОСТЬ ПЕРЕВОДА / ОШИБКИ И ИСКАЖЕНИЯ ПЕРЕВОДА / АВТОМАТИЗИРОВАННЫЙ ПЕРЕВОД / MACHINE TRANSLATION / COMPUTATIONAL LINGUISTICS / EVALUATION OF MACHINE TRANSLATION QUALITY / ADEQUACY OF TRANSLATION / MISTAKES AND DISTORTION OF TRANSLATION / AUTOMATIC TRANSLATION

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Кочеткова Наталья Сергеевна, Ревина Елена Владимировна

В статье рассматриваются достоинства и недостатки машинного перевода. Целью данного исследования является анализ основных проблем, связанных с переводом при помощи современных систем машинного перевода. В этой связи нами рассматривалось качество компьютерного перевода, была произведена оценка адекватности машинного перевода, и определены типичные ошибки и искажения машинного перевода. С опорой на проведенный анализ ошибок даны рекомендации по оптимизации компьютерного перевода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE FEATURES OF MACHINE TRANSLATION

The article discusses the advantages and disadvantages of machine translation. The purpose of the paper is to analyze the main problems which are related to the translation with the help of modern machine translation systems. In this context, the quality of translation is considered. The adequacy of machine translation is evaluated. Mistakes and distortion of machine translation are determined. Recommendations for optimizing the computer translation based on the mistake analysis are presented.

Текст научной работы на тему «Особенности машинного перевода»

Кочеткова Наталья Сергеевна, Ревина Елена Владимировна ОСОБЕННОСТИ МАШИННОГО ПЕРЕВОДА

В статье рассматриваются достоинства и недостатки машинного перевода. Целью данного исследования является анализ основных проблем, связанных с переводом при помощи современных систем машинного перевода. В этой связи нами рассматривалось качество компьютерного перевода, была произведена оценка адекватности машинного перевода, и определены типичные ошибки и искажения машинного перевода. С опорой на проведенный анализ ошибок даны рекомендации по оптимизации компьютерного перевода. Адрес статьи: \м№^.агато1а.пе1/та1епа18/2/2017/6-2/3СШт1

Источник

Филологические науки. Вопросы теории и практики

Тамбов: Грамота, 2017. № 6(72): в 3-х ч. Ч. 2. C. 106-109. ISSN 1997-2911.

Адрес журнала: www.gramota.net/editions/2.html

Содержание данного номера журнала: www.gramota.net/materials/2/2017/6-2/

© Издательство "Грамота"

Информация о возможности публикации статей в журнале размещена на Интернет сайте издательства: www.aramota.net Вопросы, связанные с публикациями научных материалов, редакция просит направлять на адрес: [email protected]

УДК 81'272

В статье рассматриваются достоинства и недостатки машинного перевода. Целью данного исследования является анализ основных проблем, связанных с переводом при помощи современных систем машинного перевода. В этой связи нами рассматривалось качество компьютерного перевода, была произведена оценка адекватности машинного перевода, и определены типичные ошибки и искажения машинного перевода. С опорой на проведенный анализ ошибок даны рекомендации по оптимизации компьютерного перевода.

Ключевые слова и фразы: машинный перевод; компьютерная лингвистика; оценка качества машинного перевода; адекватность перевода; ошибки и искажения перевода; автоматизированный перевод.

Кочеткова Наталья Сергеевна Ревина Елена Владимировна

Самарский государственный технический университет [email protected]

ОСОБЕННОСТИ МАШИННОГО ПЕРЕВОДА

В процессе изучения иностранного языка, в том числе и профессионально-ориентированного, студент, сталкиваясь с заданием перевести текст, немедленно обращается к помощи компьютера, а именно - осуществляет машинный перевод. Машинный перевод (МП) - это процесс перевода письменных текстов с одного естественного языка на другой с помощью специальной компьютерной программы [3, c. 15]. Иногда такое обращение оказывается полезным, так как позволяет быстро понять основное содержание текста, однако гораздо чаще, особенно при работе с научно-технической литературой, подобные переводы не выдерживают критики.

Неужели в век информационных технологий, когда компьютер может взять на себя многие задачи полностью, не требуя вмешательства и контроля человека, машинный перевод, так необходимый современному обществу, все еще остается делом будущего? Несмотря на то, что машинный перевод имеет уже вековую историю (компьютерный перевод ведёт летоисчисление, начиная с проекта цифровой аналитической машины Г. Беббиджа с середины XIX в. [3]), до сих пор эта сфера компьютерной индустрии остается несовершенной.

Проблема машинного перевода довольно сложна и ещё не до конца изучена. Её исследование представляется актуальным, прежде всего, с позиции оптимизации процесса перевода.

В данной работе мы рассматриваем основные проблемы машинного перевода и освещаем типичные ошибки, допускаемые машиной при переводе. Целью данного исследования является:

- изучение эффективности и качества компьютерных переводчиков;

- определение типичных ошибок, допускаемых при машинном переводе;

- выработка рекомендаций по использованию переводчиков с учетом проанализированных ошибок.

В ходе исследования нами были использованы следующие методы: теоретический метод, основанный на анализе литературных источников по изучаемой проблеме, эмпирические методы (опросы и наблюдения во время практической работы студентов, магистров, аспирантов с переводом текстов) и сравнительно-сопоставительный анализ (оригинал - компьютерный перевод - перевод вручную).

Прежде чем оценивать системы машинного перевода, мы провели опрос с целью выявления наиболее популярных программ электронного перевода. Из 76 студентов 36 человек используют онлайн-переводчик PROMT (40%), 19 студентов прибегают к услугам переводчика Google Translate (25%), 18 человек пользуются машинным переводчиком Яндекс (24%), и лишь (8%) 3 человека используют бумажные словари и переводят текст вручную.

Чем же вызвана такая популярность компьютерного перевода? Нынешний век гаджетов, где повсеместно применяются электронные средства связи, диктует свои условия. Для современной молодежи переводить текст с помощью обычного словаря стало не модно, как, впрочем, и читать книгу в бумажном варианте. Зачем пользоваться словарём, если можно перевести текст за секунды? Большинство программ машинного перевода просты и удобны в использовании. Услугами электронного полиглота охотно пользуются практически в каждом доме по причине полного или частичного отсутствия времени, иногда и желания, а также знаний. Почти все мы, оказывается, вне зависимости от возраста и рода занятий, являемся потенциальными «клиентами» компьютерного переводчика. Учитывая вышесказанное, мы понимаем, что запретить студентам пользоваться услугами компьютерных переводчиков не представляется возможным. Поэтому считаем целесообразным лишь указать на достоинства и недостатки машинного перевода.

Неоспоримым достоинством машинного перевода является, прежде всего, его скорость. Всего за несколько секунд мы получаем перевод многостраничного текста, общий смысл которого вполне возможно понять.

Manchmal wachsen Freundschaften schnell, und man merkt einfach dass man sich wohl fühlt in der Anwesenheit des anderen. Dass man sich geachtet und anerkannt fühlt. Man fühlt die ähnliche Wellenlänge, die zwischen einem steht und die «Freunde» auf unterschiedliche Art miteinander verbindet. Nicht Gegensätze ziehen sich an, sondern Ähnlichkeiten [5] (Иногда дружба развивается быстро, и ты просто замечаешь, что в присутствии другого человека тебе хорошо. Что тебя уважают и принимают во внимание твое мнение. Чувствуешь себя с кем-то на одной волне, которая объединяет между собой таких разных «друзей». Притягиваются вовсе не противоположности, а похожие люди).

Перевод:

Иногда дружба растет быстро, и запоминают просто что, пожалуй чувствует в присутствии другого. То, что чувствуют себя уважаемым и Признано. Чувствуют похожую длину волн, которая стоит между одним и связывает «друзей» разным видом друг с другом. Не противоположности одеваются, а сходства.

Предложенный текст на основе общеупотребительной лексики Promt, так же, как и другие программы -Яндекс и Google, - перевел с ошибками, некрасиво, но вполне доступно для понимания общего смысла.

Немаловажным фактором при выборе в пользу компьютерного перевода является его доступность - достаточно лишь выйти в Интернет и загрузить текст в браузер. Наличие словарей разных специализаций в программе компьютерного переводчика позволяет говорить и об его универсальности: главное - грамотно выбрать словарь необходимой специализации (экономический, юридический, нефтетехнологический и т.д.). Отсутствие затрат (большинство программ машинного перевода бесплатны) также является зачастую важным преимуществом.

Но мы не можем оставить без внимания количество ошибок (в том числе выделенных нами в переведенном тексте). И, если в текстах с общеупотребительной лексикой они не затрудняют понимание общего содержания текста, как это видно из примера выше, то в случае со специализированной лексикой в научно-технических текстах дело обстоит гораздо хуже:

Insbesondere der gesteuerte Rohrvortrieb, der seit geraumer Zeit weltweit beim Bau von Abwasserkanälen eingesetzt wird, wird als eingriffsarme Verlegeart beworben. Mit diesem sollen Power-Tubes-Leitungsgänge bzw. Kabeltunnel problemlos neben oder unter bestehenden Infrastrukturen verlegt werden [4] (Особенно регулируемое продавливание обделки, которое продолжительное время используется при строительстве водоотводных каналов, заявляется как способ прокладки с плохим зацеплением. Поэтому мощные линии передач, а именно кабельные туннели, прокладываются рядом или под инфраструктурой без каких-либо проблем).

Перевод:

В частности, управляемого продавливания труб, который давно во всем мире при строительстве коллекторы используется, рекламируется как вмешательство бедная укладки. С этой властью нужно-Tubes-линии передач или кабель-тоннель прокладывается без проблем рядом или под существующую инфраструктуру.

Доля ошибок в тексте, в том числе при переводе терминов, достаточно высока, чтобы понять его содержание. А ведь в случае со специальными текстами нам необходим довольно точный перевод.

С целью выявления наиболее типичных для машинного перевода ошибок нами был проанализирован научно-технический доклад «"Elektrische Strasse" Institut für Zukunftsenergiesysteme» («Электрические трассы» института энергосистем будущего) [Ibidem]. В результате анализа были выявлены ошибки на лексическом, морфологическом и синтаксическом уровнях.

Среди лексико-семантических ошибок мы выделили следующие:

1. Лексическая единица не переведена совсем:

Ein halbes Jahr zuvor hatte sie mit dem Energiekonzept bereits die Leitlinien für die langfristige Ausrichtung der Energiepolitik festgelegt (Еще полгода назад оно определило направления развития энергополитики на длительный срок согласно энергетической концепции ФРГ)._

На полгода раньше у нее были с энергетической программой уже направляющие линии для долгосрочного выравнивания энергетической политики festgelegt.

Глагол festgelegt при переводе в Promt остался непереведенным, несмотря на то, что данное слово присутствует в программе-словаре.

2. Лексическая единица переведена неверно:

Die im Alltag erfolgenden Verbrennungen sind immer Reaktionen eines Brennstoffs mit dem Luftsauerstoff verbunden (Горение, с которым мы имеем дело в повседневной жизни, связано всегда с реакцией горючего и кислорода)._

Изъятие место в повседневной жизни ожогах всегда реакция топлива с кислородом в воздухе.

Существительное во множественном числе «die Verbrennungen» имеет несколько значений: 1) ожог, 2) горение, сожжение, - из которых первое значение не подходит по смыслу в приведенном выше предложении. 3. Смысл предложения сложно или совсем невозможно понять:

Dies hat zur Folge, dass die bestehenden Vorschriften und Genehmigungsverfahren von der Verlegung im offenen Graben ausgehen, was wiederum vielfach prohibitiv gegenüber Tunnellösungen wirkt und deren Potenzial nicht ausschöpft (Это является следствием того, что существующие нормативные документы и процедуры утверждения подразумевают прокладку в открытых траншеях, а это отрицательно сказывается на принятии решений о прокладке кабелей в туннелях и снижает их потенциал).

Это означает, что существующие правила и процедуры лицензирования от укладки в одном открытую траншею исходить, что в свою очередь действует непомерно многократно по сравнению тоннель решений и их потенциал не исчерпывает.

Морфологические ошибки, возникающие при машинном переводе, являются наиболее частотными. К ним относятся ошибки, связанные с категорией: 1) числа

Erdkabeltrassen besitzen gegenüber Freileitungen geringere Trassenbreiten, was sich bei der Querung von Gehölzen positiv auswirkt (Подземный кабель по сравнению с воздушным имеет ограниченную длину, что является плюсом при обходе растительности)._

Подземный кабель трасс имеют широкую дорогу снижение воздушных линий.

2) падежа

Bedingt wurde sie in erster Linie durch die geografische Verteilung der Verbraucher und dem maßgeblich an den Kohlevorkommen orientierten Kraftwerkspark (Оно обусловлено в первую очередь географической разбросанностью потребителей и парком электростанций, ориентированным, прежде всего, на угольные месторождения).

Она была обусловлена в первую очередь географическое распределение потребителей и важную роль в угольных месторождений, ориентированных на электростанции парке.

3) времени

Die Bundesregierung hat nach der Atomkatastrophe im У федерального правительства есть после атомной ката-japanischen Fukushima im Frühjahr 2011 das Thema строфы в японском Fukushima весной 2011 тема энерге-Energiewende ganz oben auf die politische Agenda gesetzt тический поворот на самом верху на политическую по-(После катастрофы на АЭС Фукусима в Японии весной вестку дня gesetzt. 2011 федеральное правительство выдвинуло тему преобразования энергетики на передний план).__

4) наклонения

Hier könnte eine Ermächtigung der Genehmigungsbehörde zum Vorschlagen von Trassenalternativen Verbesserungen bringen (Предложения о введении альтернативных электрических трасс, поступившие от ведомств, отвечающих за допуск в эксплуатацию, могли бы привести к существенным улучшениям)._

Здесь посвящение в орган лицензирования может привести к Предлагать альтернативных Маршрута улучшений.

При переводе нет соответствия в наклонении глагола könnte - Konjuktiv. 5. Ошибки при переводе степеней сравнения прилагательных и наречий:

Weitere Gründe, die im Netzausbaubericht der Bundes-netzagentur genannt sind, sind vor allem die Anpassung von Antragsunterlagen an aktuellsten Gesetzesänderungen bzw. aktuelle Gerichtsentscheidungen (Другой причиной, названной Федеральным сетевым агентством во время доклада о расширении энергосетей, является соответствие документов самым последним изменениям в законодательстве, а именно последним решениям суда)._

Другие причины, которые называются в сети развитие отчетов Федерального сетевого агентства, в основном настройки приложения документов к последних законодательных изменений или текущий судебных решений.

Превосходная степень прилагательного переведена компьютерной программой неточно. 6. Ошибки при переводе предлогов:

Ein halbes Jahr zuvor hatte sie mit dem Energiekonzept bereits die Leitlinien für die langfristige Ausrichtung der Energiepolitik festgelegt (Еще полгода назад оно определило направления развития энергополитики на длительный срок согласно энергетической концепции ФРГ)._

Полгода назад она была определена с энергетической концепции уже руководящие принципы для долгосрочного ориентация энергетической политики.

Между предлогами различных языков обычно нет соответствия, поэтому типичный для предлога mit перевод с в данном предложении неуместен.

Среди синтаксических ошибок следует выделить, прежде всего, неправильное расположение слов в предложении, чаще всего - глагольных форм.

Im Folgenden werden diese Übertragungsalternativen in Kombination mit Autobahnstruktur untersucht und mögliche Synergieeffekte beim Ausbau und Betrieb aufgezeigt (Ниже исследуются эти альтернативы передачи энергии в условиях автострады и показывают возможные синергетиче-ские эффекты при создании и введении в эксплуатацию).

В дальнейшем эта передача альтернатив в сочетании с автострады исследуются и возможные синергетические эффекты при демонтаже и эксплуатации и отладки показываются.

Порядок слов в немецком и русском языках существенно различается, поэтому оставлять глаголы при переводе на том же месте, что и в исходном языке, не рекомендуется.

Результаты анализа машинного перевода доклада «Elektrische Strasse» [Ibidem] представлены в таблице.

Типы ошибок Количество ошибок

Лексические ошибки (всего) 208

Из них:

Лексическая единица не переведена 41

Лексическая единица неправильно переведена 159

Смысл предложения сложно или совсем невозможно понять 8

Морфологические ошибки (всего) 109

из них:

число 21

падеж 61

время 6

наклонение 1

степени сравнения прил. и наречий 6

предлоги 14

Синтаксические ошибки 83

неправильное расположение слов в предложении 83

Полученные в результате анализа данные позволяют нам утверждать, что полностью автоматизированный перевод (независимый от человека) на сегодняшний день невозможен. Но результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием при условии, что текст используется как сигнальная информация [1] и не требует тщательного редактирования. Для полноценного же перевода необходимо постредактирование текста с учетом выявленной типологии ошибок машинного перевода. Следует отметить, что мы выделили лишь некоторые, наиболее частотные ошибки машинного перевода, и данный список может быть, несомненно, продолжен.

Таким образом, мы считаем, что преподавателю необходимо предупредить студентов, начинающих свое знакомство с научно-техническими текстами, о подстерегающей их опасности при использовании компьютерных программ для перевода. При этом следует обратить их внимание на то, что им предстоит умело и грамотно исправлять и заранее предвидеть ошибки, допускаемые машиной. Сравнительно-сопоставительный анализ исходного и переведенного текстов, применяемый на занятиях, помогает им избежать типичных ошибок и правильно перевести текст. Регулярное постредактирование текстов вынуждает порой студентов отказаться от электронных переводчиков (вследствие большого количества затраченного на редактирование времени), а использовать электронные словари, такие как Мультитран или ABBYY Lingvo, которые насчитывают от 12-ти электронных словарей, но в которых нет функции полнотекстового перевода.

Список источников

1. Алексеева И. С. Введение в переводоведение: учеб. пособие. М.: Академия, 2004. 347 с.

2. Евдокимов А. С. Искусство машинного перевода // Hard'N'Soft. 2005. № 7. С. 86-91.

3. Марчук Ю. Н. Проблемы машинного перевода. М.: Наука, 1983. 201 с.

4. http://www.bast.de/DE/Strassenbau/Publikationen/Download-Publikationen/Downloads/s-elroad.pdf?_blob=publication

File&v=4 (дата обращения: 25.03.2017).

5. https://www.psychotipps.com/freundschaft.html (дата обращения: 20.03.2017).

6. Schwanke M. Maschinelle Übersetzung. Ein Überblick über Theorie und Praxis. Berlin: Springer, 1991. 231 S.

THE FEATURES OF MACHINE TRANSLATION

Kochetkova Natal'ya Sergeevna Revina Elena Vladimirovna

Samara State Technical University [email protected]

The article discusses the advantages and disadvantages of machine translation. The purpose of the paper is to analyze the main problems which are related to the translation with the help of modern machine translation systems. In this context, the quality of translation is considered. The adequacy of machine translation is evaluated. Mistakes and distortion of machine translation are determined. Recommendations for optimizing the computer translation based on the mistake analysis are presented.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Key words and phrases: machine translation; computational linguistics; evaluation of machine translation quality; adequacy of translation; mistakes and distortion of translation; automatic translation.

i Надоели баннеры? Вы всегда можете отключить рекламу.