www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
Philology
Филология
вопросы создания электронных ресурсов тувинского
языка: НЕКОТОРЫЕ
итоги, неотложные задачи и перспективы
Мира В. Бавуу-Сюрюн
Тувинский государственный университет
CREATING ELECTRONIC
resources ON TUvAN language: preliminary results,
CURRENT CHALLENGEs AND pROspECTs
Mira V. Bavuu-Surun
Tuvan State University
Развитие корпусной лингвистики на сегодня представляет собой активно развивающую отрасль научных исследований, имеющих в том числе большое прикладное значение. В Туве вопрос о применении современных технологий в исследованиях по тувинскому языку и литературе поднимался еще в 1990-х гг., но начал решаться с 2009 г., с началом работ Научно-образовательного центра (НОЦ) «Тюркология» Тувинского государственного университета, под руководством автора статьи. В статье подводятся некоторые итоги проделанной работы, отмечаются проблемы, ставятся новые задачи.
Работа НОЦ ведется в сотрудничестве с кафедрой информатики ТувГУ, Сибирского федерального университета; представителей зарубежной науки — Ф. Тайерс (Университет Тромсё, Норвегия), Дж.Вашингтон (Университет Индиана, США). Среди уже начавших реализовываться проектов называется Электронный корпус тувинского языка (www.tuvacorpus.ru). Среди актуальных задач — создание электронных учебников по тувинскому языку и литературе для общего образования в со-
At the moment, corpus linguistics is a rapidly developing field of studies, which, among everything else, plays a significant role in applied research. In the Republic of Tuva, debates on using information technologies in studying Tuvan language and literature studies began as far back as the 1990s, but a breakthrough cane in 2009, when the Research and Education Center of Turkic Studies was opened at Tuvan State University. As the Center's director, in this article the author takes stock of the work done so far, sets new goals and describes the current challenges.
The Center works in collaboration with the Departments of IT at Tuvan State University and Siberian Federal University, as well as with foreign scientists - F. M. Tyers (University of Troms0, Norway), J. Washington (Indiana University, Bloomington, USA). Among the projects already under way a special place belongs to the Electronic Corpus of Tuvan Language (www.tuvacorpus. ru). Current challenges include creating electronic
Бавуу-Сюрюн Мира Викторовна — кандидат филологических наук, доцент, директор Научно-образовательного центра «Тюркология» Тувинского государственного университета. Адрес: 667000, Россия, г. Кызыл, Студенческий квартал, д. 5, ауд. 129. Тел.: +7 (394-22) 2-19-69. Эл. адрес: mira.bavuu_surun@mail.ru Bavuu-Surun Mira Viktorovna, Candidate of Philology, Associate Professor and Director, Research and Education Center of Turkic Studies, Tuvan State University. Postal address: Room 129, 5 Studencheskii Kvartal, 667000 Kyzyl, Republic of Tuva, Russian Federation. Tel.: +7 (394-22) 2-19-69. E-mail: mira. bavuu_surun@mail.ru
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
ответствии с требованиями федеральных государственных образовательных стандартов.
Масштабным совместным проектом под руководством НОЦ является сайт «Тываныц чогаал-чылары (Писатели Тувы)» (http://pisateli-tuvy.ru/). Среди участников проекта: Институт развития национальной школы Тувы, республиканские инновационные площадки, а также подразделения ТувГУ. На сайте всего планируется разместить материалы свыше 100 писателей. Набраны материалы для личных страниц половины из них (биографии, списки произведений, критика, переводы, публицистика, научные исследования, фото, аудио-, видеоматериалы, презентации и пр.). Сайт составляет основу для базы данных к другим вновь создаваемым электронным образовательным ресурсам: «Электронная библиотека детской литературы на тувинском языке», «Классические произведения тувинской литературы», «Электронная школьная библиотека на тувинском языке» и др.
Среди перспективных проектов называется корпус тувинских текстов на разной графической основе (тибетский язык, старописьменный монгольский, санскрит, латиница, кириллица начала ХХ в.); корпус параллельных текстов (тувинско-русского, русско-тувинского, монгольско-тувинского, немецко-тувинского, тувинско-немецкого, тувинско-английского и др.), корпус собственных имен (базы данных топонимов Тувы, антропонимов, традиционных названий пантеона божеств, небесных тел, клички животных), корпус словарей (разных типов), диалектный корпус, фольклорный корпус.
Каким быть корпусу тувинского языка, сколько их может быть и с какими названиями — нужно дискутировать сейчас, когда только закладывается основа. Национальный корпус тувинского языка представляется одним из фундаментальных проектов, который сможет внести свою лепту в дело сохранения языка в условиях постоянного уменьшения количества его активных носителей.
Ключевые слова: тувинский язык; электронный корпус тувинского языка; Национальный корпус тувинского языка; корпусная лингвистика; корпус текстов; Писатели Тувы; электронный учебник; информационные технологии; НОЦ Тюркология; Тувинский государственный университет
textbooks on Tuvan language and literature for secondary school level (in compliance with the Federal State Standards of Education)
Another large-scale project spearheaded by the Center is the 'Pisateli Tuvy / TyvanyH chogaalchylary' website (http://pisateli-tuvy.ru/). The list of its participants includes the Institute for the Development of Ethnic Schools in Tuva, innovative platforms of the Republic of Tuva, as well as several departments at Tuvan State University. When completed, the website will feature materials on over 100 Tuvan writers, including biographies, bibliographies, criticism, translations, opinion writing, scholarly papers, photos, audio recordings, presentation files and other pieces which will soon appear on their profile pages. The site will serve as a fundamental database of sources for other electronic educational resources, such as 'The Electronic Library of Children's Literature in Tuvan Language', 'Classic Works of Tuvan Literature' and 'Electronic School Library in Tuvan Language'.
Other promisingprojects worth mentioninginclude a corpus of Tuvan texts in various systems of writing (Tibetan, Old Mongolian, Sanskrit, Latin script and early 20th century Cyrillic), a corpus of parallel texts (Tuvan-Russian, Russian-Tuvan, Mongol-Tuvan, German-Tuvan, Tuvan-German, Tuvan-English, etc.), a corpus of proper names (databases of Tuvan placenames, personal names, gods of traditional Tuvan pantheon, names of celestial objects, pets, etc.), a corpus of various dictionaries, a corpus of dialects and that of folklore.
The present moment when the foundations of all these corpuses are just being laid is the right time to discuss their future and number. The National corpus of Tuvan language is one of those fundamental projects which can help preserve a language while the number of its active speakers is constantly decreasing.
Keywords: Tuvan language; electronic corpus of Tuvan language; National corpus of Tuvan language; corpus linguistics; corpus of texts; Pisateli Tuvy / TyvanyH chogaalchylary; electronic textbook, information technologies; Research and Education Center of Turkic Studies; Tuvan State University
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
Введение
С конца ХХ века в России началось развитие национальных и других видов текстовых корпусов. За почти два десятилетия количество естественных языков, имеющих представление в виде машинного корпуса увеличилось. Развиваются корпуса: башкирского языка (Машинный корпус ... , Электр. ресурс), хакасского (Электронный корпус хакасского ... , Электр. ресурс; см. также: Дыбо, Шеймович 2014), калмыцкого (Национальный корпус ... , 2012; Куканова, 2015: Электр. ресурс), и других языков по программе фундаментальных исследований Президиума РАН (Корпусная лингвистика, Электр. ресурс).
Эта же задача актуальна для тувинской филологии. Поэтому в данной статье мы подведем некоторые итоги работ, уже проделанных в данном направлении специалистами в области тувинского языкознания в сотрудничестве с представителями других отраслей.
Проект по созданию Тувинского национального корпуса (или же по-другому: Национального корпуса тувинского языка), так же как и любого другого электронного образовательного или культурно-просветительского ресурса, предусматривает решение нескольких поэтапных задач: 1) проведения каталогизации существующих текстов и записей на тувинском языке; 2) оцифровку текстов; 3) сверку электронных файлов с авторским текстом; 4) сбор и составление материалов для мультимедийного, диалектного, устного, словарного корпусов; 4) составление метаразметки текстов, т. е. информации экстралингвистического характера); 5) подготовку отдельных корпусов по мере их готовности; 6) составление программ автоматической обработки текста); 7) составление программ управления.
В результате выполнения всех указанных пунктов главным итогом станет создание информационно-справочной системы, основанной на оцифрованном массиве материалов на тувинском языке, которые сопровождаются лингвистической и металингвистической информацией. Корпус имеет одну важную особенность: в нем будет аккумулировано все то богатство, которое выработал тувинский народ, изустно передавая веками из поколения в поколение. Он основан на материале, который станет одним из каналов устойчивой связи поколений в трансляции культурных ценностей, в их числе и языка как достояния духовной культуры народа, его главного богатства. Этот факт еще более усиливает актуальность проводимой работы в этом направлении.
Начало работ
Вопросы использования возможностей информационных технологий в гуманитарных исследованиях по тувинскому языку был поднят первым ректором Ту-
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
винского государственного университета О. Б. Бузур-оолом ещё в 1990-х годах. Но после его ухода из жизни (в 1999 г.), эта работа долго не продвигалась никем.
Лишь с момента создания структурного подразделения Тувинского госуниверситета — научно-образовательного центра «Тюркология» в 2009 г. встал вопрос о применении современных технологий в исследованиях по тувинскому языку и литературе, о формировании базы данных для электронного корпуса тувинского языка (ЭКТЯ).
Надо признать, что первые шаги были не такими простыми. Тем не менее, определенная работа за сравнительно небольшой отрезок времени была проведена, определился круг ученых, которые сосредоточили свое внимание на создании ЭКТЯ, в частности в создании баз данных (БД), разработке программ (Салчак, 2012: Электр. ресурс; Салчак, Байыр-оол, 2013; также см. статью С.М.Далаа в настоящем номере: Далаа, 2016: Электр. ресурс).
Если проект создания Национального корпуса русского языка уже на самых ранних этапах был поддержан компанией «Яндекс» (крупнейшим российским поисковиком, разработавшим одну из самых быстрых и эффективных поисковых программ по русскому сегменту Интернета) (Плунгян, 2005), то ресурсы и возможности для региональных корпусов гораздо скромнее. С нами — тувинскими лингвистами — работают представители нашего же университета, кафедры информатики и их ученики. С самого начала проекта с нами сотрудничает доцент кафедры информатики ТувГУ Сергей Монгушевич Далаа со своими студентами. Двое из них — А. Дагбажык и Ч. Монгуш, закончив ТувГУ, продолжили свое обучение в аспирантуре, сейчас они — аспиранты Сибирского федерального университета, и принимают активное участие в проектах НОЦ «Тюркология» (см. их статьи в этом же номере журнала: Дагбажык, 2016ab; Монгуш, 2016: Электр. ресурс).
С прошлого года к группе исследователей присоединился норвежский программист Ф. Тайерс, участвовавший в разработке морфологического анализатора для ряда тюркских языков: кыргызского, казахского, татарского (Агеева, Тайерс, 2016). Ф. Тайерс в соавторстве с представителем Университета Индианы (США) Дж. Вашингтоном и тувинскими филологами А. В. Байыр-оол и А.Я.Салчак представили в текущем 2016 г. разработку конечного морфологического анализатора тувинского языка на очередной Международной конференции по развитию языковых ресурсов LREC в Словении (Finite-State Morphological Analyser for Tuvan, Электр. ресурс).
Проблема электронных учебников
Сегодня перед тувиноведами, работающими в области корпусной лингвистики, стоит сверхзадача — совмещая задачи создания разнонаправленных
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
электронных ресурсов на тувинском языке, в ближайшее время помочь в создании электронных учебников по тувинскому языку и литературе для общего образования в соответствии с требованиями федеральных государственных образовательных стандартов (ФГОС), федерального Закона об образовании. Таким образом, создание различных баз данных на тувинском языке стало актуальной задачей для тувинских ученых.
Электронные учебники, как указывается в рекомендациях Федерального института развития образования, при этом должны: 1) выполнять все функции, присущие бумажному учебнику, 2) обеспечивать широкие возможности компьютерной визуализации учебной информации; 3) служить основой создания активно-деятельностной познавательной среды для учащегося за счет возможности осуществления информационно-поисковой деятельности, моделирования, тренировочной учебной деятельности и контроля знаний, поддержки творческой деятельности с элементами контента; 4) выполнять функцию навигатора по электронным материалам УМК; 5) поддерживать возможность реализации учащимися индивидуальных образовательных траекторий за счет наличия дополнительного материала, расширяющего и углубляющего основное содержание предмета, гиперссылок на материалы электронного приложения к учебнику и других электронных компонентов УМК, гиперссылок на сетевые ресурсы региональных и федеральных хранилищ электронных образовательных ресурсов (ЭОР); 6) обеспечивать комфортные, интуитивно понятные учащемуся условия для взаимодействия с образовательным контентом, как во время аудиторных занятий, так и при самостоятельной работе (см.: Электронные учебники ... , 2012: 9).
Из требований по созданию электронных учебников также очевидно, что должны быть разработаны региональные электронные образовательные ресурсы (ЭОР) (см. калмыцкие примеры: Куканова, Салаев, Трофимова, 2013: Электр. ресурс). В Туве отдельные работы (попытки создания электронных учебников) ведутся Институтом развития национальной школы при Министерстве образования и науки Республики Тыва (см. статью Ч. Е. Ооржак в этом номере: Ооржак, 2016: Электр. ресурс), но в целом, ни одно научное и учебное заведение Тувы пока еще не имеет опыта разработки подобных систем, а в условиях сужения сферы функционирования младописьменного тувинского языка и снижения уровня владения им носителями языка такая работа приобретает особое значение. Создание электронного информационно-образовательного ресурса на тувинском языке необходимо в целях сохранения языка, истории и культуры тувинского народа, а эта же информация, переведенная на русский язык или же наоборот, будет безусловно способствовать развитию тувинско-русского билингвизма.
Если на российском уровне по предметам федеральной компетенции работы по оснащению учебного процесса необходимым учебно-методическим,
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
материально-техническим оснащением ведутся на достаточно высоком уровне многими научными, издательско-полиграфическими комплексами (см.: Федеральные образовательные ... , Электр. ресурс), то в условиях нашей республики об оснащении уроков тувинского языка, тувинской литературы, истории Тувы, географии Тувы, предметов школьного компонента с региональной и этнокультурной составляющей можно считать еще в самом зачаточном состоянии. Имеется детский литературный сайт «Челээш» (http://tuvacheleesh.ru/) на русском языке.
Проект «Писатели Тувы»
Пока единственным серьезным электронным ресурсом можно считать энциклопедию тувинских музыкальных инструментов, которая создана как отдельный диск на русском языке, к сожалению, нет его тувиноязычного варианта. В музыкальном пространстве преуспели наши музыкальные студии «Анай-Хаак», «Агым» и другие, принадлежащие частным лицам, продукция которых чаще всего далека от учебных и просветительских целей.
Для решения данной насущной задачи ряд образовательных учреждений во главе с Институтом развития национальной школы Министерства образования и науки Республики Тыва разработали проект «Электронные образовательные ресурсы по предметам этнокультурной составляющей». В ходе работы отдельно выделился проект создания сайта «Тываньщ чогаалчылары (Писатели Тувы)» (http://pisateli-tuvy.ru/). Он создан как научно-методический и просветительский контент на тувинском языке, хотя в базе данных имеются тексты на других языках в виде переводных произведений, научных работ о творчестве конкретного писателя. Над пополнением базы данных данного портала работает целая сеть образовательных учреждений республики (Бавуу-Сюрюн, 2016).
Работу возглавляет Научно-образовательный центр (НОЦ) «Тюркология» Тувинского госуниверситета. Он осуществляет организационные и координационные работы: сбор, приемку и систематизацию материалов, проверяет паспортизацию текстов, распределяет фронт работ между исполнителями проекта; взаимодействие с группой проекта «Электронный корпус тувинского языка»; совместно с Институтом развития национальной школы обеспечивает научно-методическое сопровождение проекта; проводит совместно с Институтом развития национальной школы обучающие семинары; собирает материалы для пополнения базы данных личных страниц писателей.
Институт развития национальной школы, являясь соучредителем проекта, решает организационные вопросы; обеспечивает координацию деятельности участников проекта, регулирует нормативно-правовые взаимоотношения между ними; обеспечивает научно-методическое сопровождение; проводит
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
экспертизы инновационных проектов школ при наборе новых участников проекта или при завершении проекта, а также между этапами работы; проводит совместно с НОЦ «Тюркология» обучающие семинары; организует отчетные мероприятия, конференции по итогам работы.
Непосредственное участие в проекте принимает Студенческое бюро НОЦ «Тюркология». Так, студенты филологического факультета, обучающиеся по специальности «Родной язык и литература», производят компьютерный набор текстов, что дает возможность для дальнейшего поиска лексем, морфем, отрывков текстов по заданным параметрам; проверяют поступившие работы от других участников, работающих в данном сетевом проекте, составляют паспорта электронных документов. Студенты физико-математического факультета Тувинского госуниверситета, обучающиеся по специальности «Информатика» под руководством С. М. Далаа, создают программы для ЭВМ по заданию НОЦ; совместно с отделом информационных технологий ТувГУ обеспечивают создание и поддержку информационных ресурсов. Студенты специальности «Родной язык и литература», «Информатика» по их желанию и по согласованию с научными руководителями принимают участие в создании вышеуказанных контен-тов и сайтов писателей-земляков в форме курсовых и дипломных работ.
К сожалению, в прошлом 2015-2016 учебном году многие прекратили свою работу в связи с истечением сроков проектов.
Другие участники проекта. Литературный музей ТувГУ осуществляет подбор материалов из фондов музея для размещения на личных страницах писателей Тувы, обеспечивает координацию деятельности мегапроекта с писательскими организациями республики. Отдел интеллектуальной собственности и трансфера технологий, а также отдел информатизации обеспечивают создание и поддержку информационных ресурсов
Преподаватели кафедр университета руководят курсовыми и дипломными проектами, а также исследовательскими проектами студентов в соответствии с целями и задачами мегапроекта по желанию студентов.
Республиканские инновационные площадки (РИП) собирают краеведческий материал по историко-культурным памятникам, памятникам природы; составляют словарные статьи и презентационные материалы по ним; собирают материалы для сайтов писателей-земляков, переводят на цифровые носители вышедшие из печати произведения писателей-земляков, создают собственные сайты в соответствии с полученными заданиями. Количество и состав РИП меняются в зависимости от выполнения поставленных перед ними задач и от сроков реализации проектов, возможностей самих образовательных учреждений.
В настоящее время собраны материалы для личных страниц писателей Барун-Хемчикского, Чаа-Хольского районов, активно работают над созданием личных страниц писателей-земляков школы Тес-Хемского района. Материалы 10
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
писателей Улуг-Хемского, Тоджинского, Монгун-Тайгинского районов собирают студенты-земляки писателей, которые учатся на специальности «Родной язык и литература».
Структура портала «Писатели Тувы»
Всего на сайте «Писатели Тувы» должны разместить материалы свыше 100 писателей — членов Союза писателей Тувы. Пока набраны материалы для личных страниц примерно половины из списка писателей Тувы (членов Союза писателей Тувы, составленный заведующим Литературного музея Тувинского государственного университета М. А. Кужугет). Всего в нем значится 120 человек, в этот список входят также русскоязычные писатели (18 человек) и литературоведы (4 человека).
В настоящее время набрано в режиме Word 1267 прозаических произведений общим количеством 5,5 миллионов словоупотреблений, 5540 поэтических произведений с 1,3 млн словоупотреблений, 28 драматических произведений с 206 тыс. словоупотреблений. Всего художественных произведений на 7 млн словоупотреблений.
В основном набраны произведения основателей тувинской литературы, второго и третьего поколения, поэтому можно прогнозировать, что статистика словоупотребления в тувинских художественных произведениях может оказаться в пределах 30 миллионов словоупотребления.
На сегодняшний день идет набор и вычитка текстов по другим художественным текстам силами студентов филфака и сотрудником ИРНШ А.Нара-Мандып. Мы с удовольствием принимаем помощь в вычитке и оцифровке текстов от всех заинтересованных лиц. Благодарны самим писателям, их родственникам, землякам за ту работу, которая помогает в пополнении базы данных сайта. Работа организована по принципу сетевого взаимодействия учреждений общего, высшего профессионального и дополнительного образования с привлечением ученых республики, поэтому для нас это мегапроект.
Поиск текста на сайте можно будет вести по следующим параметрам (мета-разметка): по названию произведения, по автору, году издания, жанрам, теме, идее, ключевым словам.
Поиск страницы отдельного писателя можно вести по его имени или по районам на карте Тувы. Личная страница конкретного писателя содержит следующие опции:
а) краткая биография писателя;
б) краткая характеристика его творческой деятельности;
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
в) список книг, произведений;
г) литературно-критические статьи о нем;
д) переводы (переводы произведений писателя на другие языки; переводы, осуществленных писателем, на тувинский язык);
е) публицистика;
ё) песни на стихи писателя;
ж) галерея: фото-, аудио-, видеоматериалы, презентации.
Личная страница каждого писателя отражает всю его многогранную деятельность, на ней представлены не только художественные произведения, но и вся публицистика (при его наличии); а также дается библиографический список научных работ о нем, представлен список курсовых и дипломных работ, написанных на материале произведений конкретного писателя. В отдельном меню можно познакомиться с переводами писателя с других языков на тувинский, чаще всего переводы с русского на тувинский, и переводы произведений писателя на другие языки. Безусловно, эти тексты будут также входить в корпус параллельных текстов.
Научные работы о творчестве писателя будут составлять часть электронной научной библиотеки по тувинской филологии. В этом большим подспорьем будет проект Национальной библиотеки Республики Тыва по оцифровке своих фондов.
Таким образом, материалы сайта будут использованы как базы данных для корпусов художественных, публицистических, научных, параллельных текстов Электронного корпуса тувинского языка; электронной библиотеки художественной литературы на тувинском языке, электронной научной библиотеки по тувинской филологии. Для учителя портал даёт возможность найти дополнительный материал для урока, организовать научно-исследовательскую деятельность учащихся на материале тувинской литературы. А для авторов школь -ных учебников он служит базой как для создания электронных учебников, так и для сбора дидактического материала.
Неотложные задачи
Потенциал сайта «Писатели Тувы» не исчерпывается этим, он составляет основу для базы данных к другим вновь создаваемым электронным образовательным ресурсам.
Это в первую очередь «Электронная библиотека детской литературы на тувинском языке». Работу возглавляет специалист по тувинской детской литературе, доцент кафедры тувинской филологии и общего языкознания Е. Т. Чам-
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
зырын. Сюда войдут все произведения тувиноязычных писателей для детей, а также переводы на тувинский язык произведений русских и мировых классиков детской литературы, поскольку одной из задач создания данного сайта составители видят в сохранении всего наследия, созданного со времени возникновения тувинской художественной литературы и переводов на тувинский язык для детей.
Главной проблемой создания данного сайта является поиск переводов. Переводчиками были не только профессиональные переводчики и писатели, но и работники редакций, журналисты, ученые, поэтому не все тексты можно найти в базах данных сайта «Писатели Тувы». Многие тексты, переведенные в 1940-1960-х гг., утрачены и отсутствуют в библиотеках, поиски нужно делать в личных библиотеках и архивах, что-то осталось на страницах учебников того времени и на газетных страницах.
Для удобства пользователей на сайте можно будет вести поиск произведений по темам, жанрам, писателям, переводчикам, годам, авторам, названиям произведений, а также по целевым группам: для детей дошкольного возраста, младших школьников, юношей; переводной или оригинальный текст; если текст переводной, то его название на языке оригинала, его автор.
На основе базы данных этого же портала будет создан отдельный сайт «Классические произведения тувинской литературы», который станет надежным источником языкового материала для составления словарей, грамматик, учебников, справочных пособий не только по тувинскому языку и литературе, но и по языкам и литературам народов России. К нему могут обращаться наши коллеги из других тюркоязычных регионов, поскольку в банк данных войдут переводы произведений на русский язык при их наличии.
На сайте будут полнотекстовые электронные варианты произведений классической тувинской литературы с соответствующим литературоведческим комментарием, метаразметкой. В настоящее время в целом сформирован список произведений, которые будут составлять базу данных. Они составляются по жанрам и по целевой аудитории. Основным разработчиком проекта выступает Литературный музей ТувГУ во главе с его заведующим, членом Союза писателей России М. А. Кужугет. Также выразили свое согласие принять участие научные сотрудники Тувинского института гуманитарных и прикладных социально-экономических исследований У. А. Донгак и Л. С. Мижит.
Следующий планируемый сайт — «Электронная школьная библиотека на тувинском языке» — будет включать в себя тексты произведений, рекомендованные по школьной программе в качестве обязательного и дополнительного чтения. Естественно, сюда войдут не только произведения тувинских писателей, но и переводы на тувинский язык произведений русских писателей, представителей литератур народов России, зарубежных писателей. Поэтому дополни-
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
тельно к тому, что можно взять с базы данных сайта «Писатели Тувы», нужно добавить переводную литературу. В данной работе может помочь Национальная библиотека им. А. С. Пушкина Республики Тыва, которая уже несколько лет переводит на цифровые носители свои фонды в формате PDF. По переданным нам данным, на сегодня оцифровано порядка 600 наименований различных книг разного времени издания на русском и на тувинском языках.
Таким образом, электронный образовательный ресурс «Тываньщ чогаалчы-лары (Писатели Тувы)» является базой создания целого ряда близких, но отчасти разных по целевому назначению и содержанию сайтов на тувинском языке. Сейчас совершенно очевидно, что нужно создавать единый координационный центр в целях рационального использования всех ресурсов: кадровых, материальных.
Между тем, целевая аудитория ждет и давно результатов нашего труда в виде электронных книг, учебников, пособий. Особенно они нужны для детей с ограниченными возможностями здоровья, обучающихся в дистанционной форме обучения: услышать озвученные, прочесть переведенные на систему Брайля произведения тувинских писателей, путешествовать по местам литературных событий вместе с героями книг.
Для этого нужно разрабатывать мультмедийный корпус.
Целенаправленная работа по созданию базы данных мультимедийного корпуса была начата республиканскими инновационными площадками Барун-Хемчикского района совместными усилиями учителей и работников Центра дополнительного образования п. Кызыл-Мажалык. Были сняты видеоролики о творчестве С. Сурун-оола, М. А. Кужугет, по произведениям А. Уержаа, А. Бегзин-оола и других писателей-земляков.
Мультимедийный корпус должен представлять в виде параллельных видеоряда, аудиоряда и текстовой расшифровки звучащей речи. При составлении базы данных данного корпуса надеемся на взаимопонимание с руководством Национального театра им. В. Кок-оола Республики Тыва и получить хотя бы одну-две театральные постановки пьес тувинских писателей, а также Центра традиционной тувинской культуры и ремесел.
Перспективы
Исходя из истории использования на территории Тувы в течение краткого для жизни языка периода — около ста лет — разных видов письма —старописьменного монгольского, латинского алфавита, кириллицы, мы считаем, что в качестве базы для исследований нужно создать корпус тувинских текстов на разной графической основе.
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
Есть неопровержимые доказательства использования тибетского языка в Туве. Это не только различные сутры, привезенные из Тибета, но и тексты, созданные в Туве тувинскими ламами. Безусловно, эти образцы текстов на тибетском языке должны стать предметом специального исследования, поэтому эта историческая страница в жизни тувинского народа должна быть обязательно отражена в электронном корпусе тувинского языка в разных форматах. Пока в нашем распоряжении имеется небольшое число текстов, созданных в Туве по буддийским канонам для священных книг. Это восхваления святым местам Тувы (Бавуу-Сюрюн, Геше Лопсан Тубтен, 2001).
Есть также сведения о том, что тибетские сутры приобретались в Пекине, переводились на тувинский язык. Например, текст «Гэсэра» (Куулар, 1995: 4) и другие буддийские тексты (Аранчын, 1976: 5). Полный текст «Гэсэра» был настолько объемным, что сказители в долгие зимние вечера рассказывали его в дальней дороге из Тувы в Пекин (Бээжин по-тувински) и обратно, при этом ни разу не повторив ни одну из частей повести (Куулар, 1995: 9). Прежде чем исполнить наизусть такой объемный текст, нужно его выучить, причем не только перевести, но и переложить на тувинский лад, то есть в какой-то мере обрабатывать текст. Остается загадкой, каким письмом фиксировали эти переводы на тувинский язык, скорее — тибетским. Думается, что со временем архив сутр на тибетском языке пополнится и другими образцами после тщательной инвентаризации и паспортизации архивов Национального музея им. Алдан Маа-дыр Республики Тыва, Государственного архива Республики Тыва, Тувинского института гуманитарных и прикладных социально-экономических исследований, частных коллекций, действующих монастырей.
Изучение рукописей, созданных в Туве на тибетском языке (или возможно, на тувинском языке с использованием тибетского письма) представляет определенный интерес (Бичелдей, 2010: 8). Данная работа рассчитана на дальнюю перспективу.
Тексты на старописьменном монгольском языке. Официальное делопроизводство в годы Тувинской Народной Республики с 1921 по 1930 гг. велось на монгольском языке. Известно, что старейшее печатное издание газета «Шын» выходила с 1925 по 1930 гг., то есть до момента создания тувинской письменности на новотюркской латинизированной основе, на монгольском языке. Такого же внимания требуют все тексты, созданные в Туве на монгольском языке. Предполагается, что эти образцы будут объектом внимания лингвистов и всех тех, кто ими интересуются, в ближайшем будущем. В настоящее время стоит задача — сделать их достоянием как можно большего числа интересующихся. Тем более в Туве сейчас имеются ламы, получившие специальной образование в буддийских монастырях Индии, Монголии, владеющие монгольским и тибетским языками и письмом. Классическое буддийское ламское образование предполагает также знание санскрита. Пока есть некоторые сведения о нали-
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
чии в современной Туве сутр на санскрите, сохранившиеся в личных архивах и других государственных учреждениях.
Тексты на латинице, как бесценный источник по становлению стилей тувинского языка, его стилистического расслоения в самом начале становления литературного языка, его норм. Текстов, созданных при помощи новотюркского латинского алфавита, немного, поэтому ценен каждый документ. Он охватывает период с 1930-го по 1944 гг. Основная масса текстов принадлежит публицистике, официально-деловому стилю. Возможно, сохранились личная переписка, документы. В связи стоящими перед нами задачами, данный корпус будет набран во вторую очередь. Нужно ли переводить их на современную тувинскую письменность? Оцифрованные и транслитерированные тексты на латинице позволяют описать историю становления стилей языка.
Корпус текстов на кириллице начала XX в., до принятия латинизированного алфавита в 1930 г., будут составлять отдельную группу. Небольшие по объему и количеству, эти уникальные тексты печатались в газете «Красное знамя» на тувинском языке и пока еще не были объектом внимания ученых-лингвистов. Между тем, они позволят отследить изменения в лексической семантике, судьбу неологизмов тувинского языка начала ХХ века.
Таким образом, базы данных различных корпусов ЭКТЯ будет выполнять функции электронной библиотеки, архива, хранилища текстов, созданных в Туве, носителями тувинского языка, хранилищем духовного наследия тувинского народа. Возможно, со временем для текстов, созданных на других языках, но являющихся историческим, культурным наследием тувинского народа, будет создан отдельный сайт. Но до тех пор, пока не найдутся энтузиасты, думается, тексты будут храниться в отдельном корпусе текстов на разной графической основе.
Планы на корпусы
Корпус параллельных текстов. Особым типом корпусов является так называемый параллельный корпус, в котором тексту на языке-оригинале сопоставлен перевод этого текста на другой язык или наоборот. Между единицами оригинального и переводного текста (обычно — между предложениями) с помощью специальной процедуры устанавливается соответствие; эта процедура называется выравниванием, а тексты, соответственно, выравненными.
Выравненный параллельный корпус представляет собой важный инструмент для научных исследований (в том числе и для исследований по теории и практике перевода); он может также использоваться при обучении языкам (Добровольский, Кретов, Шаров, 2005).
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
В настоящее время у нас имеется задел для создания параллельных корпусов: тувинско-русского, русско-тувинского, монгольско-тувинского, немецко-тувинского, тувинско-немецкого, тувинско-английского. В нашем распоряжении есть только один выравненный параллельный текст Конституции Республики Тыва. Имеются образцы процессуальных документов на русском и тувинском языках, с учетом внесенных изменений и дополнений в Уголовно-процессуальный кодекс РФ по состоянию на 1 января 2008 г., составляемых и применяемых на всех стадиях предварительного расследования, за исключением постановлений о назначении и проведении судебных эспертиз, так как в практической деятельности сотрудниками органов внутренних дел и других правоохранительных органов Республики Тыва указанные процессуальные документы составляются на русском языке, также экспертные заключения составляются на русском языке. Тексты любезно предоставлены автором-составителем К. Х. Нурзатом, имеющим огромный опыт работы в правоохранительных органах.
Огромное количество переводов художественных произведений якобы из других языков на тувинский на самом-то деле являются переводами из русского на тувинский, поэтому они могут попасть только в русско-тувинский параллельный корпус. В свое время группа преподавателей английского языка работала по заданию фирмы Microsoft в качестве переводчиков оригинальных английских текстов на тувинский язык в целях составления программы по автоматическому переводу. Работой руководил В. Войнов. К сожалению, у меня нет сведений о дальнейшем продвижении проекта, поэтому пока нет в нашем распоряжении текстов, который бы составил задел англо-тувинского корпуса. Поэтому с большой благодарностью примем параллельные англо-тувинские тексты, если кто-то откликнется на данную статью.
Корпус собственных имен. Сюда должны войти базы данных топонимов Тувы, антропонимов, традиционных названий пантеона божеств, небесных тел, клички животных. При сегодняшнем стремительном падении уровня владения родным языком, смешении разных культурных традиций важно зафиксировать традиционные клички животных с толкованием их значений и по возможности дать иллюстративный материал (Иванов, 2010). Известно, что тувинцы дают клички животным, исходя из их внешних примет, по нраву. Например, чаще всего лошадям дают клички по их окрасу: Дорала < доруг 'гнедой' + ала 'пестрый' или другим приметам; собакам с белыми передними лапами — Акал и т. д. Основой для базы данных по микротопонимам может стать словарь, составленный Б. К. Ондар (Ондар, 2007), в тувиноведении работ, посвященных топонимам достаточно много (Татаринцев, 1977, 1993; Розен, Малолетко, 1986 и др.). В базе данных обязательно нужно зафиксировать различное написание топонимов в разных источниках, несколько названий одного и того же объекта. Например, Кур-Чер, Целинное, Победа — это один и тот же населенный пункт в Кызылском
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
районе. Забывается топоним Германовка как второе название села Сесерлиг в Бии-Хемском районе. В дореволюционных работах селение Чаа-Хел имеет написание Джакуль. От сложного слова Эргек-Дыргак-Тайга осталось Ергаки. Только после выхода в свет романа «Белый пароход» Ч. Айтматова Улуг-Хем стали ещё называть Эне-Сай, как другое название Енисея по народной этимологии.
В связи с попытками развивать туризм в Туве, думается, что легенды о происхождении тех или иных названий, строгие этимологические изыскания будут нужны организаторам туристических маршрутов и гидам-проводникам. Они нужны и учителям географии, тувинского языка и литературы, пригодятся учителям русского и иностранных языков. Поэтому при составлении словника собственных имен может стоит предложить их транслитерацию на английский.
В тувинском языке сложно установить все закономерности пополнения имен-ника (списка антропонимов). В последнее время появились и сконструированные имена (Бавуу-Сюрюн, 2000), много вопросов о правописании собственных имен, так и географических названий. Широко известно, что тувинцы давали и возобновили традицию присвоения своим детям тибетских имен, чаще всего сами еще не зная значений этих собственных имен. Первый шаг в толковании их значений проделал С. Лудуп (Лудуп, 1996-1997), в дальнейшем со ссылкой на его работу в словарь тувинских антропонимов их ввела Н. Д. Сувандии в качестве приложения в своей монографии «Тувинская антропонимия» (Сувандии, 2011: 148-171). Она же отметила их разнописание, поэтому нужно в качестве базы данных еще раз составить тувинский именник тибетского происхождения, добавив вновь появившиеся имена и их толкование.
Кстати, эта же база данных может быть использована в электронных образовательных ресурсах, многие возвращенные тибетские имена носят дети школьного возраста. А в курсе тувинского языка есть темы «Заимствования из тибетского языка», «Собственные имена», «Правописание сложных имен», при изучении которых ученик может обратиться к такого рода справочной информации.
Корпус словарей. Корпус обязательно должен иметь разные типы словарей. Они существенно расширят круг пользователей корпуса, исходя из содержания материалов и широкого круга его пользователей электронный ресурс лучше назвать «Тувинским национальным корпусом». А. Дагбажык предлагает также новый тип комплексного словаря тувинского языка (см. его статью в настоящем номере: Дагбажык, 2016: Электр. ресурс). Я и в этом его поддерживаю. Пройдет ещё какое-то время, думаю, многие согласятся электронный ресурс назвать «национальным корпусом», потому что это будет хранилищем всего богатства тувинского языка, духовной культуры тувинского народа. Сомнений в том, что такой словарь будет, у меня нет. Имеются специальные работы по различным тематическим группам лексики тувинского языка, которые обязательно в качестве приложения имеют словари, остается только получить со-
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
гласие автора на его продолжение. Большая работа проделана по проекту ФЦП «Тематические группы глаголов в тувинском языке. Семантика, управление».
Диалектный корпус. Он представляет собой уникальное собрание фонетических записей (см.: Летучий, 2005, 2009), сделанных во время лингвоэтногра-фических экспедиций в места наиболее компактного проживания тувинцев за рубежом и по Туве. Оцифровка и перевод фонетической записи в систему Unicode позволят провести разнообразный анализ представленного диалекта тувинского языка в различных аспектах — прежде всего фонетики, лексики и морфологии. Есть словарь диалектной лексики алтайского диалекта тувинского языка с указанием принадлежности слов к отдельным его говорам; имеются подготовленные фрагменты аудио- и видеозаписей.
Фольклорный корпус. Набор фольклорных текстов, записей музыкального фольклора и устной речи ведут различные научные учреждения республики: Тувинский институт гуманитарных и прикладных социально-экономических исследований (бывший — ТНИИЯЛИ, ТИГИ), Тувинский государственный университет, Международный научный центр «Хоомей». Начало работы по созданию баз данных фольклорного корпуса на примере текстов тувинского героического эпоса можно увидеть в статье М. В. Ондар в этом номере журнала (Ондар, 2016: Электр. ресурс).
Заключение
Корпусы необходимы профессиональным лингвистам, они позволяют одновременно работать с огромными массивами текстов, значительно сокращается время на техническую работу. Становятся доступными тексты, которые уже стали библиографической редкостью, хранятся в единичных экземплярах в личных библиотеках или в фондах музея, архива. Ведь не секрет, что немногие произведения переиздаются, особенно сейчас. Например, если нам нужно описать употребление слова «ак» (тув. — 'белый') в текстах в разных временных срезах, то понадобится всего несколько минут на поиск данного слова в набранных текстах.
Для преподавателей тувинского языка материал корпуса - возможность использовать различные тексты для сбора дидактических материалов для учеников, адресованных студентам средних и высших учебных заведений. Возможно, что преподаватели тувинского языка, разрабатывающие основы преподавания тувинского языка как второго, могут найти в созданном ресурсе информацию по сочетаемости слова в лексическом и грамматическом аспекте, что, нужно отметить, является совершенно не разработанной проблемой в тувинском языкознании. Корпусы предназначены не только для лингвистов, но и для историков и этнографов: тексты содержат уникальную информацию по разным
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
вопросам этнографии и истории, поскольку художественные произведения отражают историческое прошлое народа, многие произведения можно использовать как этнографический источник. Например, «Ацгыр-оолдуц тоожузу» С. Сарыг-оола известен как энциклопедия традиционной тувинской жизни. У писателей первого и второго поколения можно прочесть удивительно реалистичные, яркие картины окружающей жизни, природы Тувы, фенологические наблюдения, описание событий, обрядов, традиций и т. п.
Каким быть Электронному корпусу тувинского языка или же Национальному корпусу тувинского языка нужно дискутировать сейчас, когда закладывается основа, которую можно совершенствовать. Вполне допустимо, что это будет два разных электронных ресурса тувинского языка. Это ясно видно на примере создания корпусов русского языка. Первые электронные корпуса русского языка, доступные для всеобщего пользования, начали появляться не в России, а в Европе, и создателями их были европейские русисты. Специалисты хорошо знают так называемый Упсальский корпус русского языка (включающий небольшой по нынешним меркам и практически не обработанный корпус русских художественных и публицистических письменных текстов 1960-1970-х годов, с отдельными добавлениями из других периодов). Этот корпус был создан в Швеции, а в настоящее время хранится на сервере Тюбингенского университета в Германии, и в свое время немало пригодился специалистам. Интересные разработки по русской корпусной лингвистике ведутся в Финляндии. Вообще, эта маленькая страна является одним из лидеров корпусной лингвистики в мире, в том числе и в области русской корпусной лингвистики (Плунгян, 2005: 298).
Национальный корпус тувинского языка представляется одним из фундаментальных проектов, который сможет внести свою лепту в дело сохранения языка в условиях постоянного уменьшения количества его активных носителей, под которыми понимаются те, кто не только понимает речь, но и осуществляет коммуникацию на том или ином языке. Этот программный продукт позволяет осуществлять лингвистические исследования с использованием корпусного подхода, что не только уточняет и дополняет имеющиеся описания языка, но и освещает те проблемы, которые еще не изучены в тувинском языкознании.
Создатели электронных ресурсов тувинского языка открыты для сотрудничества и будут рады отзывам, внимательны к замечаниям и советам по их совершенствованию и дополнению. Они дают себе отчет в том, что в ресурсе в силу его масштабности и новизны имеются погрешности, и недочеты как в программной части, так и в лингвистических базах данных, отладка и корректирование которых требуют координированных работ разных специалистов, что ведет порой к протяженности во времени, поэтому надеются на понимание пользователей корпуса.
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
СПИСОК ЛИТЕРАТУРЫ
Агеева, Е., Тайерс, Ф. (2016) Комбинированные морфологические и синтаксические неоднозначности для синтаксического анализа зависимостей кросс-языков // Известия Кыргызского государственного технического университета им. И. Раззакова. № 2 (38). С. 112-121.
Аранчын, Ю. Л. (1976) Эге сес // Эрниц экизи Хан-Харангуй. Кызыл : Тываньщ ном YндYрер чери. 118 ар. (На тув. яз.).
Бавуу-Сюрюн, М. В. (2000) Влияние русского языка на образование современных тувинских фамилий и имен // Этносоциальные процессы в Сибири / отв. ред. Ю. В. Попков. Вып. 3. Новосибирск : Изд-во СО РАН. 272 с. С. 204-205.
Бавуу-Сюрюн, М. В. (2016) Потенциал электронного образовательного ресурса «Тыванын чогаалчылары (Писатели Тувы)» // Сохранение и развитие языков и культур коренных народов Сибири: материалы IV Междун. научно-практ. конф. Абакан : Изд-во ФГБОУ ВПО «ХГУ им. Н. Ф. Катанова». С. 53-58.
Бавуу-Сюрюн, М. В., Геше Лобсан Тубтен (2001) О функционировании тибетского письма в Туве // Становление и развитие науки в Туве (Материалы Международной конференции, посвященной к 70-летию тувинской письменности 11-14 сентября 2000 г.). Кызыл : б/и. Ч. I. С. 19-20.
Бичелдей, К. А. (2010) 80 лет тувинской письменности: становление, развитие, перспективы // Тувинская письменность и вопросы исследования письменностей и письменных памятников России и центрально-азиатского региона. Материалы международной научной конференции, посвященной 80-летию тувинской письменности. Абакан : Хакасское книжное издательство. Ч. I. С. 7-12.
Дагбажык, А. С. (2016a) Формирование и ведение словарей в корпусе тувинского языка // Молодой ученый. № 9. С. 57-62.
Дагбажык, А. С. (2016b) Структура словарной статьи Национального корпуса тувинского языка [Электронный ресурс] // Новые исследования Тувы. № 4. URL: http://nit.tuva.asia/nit/article/view/612 (дата обращения: 01.12.2016).
Далаа, С. М. (2016) ЭВМ и тувинский язык: обзор исследовательских работ Тувинского государственного университета [Электронный ресурс] // Новые исследования Тувы. № 4. URL: http://nit.tuva.asia/nit/article/view/611 (дата обращения: 01.12.2016).
Добровольский, Д. О., Кретов, А. А., Шаров, С. А. (2005) Корпус параллельных текстов: архитектура и возможности использования // Национальный корпус русского языка: 2003-2005. М. : Индрик. С. 263-296.
Дыбо, А. В., Шеймович, А. В. (2014) Автоматический морфологический анализ для корпусов хакасского и древнетюркского языков // Научное обозрение Саяно-Алтая. № 2 (8). С. 9-30.
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
Иванов, Н. М. (2010) Электронная база данных топонимов как источник лингвистических исследований региона // Тувинская письменность и вопросы исследования письменностей и письменных памятников России и центрально-азиатского региона. Материалы международной научной конференции, посвященной 80-летию тувинской письменности. Абакан : Хакасское книжное издательство. Ч. I. С. 95-97.
Корпусная лингвистика [Электронный ресурс] // Корпусная лингвистика. Программа фундаментальных исследований Президиума РАН. URL: http://www. corplingran.ru/n3.html (дата обращения: 03.08.2016).
Национальный корпус калмыцкого языка: архитектура и возможности использования (2012) / Куканова, В. В., Бембеев, Е. В., Мулаева, Н. М., Очирова, Н.Ч. // Вестник Калмыцкого института гуманитарных исследований РАН. № 3. C. 138-150.
Куканова В. В., Салаев Б. К., Трофимова С. М. (2013) Структура электронного учебника калмыцкого языка: проблемы и перспективы [Электронный ресурс] // Новые исследования Тувы. № 4. URL: http://nit.tuva.asia/nit/article/view/206 (дата обращения: 16.08.2016).
Куканова, В. В. (2015) Национальный корпус калмыцкого языка: итоги работы и перспективы [Электронный ресурс] // Новые исследования Тувы. № 1. URL: http://nit.tuva.asia/nit/article/view/41 (дата обращения: 03.08.2016).
Куулар, Д. С. (1995) Эге сес // Он чYктYЦ ээзи, он хоранньщ YндYCYн Yскен Ачы-ты Кезер-Мерген дугайында тоожу. Кызыл : Тываныц ном YндYрер чери. 128 ар. (На тув. яз.).
Летучий, А. Б. (2005) Корпус диалектных текстов: задачи и проблемы // Национальный корпус русского языка: 2003-2005. М. : Индрик. С. 215-232.
Летучий, А. Б. (2009) Диалектный корпус: состав и особенности разметки // Национальный корпус русского языка: 2006-2008. Новые результаты и перспективы. СПб. : Нестор-История. С. 114-128.
Лудуп, С. (1996-1997) Адыц, шолац чажыттары // Башкы (журнал). № 5. С. 88-92; № 6. С. 79-84; № 1. С.78-84.
Машинный корпус башкирского языка [Электронный ресурс] // Машинный фонд башкирского языка. Разработчики: Сиразитдинов З. А., Бускунбаева Л. А., Ишмухаметова А. Ш., Шамсутдинова Г. Г., Полянин А. И., Ибрагимова А. Д., Ми-гранова Л. Г., Рафикова Л. Н. URL: http://mfbl2.ru/ (дата обращения: 12.08.2016).
Монгуш, Ч. М. (2016) Метатекстовая разметка в национальном корпусе тувинского языка: структура и функциональные возможности [Электронный ресурс] // Новые исследования Тувы. № 4. URL: http://nit.tuva.asia/nit/article/view/613 (дата обращения: 01.12.2016).
Ондар, Б. К. (2007) Топонимический словарь Тувы. Кызыл: Тув. книж. изд-во.
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
Ондар, М. В. (2016) База данных текстов тувинского героического эпоса: первый этап [Электронный ресурс] // Новые исследования Тувы. № 4. URL: http:// nit.tuva.asia/nit/article/view/616 (дата обращения: 01.12.2016).
Ооржак, Ч. Е. (2016) Создание электронных учебников в отделе аудиовизуальных и информационных технологий Института развития национальной школы Тувы [Электронный ресурс] // Новые исследования Тувы. № 4. URL: http://nit. tuva.asia/nit/article/view/618 (дата обращения: 01.12.2016).
Плунгян, В. А. (2005) Зачем мы делаем национальный корпус текстов русского языка? // Отечественные записки. № 2. С. 296-308.
Розен, М. Ф., Малолетко, А. М. (1986) Географические термины Западной Сибири. Томск : Изд-во Том. ун-та. 207 с.
Салчак, А. Я. (2012) Электронный корпус текстов тувинского языка [Электронный ресурс] // Новые исследования Тувы. № 3. URL: http://nit.tuva.asia/nit/ article/view/319 (дата обращения: 31.08.2016).
Салчак, А. Я., Байыр-оол, А. В. (2013) Электронный корпус тувинского языка: состояние, проблемы // Мир науки, культуры, образования. № 6. С. 408-409.
Сувандии, Н. Д. (2011) Тувинская антропонимия. Кызыл : Тывинский госуниверситет. 208 с.
Татаринцев, Б. И. (1977) О топонимии бассейна реки Каа-Хем // Тувинский язык и литература в послеоктябрьский период / отв. ред. Д. А. Монгуш. Кызыл: б/и. 187 с. С. 88-98.
Татаринцев, Б. И. (1993) О некоторых древних топонимах тюркского происхождения на территории Тувы // Вопросы тувинского языкознания : сборник материалов / ред. Д. А. Монгуш, Б. И. Татаринцев. Кызыл: МП «Новости Тувы». 126 с. С. 105-113.
Федеральные образовательные ресурсы общего образования [Электронный ресурс] // Российское образование. Федеральный портал. URL: http://www.edu. ru/db/portal/sites/res_page.htm (дата обращения: 31.08.2016).
Электронные учебники: рекомендации по разработке, внедрению и использованию интерактивных мультимедийных электронных учебников нового поколения для общего образования на базе современных мобильных электронных устройств (2012). М. : Федеральный институт развития образования. 84 с.
Электронный корпус хакасского языка [Электронный ресурс] // Электронный корпус хакасского языка. URL: http://khakas.altaica.ru/texts/ (дата обращения: 12.08.2016).
Finite-State Morphological Analyser for Tuvan (2016) / Tyers, F. M., Washington, J. N., Bayyr-ool, A., Salchak, A. A [Электронный ресурс] // LREC Conferences. The
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
International Conference on Language Resources and Evaluation is organised by ELRA biennially with the support of institutions and organisations involved in HLT. URL: http://www.lrec-conf.org/proceedings/lrec2016/pdf/1009_Paper.pdf (дата обращения: 12.08.2016).
Ageeva, E. and Taiers, F. (2016) Kombinirovannye morfologicheskie i sintaksicheskie neodnoznachnosti dlia sintaksicheskogo analiza zavisimostei kross-iazykov. Izvestiia Kyrgyzskogo gosudarstvennogo tekhnicheskogo universiteta im. I. Razzakova, no. 2 (38), pp. 112-121. (In Russ.).
Aranchyn, Iu. L. (1976) Ege ses. In: Ern^ ekizi Khan-Kharangui. Kyzyl, Tyvanyц nom YndYrer cheri. 118 p. (In Tuv.).
Bavuu-Siuriun, M. V. (2000) Vliianie russkogo iazyka na obrazovanie sovremennykh tuvinskikh familii i imen. In: Etnosotsial'nye protsessy v Sibiri, ed. Iu. V. Popkov. Vol. 3. Novosibirsk, Izd-vo SO RAN. 272 p. Pp. 204-205. (In Russ.).
Bavuu-Siuriun, M. V. (2016) Potentsial elektronnogo obrazovatel'nogo resursa «Tyvanyц chogaalchylary (Pisateli Tuvy)». In: Sokhranenie i razvitie iazykov i kul'tur korennykh narodov Sibiri: materialy IVMezhdun. nauchno-prakt. konf. Abakan, Izd-vo FGBOU VPO «KhGU im. N. F. Katanova». Pp. 53-58. (In Russ.).
Bavuu-Siuriun,M.V. and Geshe Lobsan Tubten (2001) O funktsionirovanii tibetskogo pis'ma v Tuve. In: Stanovlenie i razvitie nauki v Tuve (Materialy Mezhdunarodnoi konferentsii, posviashchennoi k 70-letiiu tuvinskoi pis'mennosti 11-14 sentiabria 2000 g.). Kyzyl, s. n. Vol. I. Pp. 19-20. (In Russ.).
Bicheldei, K. A. (2010) 80 let tuvinskoi pis'mennosti: stanovlenie, razvitie, perspektivy. In: Tuvinskaia pis'mennost' i voprosy issledovaniia pis'mennostei i pis'mennykh pamiatnikov Rossii i tsentral'no-aziatskogo regiona. Materialy mezhdunarodnoi nauchnoi konferentsii, posviashchennoi 80-letiiu tuvinskoi pis'mennosti. Abakan, Khakasskoe knizhnoe izdatel'stvo. Vol. I. Pp. 7-12. (In Russ.).
Dagbazhyk, A. S. (2016a) Formirovanie i vedenie slovarei v korpuse tuvinskogo iazyka. Molodoi uchenyi, no. 9, pp. 57-62. (In Russ.).
Dagbazhyk, A. S. (2016b) Struktura slovarnoi stat'i Natsional'nogo korpusa tuvinskogo iazyka. Novye issledovaniia Tuvy, no. 4 [online] Available at: http://nit. tuva.asia/nit/article/view/612(access data: 01.12.2016). (In Russ.).
Dalaa, S. M. (2016) EVM i tuvinskii iazyk: obzor issledovatel'skikh rabot Tuvinskogo gosudarstvennogo universiteta. Novye issledovaniia Tuvy, no. 4. [online] Available at: http://nit.tuva.asia/nit/article/view/611 (access data: 01.12.2016). (In Russ.).
Дата поступления: 01.11.2016 г.
REFERENCES
www.nit.tuva.asia
№ 4
2016
Novye issledovaniia Tuvy
Dobrovol'skii, D. O., Kretov, A. A. and Sharov, S. A. (2005) Korpus parallel'nykh tekstov: arkhitektura i vozmozhnosti ispol'zovaniia. In: Natsional'nyi korpus russkogo iazyka: 2003-2005. Moscow, Indrik. Pp. 263-296. (In Russ.).
Dybo, A. V. and Sheimovich, A. V. (2014) Avtomaticheskii morfologicheskii analiz dlia korpusov khakasskogo i drevnetiurkskogo iazykov. Nauchnoe obozrenie Saiano-Altaia, no. 2 (8), pp. 9-30. (In Russ.).
Ivanov, N. M. (2010) Elektronnaia baza dannykh toponimov kak istochnik lingvisticheskikh issledovanii regiona. In: Tuvinskaia pis'mennost' i voprosy issledovaniia pis'mennostei i pis'mennykh pamiatnikov Rossii i tsentral'no-aziatskogo regiona. Materialy mezhdunarodnoi nauchnoi konferentsii, posviashchennoi 80-letiiu tuvinskoi pis'mennosti. Abakan, Khakasskoe knizhnoe izdatel'stvo. Vol. I. Pp. 95-97. (In Russ.).
Korpusnaia lingvistika. Korpusnaia lingvistika. Programma fundamental'nykh issledovanii Prezidiuma RAN [online] Available at: http://www.corplingran.ru/n3.html (access data: 03.08.2016). (In Russ.).
Natsional'nyi korpus kalmytskogo iazyka: arkhitektura i vozmozhnosti ispol'zovaniia (2012) / Kukanova, V. V., Bembeev, E. V., Mulaeva, N. M. and Ochirova, N.Ch. Vestnik Kalmytskogo instituta gumanitarnykh issledovanii RAN, no. 3, pp. 138150. (In Russ.).
Kukanova V. V., Salaev B. K. and Trofimova S. M. (2013) Struktura elektronnogo uchebnika kalmytskogo iazyka: problemy i perspektivy. Novye issledovaniia Tuvy, no. 4 [online] Available at: http://nit.tuva.asia/nit/article/view/206 (access data: 16.08.2016). (In Russ.).
Kukanova, V. V. (2015) Natsional'nyi korpus kalmytskogo iazyka: itogi raboty i perspektivy. Novye issledovaniia Tuvy, no. 1 [online] Available at: http://nit.tuva.asia/ nit/article/view/41 (access data: 03.08.2016). (In Russ.).
Kuular, D. S. (1995) Ege ses. In: On chyktyH, eezi, on khorannyц yndysyn ysken Achyty Kezer-Mergen dugaiynda toozhu. Kyzyl, Tyvanyц nom YndYrer cheri. 128 p. (In Tuv.).
Letuchii, A. B. (2005) Korpus dialektnykh tekstov: zadachi i problem. In: Natsional'nyi korpus russkogo iazyka: 2003-2005. Moscow, Indrik. Pp. 215-232. (In Russ.).
Letuchii, A. B. (2009) Dialektnyi korpus: sostav i osobennosti razmetki. In: Natsional'nyi korpus russkogo iazyka: 2006-2008. Novye rezul'taty i perspektivy. St. Petersburg, Nestor-Istoriia. Pp. 114-128. (In Russ.).
Ludup, S. (1996-1997) AdyH, sholaH chazhyttary. Bashky, no. 5, pp. 88-92; no. 6, pp. 79-84; no. 1, pp. 78-84. (In Russ.).
Mashinnyi korpus bashkirskogo iazyka In: Mashinnyi fond bashkirskogo iazyka. Razrabotchiki: Sirazitdinov Z. A., Buskunbaeva L. A., Ishmukhametova A. Sh., Shamsutdinova G. G., Polianin A. I., Ibragimova A. D., Migranova L. G., Rafikova L. N.
www.nit.tuva.asia
№ 4
Novye issledovaniia Tuvy
[online] Available at: http://mfbl2.ru/ (access data:12.08.2016). (In Russ.).
Mongush, Ch. M. (2016) Metatekstovaia razmetka v natsional'nom korpuse tuvinskogo iazyka: struktura i funktsional'nye vozmozhnosti. Novye issledovaniia Tuvy, no. 4 [online] Available at: http://nit.tuva.asia/nit/article/view/613 (access data: 01.12.2016). (In Russ.).
Ondar, B. K. (2007) Toponimicheskii slovar' Tuvy. Kyzyl, Tuv. knizhn. izd-vo. 552 p. (In Russ.).
Ondar, M. V. (2016) Baza dannykh tekstov tuvinskogo geroicheskogo eposa: pervyi etap. Novye issledovaniia Tuvy, no. 4 [online] Available at: http://nit.tuva.asia/nit/ article/view/616 (access data: 01.12.2016). (In Russ.).
Oorzhak, Ch. E. (2016) Sozdanie elektronnykh uchebnikov v otdele audiovizual'nykh i informatsionnykh tekhnologii Instituta razvitiia natsional'noi shkoly Tuvy. Novye issledovaniia Tuvy, no. 4 [online] Available at: http://nit.tuva.asia/nit/article/view/618 (access data: 01.12.2016). (In Russ.).
Plungian, V. A. (2005) Zachem my delaem natsional'nyi korpus tekstov russkogo iazyka? Otechestvennye zapiski, no. 2, pp. 296-308. (In Russ.).
Rozen, M. F. and Maloletko, A. M. (1986) Geograficheskie terminy Zapadnoi Sibiri. Tomsk, Izd-vo Tom. un-ta. 207 p. (In Russ.).
Salchak, A. Ia. (2012) Elektronnyi korpus tekstov tuvinskogo iazyka. Novye issledovaniia Tuvy, no. 3 [online] Available at: http://nit.tuva.asia/nit/article/view/319 (access data: 31.08.2016). (In Russ.).
Salchak, A. Ia. and Baiyr-ool, A. V. (2013) Elektronnyi korpus tuvinskogo iazyka: sostoianie, problem. Mir nauki, kul'tury, obrazovaniia, no. 6, pp. 408-409. (In Russ.).
Suvandii, N. D. (2011) Tuvinskaia antroponimiia. Kyzyl, Tyvinskii gosuniversitet. 208 p. (In Russ.).
Tatarintsev, B. I. (1977) O toponimii basseina reki Kaa-Khem. In: Tuvinskii iazyk i literatura v posleoktiabr'skii period, ed. D. A. Mongush. Kyzyl, s. n. 187 p. Pp. 88-98. (In Russ.).
Tatarintsev, B. I. (1993) O nekotorykh drevnikh toponimakh tiurkskogo proiskhozhdeniia na territorii Tuvy. In: Voprosy tuvinskogo iazykoznaniia : sbornik materialov, ed. D. A. Mongush and B. I. Tatarintsev. Kyzyl, MP «Novosti Tuvy». 126 p. Pp 105-113. (In Russ.).
Federal'nye obrazovatel'nye resursy obshchego razvitiia. Rossiiskoe obrazovanie. Federal'nyi portal [online] Available at: http://www.edu.ru/db/portal/sites/res_page. htm (access data: 31.08.2016). (In Russ.).
Elektronnye uchebniki: rekomendatsii po razrabotke, vnedreniiu i ispol'zovaniiu interaktivnykh mul'timediinykh elektronnykh uchebnikov novogo pokoleniia dlia
НОВЫЕ ИССЛЕДОВАНИЯ ТУВЫ THE NEW RESEARCH OF TUVA
www.nit.tuva.asia № 4 Чг 2016 Novye issledovaniia Tuvy
obshchego obrazovaniia na bazesovremennykh mobil'nykh elektronnykh ustroistv (2012). Moscow, Federal'nyi institut razvitiia obrazovaniia. 84 p. (In Russ.).
Elektronnyi korpus khakasskogo iazyka. Elektronnyi korpus khakasskogo iazyka [online] Available at: http://khakas.altaica.ru/texts/ (access data: 12.08.2016). (In Russ.).
Finite-State Morphological Analyser for Tuvan (2016) / Tyers, F. M., Washington, J. N., Bayyr-ool, A. and Salchak, A. A. LREC Conferences. The International Conference on Language Resources and Evaluation is organised by ELRA biennially with the support of institutions and organisations involved in HLT [online] Available at: http://www. lrec-conf.org/proceedings/lrec2016/pdf/1009_Paper.pdf (access data: 12.08.2016).
Submission data: 01.11.2016.
Библиографическое описание статьи:
Бавуу-Сюрюн М. В. Вопросы создания электронных ресурсов тувинского языка: некоторые итоги, неотложные задачи и перспективы [Электронный ресурс] // Новые исследования Тувы. 2016, № 4. URL: http://nit.tuva.asia/nit/article/view/610 (дата обращения: дд.мм.гг.).
Citation:
Bavuu-Surun M. V. Creating electronic resources on Tuvan language: preliminary results, current challenges and prospects. Novye issledovaniia Tuvy, 2016, no. 4 [on-line] Available at: http://nit.tuva.asia/nit/article/view/610 (accessed: ...).