«НОВЫЕ ИССЛЕДОВАНИЯ > ТУВЫ»
электронный научный журнал
www.tuva.asia
№ 1 2010 г.
ТУВИНСКАЯ РАСКЛАДКА КЛАВИАТУРЫ
А. С. Папын1
TUVAN KEYBOARD LAYOUT
A. S. Papyn
С 90-х годов XX века с началом активного внедрения компьютерных технологий в нашу жизнь особую актуальность обрела проблема набора текстов на тувинском языке. При этом возникла она еще ранее. Поэтому сделаем поверхностный экскурс в историю компьютерного шрифта и кодировок.
Дефицит и дороговизна компьютерной памяти в середине ХХ века привели к ситуации, когда в раскладках компьютерных клавиатур со всем мире гарантированно единообразно кодировались только латинские символы, используемые в английском языке. Остальное пространство из доступных тогда кодированных знаков занимали диакритические буквы языков, использующих латинскую графику, технические символы для построения таблиц и графиков, а также управляющие символы компьютерного набора.
Появление электронно-вычислительных машин в Советском Союзе, а впоследствии в России, сопровождалось появлением нескольких версий кодировки кириллических знаков. Наиболее распространенным из них в наше время является кодировка операционной системы Windows — CP1251 (или Windows-1251). Так-
1 Папын Александр Сергеевич — режиссер телеканала «Россия-2», член редколлегии журнала «Новые исследования Тувы».
Постоянный адрес статьи: http://www.tuva.asia/journal/issue_5/1466-papyn.html
19
«НОВЫЕ ИССЛЕДОВАНИЯ > ТУВЫ»
электронный научный журнал
www.tuva.asia
№ 1 2010 г.
же достаточно распространена кодировка KOI-8 (Код обмена информацией, 8 бит), принятая Госстандартом СССР.
В этих кодировках из-за того же дефицита памяти не нашлось места для дополнительных знаков кириллицы, используемых в алфавитах языков с кириллической графикой. В том числе не нашли для себя места в этих кодировках и знаки тувинского алфавита.
В разных регионах России, стран СНГ, использующих кириллическую графику, проблема набора текстов на местных языках решалась по-разному. В Казахстане, Татарстане и Чувашии, например, была принята своя версия кириллической кодировки.
В Туве наибольшее распространение получил способ набора текстов на тувинском языке, который придумали и стали широко внедрять в Государственном лицее Республики Тыва. Он заключался в графической подмене некоторых знаков в файлах компьютерных шрифтов. Этот способ набора, широко распространенный в Туве и сегодня, нельзя назвать раскладкой, поскольку машинный код подмененного знака оставался неизменным. Вместо буквы «Ё» в шрифтовом файле рисовался знак «Ц», « + » подменялся на «©», а вместо «/» в текстах при выборе соответствующего шрифта появлялась буква «Y». Строчные буквы набирались соответственно вместо «ё» — «ц», « = » — «е» и «\» — «Y».
Этот технически легко реализуемый способ был и остается вполне приемлемым для набора печатных текстов. И он, насколько известно автору, широко используется в редакциях СМИ республики.
Тем не менее, этот способ набора тувинских текстов изначально методологически некорректен. Не будем вдаваться в тео-
20
«НОВЫЕ ИССЛЕДОВАНИЯ > ТУВЫ»
электронный научный журнал
www.tuva.asia
№ 1 2010 г.
рию кодирования информации. Начнем с того, что описанный способ фактически исключает из обращения букву «ё», а ведь есть слова, которые начинаются на нее (напр., «ёзулуг»).
Ключевой же дефект этого способа заключается в противоречии между компьютерными кодами знаков и их графическим отображением. То, что мы визуально воспринимаем, как слово «мец^н», компьютер «видит» как «м = ёг\н». С активным внедрением электронного документооборота и широким распространением Интернета становится неизбежным обмен электронными файлами между людьми. Таким образом, человек, у которого не установлены «тувинизированные» шрифты, не сможет прочитать тувинский текст, набранный описанным методом. Кроме того, такие тексты не смогут быть корректно обработаны поисковыми механизмами. А значит этот способ совершенно неприемлем для производства Интернет-сайтов на тувинском языке.
Решение описанной проблемы было предложено еще в начале 1990-ых годов, когда Международной организацией стандартизации (ISO) был принят стандарт Unicode версии 1.1. В этом стандарте были заложены коды дополнительных знаков кириллицы. Тувинские буквы «Ц», «ц», «Y», «Y», «©», «е» получили соответственно шестнадцатеричные коды «04А2», «04А3», «04AE», «04AF», «04Е8», «04Е9» (все буквы латинские, первый знак «ноль» — коды можно проверить в программе Microsoft Word: напечатайте любой из них без кавычек, выделите и нажмите сочетание Alt + латинская «X»).
В 1990-х годах этот стандарт не нашел широкого применения в связи с тем, что увеличивал объем памяти, необходимый для сохранения текстов. В условиях ограниченной пропускной
21
«НОВЫЕ ИССЛЕДОВАНИЯ > ТУВЫ»
электронный научный журнал
www.tuva.asia
№ 1 2010 г.
способности линий обмена информацией это было оправданно. Кроме того, полноценную поддержку этого стандарта корпорация Microsoft начала только с операционной системы Windows 95, но шрифтовые файлы, поставляемые с этой системой, не всегда содержали необходимые знаки.
В наше время ширина информационных каналов и невероятное удешевление компьютерной памяти позволяют активно внедрять стандарт Юникод. Начиная с операционной системы Windows XP наиболее распространенные шрифты Times New Roman, Arial, Tahoma, Verdana, Georgia включили в себя почти все знаки стандарта Юникод. Так разрешилась проблема отображения текстов на тувинском языке.
Для технологически верного метода набора тувинских текстов осталось единственное препятствие — отсутствие стандартизированной тувинской раскладки клавиатуры.
Выход из этой ситуации можно найти в использовании существующих в Microsoft Windows раскладок для языков со схожими алфавитами (например, казахского или татарского). Однако в алфавитах указанных языков дополнительных знаков гораздо больше, чем в тувинском. Кроме того, в некоторых случаях исключаются отдельные буквы русского алфавита, что усложняет набор заимствований из русского языка.
Мы в редакции журнала «Новые исследования Тувы» предлагаем решение этой проблемы. Для этого была разработана собственная версия раскладки клавиатуры для тувинского языка.
Программу установки тувинской раскладки клавиатуры для семейства операционных систем Microsoft Windows можно скачать с сайта http://www.tuva.asia/tt/tuvan.exe.
22
«НОВЫЕ ИССЛЕДОВАНИЯ > ТУВЫ»
электронный научный журнал
www.tuva.asia
№ 1 2010 г.
ВНИМАНИЕ!!! Редакция журнала гарантирует безопасность программы, скачанной только с указанного адреса! Файлы, установленные из любого другого источника, могут содержать вредоносный код и стать источником заражения вирусами для вашего компьютера!
При установке tuvan.exe появится сообщение, что устанавливается тувинская раскладка для татарского языка. К сожалению, тувинского языка в дистрибутивах Microsoft Windows пока нет, поэтому был избран такой выход. Выбор татарского языка в качестве носителя обусловлен его сокращением «ТТ», что можно понять как тувинский.
После установки в языковой панели появится дополнительная раскладка клавиатуры с кодом «ТТ».
В этой раскладке тувинские знаки расположены на клавишах «4» — «ц», «8» — «Y» и « = » — «©». Смещенные таким образом цифры и знак « = » можно набрать сочетанием соответствующей клавиши и кнопки AltGr (правый от пробела Alt).
Замещение клавиш для тувинских знаков неизбежно, так как количество клавиш на всех клавиатурах стандартизировано и не позволяет добавить к клавиатуре дополнительные 3 клавиши, чтобы их закодировать под тувинские знаки.
Выбор клавиш для замещения осуществлялся исходя из особенностей работы журналистов и ученых, в текстах которых цифры используются в разы реже, чем обычные буквы. Во главу угла был поставлен принцип сохранения неизменным расположения клавиш классической русской раскладки с целью облегчения работы журналистов и ученых.
23
электронный научный журнал
«НОВЫЕ
ИССЛЕДОВАНИЯ
ТУВЫ»
www.tuva.asia
№ 1 2010 г.
Выбор цифр «4» и «8» был обусловлен их «соседями» по верхнему регистру — знаками «;» и «*», которые в повседневных тувинских текстах встречаются крайне редко. Чаще можно встретить знак «;», как правило, в бюрократических документах как разделитель маркированного списка, но такие документы чаще всего составляются на русском языке, и значит этот знак находится в зоне доступности в русской раскладке. Буква «ё» и знак «-» в тувинских текстах встречается достаточно часто, поэтому их замещение нецелесообразно. Кажется логичным один из тувинских знаков закодировать под клавишу с обратным слэшем (\), что предлагали наши вебмастеры, но данная клавиша на разных клавиатурах находится в самых разных местах (см. рисунок), что неизбежно будет приводить к путанице.
Поэтому после консультаций с программистами республики мы приняли решение использовать именно клавиши «4», «8» и « = » для расположения тувинских знаков.
Так, тувинские знаки обретут постоянные места вне зависимости от размеров и производителей.
Предлагаемый способ набора тувинских текстов гарантированно работает в текстовых редакторах корпорации Microsoft (Word, Блокнот, WordPad). Стандарт Юникод, которым кодиру-
24
«НОВЫЕ ИССЛЕДОВАНИЯ > ТУВЫ»
электронный научный журнал
www.tuva.asia
№ 1 2010 г.
ются тувинские знаки, обязаны поддерживать все производители программного обеспечения, поэтому можно не волноваться, что текст на тувинском языке, отправленный по электронной почте, не будет прочитан вашим корреспондентом.
Апробацию программа прошла коллегами при разработке обновленной версии сайта Правительства Республики. База данных обновленного сайта была изначально запланирована в кодировке Юникод, и использование предлагаемой раскладки значительно облегчит работу журналистов.
Однако предлагаемый метод набора тувинских текстов столкнется с серьезными проблемами при внедрении в тувинском издательском деле. Большинство редакций газет в Туве использует в своей работе программу Adobe PageMaker устаревшей версии 6.5 или 7, которые несовместимы со стандартом Юникод. Полноценная поддержка этого стандарта корпорацией Adobe была реализована в преемнице Adobe PageMaker — настольной издательской системе InDesign, а также в графических редакторах Adobe Photoshop семейства Creative Suite (CS).
25