ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН _______________________________________2008, том 51, №3___________________________________
ИНФОРМАТИКА
УДК 410.51 + 491.550
Академик АН Республики Таджикистан З.Д.Усманов, И.Л.Васильева ЭРГОНОМИЧНАЯ РАСКЛАДКА ТАДЖИКСКОГО АЛФАВИТА НА КЛАВИАТУРЕ МОБИЛЬНОГО ТЕЛЕФОНА
В настоящее время мобильных телефонов с таджикской клавиатурой не существует, однако нельзя исключать того, что потребность в них появится в самом ближайшем будущем. И тогда, следуя тенденциям современной цивилизации, они станут использоваться не только для разговоров, но также и для передачи коротких сообщений (SMS). В связи с последним возникнет необходимость определиться с раскладкой 35 букв таджикского алфавита, проектируя её таким образом, чтобы предоставить пользователям возможно большие удобства при наборе текстов на клавиатуре мобильного телефона. С этой целью первое ограничение, которое, вероятно, следует соблюсти, - сохранить алфавитный порядок расположения букв. Второе, это - осуществить, по возможности, равномерную раскладку букв по клавишам (тогда при раскладке на 8 клавишах: на трех из них разместятся по 5 букв, а на пяти других - по 4 буквы; для случая 9 клавишей: на восьми из них могут размещаться по 4 буквы, а еще на одной - 3 буквы).
Очевидно, что накладываемые ограничения не являются слишком жесткими в том смысле, что оставляют проектировщикам определенный выбор для обеспечения пользователей дополнительными удобствами. Поясним подробнее, о каком выборе идет речь.
У большинства мобильных телефонов клавиши содержат одну цифру и несколько букв, расположенных в алфавитном порядке. При формировании текста сообщения использование необходимого символа осуществляется нажатием соответствующей клавиши, причем в количестве, равном его порядковому номеру среди символов данной клавиши. Вследствие этого при наборе текста количество нажатий клавишей оказывается больше числа символов текста. Полагая, что однократное нажатие любых клавишей (независимо от их положения на клавиатуре мобильного телефона) требует равных трудозатрат, мы можем определить работу, затрачиваемую на набор конкретного текста, через общее число нажатий на клавиши. Этот показатель возьмем в качестве целевой функции для решения задачи об оптимальном размещении букв на клавиатуре мобильного телефона.
1. Формализация задачи. Пусть А= е$(1),а(2),...,а(п) - некоторый алфавит, содержащий п букв, и С = 1,С2,...,СГ - упорядоченное г - множество клавишей, в кото-
рых размещаются наборы букв с сохранением алфавитного порядка, то есть
С = |(/0 +l),...,a(/1)i...,Ci a(/r)3 (1)
Мы полагаем, что г <п,
/ж_! +1 < I,, 5 = 1,..г, причем /0 =0 и 1г =п . (2)
Запись (1) при фиксированных значениях /ж, 5 = 1,..г, будем называть одним из вариантов размещения букв а(к), к = 1,..п, по клавишам Сж, 5 = 1,..г.
Условия (1) и (2) показывают, что мы рассматриваем только такие варианты размещения, в которых сохраняется алфавитный порядок следования букв и ни одна из клавишей не пуста. Очевидно также, что отмеченное в предыдущем пункте ограничение на “равномерное размещение” букв по клавишам здесь не учитывается.
В таком случае общее количество различных вариантов (1) будет зависеть только от числа букв, размещаемых по тем или иным клавишам, в то время как упорядоченность символов не будет иметь значения. Но тогда в согласии с [1] количество различных вариантов определяется числом Сгп2{ сочетаний из п -1 элементов по г -1.
Пусть С, см. (1), - какая-либо фиксированная раскладка. Тогда работа Ж, затрачиваемая на набор некоторого фиксированного короткого сообщения Т0, будет вычисляться по формуле:
г р(я)=1(я)-1(я-1)
Ж(С,Г°) £ А +р(з))р(з), (3)
,$=1 _К5)=1
где е - работа, затрачиваемая на однократное нажатие клавиши; А(к) - суммарное число встречаемости буквы а(к), к — \,...,п,в Т° - сообщении, р(в) = к — 1^ - порядковый номер буквы а(к), /жЧ < к < , на клавише с номером 5 и, вместе с тем, число нажатий клавиши с
номером ^ для извлечения буквы а(к) .
Для того чтобы приспособить формулу (3) к вычислению работы для набора произвольного короткого сообщения Т, вместо А(к) следует использовать Я(к) - математическое ожидание относительной частоты встречаемости буквы а(к) в произвольных коротких сообщениях Т . Тогда получим
г р($)=1($)-1($-1)
ЩС} = е'£ Т. Л(1,_<+р(*))р(*), (4)
5 = 1 ^(^)=1
и Ж (С) будет означать математическое ожидание величины относительной работы, затрачиваемой на набор некоторого произвольного короткого сообщения Т . Очевидно, что величина Ж (С) зависит от характера раскладки С букв на клавиатуре мобильного телефона, в связи с чем имеет смысл решение следующей задачи.
Задача К. Из множества вариантов С размещений определить тот, для которого показатель Ж принимает минимальное значение.
Для решения задачи предложен алгоритм переборного типа. Мы не приводим его описание, поскольку его основу составляет хорошо известное в комбинаторном анализе последовательное перечисление всех способов проведения (г — 1) линий в (п — 1) промежутках между неразличимыми элементами или же окрашивания г цветами п одинаковых объектов, см. [1].
2. Эргономичные раскладки таджикского алфавита на клавиатуре мобильного телефона. Для получения упомянутых раскладок нам следует адаптировать формулу (4) к решению интересующей нас прикладной проблемы. Прежде всего, отметим, что алфавит таджикского языка содержит 35 букв, потому п = 35. Кроме того, поскольку конкретное значение константы в не влияет на выбор оптимальной раскладки, мы полагаем е = 1. Далее в качестве Л(к), к - 1,.. .,35 , примем значения относительных частот встречаемости таджикских букв в таджикском литературном языке. Эти данные в порядке убывания /Лк) приведены в табл. 1, см.[2].
Таблица 1
п Буквы X п Буквы X п Буквы X
1 А 16.55 13 К 2.46 25 И 0.71
2 И 9.63 14 В 2.18 26 Я 0.67
3 О 9.21 15 Е 2.14 27 П 0.68
4 Р 6.61 16 Ш 2.08 28 Е 0.47
5 Д 6.36 17 З 2.01 29 Ч 0.43
6 Н 6.24 18 Л 1.99 30 Ъ 0.42
7 М 5.02 19 Х 1.33 31 И 0.40
8 Т 3.93 20 Г 1.27 32 Г 0.24
9 У 3.70 21 Ф 1.15 33 Э 0.07
10 Б 3.44 22 Ч 0.99 34 Ю 0.06
11 С 3.05 23 к; 0.88 35 Ж 0.03
12 2.73 24 У 0.79
В связи с тем, что формула (4) настроена на определение минимального значения математического ожидания относительной работы, затрачиваемой на набор средне статистического БМБ-сообщения, то получаемую из неё раскладку мы называем не оптимальной, а эргономичной раскладкой.
Далее приводятся результаты исследований случаев 8-и, 9-и и 10-и клавишных мобильных телефонов.
Раскладка на 8 клавишах. Итак, пусть г = 8 . Тогда общее число возможных вариантов размещений букв таджикского алфавита по клавишам будет С^1 = С374 =5 379 616.
Поиск раскладки с минимальной трудоёмкостью Жтп =1.8502 выполнялся переборным спо-
собом. В таблице 2 эта раскладка показана под номером 1. Сведения о ней и о 17 других раскладках со значениями Ж, близкими к Жтп , а также с указанием числа букв, размещаемых на каждой из 8 клавишей, даны в таблице 2.
Таблица 2
Ж (С) Клав 1 Клав 2 Клав 3 Клав 4 Клав 5 Клав 6 Клав 7 Клав 8
1 1.8502 5 5 5 2 3 2 5 8
2 1.8557 5 5 5 2 3 3 4 8
3 1.8597 5 5 6 2 2 2 5 8
16 1.8956 5 5 3 3 4 2 5 8
17 1.8959 5 5 6 1 3 2 5 8
18 1.8969 5 5 5 2 3 3 6 6
Первая строка табл. 2, сообщающая данные о раскладке с минимальной трудоемкостью, изображена на рис. 1 в виде клавиатуры мобильного телефона. Её недостаток состоит в неравномерном распределении количества букв по клавишам, в частности, на последней клавише располагаются сразу 8 букв, что затруднительно реализовать на практике ввиду ограниченной площади клавиши.
✓
А Б В Г Б Д Е Е Ж З
N
ч ✓ /
и й И к Л М Н О П
/ ч
Ч Ч
Р С Т У У Ф ХХ Ч Ц Ш Ъ Э Ю Я
N у N / >
Рис.1.
Как показано в табл. 2, такого же рода недостатки присущи раскладкам с номерами 2 - 17 и лишь 18-я раскладка с несколько большей трудоемкостью ( Ж =1,8969), но уже с 6 буквами на последней клавише, может быть с практической точки зрения принята в качестве эргономичной, см. рис.2.
А Б В Г Б Д Е Е Ж З
И й И К Л М Н О П
Р С Т У У Ф Х Х ЧЦ ШЪЭЮЯ
Рис.2.
Раскладка на 9 клавишах. Возможно, что лицам, принимающим решения, покажется целесообразным осуществить размещение таджикских букв на 9 клавишах. В таком случае при г = 9 перебор (= С|4 = 18 156 204 вариантов позволяет выделить 10 раскладок с наименьшими значениями Ж, см. табл. 3.
Таблица 3
Ж(С) Клав 1 Клав 2 Клав 3 Клав 4 Клав 5 Клав 6 Клав 7 Клав 8 Клав 9
1.6986 5 5 3 3 2 2 2 5 8
1.7041 5 5 3 3 2 2 3 4 8
1.7174 5 5 3 3 2 2 2 4 9
1.7182 5 4 4 3 2 2 2 5 8
1.7237 5 4 4 3 2 2 3 4 8
1.7348 5 5 3 3 1 3 2 5 8
1.7358 5 5 5 2 3 2 4 4 5
1.7363 5 5 3 3 2 2 3 3 9
1.737 5 4 4 3 2 2 2 4 9
1.7403 5 5 3 3 1 3 3 4 8
Наилучший вариант с трудоемкостью 1.6986, записанный в первой строке табл. 3, имеет 8 символов на 9-й клавише. Этот вариант на рис.3 представлен в виде клавиатуры мобильного телефона.
А Б В Г Б
Д Е Е Ж З
И й И К К
Л М
Т У У Ф
Н О П
х х ч ц
Р С
Ш Ъ Э Ю Я
Рис.3.
Перегруженность 9-й клавиши 8-ю буквами имеет место и для других раскладок, а
для
3-й, 8-й и 9-й раскладок на последней клавише располагаются даже 9 букв, что весьма неудобно для набора. С этой точки зрения эргономичной представляется 7-я раскладка с 5-ю буквами на 9-й клавише ( Ж =1.7358), изображенная на рис. 4.
А Б В Г Б
Д Е Е Ж З
И й И
к К л
Р С
М Н
Т У У Ф Х
О П
Х ЧЦ ШЪЭЮЯ
Рис.4.
Раскладка на 10 клавишах. В таком случае г = 10, и перебор Сгп\ = (4 = 52 451 256 вариантов позволяет выделить 10 раскладок с наименьшими значениями Ж, см. табл. 4.
Таблица 4
Ж (С) Клав 1 Клав 2 Клав 3 Клав 4 Клав 5 Клав 6 Клав 7 Клав 8 Клав 9 Клав 10
1.5842 5 5 3 3 2 2 2 4 4 5
1.5932 5 5 3 3 2 2 2 4 3 6
1.5987 5 5 3 3 2 2 2 5 3 5
1.6013 5 5 3 3 2 2 2 3 5 5
1.6022 5 5 3 3 2 2 2 3 4 6
1.6031 5 5 3 3 2 2 3 3 4 5
1.6038 5 4 4 3 2 2 2 4 4 5
1.6042 5 5 3 3 2 2 3 4 3 5
1.6121 5 5 3 3 2 2 3 3 3 6
1.6128 5 4 4 3 2 2 2 4 3 6
Здесь первая раскладка с Жтп = 1.5842, впрочем, так же, как и 9 других с близкими значениями Ж, оказывается вполне эргономичной: по всем 10-и клавишам буквы разложены более или менее равномерно. Клавиатура, соответствующая этому случаю, показана на рис. 5.
Ш Ъ Э Ю Я
А Б В Г Б Д Е Е Ж З | 1 и й И
К К Л | М Н 1 О П
Р С 1 т у У ф х х ч ц
Рис.5.
Институт математики АН Республики Таджикистан,
*
Московский энергетический институт (ТУ), Волжский филиал
Поступило 26.02.2008 г.
ЛИТЕРАТУРА
1. Рыбников К.А. Введение в комбинаторный анализ. - М.: Изд-во МГУ, 1985, 308 с.
2. З.Д.Усманов, О.М.Солиев. - ДАН РТ, 2003, т. 46, № 3-4, с.59-62.
З.Ч,.Усмонов, И.Л.Василева ТАЦСИМОТИ ЭРГОНОМИКИИ АЛИФБОИ ТОЧ,ИКЙ ДАР ТУГМАДОНИ ТЕЛЕФОНИ МОБИЛЙ
Дар макола барои тугмадоннои 8, 9 ва 10-тугмагии телефонной мобилй чунин таксимоти нарфнои точикй муайян карда шудаанд, ки дар онно интизории математикии кори барои нуруфчинии SMS-хабарнои кутон масрафшаванда киммати хурдтаринро кабул мекунад.
Z.D.Usmanov, I.L.Vasileva ON AN ERGONOMIC ARRANGEMENT OF TAJIK ALPHABET ON THE KEYBOARD OF THE MOBILE PHONE
In the article on the basis of minimizing the mathematical expectation of a work expended to typing short messages, an optimal arrangement of Tajik letters on the keyboard of the mobile phone is established.