Научная статья на тему 'Об оптимальной раскладке символов на клавиатуре'

Об оптимальной раскладке символов на клавиатуре Текст научной статьи по специальности «Математика»

CC BY
271
68
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Об оптимальной раскладке символов на клавиатуре»

линеиного элемента получить устройство, вычисляющее любую непрерывную функцию с любой наперед заданной точностью. Нейронная сеть с произвольной функцией активации может аппроксимировать произвольную непрерывную функцию. При этом достаточно трехслойной сети с одним скрытым слоем. Точность решения можно повысить путем увеличения числа нейронов в скрытом слое.

Выбор оптимального маршрута осуществляется с помощью модуля Neural Analyzer, входящего в состав пакета Deductor Professional [2]. Он представляет собой систему анализа данных на основе нейронных сетей.

Исходными данными для расчетов является матрица Z:dim Z=60x5, отражающая статистические данные о выполненных перевозках КТГ за несколько лет (см. рисунок).

При активации модуля Neural Analyzer открывается мастер обучения сети. Осуществляется настройка полей. Поля длина, ширина, высота и

ОБ ОТИМАЛЬНОЙ РАСКЛАДКЕ СИМВОЛОВ НА КЛАВИАТУРЕ

сцепка задаются как входные переменные, а поле себестоимость как выходная переменная. Далее устанавливаются параметры сети, где можно выбрать алгоритм построения сети и активационную функцию, параметры обучения, условия остановки. После этого проходит обучение сети и расчет тестовых примеров, а также отображается график выходов сети (заданная точка и расчетная) и представляется информация о построенной нейронной сети.

Полученные результаты нагими практическое применение в компании по международным перевозкам КТГ г. Твери.

Список литературы

1. Романов В.П. Интеллектуальные информационные системы в экономике. - М.: Экзамен, 2003. - 496 с.

2. BaseGroup Labs, Web: http://www.basegroup.ru_____*

З.Д. Усманов

В 1867 г. К. Шоулс и С. Суле представили свое изобретение - первую в мире печатающую машинку. Можно предположить, что в ту пору авторов заботило прежде всего продвижение собственного, принципиально нового механического устройства и в меньшей степени то, каким образом следует располагать буквы на его клавиатуре. Раскладка, примененная ими, оказалась достаточно бесхитростной: на клавишах, сконструированных в два ряда, латинские буквы размещались в алфавитном порядке. Дефекты такого решения проявлялись в случаях скоростного печатания. При последовательном нажатии соседних клавишей соответствующие им исполнительные механизмы - молоточки с закрепленными на них литерами - нередко зацелялись друг за друга, застопоривая дальнейшую работу пишущей машинки. В последующем К. Шоулс, пытаясь устранить этот недостаток, предложил другую раскладку, в которой буквы, наиболее часто встречающиеся в английских текстах парами, разместились в разных местах клавиатуры. Такая раскладка получила название по шести первым буквам верхнего ряда клавиатуры - QWERTY.

Таким образом, необходимость решения проблемы раскладки впервые была инициирована конструктивными особенностями печатного механизма. Однако у этой проблемы выявилась и другая, не менее важная сторона. Дело в том, что от характера раскладки букв на клавиатуре зависит скорость набора. Поэтому вполне естественно бы-

ло ожидать появление исследований именно в этом направлении, что и было осуществлено в 1930-х годах профессором Двораком. Детально изучив технику печатания, он предложил новую раскладку, в которой с учетом частот встречаемости латинских букв наиболее частые из них разместились в среднем ряду, менее частые - в верхнем и редкие - в нижнем рядах. Кроме того, все гласные буквы расположились в левой части клавиатуры. По утверждению А. Дворака, его раскладка в сравнении с QWERTY позволила увеличить скорость печатания на 70 %. Результаты соответствующих экспериментов подтвердили преимущества такой раскладки, но, несмотря на это, она так и не появилась на клавиатуре пишущих машинок.

Между тем изобретение компьютеров и по-

следующие их усовершенствования должны были вновь привлечь внимание к проблеме раскладки. Однако этого не произошло. Инертность и консерватизм человеческого мышления способствовали тому, что QWERTY успешно перебралась и на клавиатуры компьютеров, с каждым днем все

более и более укрепляя свои позиции. Ныне даже трудно поверить в то, что когда-нибудь по тем или иным причинам она уступит место какому-либо

своему конкуренту. Тем не менее для английского языка проблема "оптимальной" раскладки символов на клавиатуре компьютера остается нерешенной.

41

Удалено:

Удалено: . После этого

Отформатировано

Отформатировано: Шрифт: курсив

Удалено: <яр>

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано:

интервал Перед: 1 пт

Удалено: .).

Удалено:1

1

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано

Отформатировано

Отформатировано

Отформатировано: русский (Россия)

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано: русский (Россия)

Отформатировано

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано

Отформатировано

Отформатировано: Шрифт: 10 пт

Отформатировано: Отступ: Первая строка: 0 см, Поз.табуляции: 2,12 см, по левому краю + нет в 7,62 см + 15,24 см

Продвижение в этом направлении уже имеется программист из фирмы Cray (США) р. Клауслер недавно обнародовал свой подход к решению проблемы для английской клавиатуры1. Им предложена алгоритмическая процедура для вычисления "суммарной работы", затрачиваемой на набор текста фиксированной длины (порядка 20 Mb) для заданной раскладки символов на клавиатуре. Из 4096 случайно выбранных раскладок предпочтение отдается той, для которой принятый критерий качества принимает наименьшее значение. Определенная таким образом приоритетная раскладка оказывается также более эффективной в сравнении с раскладками QWERTY и Дворака.

В методическом подходе Клауслера просматриваются два узких места:

• нет статистического обоснования того, что случайная выборка из 4096 раскладок является репрезентативной; следовательно, полученный им результат нельзя принимать как окончательный;

• достаточно субъективной представляется совокупность количественных показателей, введенных эвристическим путем для характеристики элементарных работ, затрачиваемых на нажатие той или иной клавиши; по этой причине нет никакой уверенности в том, что окончательный результат является устойчивым по отношению к слабым изменениям упомянутых количественных показателей.

Отмеченные недостатки указывают на незавершенность имитационной модели Клауслера даже для теоретического решения вопроса об оптимальной раскладке латинских букв на английской клавиатуре.

В заключение обзора обратим внимание на характер раскладки букв русского алфавита на пишущей машинке (ГОСТ 6431-90) и компьютерной клавиатуре (ГОСТ 14289-88, стандарт для среды MS DOS и стандарт для среды MS Windows)2. Различия этих случаев наблюдаются в позициях управляющих, цифровых, функциональных, символьных и прочих клавишей на клавиатуре. Что касается раскладки букв, то она абсолютно одинакова для них и представляется достаточно обоснованной. В упомянутой ссылке, однако, не содержится описания того, какие принципы были положены в основу такой раскладки.

В настоящей статье, продолжающей исследования, начатые в материале, опубликованном в 2003 г. в № 3 настоящего журнала, предлагается критерий для оптимальной раскладки символов на компьютерной клавиатуре.

Формализация критерия. Пусть K - конечное множество, состоящее из n клавишей K1,K2,...,Kn , причем каждой клавише Kj при-

1 QWERTY.HTM

2

http://www.quickkeyboard.nm.ru/standart.htm

писано некоторое положительное число к! , указывающее количество элементарной работы, ко-^-торую следует затратить для того, чтобы "активизировать" К!. Будем считать, что нумерация клавишей осуществлена таким образом, что

к, > к2 > ... > к„ > 0 . (1) Пусть А конечный набор символов а1,а2,...,ап (например, буквы какого-либо естественного языка Ь и, возможно, некоторые знаки препинания), предназначенных для раскладки \ на клавишах множества К. Предположим, что \ нам известны частоты X,, X 2,..., Хп встречаемости ^ этих символов в репрезентативных текстах текстах), написанных на языке Ь, причем без ог- V у раничения общности можем принять условие X, > X2 > ... > Хп > 0 . (2)

А_ 1 2 п

Известно, что п символов на п клавишах можно расположить п! различными способами. Воз-_1|,\1\ можные варианты раскладок будем записывать в

Удалено: П. Клауслер -Удалено:п

виде подстановки n-й степени:

Kj.K,,Kn

P(aK1,aK2,—,aKn) =

т

указывая тем самым, на каких клавишах размещаются те или иные символы. Здесь аК1 может быть любым символом из набора А, при этом аК1 ^ аК , если 1 ^ j . Сопоставим каждому вари- 1 \ I1',/,

Ю

анту количественный показатель

п

КаК1,ак2>->аКп) = Е Х(аК1 )к1 ,

1=1

где Х(аК1) - частота встречаемости того символа, который в данном варианте присваивается клавише К1. Этот показатель будем называть суммарной работой, которую необходимо затратить пользователю для набора репрезентативного текста на компьютерной клавиатуре с фиксированной раскладкой символов Р(аК1,аК2,...,аКп) .

Критерий раскладки. Из всех возможных раскладок предпочтение следует отдать той, для которой 1(аК1,аК2,...,аКп) принимает минимальное значение.

В настоящей статье получен следующий результат.

Теорема. В условиях (1) и (2) на раскладке Р(ап,ап_,,...,а1) суммарная работа, затрачиваемая на набор репрезентативного текста, имеет минимальное значение:

т1п ] (аК1 ,аК2 >—>аКп ) = Лап>ап-1>">а1)= =Хпк1 +Хп_1к2 + - +Х1кп-

Иными словами, это значит, что наилучшей является такая раскладка, в которой чаще встречающиеся символы размещаются на менее трудоемких клавишах и наоборот.

Отформатировано: русский (Россия)

Удалено:

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Удалено:

Отформатирован^ ■ ■■ [2241

Удалено:

Отформатировано . [225]

Удалено:

Отформатировано ... [226]

Отформатировано . [227]

Удалено: 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Отформатировано . [228]

Код поля изменен

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

1229!

1230!

[23Ц

!232i

I233L

im

Код поля изменен

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

[235]

[236]

[237]

[238]

I2M

[240]

[241]

[242]

Удалено: непосредственно

Удалено: [1]

Отформатирован^ ■■■ [243]

Отформатировано . [244] Отформатировано _ [245]

Отформатирован^ _ [246] Отформатирован^ ■■■ [247]

42

Замечание 1. Отметим, что если бы нас интересовал вопрос о наихудшей раскладке символов по клавишам компьютерной клавиатуры, то таковой оказывается Р(а1,а2,...,ап), причем ей соответствует наибольшая суммарная затрачиваемая работа на набор И-текста:

тах 1(аК1,аК2,...,аКп) = 1(а1,а2,...,ап)=

= Х1к1 + х 2к2 +... + \,кп.

В такой раскладке, очевидно, чаще встречающиеся символы располагаются на самых трудоемких клавишах, а редкие символы - на легко доступных клавишах.

Замечание 2. В случае если число т клавиш оказывается больше числа п символов, то исходный набор символов А можно пополнить фиктивными символами ап+1,ап+2,...,ат , приписав им нулевые частоты встречаемости Хп+1=Лп+2=~=Ят= =0. После этого можно воспользоваться результатами теоремы.

Доказательство теоремы осуществляется методом математической индукции. Вначале утверждение теоремы проверяется для п=2. В этом случае имеются лишь две раскладки Р(а1,а2) и Р(а2,а1) , причем именно вторая, как это утверждается в теореме, является наилучшей, поскольку

1(а2,а1) = Х2к1 + Х1к2 < 1(а1,а2)=

= ^чк + Х 2к2

вследствие условий (1) и (2).

Теперь предположим, что теорема верна при п=8. Это значит, что раскладка Р(а5,а5_1,...,а1) является наилучшей и

Ла^,!.-.^) =^к1 +^_1к2

+... + А.1к5 < 1(ак1,ак2.".ак*) '

Докажем теорему для значения п=8+1, то есть установим, что раскладка Р(а5+1,а5,...,а1) является наилучшей.

Будем говорить, что две раскладки совпадают по одному символу, если у них на одной и той же клавише размещается один и тот же символ.

Разобьем множество {Р(аК1, аК2, ..., аК(5+1))} всевозможных раскладок 8+1 символа по 8+1 клавишам на два подмножества Q1 и Q2 . В состав Q1 включим такие раскладки, которые совпадают хотя бы одному из 8+1 символов с раскладкой Р(а8+1,а8,...,а1). Что касается Q2 , то оно содержит все прочие раскладки.

Проверим, что для любой раскладки из подмножества Q1 затраты суммарной работы на набор И-текста оказываются не меньше, чем для наилучшей раскладки, для которой эта работа определяется как

Ла8+1 ,а8 >->а1) = ^8+1к1 + Х*к2 + ••• + +^8_1+2к1 + ... + *А+1- '

В самом деле, пусть

Р(аК1,аК2 , —'а8_|+2>-"> аК(8+1) ) = К1,К2>">К1>">К!+1 ^аК1, аК2 , •••,а8—1+2 , .">аК(8+1) _

одна из таких раскладок, которая совпадает с наилучшей по символу а8—1+2, размещенному на клавише К1 . При сравнении работ, затрачиваемых на печатание И-текста на клавиатурах с двумя такими раскладками, различие возникает за счет работ по нажатию 8 других клавиш (на них расположены символы, отличные от а8—1+2). Однако это значит, что для оценки суммарной работы мы, по существу, оказываемся в ситуации, когда п=8. Принимая во внимание предположение, сделанное ра-^ нее, получим, что

I(аК1,аК2 , —,а8_1+2,."> аК(8+1) ) >

> 1(а8+1,а8,...,а8_1+2,...,а1),

то есть суммарная работа на печатание К-текста на клавиатуре с раскладкой из подмножества Q1 не меньше, чем на клавиатуре с оптимальной раскладкой.

Теперь обратимся к подмножеству Q2 . Его элементами являются такие раскладки, которые ни по одному символу не совпадают с наилучшей раскладкой. Рассмотрим одну из них, отметив в ней клавишу К1 (1 Ф 1), на которой размещается символ а8+1 (с наименьшей частотой встречаемо-

сти):

Р(аК1>аК2>. •,а8+1... >аК(5+1))

К1,К2 ,...,К1,. •,К8 + 1 1

----- ч аК1'аК2> •••,а8+1,. ••>аК(5+1) ,

Сопоставим ей следующую раскладку

Р(а*+1>аК2>- ••,аК1,.. 'аК(5+1))

К1,К2 •,К8 + 1 1 ,

ч а5+1'аК2' •••,аК1,. ">аК(5+1) ,

которая отличается от предыдущей всего лишь транспозицией символов а8+1 и аК1 . Сравнивая суммарные работы, выполняемые на этих раскладках, получим

1(аК1 ,аК2 '—,а8+1 >.">аК(5+1) ) -1 (а5+1,аК2 ,...,аК1 >.">аК(8+1) ) =

= А,(аК1)к1 +^8+1к1 _ ^8 + 1к1 _ Х(аК1)к1 =

= (к, _к1)(Х(аК,)_X8+1) > 0 в силу (1) и (2). Однако раскладка

'(а5+1'аК2'...'аК1'...'аКп) п

жеству Q1 , и потому 1(а8_

2,...,аК1 ,...,аКп) >

43 |

Отформатировано: русский (Россия)

Отформатировано: русский (Россия)

Код поля изменен

Отформатировано: русский (Россия)

Отформатирован^ . [2461

Отформатирован^ ■ ■■ [2491

Удалено:

Отформатировано

Отформатировано [

Отформатировано

Отформатировано

Отформатировано Г

Отформатировано

Отформатировано Г

Отформатировано^

Отформатировано

12501

12511

12521

12531

[2541

[2551

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12561

12571

Удалено:

[2581

Отформатировано Г . [2591

Отформатировано . [2601

Удалено: всего

Отформатировано Г

Отформатировано [

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано [

Отформатировано

Отформатировано

Отформатировано

Отформатировано

Отформатировано

[2611

[2621

12631

[2641

[2651

12661

[2671

12681

12691

[2701

[2711

[2721

[2731

Отформатировано

[2741

Отформатировано

Отформатировано

Отформатировано[ . [2751

Отформатировано

Отформатировано

^Отформатировано

Отформатировано

[ ■■■ [2761

■■■ [2771

Отформатирован^ ■■■ [2781

> Да s+1>as>•••>al) . Но тогда и •Т(аК1>аК2>'">^+1>

д__________________________________

•••,aKn) > J(as+1,as,•••,a1) , то есть затраты суммарной работы на печатание ^текста на любой раскладке из Q2 также не меньше, чем с помощью оптимальной раскладки.

Теорема доказана.

Замечание 3. По аналогии с приведенным доказательством устанавливается справедливость утверждения, высказанного в замечании 1.

Как было сказано ранее, раскладка английского алфавита по клавишам компьютерной клавиатуры не является оптимальной. Однако подобная ситуация имеет место для большинства европейских языков, в основу которых положен латинский алфавит. Настоящая работа в части приложения адресуется прежде всего тем естественным языкам, для которых еще не утверждены национальные стандарты компьютерной клавиатуры.

На пути практического применения полученных результатов необходимо определить объем репрезентативного текста и значения частот Х1 встречаемости букв (возможно, и некоторых знаков препинания) в текстах, написанных на интересующем нас языке. Для этих целей подготавливается выборка из 100-150 случайно взятых страниц, которая, вероятнее всего, окажется достаточной для получения достоверных результатов. Затем с шагом в 5 страниц осуществляется обработка все возрастающего объема случайной выборки и контролируется процесс сходимости частот встречаемости символов. Начиная с некоторого объема, вариации функции распределения частот практически прекращаются, и последующая обработка становится бессмысленной. Случайную выборку такого объема следует рассматривать как репрезентативную, а извлекаемые из нее частоты встречаемости символов их окончательными значениями.

Интересно отметить, что предварительные исследования, проведенные для английского, русского и таджикского языков, показали, что приблизительно 25 страниц случайной выборки текстов во всех случаях являются репрезентативными, статистическая обработка которых позволяет подсчитать достаточно точно значения частот встречаемости букв.

Еще одна группа параметров, влияющая на выбор оптимальной раскладки символов на клавиатуре, - элементарные работы к1 при ^нажатии .на клавиши. Путем усреднения мнений програм-

будет провести исследование устойчивости оптимальной раскладки в зависимости от вариации значений к1 . Если такое исследование приведет к удовлетворительным результатам, то оптимальная раскладка согласно доказанной теореме будет иметь вид:

Код

поля изменен

мистов-экспертов, владеющих способом 10-пальцевого печатания, определяются показатели трудоемкости для каждой клавиши, то есть значения к1 .

Очевидно, что вместо метода экспертных оценок могут быть использованы и другие методы. Однако какой бы из них не был применен, полезно

Отформатировано: русский (Россия)

-{^Удалено: ,

Удалено: ,

44

P(an>an-l>'">ai) =,____

K1,K2,...,Ki,...,Kn

В случае, если для пары клавиш, например К и К!+1, соответствующие им трудоемкости оказываются равными (к1 = кк+1), то, по крайней мере, имеются две оптимальные раскладки (они разли-

чаются тем, что в них символы ап_1+1 и ап_, размещаемые соответственно на К и К1+1, меняются местами При наборе К-текста на обеих раскладках суммарные затрачиваемые работы одинаковы по величине. В этом случае появляются дополнительные возможности выбора, в частности, можно воспользоваться информацией о частотах встречаемости пар букв.

МОДЕЛИРОВАНИЕ ПРОЦЕССОВ УПРАВЛЕНИЯ ПАССИВНЫМИ ОБЪЕКТАМИ В ТАКТИЧЕСКИХ ТРЕНАЖЕРАХ

В.Ю. Андреев, А.Ф. Базлов, А.А. Веселое

Тренажерные системы являются одним из приоритетных направлений развития компьютерных технологий уже довольно длительное время. Тенденция замены обучения в боевых условиях тренировкой на тренажере особенно ярко проявляется в подготовке операторов сложных технических систем. Причем если объектом внимания при обучении в прошлом были технический профессионализм плюс соблюдение установленных принципов, правил и порядка действий, то на современном этапе развития тренажерного обучения обращается внимание на оптимизацию работы членов экипажа (группы) с максимальным использованием его ресурсов. Важное значение приобретают решения, принимаемые руководителями, планирование и затем уже исполнение общего плана всей группой обучаемых. Именно эти тенденции обусловливают актуальность разработки тактических тренажерных систем. К таковым относятся тактические тренажеры для обучения экипажей кораблей различных классов.

Отличительной особенностью таких тренажерных комплексов является высокая сложность и многообразие проблемных ситуаций, используемых в процессе обучения. Это связано с тем, что в тренажерах данного вида роль обучаемых не определяется жесткой схемой, а предполагает творческий характер действий - решение одной и той же задачи может достигаться множеством способов.

Для любого тренажера важнейшей составляющей является система подготовки и поддержки сценария проведения занятия, который определяет поведение внешней по отношению к обучаемым среды. Современный тренажерный комплекс включает в себя не только модели технических систем, непосредственно управляемых обучаемыми (активные объекты), но и модели систем и объ-

ектов, образующих обучающую среду (пассивные объекты). Поведение таких объектов используется руководителем обучения как средство создания разнообразных проблемных ситуаций, требующих от обучаемых принятия определенных решений. В случае тактического тренажера сложность и многообразие вариантов поведения различных

объектов обучающей среды позволяют рассматривать управление обучающей средой как самостоятельную проблему, возникающую при разработке тренажера.

В настоящее время преобладающим подходом к решению данной проблемы является использование ручного управления обучающей средой со стороны преподавателя. В ходе проведения занятия он вынужден постоянно контролировать состояние объектов обучающей среды и изменять его для реализации замысла тренировки. При этом

Удалено:1

Удалено: .

Удалено: ),

Отформатировано: русский (Россия)

Отформатировано

Отформатировано: русский (Россия)

Отформатировано:

Граница: сверху: (двойная линия, Авто, 0,75 пт линия, От текста: 6 пт Просвет: )

Удалено:

Удалено:,

Отформатировано: Отступ: Первая строка: 0 см

Отформатировано: Шрифт: 10 пт

Отформатировано: Отступ: Первая строка: 0 см, Поз.табуляции: 2,12 см, по левому краю + нет в 7,62 см + 15,24 см

45

<an >an-l> •••> an-i+l > •••> ai >

i Надоели баннеры? Вы всегда можете отключить рекламу.