Научная статья на тему 'Использование информационных критериев для оценки иерархических диалоговых систем'

Использование информационных критериев для оценки иерархических диалоговых систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
143
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫЧИСЛИТЕЛЬНЫЕ МАШИНЫ / ДИАЛОГОВЫЕ СИСТЕМЫ / ИНФОРМАЦИОННЫЕ КРИТЕРИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мещеряков Роман Валерьевич

Рассмотрена структура иерархической системы обработки информации. Предложено использовать различные информационные оценки для оптимизации структуры.I

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мещеряков Роман Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n article the hierarchical systems structure of information processing is considered. It is offered to use various information estimations for structure optimization

Текст научной работы на тему «Использование информационных критериев для оценки иерархических диалоговых систем»

Вычислительные машины и программное обеспечение

УДК 004.056:336.717

Р. В. Мещеряков

ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННЫХ КРИТЕРИЕВ ДЛЯ ОЦЕНКИ ИЕРАРХИЧЕСКИХ ДИАЛОГОВЫХ СИСТЕМ

Обработка информации в различных информационных системах требует оценки необходимых вычислительных ресурсов. Одна из наиболее эффективных организаций процесса обработки информации — представление ее в виде иерархической системы [ 1 ].

Очевидно, что при оценке требуемой вычислительной сложности и объемов памяти необходимы дополнительные критерии. Цель данной работы — оценка возможности использования информационных показателей информационных диалоговых систем. Рассмотрим различные направления использования диалоговых систем, имеющих преимущественно иерархическую структуру.

Основное назначение диалоговой системы — обеспечение взаимодействия различных сторон. Явным примером диалоговых систем являются интеллектуальные телекоммуникационные вопросно-ответные системы. Основная особенность подобных систем состоит в непосредственном участии в речевом диалоге человек — машина.

Другие распространенные представители этого класса — системы безопасности. Одним из основных элементов практически любой системы служат подсистемы аутентификации и идентификации. Основой данных систем является идентификатор объекта, используемый субьектом доступа в систему. Система при идентификации проверяет соответствие субъекта (объекта) и предъявляемого идентификатора. При этом вступают во взаимодействие две стороны: субъект (объект) и вычислительная система. Очевидно, что отсутствие учета факторов взаимодействия элементов всей системы безопасности может привести к рассогласованию элементов системы.

Следующие яркие представители диалоговых систем — образовательные системы [2]. В данном

случае образуется не только взаимодействие человек — система, но и опосредованное взаимодействие обучающегося, преподавателя и вспомогательного персонала. При этом необходимо учитывать не только текстовую информацию в виде электронных учебников, тестирующих систем, но и интерактивные средства обучения: мультимедиа, online конференции и т. п.

Биологические и медицинские системы выступают, как правило, в качестве информаци-онно-консультационных систем поддержки установления диагноза и реабилитации больного.

Необходимо отметить, что в дан ных с истемах обычно используется одноуровневое взаимодействие, которое, с одной стороны, существенно упрощает проектирование систем, с другой — ограничивает их применение.

Очевидно, что для полноценного проектирования систем необходимо учитывать иерархическую природу диалоговых систем, основанных на обработке естественного языка [3J. Таким образом, для иерархических систем целесообразно использовать общую модель, обобщенно представленную на рис. 1, на котором изображены две стороны — А и 5, ведущие диалог. Движение информации снизу вверх характеризует канал восприятия (распознавания), а сверху вниз — канал синтеза. Каждый выделенный объектоп-ределяется своим набором сведений о системе, мире, правилах преобразований и связей с другими уровнями. В схеме отражены непосредственные взаимосвязи только двух уровней: вышестоящего и нижестоящего, в реальности же существует больше взаимосвязей. Так, на вышестоящих уровнях большое значение имеют знания о мире, в частности сведения о текущей предметной области. Отметим, что на нижестоящих уровнях эти знания о мире теряют свое значение.

Модели диалога

•А' Т ........... .. .. ¿к я

1 1 Назначение Общее назначение Назначение

---------------------------------------— _____ ____ ________-— к

Г' г • 1 •■*' I Цель Цели диалога Цель --1

..........X_____________ -------------* Б:::;:::::::: -

1 Предложение Правила построения предложений Предложение

5, ___________1 ^.............. 1

• >» 'К ......... г

Сигнал • с-м- Сигнал

- > а 1

С 4 -

Внешняя среда

Рис. 1. Общая модель иерархических систем

Очевидно, что для решения задач интеллектуального взаимодействия необходимо привести их в соответствие с общей моделью функционирования системы. Для эффективного функционирования диалоговой системы необходимо, чтобы на каждом уровне иерархии собеседники функционировали ведином поле диалога |3]. При этом необходимо отметить, что в зависимости от вида собеседников и систем модели их поведение может

претерпевать изменения, как сближаясь, так и расходясь. Кроме того, в данных системах требуется решение прямой и обратной задачи формирования сигнала передачи информации от одного собеседника другому. На рис. 2 представлена временная диаграмма передачи информации между двумя участниками диалога. Стрелками отражены реакции участников на изменение целевой установки диалога в ходе обмена информацией.

Таким образом, основой диалоговой системы может служить многоуровневая иерархическая модель, что предполагает:

полное описание моделей поведения как иерархии тесно интегрированных событий с определением соответствующих правил преобразования информации на соответствующих уровнях;

учет метазнаний — предметной области диалога, т. е. возможность прогноза развития событий (направления хода диалога).

В результате основные положения при построении модели диалоговой системы можно свести к следующим:

модели мира субъектов, ведущих диалог, пересекаются, т. е. для них частично общие — знания о мире, определяемые конкретной предметной областью диалога [3];

субъекты всегда по предыстории диалога с определенной вероятностью предсказывают реакцию оппонента.

Очевидно, что диалоговая система, построенная поданным положениям, должна включать решение не только прямой задачи, но и обратной: будут решаться параллельно задачи анализа и синтеза. Кроме того, система в ходе выполнения обработки информации вносит коррективы по формированию цели своей работы.

Обработка информации в диалоговых системах сопряжена с рядом особенностей, отмеченных ранее, что влечет за собой создание определенных критериев качества |4]. Для определения меры соответствия выполнения процесса обработки информации необходимо постоянно проводить оценки.

Для этого прежде всего рассмотрим критерий достоверности преобразований. При обработке информации на различных уровнях иерархии происходит формирование из элементов верхних уровней конфигураций нижних уровней и наоборот. Таким образом, при наличии прямой и обратной цепочек преобразований проводится сравнение результатов преобразований. Будем считать, что преобразование достоверно с заданной точностью, если обеспечивает покрытие характеристиками элементов поля сочетаний не менее заданного |4, 5]. Важно отметить, что при увеличении количества последовательных преобразований между уровнями появятся рассогласования, обусловленные нетолькоошибками преобразований, но и особенностями интерпретации знаний.

Кроме указанных критериев качества диалоговой системы при преобразовании информации предлагается ввести: достоверность; управляемость; надежность; обратимость; такое дополнительное качество, как количество информации (знаний), обрабатываемой в системе.

На рис. 3 представлены две подсистемы Ах и А2, участвующие вдиалоге через внешнююсре-ду ВС. Уровни АГп и А"2| подобны, ибо реализуют подобные функции, такие, как формирование и передача сообщений; кроме того, являются подсистемами. Уровни К12 и К22, реализующие функции приемника, также подобны. Таким образом, функции субъектов диалога должны быть подобны. Можно предположить, что при формировании сообщений используется часть информации по каналу восприятия. Таким образом источник сообщения учитывает возможности приемника сообщения. В данном случае можно сказать, что при формировании и передаче сообщения приемник стремится достичь не только оптимального кодирования [6|, но и достаточного уровня надежности распознавания, используя имеющиеся в его системе сведения о своих возможностях. Некоторые параметры он может использовать, располагая структурой и поведением своего восприятия.

Получаем:

К2=Г\К1), (1)

где А", — вектор значений параметров элемента верхнего уровня; К2 — вектор значений параметров структур элементов нижнего уровня; Г( )

Рис. 3. Две подсистемы диалога

и — прямая и обратная функции форми-

рования параметров элементов верхнего уровня из структур нижнего уровня соответственно.

Очевидно, что чем ближе значения параметров (или, как отмечалось, их покрытие), тем более эффективной будет процедура преобразований. Процедуры сравнения обработанных параметров могут измеряться с помощью различных мер. Данное качество может быть интерпретировано как ограничения, накладываемые на систему обработки знаний. Необходимо учитывать особенности преобразований различных шкал, в которых выражены параметры элементов системы [7].

Классически [5| используются следующие оценки:

,=1 (2)

где М — мера близости; и к] — значения параметров, выраженных в порядковых шкалах.

Необходимо отметить, что данный подход не всегда эффективен при использовании в интеллектуальных системах. Так, в случае выброса одного из параметров объекта значение итоговой функции значительно влияет на саму меру близости. Кроме того, значения могут выражаться в интервальных шкалах или шкалах наименований (например,на уровне семантики или прагматики) [8].

Очевидно, что методы кластерного анализа [5] могут подойти при окончательной категоризации объекта. Так, использование различных пространств состояний может однозначно определить местоположение объекта в семантическом пространстве. Тем не менее предлагается использовать оценку функций, приводящих к конечному состоянию:

У(/5) = Ч>(/2Ь (3)

где ¥(•) — целевая функция определения аттрактора функции;/) и/2 — функции определения движения на соответствующих уровнях иерархии.

Будем считать две функции равными по цели с определенной степенью, если они приобретают

одинаковое значение из области значения функций при некоторых значениях из области определения функций.

Еще одна из используемых классических оценок — определение количества информации [6]. Данный показатель, как правило, используется для оценки систем передачи информации, а также для систем поддержки принятия решения или логического вывода. При определении количества требуемых вычислительных ресурсов для реализации диалоговых систем необходимо учитывать шкалы, в которых выражены сигналы на соответствующих уровнях иерархии диалоговой системы.

Очевидно, что этот показатель может быть применен и клюбым элементам систем обработки информации. Рассмотрим дискретный случай. Примем, что блок обработки информации, на вход которого поступаете потоков (в каждом можетбыть (/состояний), производит некоторое преобразование В, в результате чего на выходе получаем У потоков (в каждом может быть qf состояний) B.sxq^s'xq'.

Оценим количество входящей обрабатываемой информации в битах, при этом сделаем допущение, что вероятностьр нахождения каждого потока s в состоянии ^одинакова. Тогда

S

Pi loS2 (Pi) = ~SP loS2 (p) =

1=1

-iog2(g)=iog2(^/'). (4)

Таким образом, задача разбиения блока обработки информации на несколько блоков может быть представлена как задача нахождения оптимальной иерархии 116]. При этом частная задача определения оптимального числа блоков обработки и количества уровней иерархии представляет

собой задание функционала: arg min R(G), где

Geil

Q — множество представлений процесса обработки информации (с представлением в иерархическом виде) с заданным функционалом R: Q ->[0, + оо). При этом определение функционала представляет собой постановку задачи определения ограничений на оптимизацию процесса обработки информации и по существу — функционал стоимости.

Предположим, что проведено разбиение блока обработки информации на т блоков с сокра-

шением информационной нагрузки на каждый блок. Вместе с тем необходимо выделить особый блок — блок управления Вс, который будет проводить согласование работы различных блоков, а также объединять (собирать) результат (рис. 4). Необходимо отметить, что распараллеливание процесса обработки информации подобным образом проводится достаточ но успешно на различных уровнях обработки: как на уровне элементов процессора (например, на уровне ядра), так и при реализациях в виде кластерных систем.

Рис. 4. Блок управления

Предлагается использовать критерий оценки количества обрабатываемой информации для оптимального распределения вычислительных ресурсов системы. Будем считать критерием оптимальности (или функционалом для задачи оптимизации иерархии ) равенство количеств обрабатываемой информации, определенной по формуле (4):

- ... = Нт. (5)

Очевидно, что при увеличении количества блоков т, на которые разбивается исходный блок обработки информации, количество входящей информации в блоке управления растет. Оптимальным в общем случае будет равенство

Н1 = Н2 = ... = Нт = НВс. (6)

Тем не менее может получиться так, что количество обрабатываемой информации превысит вычислительные возможности, в этом случае необходимо учитывать возможности блока управлениям, е. таким образом изменить функционал нахождения оптимальной иерархии, чтобы функционал стоимости учитывал вычислительные ресурсы каждого блока иерархии системы обработки информации. Для практического применения целесообразно приводить следующий критерий, дополняющий критерий (6):

УвнВс = = У2Н2 = ... = УтНт, (7)

где У,- — вычислительная сложность, реализованная в блоке /.

Таким образом, учитывается не только количество входящей информации, но и вычислительная сложность реализуемой функции обработки данных в блоке. В ряде случаев система обработки информации представляет собой реализацию последовательного или параллельного процесса, который включает преобразование данных, представленных на рис. 5.

Очевидно, что количество обрабатываемых данных в классической постановке вопроса включает расчет информационной энтропии для дискретного и непрерывного случаев [6]:

п

/=1

+00

//(х) = - \ р{х,у)^р(х,у)с1у. (8)

-00

Учитывая, что ценность обрабатываемых данных может различаться от блока к блоку, предлагается согласовывать их функции по показателю информационного наполнения, т. е. формировать обработчиков таким образом, чтобы количество обрабатываемых данных было одинаковым: Н(В,) = И(В2) или стремилось к данному соотношению. При такой постановке возникает вопрос согласования уровней обработки данных в выделенных блоках.

Примем по известному соотношению 7 ± 2 [9] количество одновременно обрабатываемых объектов. Однако обрабатываемые данные могут иметь различную природу и выражаться в различных шкалах. При этом для равновероятного дискретного случая (п принимаем равным количеству объектов) получаем диапазон информационной энтропии 11,6-28,5. Соответственно значение интеграла должно принимать также

Рис. 5. Преобразование данных

1 1 7

заданный диапазон. Кроме того, могут возникнуть сложные сочетания получаемых и обрабатываемых данных.

Очевидно, что информационная ценность получаемых данных после обработки повышается и при последующей обработке может быть сформирована таким образом, что количество информации будет увеличиваться (так как неопределенность результата в общем случае увеличивается).

Предлагается разнесение блоков обработки по информационно-разделенным функциям с соблюдением условий качества системы обработки информации, например как в |4]. Тогда получаем линейный рост функции информационной энтропии по всему процессу обработки информации.

В частности, можно рассмотреть подкласс иерархических систем, в которых на каждом уровне иерархии обрабатывается информация, выраженная в одних шкалах и обладающая одинаковой (или близкой) ценностью. Тогда получаем систему ее обработки, представленную на рис. 6.

Предположим, что первоначально поступают числовые данные. На первом этапе в блоке Вп поступающая информация разбивается на взаимно-независимые участки по условию равно-сти количества информации. Далее в виде данных она поступает на блоки уровня 1 — Вп, Вп, /?,з и преобразуется в порядковых шкалах. Количество информации при этом соответственно уменьшается, так как количество возможных исходов сокращается, и одна информационная ценность увеличивается.

Получаемая после обработки информация с трех блоков поступает на уровень 2 и далее обрабатывается в шкале наименований. Эта ин-

формация также повышает информационную энтропию, но диапазон представлений ее сокращается. Очевидно, что использование прямого расчета количества возможных исходов не может быть оценено ввиду различных видов и неопределенности оценки количества информации. Однако в общем случае информационная энтропия может быть сопоставлена и соотнесена таким образом, что управляемость процессом сохранится. Рассмотренная реализация для иерархических систем может быть использована и для других видов систем обработки информации с возможностью оценки и проверки работоспособности и нагруженности блоков обработки.

В качестве критерия для данного подхода можетбытьпредложено Л/ качество [3], которое позволяет оценить возможность реализации системы обработки информации с точки зрения информационной энтропии. Из этого можно сделать вывод, что система будет работать не только эффективно и прогнозируемо, но и соблюдать условия надежности при обработке данных.

Для иллюстрации предлагаемого подхода рассмотрим систему синтеза и распознавания речи. Речевая система в общем случае рассматривается как диалоговая иерархическая многоуровневая система и представляется цепочкой отображений:

Л/,

Ф„

Фз

Уз

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ф3

Ч>2

V

Ф'3

г г

ф', Ф'2 Ф'з

Ф,

ф',

Ф,

5

г

5*

Мг , (9)

Вп Вп Г Вп

1 4 1

В0

Рис. 6. Обработка информации в иерархических системах

где /•}, <7,, С/ — описание высказываний на разных уровнях иерархии в системах речеобразо-вания и речевое приятия; ср,, ф/ — отобра-

жение описаний; 5, 5* — речевые сигналы; Ми М2— модели мира участников диалога. Стрелки между описаниями и (7, характеризуют взаимосвязи между ними. Реально за этими стрелками должны быть соответствующие модели.

Возможны различные типы связей в речевой системе, например:

Ф. V,

С,

5*

Ч>2 Ч>| , Ч>| _ Ч>2

г-, —> Л —> Л —> Л —>6,

Ог.

<?,; (ю;

(П)

2 -»"Г

Кроме того, возможны биологические обратные связи, включающие участников диалога:

Ф,

Ф,

Ф':

Ф',

V;

V,

<7,

(12)

Приведенные структуры определяются структурой естественного языка. Более того, они замыкаются на очень низком уровне — образования звонких звуков речи, поэтому для нижних уровней иерархии диалоговой системы необходимо обеспечить устойчивость и точность управления. т. е. соблюдение условий (I).

Соотношение (12) можно определить как условие обратимости цепочки преобразований (9) при восприятии и синтезе речевого сигнала и, возможно, речи.

Исходя из сформированного подхода упрошенная модель системы диалога может быть представлена схемой на рис. 7, в которой стрелками указаны направления движения потоков информации. Движение потоков информации снизу вверх характеризует канал восприятия (распознавания), а сверху вниз — канал синтеза. Каждый выделенный объект определяется своим набором сведений о языке, правилах преобразований и связей с другими уровнями.

Рассмотрим взаимное влияние верхних уровней на нижние и наоборот. Очевидно, что смысл предложения накладывает ограничения на состав слов, содержащихся в предложении, а также на их синтаксические связи. Бесспорно, что синтаксические связи слов в предложении также определяют смысл высказывания и его целевую функцию. Известно [6], что буквы в тексте имеют различную вероятность появления и что

Рис. 7. Упрощенная модель системы диалога

вероятность появления следующей буквы зависит от предшествующих. Однако уже при трех и более буквенных сочетаниях эта вероятность снижается. То же самое имеет место и для слов в предложениях. Таким образом, текущий прогноз на уровне букв или слов позволяет снизить области принятия решений при распознавании.

Представляет определенный интерес влияние результатов прогноза развития диалога на уровне модели мира, например на лексическую базу области допустимых решений на уровне фонетических слов. Известно, что для бытового общения достаточно 100—200 наиболее часто употребляемых слов. Естественно, что любая другая специальная предметная область потребует включения своих терминов и понятий, т. е. новых слов, что приведет к расширению лексической базы. Оказывается при этом, что общая лексическая база увеличивается незначительно. С этой целью на основе алгоритмов морфологического и синтаксического анализа 110| проведена оценка лексической базы для предметных областей: компьютерной техники и радиоэлектроники. Оказаюсь, что наиболее часто встречаемые слова в этих областях увеличивают лексическую базу на 30—50 %. Естественно, если ведется текущий прогноз диалога, то область допустимых решений даже в этой лексической базе будет значительно ограничена, следовательно, приведет к повышению надежности распознавания на уровне слов.

Можно предположить, что при использовании Л/-качества количество объектов, одновременно обрабатываемое каждым уровнем, приблизительно одинаково [11]. Однако объекты имеют различные природу и свойства, т. е. представление информации на физическом уровне отличается от ее описания на уровне слов. В частности, информация на уровне сигналов представлена в шкалах интервалов, а на уровне слов — в шкалах наименования и порядка.

Для выделения элементарных объектов физического уровня (уровня звуков) чаше всего используют предварительную сегментацию на квазиоднородные участки звукового сигнала с их последующей классификацией. Множество разнородных сегментов S= {5,}, /=1,2,..., /, где / конечно. Для каждого выделенного объекта мож-ноопределитьсвое тело кластера Кг Используя ка-кую-либо меру близости [12] в данном пространстве, можно и нужно определить образ, в который

попадает искомый сегмент речевого сигнала. Очевидно, что на данном уровне сравнение может происходить в шкалах интервалов и в качестве меры близости использоваться расстояние (2).

С другой стороны, количество информации, обрабатываемой на данном уровне, ограничивается количеством состояний введенных сегментов включаюших основные блоки обработки информации [13, 14]. При этом предлагаемое разбиение блоков обработки информации последовательно классифицирует участки, подлежащие обработке: на первом блоке определяется — голос или не голос (Voice Activity Detector), затем тип участка, его однородность и пр. Это соответствует разбиениям, предлагаемым при оценке (5) — (7).

Следующий уровень описания речевогосиг-нала — параметрический, входом его служит множество элементов MN= {m¡}. В зависимости от длительности цепочки необходимо учитывать связи не только двух последовательно стоящих элементов, но и все находящиеся в цепочке элементы. В данном случае целесообразно применять меру близости (3), формирующую отнесение элемента к группе [15]. Аналогично действуем при повышении уровня к самому верхнему уровню прагматики высказывания.

В качестве иллюстрации разбиения блоков рассмотрим часть системы, отвечающую за синтез речевого сигнала. Известно, что длительность ударного гласного, а также его произнесение зависят от местоположения в слове относительно ударного гласного (предударный, ударный, заударный, неударный) в высказывании [13, 14]. Схема, приведенная на рис. 8, показывает необходимость формирования параметров управления всего высказывания до начала его произнесения.

Формула (9) после определения правил преобразования и баз данных является идеализированной моделью системы синтеза речи. Она может служить в качестве базы для синтеза речи в общем случае (без настройки на диктора). В реальности всегда происходит подстройка параметров речеобразуюшего тракта во время произнесения.

Выберем блок обработки информации: транскрибирование текста. При произнесении текста человек генерирует определенное сочетание частот для создания какого-либо звука, которое в фонематическом тексте выражено фонемой. Отметим, что не существует взаимно однозначного

отображения множества звуков во множество фонем. Сложность нахождения фонетической транскрипции для русского языка состоит в том, что 90 % слов написаны фонематически, а 10 % — не фонематически (традиционно) [14].

Текст

Речевой сигнал

Абзац

Предложение

Слово

Слог

X

Буква

1

Фоноабзац

1 к

Высказывание

1 1

Фонетическое слово

1 1

Дифон

< 1

Звук

Рис. 8. Пример разбиения блоков

Рассмотрим систему, на вход которой поступает орфографический текст с размеченными ударениями и границами синтагм, а на выходе — фонетическая транскрипция текста. На рис. 9, а представлены блоки системы до применения предложенного метода, а на рис. 9,6 — после.

Система транскрибирования проводит различные операции и включает блок обработки слов-исключений, которые не могут быть транскрибированы верно по существующим правилам

языка. Правила фонетического транскрибирования могут быть разделены надве группы: для гласных и согласных звуков, так как на согласные звуки при фонетическом транскрибировании в большей степени влияют последующие звуки, а на гласные — предыдущие и их степень ударности. Блок сводной обработки собирает полученные данные с других блоков и принимает окончательное решение о выдаче последовательности транскрипционных знаков. Оценки по критерию (6) составляют для Я„ — 780, Вг — 1060, Вс — 1382, В5— 864. Таким образом, на выходе системы транскрибирования получаем множество фонетических символов, объединенных в фонетические слова и далее в высказывания. Оптимален при этом процесс обработки информации с применением критериев (5) — (7).

Предлагаемый подход требует использования моделей иерархических систем, что позволит расширить область применения диатоговых систем. В частности, рассмотренные структуры диалоговой системы могут быть использованы в областях систем безопасности, обработки естественного языка, медицинских систем. Возможные траектории изменения состояний системы при обработке информации на различных уровнях иерархии обеспечивают процесс движения по пространству диалога.

Предлагаемые информационные оценки могут служить критериями качества построения систем обработки информации. Кроме того, в зависимости от вида систем необходимо вводить требования поддержания единства пространства диалога в виде многоуровневой обратной связи каждого участника.

б)

а)

Исключения

Транскрибирование

*

Правила транскрибирования

Транскрибирование

Сводная обработка В>

иг

Обработка исключений В.

Обработка гласных В,

Исключения

Обработка согласных Вс

Правила

для гласных

Правила

для согласных

Рис. 9. Блоки системы транскрибировании ло предложенного метода (а) и после (б)

СПИСОК ЛИТЕРАТУРЫ

1. Месеарович М., Мако Д., Такахара И. Теория иерархических многоуровневых систем / Под ред. И.Ф. Шахнова: Пер. с англ. М.: Мир, 1973. 311 с.

2. Интернет-обучение: технологии педагогического дизайна / Под ред. М.В. Моисеевой. М.: ИД "Камерон", 2004. 216 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Мещеряков Р.В., Бондаренко В.П. Диалог как основа построения речевых систем // Кибернетика и системный анализ. 2008. № 2. С. 30-41.

4. Флейшман Б.С. Элементы теории потенциальной эффективности сложных систем. М.: Сов. радио, 1971. 223 с.

5. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Ин-та математики, 1999. 270 с.

6. Шеннон К. Работы по теории информации и кибернегике. М.: Изд-во иностр. лит., 1963. 830 с.

7. Пфанцагль. Теория измерений / При участии В. Баумана и Г. Хубера; Пер. с англ. В.Б. Кузьмина. М.: Мир, 1976. 250 с.

8. Мещеряков Р.В., Бондаренко В.П. Формирование переходов в иерархии шкал речевых систем // Диалог-2003: Матер. Междунар. конф.

9. Миллер Д.Ж. Магическое число семь плюс или минус два: О некоторых пределах нашей способности перерабатывать информацию // Инженерная психология / Под. ред. А.Н. Леонтьева. М.: Прогресс, 1964.

10. Белоногов Г.Г., Новоселов А.П. Автоматизация процессов накопления, поиска и обобщения информации. М.: Наука, 1979. 257 с.

11. Клацкн Р. Память человека: Структуры и процессы / Пер. с англ. под ред. Е. Соколова. М.: Мир, 1978. 319 с.

12. ТУ Дж., Гонеалес Р. Принципы распознавания образов. М.: Мир, 1978. 412 с.

13. Taylor P. Tcxt-to-Speech Synthesis: Cambridge University Press, 2009. 597 p.

14. Лобанов Б.М., Цирюльник. Л.И. Компьютерный синтез и клонирование речи. Минск: Белорус. наука, 2008. 343 с.

15. Конев А.А., Бондаренко В.П., Мещеряков Р.В. Сегментация и параметрическое описание речевого сигнала// Изв. вузов. Приборостроение. 2007. Т. 50, № 10. С. 3-7.

16. Воронин А.А., Мишин С.П. Оптимальные иерархические структуры. М.: ИПУ РАН, 2003. 214 с.

УДК 004.051:007.51

Н.С. Белова, А.Д. Брейман САМОЛЕЧЕНИЕ И ЭФФЕКТИВНОСТЬ ВСТРАИВАЕМЫХ БАЗ ДАННЫХ

В последнее время все интенсивнее развивается рынок портативных устройств. У мобильных вычислительных устройств, таких, как системы телематики, портативные компьютеры, смартфоны, смарт-карты, аэрокосмические системы и др., есть одна общая особенность — ограниченные ресурсы. Для минимизации размеров, снижения затрат или в силу обеих этих причин мобильным вычислительным системам требуются базы данных, которые бы соответствовали их архитектуре, поддерживали их платформы и работали прозрачно для пользователей 11). Именно такие базы данных принято называть встраиваемыми (ВБД).

В БД уже заняли свою нишу на рынке и продолжают доказывать свое право на существование и развитие. К основным преимуществам ВБД относят простоту эксплуатации и существенно

меньшую стоимость [ 1 ]. Простота эксплуатации с точки зрения пользователя достигается за счет прозрачности функционирования базы данных, администрирования ВБД и, в частности, осуществления процесса самолечения ВБД. Сегодня применяют два метода самолечения: метод анализа трасс и метод восстановления из резервной копии [2]. В первом методе трассой называются автоматически собранные данные о работе приложения и его обращениях к БД. Существенный недостаток метода заключается втом, что информация анализируется и обрабатывается с учетом только заранее предполагаемых сбоев. Главный минус метода восстановления из резервной копии очевиден — потеря всех изменений, внесенных в данные начиная с момента последнего резервирования [3). Таким образом, сфера применения каждого из этих методов ограничена:

i Надоели баннеры? Вы всегда можете отключить рекламу.