Неотъемлемой составляющей для построения системы синтеза речи является выбор параметров, обеспечивающих генерацию естественного сигнала. Такие параметры могут включать, например, тип предыдущего/следующего аллофона, слога, слова, предложения и т.д. Определение набора таких параметров для определенного языка базируется на лингвистической и просодической информации. Помимо теоретического подхода, применяется также эмпирический анализ с целью выбора наиболее информативных из них. Так, для русского языка было выбрано 7 аллофонных, 13 слоговых, S словных и 3 синтагматических признака, таких как имя фонемы, предшествующей предыдущей, имя предыдущей фонемы, имя текущей фонемы, имя следующей фонемы, имя фонемы, следующей за следующей, позиция текущей фонемы от начала слога, позиция текущей фонемы от конца слога и т.д.
Моделируемые параметры идеологически делятся на две группы - спектральные и временные. В качестве спектральных используются частота основного тона и мел-частотные кепстральные коэффициенты. Расчет данных параметров выполняется по всей фонограмме из базы данных с окном анализа 25 мс и смещением 1G мс. Временные параметры представляют собой длительности соответствующих аллофонов.
Важным этапом для обеспечения качественного синтезированного сигнала является моделирование функции возбуждения. Наиболее качественную работу показывает алгоритм [2], основанный на моделировании формы этой функции при помощи двух фильтров (единичных импульсов - (1) и белого шума - (2)),
M/2
Hv (z) = X h(l)z-l , (1)
l=-M /2
Hu ( z) =-L--, (2)
1 -X g (l ) z-l
l=1
для вокальной и шумовой составляющих соответственно, коэффициенты которых h(l) и g(l) вычисляются на этапе обучения. Порядки фильтров M и L равны 512 и 256 соответственно. Примеры синтеза показывают, не вдаваясь в детали качества воспроизведения аллофонов, что ритмика фразы сохраняется. Данный факт демонстрирует важную характеристику основанного на HMM синтеза речи: возможность имитировать просодические характеристики корпуса, который был использован при построении модели голоса. Также стоит отметить, что для построения модели голоса достаточно небольшого количества материала, однако отсутствие некоторых элементов в базе данных существенно влияет на качество, что делает процесс подготовки звуковой базы данных также очень важным при разработке систем синтеза.
Автором предложен подход к построению системы синтеза русской речи на основе скрытых марковских моделей. Принцип основан на методе, в котором соответствующие параметры извлекаются из скрытых марковских моделей, векторы наблюдений которых содержат спектральные характеристики, значения основного тона и длительности речи. Экспериментальные результаты показывают, что русская речь может быть успешно параметризована и произвольное предложение может быть синтезировано из полученных моделей.
1. Maia R., Zen H., Tokuda K., Kitamura T., Resende F.G. Towards the development of a Brazilian Portuguese text-to-speech system based on HMM // Proceedings of the European Conference on Speech Communication and Technology (EUROSPEECH). - Geneva, Switzerland, 2GG3. - P. 2465-246S.
2. Maia Ranniery, Toda Tomoki, Zen Heiga, Nankaku Yoshihiko, Tokuda Keiichi. An Excitation Model for HMM-Based Speech Synthesis Based on Residual Modeling // 6th ISCA Workshop on Speech Synthesis. -Bonn, Germany, 2GG7. - P. 1315-131S.
Чистиков Павел Геннадьевич - ООО «ЦРТ», научный сотрудник, аспирант, [email protected] УДК 372.862,681.5
АВТОМАТИЗАЦИЯ ОЦЕНКИ И ВВОДА РЕЗУЛЬТАТОВ ВЫПОЛНЕНИЯ ДОМАШНИХ ЗАДАНИЙ В ЛОКАЛЬНЫЙ ЭЛЕКТРОННЫЙ ЖУРНАЛ УСПЕВАЕМОСТИ
Ю.В. Китаев
Рассматривается построение и функционирование процесса автоматизированного сбора и оценки выполнения домашних заданий с использованием интернет-технологий в дистанционном обучении. Ключевые слова: дистанционное обучение, интернет-технологии.
Контрольная проверка знаний может производиться различными способами, в том числе в процессе выполнения домашних заданий. Для дисциплин с преобладанием точных наук нетрудно подготовить пакеты домашних заданий, в которых проверка ответов может быть автоматизирована, сокращая время, затрачиваемое преподавателем, и уменьшая риск неправильной оценки. Один из способов такой автоматизации, разработанный автором, представлен на рисунке. Обучающиеся (студенты) получают варианты домашних заданий с разовыми паролями. Ответы пересылаются на электронный почтовый ящик, который преподаватель открывает для этих целей. Специальная программа на компьютере преподавателя
Научно-технический вестник информационных технологий, механики и оптики,
2012, № 3 (79)
считывает ответы из почтового ящика, оценивает их и записывает результаты в электронный локальный журнал (ЭЛЖ) [1].
Рисунок. Схема автоматизированного сбора результатов домашних заданий в ЭЛЖ
Ответы оформляются по специальной форме, включающей следующие поля: фамилия и инициалы, номер группы, дата и время, пароль, номер варианта задания, ответ/ответы. Причем, запись делается не в самом письме, а в теме сообщения, что значительно ускоряет и упрощает обработку ответов. Затем письмо отправляется на электронный почтовый ящик преподавателя (SMTP-сервер).
Программа, установленная на компьютере преподавателя, осуществляет сбор ответов с почтового сервера и может работать, как постоянно в режиме сервиса (службы), так и по запросу преподавателя. Она содержит модули, которые осуществляют опрос POP-сервера электронной почты преподавателя, выделение компонентов темы сообщения, заполнение или обновление записей в ЭЛЖ. Программа написана в среде MS Excel с использованием VBA и дополнительных библиотечных модулей. Ниже приводится фрагмент, выделяющий «тему - Subject» из электронного письма и заполняющий массив строк с ответами, персональными данными и другой информацией. Set POP3Msg = Session.GetMessage
For Each POP3Email In POP3Msg.Senders
TextSubj(i) = POP3Email.Subject Next
После разбора текстовых строк на компоненты [2], вызывается модуль, обновляющий электронный локальный журнал преподавателя в соответствии с результатами проверки домашнего задания.
Предлагаемая структура и содержание программы для проверки домашних заданий позволяет существенно ускорить проверку ответов, автоматизировать заполнение ЭЛЖ и устраняет возможные ошибки.
1. Китаев Ю.В. Автоматизация ведения электронного журнала и интернет технологии // Сборник тезисов конференции «Оптика и образование». - СПб: СПБГУ ИТМО, 2010. - С. 48-49.
2. Попова С.В., Ходырев И.А. Извлечение ключевых словосочетаний // Научно-технический вестник информационных технологий, механики и оптики. - 2012. - № 1 (77). - С. 67-71.
Китаев Юрий Васильевич - Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кандидат технических наук, ст. научный сотрудник, доцент, [email protected]
УДК 617+616.8+615.1/.4
РАЗРАБОТКА АВТОМАТИЗИРОВАННОГО КОМПЛЕКСА ВЫПОЛНЕНИЯ НЕЙРОХИРУРГИЧЕСКИХ ОПЕРАЦИЙ Ю.А. Скупов, С.С. Киселев, А.Д. Аничков, Ю.З. Полонский, А.Н. Серегин
Проанализированы известные в настоящее время системы для стереотаксической нейрохирургии. Приведен принцип расчета координат внутримозговых мишеней и метод наведения на них. Описан новый автоматизированный комплекс и принцип его работы.
Ключевые слова: стереотаксическая нейрохирургия.
Стереотаксическая хирургия является малоинвазивным методом хирургического вмешательства, когда доступ осуществляется к целевой точке внутри тела или толщи тканей какого-либо органа с использованием пространственной схемы по заранее рассчитанным координатам по трехмерной декартовой системе координат.
Стереотаксическое направление в нейрохирургии неуклонно развивается. Разработаны и успешно применяются стереотаксические операции на головном, спинном мозге и мозжечке. Объектами вмешательства являются самые разнообразные патологические процессы: паркинсонизм, торсионная дистония, гемибаллизм, болевой синдром, детский церебральный паралич, хореические и миоклонические гипер-кинезы, аневризмы мозговых сосудов, опухоли мозга, внутримозговые кисты и абсцессы, эпилепсия [1].
Научно-технический вестник информационных технологий, механики и оптики, 2012, № 3 (79)