Научная статья на тему '2012. 04. 029. XIV международная конференция SPECOM' 2011 «Speech and computer (речь и компьютер)». (обзор)'

2012. 04. 029. XIV международная конференция SPECOM' 2011 «Speech and computer (речь и компьютер)». (обзор) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
85
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Потапов В. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2012. 04. 029. XIV международная конференция SPECOM' 2011 «Speech and computer (речь и компьютер)». (обзор)»

2012.04.029. XIV МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ SPECOM' 2011 «Speech and Computer (Речь и компьютер)». (Обзор).

XIV Международная конференция SPEC0M'2011 «Speech and Computer (Речь и компьютер)» состоялась в период с 27 по 30 сентября 2011 г. в Казанском (Приволжском) федеральном университете. Объектом исследований являлись как устная и письменная речь естественного языка, так и другие объекты исследования в смежных дисциплинах, начиная от искусственного интеллекта и заканчивая биомедициной. В центре интереса участников конференции находились следующие проблемы: автоматическое распознавание устной речи; кодирование и передача речевого сигнала; автоматическое понимание устной речи; обработка многоязычной речевой информации; обработка мультимодальной и мультимедийной речевой информации; идентификация и верификация говорящего по голосу и речи; идентификация эмоционального состояния говорящего по голосу и речи; идентификация языка и акцента говорящего по речи; анализ и моделирование устноречевого дискурса; лингвокриминалистические системы; системы обработки языковой и речевой информации в промышленности; речепроизводство и речевосприятие; моделирование восприятия спонтанной устной речи; системы преобразования «текст - речь»; автоматические системы устно-речевого диалога; математическое и концептуальное моделирование естественных механизмов порождения и восприятия устной речи; лингвистические и паралингвистические коммуникативные стратегии; системы автоматического перевода; новые технологии в лингводидактике; речевые и языковые базы данных; перспективы эволюции речевых технологий; автоматическая обработка текста; экспертные системы; кодирование и декодирование устной и письменной информации; акустическая и лингвистическая стеганография и криптография; тестирование систем автоматического распознавания речи; измерение разборчивости речевой информации, передаваемой по различным каналам связи; речь в шумах и помехах; использование речевой информации в робототехнике.

В докладе (11) обзор языков на территории современной мультилингвальной России с приведением полезных статистических данных позволяет сделать ряд значительных заключений: 1) для изучения вопроса различных форм языковой миграции, а

также характеристик устной речи при изучении языков бывшего Советского Союза и современной территории Российской Федерации представляется необходимым учет языков стран СНГ и целого ряда бывших советских республик; 2) необходимо обратить особое внимание на проблему процесса исчезновения языков в условиях многонациональной России; 3) языки, на которых говорят в автономных республиках и регионах Российской Федерации и странах СНГ, требуют количественных и качественных параметров описания. В докладе также отмечается целесообразность исследования особенностей процессов взаимовлияния между русским языком и языками бывшего Советского Союза в области судебной фонетики. Проблема мультилингвального исследования имеет целый ряд научных директив: анализ речи применительно к человеко-машинному взаимодействию, разработка устно-речевых диалоговых систем, анализ звучащей речи и выявление акустических характеристик речевого сигнала, составление фонетической мультилингвальной базы данных и, в частности, фонетического корпуса вибрантов в различных языках. Устно-речевые базы данных, прежде всего, должны составить объект разработки в таких областях речеведе-ния, как фонетика и фонология, акустика, восприятие речи и т.д.

Доклад (21) представляет собой обзор исследовательских программ в области речевых технологий, которые в настоящее время проводятся в Сербии. Научными проектами в рамках таких программ занимаются междисциплинарные научные организации, имеющие следующую исследовательскую установку: внедрить передовые междисциплинарные подходы к изучению разнообразных вопросов в области речевых технологий и разработать в ней новейшие продукты. В докладе освещаются четыре проекта, объектами исследования в которых являются человеко-машинное взаимодействие, устноречевые диалоговые системы, автоматическое распознавание речи, синтез речи по тексту, голосовые порталы, пренатальное и доречевое развитие, восприятие речи, речеобразо-вание, оценка вербальной коммуникации, паралингвистика, когнитивно-психосоматическая коммуникация, оценка качества речи, интернет-технологии в медицине, телемедицина, проектирование роботов, мультимодальное человеко-машинное взаимодействие и т.д. Еще одной немаловажной целью таких проектов является попытка сербского научного сообщества в сфере речевых технологий

заявить о себе как о надежном партнере, который может быть принят в международные научные консорциумы.

В докладе (18) освещается идея анализа речи на основе синергии различных компонентов, которая достигается на двух разных уровнях: 1) среди алгоритмов обработки речи представляется возможным выделить общие компоненты; 2) информация, получаемая на выходе одного анализатора, может быть использована для уточнения результатов другого анализатора. В работе рассмотрены три основных уровня синергии применительно к извлечению самой разной информации из речи; в настоящее время они используются в мировой практике: синергия высокоуровневых компонентов обработки речи, информационная синергия и синергия общего информационного поля. Ценность доклада заключается в том, что автор указывает на важность комплексного, синергетического подхода при анализе такого мощного источника информации, как речь.

В докладе (17) рассмотрены подходы к автоматическому анализу текстов, и в частности - к формированию смыслового портрета текста как одной из наиболее важных задач такого анализа. Подход, предлагаемый в докладе, представляет собой объединение, синергию более традиционных статистического и лингвистического подходов и является подходом когнитивным, реализующимся на основе представлений об обработке информации, как речевой, так и текстовой, в головном мозге человека. Смысловой портрет текста при когнитивном подходе строится как ассоциативная частотная сеть, числовые характеристики которой перенормируются в смысловые веса. В докладе отмечается эффективность использования когнитивного подхода в решении стандартных задач автоматического анализа текстов.

В докладе (12) охарактеризованы особенности и результаты эксперимента по формированию речевого портрета говорящего в ситуациях конфликта и консенсуса. Исследование произносительной экспликации коммуникативной модели «конфликт - консенсус» проводилось в 2009-2011 гг. в Центре фундаментального и прикладного речеведения Московского государственного лингвистического университета. Актуальность такого исследования, прежде всего, продиктована потребностью диагностики конфликтности и выявления параметров перехода от конфликта к консенсусу и наоборот. Сам эксперимент включал в себя две составляющие: пер-

цептивно-слуховой эксперимент, проводимый на материале реальных конфликтов в стадии предконфликта и зрительный эксперимент в сочетании с перцептивно-слуховым, проводимые на материале телевизионных ток-шоу с консенсуальной коммуникацией и сценическими конфликтами на материале кинофильмов. Эксперимент предоставил важные научные результаты, в которых определены наиболее существенные параметры для оценки социального портрета говорящего по голосу и речи, а также речевые маркеры перехода коммуникантов из состояния конфликта в консенсус и обратно.

Пленарное заседание конференции 8РЕС0М'2011 позволило сделать целый ряд серьезных заключений относительно настоящего положения дел в области речеведения и современных речевых технологий и определить наметившиеся тенденции развития этой междисциплинарной научной области.

1. В настоящее время анализ такого разнопланового человеческого явления, как речь, уже не может представлять собой набор разрозненных, обособленных научных работ, результаты которых не могли бы дополнять друг друга. Автоматический анализ речи целесообразно проводить как комплексное, разностороннее исследование, где необходима синергия, совмещение самых разных научных направлений и достижений в них.

2. Речевые технологии имеют исключительно положительную динамику развития, которая характеризуется самыми разными направлениями, начиная от человеко-машинного взаимодействия и заканчивая технологиями в других науках, как, например, в медицине.

3. Сложность и неоднозначность проблемы речевых технологий в России обусловливается мультилингвальностью этого государства, и одной из насущных проблем, решение которой должно стимулировать дальнейшее развитие речевых технологий и наметить его возможные ракурсы, - это разработка мультилингвальных устноречевых баз данных.

Пять рабочих секций конференции были распределены по трем дням ее проведения (27-29 сентября). Первая секция «Фундаментальные и прикладные проблемы современного речеведения» преподнесла важные с научной точки зрения теоретические положения и выводы. Метод стеганографии, основанный на квантова-

нии однородной сегментации речевого сигнала по времени и квантовании стеганографических данных, скрытых в сегментах, по уровню, представлен в докладе (30). В результатах, освещенных в докладе, отмечается, что, принимая во внимание естественную сегментацию речи и особенности человеческого восприятия, авторам доклада удалось достичь высокого уровня защиты конфиденциальных данных от третьей стороны. Сравнительный анализ просодических элементов (тон, ритм, ударение и интонация) как средств речевого воздействия в таких языках, как английский, немецкий и нидерландский, составил содержание научной статьи (28). Предпосылкой такого анализа явилась постановка следующего вопроса - схожи ли просодические единицы в упомянутых языках или же они обладают дифференциальными признаками. Результаты первого из двух частей исследования (акустический анализ частоты основного тона, интенсивности и временных характеристик) показали, что хотя английский, немецкий и нидерландский языки принадлежат к одной и той же языковой семье, в этих языках наблюдаются разные просодические особенности, выступающие как средства речевого воздействия. Результаты второй части эксперимента (во время которого испытуемые прослушивали языковой материал и описывали следующие особенности: высота голоса, темп речи, длительность пауз в речи и способы их заполнения, сила голоса, ритм и т.д.) показали, что языковая компетенция имеет отношение к пониманию речевого воздействия. Новизна такого анализа определяется тем, что в настоящее время практически нет работ, освещающих сравнение сразу нескольких языков на предмет различия просодических характеристик в них как средств речевого воздействия. Другими значительными достижениями рассматриваемой рабочей секции явились:

- выявление статистических данных (таких как частота встречаемости) русских монофон и дифон, полученных из стилистически гетерогенного корпуса текстов, содержащего 2 500 000 фон; полученные результаты могут быть использованы для типологических межъязыковых сравнений и для совершенствования систем автоматического распознавания русской речи (34);

- использование системы перефразирования для сокрытия информации (для целей стеганографии) с учетом стилистических особенностей различных текстов может обеспечить надежную сте-

ганографическую систему, способную предоставить обмен сообщениями со скрытой информацией, а также способствовать разработке алгоритмов для анализа текстов на наличие скрытого сообщения, в том числе и в автоматизированном режиме (6);

- благодаря инновационным методам изучения механизмов речевой артикуляции, в частности метод МРТ, были в деталях рассмотрены артикуляционные профили русских губных согласных [б] и [м] в определенных вокалических контекстах с последующим обсуждением результатов исследования (5);

- проведен перцептивно-слуховой эксперимент как часть разработанного метода анализа индивидуальных и личностных особенностей человеческой речи на основе целого набора просодических характеристик; такой эксперимент включил в себя использование специально разработанного опросного листа, способствующего определению характерных особенностей говорящего; он позволил выявить особенности слухового восприятия спонтанных вербальных сообщений при отсутствии невербальных визуальных средств (14);

- в результате проведения слухового анализа материала, предоставленного в условиях зашумленности, представляется возможным определить тему устного сообщения (чтение текста или монолога, диалога и полилога без подготовки), причем анализы восприятия такого материала имеют содержательные результаты, как то: сложность в формулировании как глобальной, так и локальных тем текста; в затрудненных условиях лучше воспринимаются диалоги (полилоги); анализ глобальной и локальных тем текста свидетельствуют о том, что информанты используют для формулировок разные стратегии; восприятие текста в затрудненных условиях и определение тем текстов - задачи разного плана и т.д. (13);

- в результате экспериментального исследования перцептивно-слухового восприятия спонтанных диалогов в условиях белого шума были определены факторы, способствующие правильной формулировке глобальной и локальных тем диалогов на основе количества и качества воспринятых речевых единиц (1);

- рассмотрена проблема синтеза выражений русского жесто-вого языка по естественно языковому контексту; при этом приведены характеристики онтологического описания, служащего свя-

зующим звеном между лексическим анализатором и жестовым синтезатором, и экспериментальной областью (7).

Секция «Автоматизированные системы распознавания, понимания и синтеза устной речи» примечательна новейшими разработками и достижениями в области автоматического распознавания речи. Так, в докладе (29) представлен инновационный метод, улучшающий точность работы систем по распознаванию непрерывного речевого сигнала на основе скрытых Марковских моделей. Такой метод базируется на дополнительном моделировании акустической вариативности в базовой системе распознавания непрерывного речевого сигнала в форме Гауссовских смешанных компонентов. Сущность метода заключается в разработке новых скрытых Марковских моделей фактически путем приписывания акустического состояния каждому Гауссовскому компоненту и дополнительного моделирования вероятностей перехода между заново полученными состояниями бесперебойным способом, с использованием предшествующих данных из той базовой системы, из которой возникли такие состояния. Экспериментальные результаты, которыми снабжена рассматриваемая статья, показывают, что предлагаемая система имеет значительные улучшения по сравнению с базовой системой. Доклад (35) освещает новейшие технические средства для обнаружения повторяющихся лексем, извлекаемых из заданного словаря, в системе распознавания связной речи, основанной на словаре больших размеров и используемой для транскрибирования данных из новостных сообщений, передаваемых в устно-речевой форме. В докладе сообщается, что предлагаемая система состоит из двух блоков: детектора слов, извлекаемых из словаря, и модуля кластеризации, который обрабатывает обнаруженные сегменты слов. Сам алгоритм кластеризации основан на оценке энтропии. В результатах к эксперименту отмечается, что сочетание детектора лексем из словаря и кластеризации сегментов слов из этого словаря может предоставить большую точность в сравнении с использованием только одного детектора слов из заданного словаря. Румынские специалисты для решения проблемы недостатка ресурсов базовых и узкоспециализированных текстов для систем распознавания румынской речи в своем докладе (20) предлагают использовать тексты, переведенные путем машинного перевода, а также тексты, полученные из корпусов текстов, дос-

тупных в интернет-среде. В результатах проведенной работы авторы сообщают, что благодаря используемой методологии им в сравнительно небольшие сроки удалось получить систему распознавания румынской речи, не зависящую от говорящего. Среди других не менее впечатляющих достижений рассматриваемой секции можно отметить следующие моменты:

- успехи по улучшению бесперебойности в процессе автоматического распознавания речи при изменении ее громкости с приведением полезных статистических данных в результатах (37);

- разработка адаптивной модели языка множества предметных областей с использованием эксплицитного семантического анализа(24);

- разработка подхода к преобразованию графем в фонемы применительно к порождению множественных акцентов в произношении на основе вероятностного метода, подразумевающего условные случайные поля; такой подход выдерживает конкуренцию с другими инновационными методами и имеет хорошие результаты как качества акцентов в произношении, так и точности процедуры порождения множественных акцентов (23);

- предложена модель, прогнозирующая вероятность границ между предложениями исключительно на основе просодических элементов: высоты тона, энергии и длины пауз; при этом разработанный алгоритм работает в режиме онлайн и прогнозирует вероятность границы предложения для каждого разрыва в высоте тона, полученные данные используются в качестве дополнительного источника информации для модели языка в автоматическом распознавании речи (19);

- была представлена экспериментальная версия синтезатора татарской речи, при этом эксперименты по аудированию показали удовлетворительную разборчивость синтезированной речи, хотя по звучанию татарская речь на выходе синтезатора несколько отличается от натуральной (4).

Следующей ключевой секцией конференции, посвященной вопросам обработки разного рода данных в речевых технологиях, явилась секция «Автоматическая обработка мультилингвальной, мультимодальной и мультимедийной информации». В докладе (33) поднята проблема автоматического подбора оптимальных средств видеонаблюдения за активным выступающим в помещении для

совещаний, где присутствуют более тридцати участников дискуссии. Авторы доклада провели эксперименты, в которых для записи сообщений говорящего осуществили локализацию аудио-источника и средств видеонаблюдения. При этом для определения текущего положения говорящего использовалась локализация мультиканального аудио-источника. Видеообработка сигналов пяти камер послужила средством регистрации участников обсуждения в их определенном сидячем положении, при этом отслеживался главный выступающий и происходила видеозапись аудитории. Проведенные эксперименты показали, что разработанная аудиовизуальная система зафиксировала сообщения всех говорящих. В докладе (25) предложен онлайн (on-line) метод сегментации с выделеним тем в слитной речи при вещании новостей. Такой метод основан на данных о границах предложений, получаемых через систему их автоматического обнаружения. Рассматриваемый в работе метод сопоставляется с другим методом, при котором для деления спонтанной речи на фрагменты используется только пороговая величина количества слов. Авторы доклада отмечают, что принятие в расчет данных о границах предложений для деления слитной речи на фрагменты в целях классификации выделяемых тем обеспечивает повышение точности систематизации тем на 25-30%. Другие работы, представленные в данной секции, отмечены не менее значимыми и полезными научными достижениями:

- реализована гибридная дискриминационно-порождающая EV-HMM (GMMs) система диаризации, при этом показана эффективность итеративного взаимодействия между порождающим и дискриминативным блоками в такой системе, позволяющая превзойти по качеству диаризации EV-VBA систему в случае коротких диалогов (9);

- представлены математические модели, которые могут быть использованы для описания некоторых механизмов речеобразова-ния и слуха, и изложены соответствующие выводы, среди которых:

1) канал передачи речи от одного человека к другому есть нелинейный канал передачи гибридных аналого-цифровых сообщений;

2) в речевом тракте человека входной сигнал из головного мозга преобразуется в выходной сигнал речи с расширением спектра и увеличением амплитуды; 3) слуховая система речи имеет тонкую структуру, обусловленную многоканальностью (3);

- на основе представления зашумленного речевого сигнала в виде отклика голосового тракта, задаваемого уравнениями состояния и наблюдения, синтезирован оптимальный линейный фильтр, при этом произведена оценка параметров фильтра на основе метода наименьших квадратов с конечной памятью (15);

- представлен эффективный вычислительный метод фонемной сегментации, не зависящей от текстов и дающий хорошие результаты; такой метод получен в результате экспериментирования с использованием функции спектральной вариативности, простого непараметрического метода фонемной сегментации (36).

Рабочая секция «Автоматизированные системы идентификации / верификации, эмоционального состояния и языковой принадлежности говорящего» вобрала в себя доклады, ориентированные на проблемы автоматизации определения различных характеристик говорящего. Научная цель, поставленная авторами доклада (38), - автоматическое определение вербального интеллекта говорящих на основе порождаемых ими высказываний. Эксперимент заключался в просьбе людей различного возраста и с различным образованием дать описание одного и того же события. На основе записанной речи уровень вербального интеллекта был измерен с использованием теста на него. Из транскрибированных монологов были извлечены различные лингвистические особенности, стиль и ключевые слова. Для обнаружения говорящих с более высоким или более низким вербальным интеллектом были обучены машины опорных векторов с использованием отмеченных лингвистических особенностей. Для определения более информативных признаков был применен простой односторонний дисперсионный анализ, давший содержательные результаты. В работе (22) для решения задачи идентификации языка использован фонотактический метод, в основе которого лежит расчет вероятности принадлежности языку по его К-граммной модели, обученной на множестве автоматически распознанных последовательностях фонем. С целью повышения точности системы идентификации языков был разработан метод сглаживания, а также сокращенный инвентарь фонем. Проведенные авторами доклада эксперименты показали, что в открытой задаче идентификации языка на примере русского предложенные подходы приводят к увеличению точности. Применение сокращенного инвентаря позволило увеличить точность системы

на 9,8%, а совместное использование с разработанным методом сглаживания К-граммной модели привело к увеличению точности еще на 1,3%. Среди других результатов секции следует назвать следующие положения:

- применение метода доверительных границ кривых для оценки сомнительности результатов автоматического распознавания говорящего и положительные стороны такого метода (26);

- представлен новый метод независимой от текстов автоматической идентификации говорящего; такой метод базируется на дифференциальном классификаторе и дает лучшие результаты, нежели другой инновационный метод, предполагающий моделирование смеси нормальных распределений (27);

- было проанализировано влияние наркотического опьянения на частоту основного тона говорящего и сделано важное научное открытие: основной причиной изменений в частоте основного тона является эмоциональное состояние говорящего, нежели лечение наркозависимости; также в работе указано, что у людей, продолжительно принимающих наркотики героиновой группы, проявляется тенденция к снижению частоты основного тона ежегодно на 3% (32);

- представлен метод психологического шкалирования, позволяющий прогнозировать персональные черты говорящего по его речи; такой метод подразумевает модель личности говорящего и выполняемые на компьютере процедуры для обучения, отбора и поддержки экспертов в работе (40);

- был предложен для построения иВМ-модели ОММ-систем распознавания диктора алгоритм обучения, основанный на вариационном Байесовском анализе вместо традиционно используемого алгоритма, основанного на методе максимального правдоподобия (8);

- были определены изменения, которым подвергаются различные параметры голоса и речи человека под влиянием смены языкового кода, а также установлены характеристики, которые остаются неизменными в речи носителей русского языка при переходе на немецкий язык (10).

Заключительной рабочей секцией конференции явилась секция «Корпусная лингвистика применительно к устной и письменной речи», где были продемонстрированы результаты разработки различных корпусов текстов, на основе которых представляется

возможным проводить другие исследования. В докладе (2) представлена разработка речевого корпуса «Интонация русского диалога», который, как отмечается в работе, изначально ориентирован на представление звучащей речи, а не письменного текста. Такой корпус иллюстрирует роль просодии в современном русском языке. Основная цель корпуса - детальная просодическая транскрипция представительного массива диалогических высказываний в сочетании с их семантико-прагматическими и грамматическими аннотациями. Корпус «Интонация русского диалога» в первую очередь предназначен для исследователей русского языка, а также для изучающих этот язык. От корпусов, создаваемых для целей автоматической обработки речи, он отличается специализированной классификацией и специальным подбором диалогических реплик, репертуаром локальных и интегральных просодических характеристик, что представляет особый интерес для лингвистов, занимающихся фонетикой и речеведением. В докладе (31) представлено описание этапов разработки Украинского корпуса устноречевых новостных сообщений. При этом дается обзор настоящего положения дел в создании Ураинских речевых корпусов. Украинский корпус устноречевых новостных сообщений содержит спонтанную украинскую речь и морфологически размеченные транскрипции. Помимо всего прочего в докладе освещаются основные идеи и технические решения, использованные в записи и компьютерном аннотировании для уже существующих речевых корпусов. В других докладах, представленных в секции, затрагиваются различные научные проблемы и методика их решения с применением данных корпусов:

- спроектирован алгоритм, позволяющий реализовать процесс автоматической предварительной обработки текстовых данных (взятых из русских текстовых корпусов) для языкового моделирования (39);

- разработана программа, преобразующая разметку звукового сигнала из текстового формата в формат данных хт1 и позволяющая представить отраженные в разметке сигнала уровни в виде иерархии, каждый уровень которой соответствует определенному уровню языка; такое представление делает возможным поиск средствами языка запросов LINQ тех сегментных и супрасегментных

единиц и их статическое описание, которые представляют интерес для исследования (16).

В заключение следует подчеркнуть, что наиболее активная работа ведется в направлении корпусной лингвистики, автоматизированных систем анализа - синтеза речи, распознавания и понимания речи, эмоционального состояния говорящего, математической обработки данных и т.д. Заслушанные доклады в большинстве случаев носят практический характер. Представлены также и глубокие концептуальные теоретические обобщения.

Список литературы

1. Абрамов Ю.В., Потапова Р.К., Хитина М.В. Смысловая интерпретация спонтанного звучащего диалогического текста (в условиях зашумления речевого сигнала) // Proceedings of the 14th International conference «Speech and computer» (27-30 Sept., 2011, Kazan, Russia). - Moscow; Kazan, 2011. - C. 180-187.

2. Архипов А.В., Кривнова О.Ф., Лебедев А.А. Речевой корпус «Интонация русского диалога // Там же. - C. 463-468.

3. Жарких А. Канал передачи речи от одного человека к другому как нелинейный канал передачи гибридных аналого-цифровых сообщений // Там же. - C. 395401.

4. Ибрагимов Т., Салимов Ф., Сайхунов М. Синтезатор татарской речи по тексту // Там же. - C. 173-179.

5. Кедрова Г.Е., Захаров Л.М., Анисимов Н.В. О веляризованности русских губных согласных // Там же. - C. 244-249.

6. Ким А. Лингвистические детерминанты средств защиты и извлечения смысловой информации // Там же. - C. 235-238.

7. Курбатов С., Литвинович А., Хахалин Г. Синтез выражений русского жестово-го языка по естественно языковому контексту // Там же. - C. 420-425.

8. Пеховский Т., Лоханова А. Выбор UBM модели с помощью вариационного байесовского анализа для GMM-UBM систем распознавания диктора // Там же. - C. 327-332.

9. Пеховский Т.С., Шулипа А.К. Гибрид генеративных и дискриминативных моделей для задачи диаризации в коротком телефонном диалога // Там же. -C. 389-394.

10. Платонова Т., Смолина А. Идентификация говорящего с учетом изменения языкового кода: (На материале русского и немецкого языков) // Там же. -Р. 333-337.

11. Потапова Р.К. Multilingual spoken language databases in Russia // Ibid. - P. 13-17.

12. Потапова Р.К., Комалова Л.Р. Речевой портрет коммуникантов в условиях «конфликта - консенсуса» // Там же. - C. 43-50.

13. Потапова Р.К., Потапов В.В., Хитина М.В. Определение темы текста, воспринятого в затрудненных условиях: (Экспериментальное исследование) // Там же. - С. 168-172.

14. Потапова Р.К., Потапов В.В., Хитина М.В. Особенности варьирования фонетических признаков спонтанного речевого материала: (На основе перцептивно-слухового анализа) // Там же. - С. 250-254.

15. Санников В., Маслов С. Оптимизация алгоритма калмановской фильтрации зашумленной речи // Там же. - С. 406-412.

16. Тананайко С., Кочаров Д., Садуртинова К. Программа статистической обработки корпуса речевых данных // Там же. - С. 457-462.

17. Харламов А.А. Тенденции в автоматическом анализе текстов // Там же. -С. 33-36.

18. Хитров М. Синергетический эффект в речевых технологиях // Там же. - С. 2732.

19. Chistikov P., Khomitsevich O. Online automatic sentence boundary detection in a Russian ASR system // Ibid. - Р. 112-117.

20. Cucu H., Besacier L., Burileanu C. Enhancing automatic speech recognition for Romanian by using machine translated and web-based text corpora // Ibid. - Р. 8188.

21. Delic V., Secujski M., Gnjatovic M. et al. An overview of current research activities in the field of speech and language technologies in Serbia // Ibid. - P. 18-26.

22. Glavatskih I., Shirokova A., Zykov A. N-gram smoothing and phoneme clustering in automatic language identification //Ibid. - Р. 290-295.

23. Illina I., Fohr D., Jouvet D. Multiple pronunciation generation using grapheme-to-phoneme conversion based on conditional random fields // Ibid. - Р. 105-111.

24. Kilgour K., Kraft F., Stueker S. et al. Multi domain language model adaptation using explicit semantic analysis // Ibid. - Р. 96-104.

25. Kopenevsky M., Ponomareva I., Levin K. On-line topic segmentation of Russian news // Ibid. - Р. 373-378.

26. Koval S., Lokhanova A. Confidence bounds curves as a tool for evaluation of automatic speaker recognition results uncertainty // Ibid. - Р. 284-289.

27. Lyubimov N., Lednov D., Andreev M. Automatic speaker identification system based on discriminative classifier // Ibid. - Р. 273-277.

28. Moskvina A. Prosodic features as means of speech influence: (Comparative study of English, German and Dutch) // Ibid. - P. 213-217.

29. Pekar D., Janev M., Jakovlevic N. A novel HMM continuous speech recognition system based on additional modeling of acoustical variability // Ibid. - Р. 55-61.

30. Potapova R., Sagalay M. Elaboration of steganography method for data hiding in prosodic speech parameters // Ibid. - P. 202-206.

31. Pylypenko V., Robeiko V., Sazhok M. Ukrainian broadcast speech corpus development // Ibid. - Р. 435-440.

32. Raev A., Matveev Y., Goloshchapova T. The effect of long-term use of drugs on speaker's fundamental frequency // Ibid. - Р. 308-314.

33. Ronzhin A., Budkov V. Determination and recording of active speaker in meeting room // Ibid. - Р. 361-366.

34. Smirnova N., Chistikov P. Statistics of Russian monophones and diphones // Ibid. -P. 218-223.

35. Stouten F., Illina I., Fohr D. Clustering repeated out-of-vocabulary word tokens in order to model them for LVCSR // Ibid. - Р. 73-80.

36. Winebarger J., Daoudi K., Yahia H. Improving SVF with DISTBIC for phoneme segmentation // Ibid. - Р. 207-212.

37. Yurkov P., Korenevsky M., Levin K. An improvement of robustness to speech loudness change for an ASR system based on LC-RC features // Ibid. - Р. 62-66.

38. Zablotskaya K., Zablotskiy S., Walter S. A simple one-way analysis of variance as a way to determine more informative features for speech-based user's verbal intelligence estimation // Ibid. - Р. 267-272.

39. Zabolotskiy S., Zabolotskaya K., Minker W. Automatic pre-processing of the Russian text corpora for language modeling // Ibid. - Р. 429-434.

40. Zhuravleva A. The expert method of identifying personality traits by speech // Ibid. -Р. 315-320.

В.В. Потапов

ГРАММАТИКА. МОРФОЛОГИЯ

2012.04.030. КАРПОВ В.И. ГОТСКИЕ ИМЕННЫЕ СЛОЖЕНИЯ И СЛОВОСОЧЕТАНИЯ: Опыт сопоставительного описания. -Saarbrücken: Lambert acad. publ. GmbH, 2011. - 218 S.

Владимир Ильич Карпов - кандидат филологических наук, старший научный сотрудник сектора германских языков Института языкознания РАН, специалист в области истории и диалектологии германских языков.

В монографии обсуждается круг вопросов, связанных с комплексным анализом древнегерманских сложных слов и словосочетаний. На материале готских текстов как наиболее древних памятников германской письменности проводится сопоставительное описание структуры и семантики детерминативных композитов и коррелирующих с ними субстантивных словосочетаний и выявляется специфика их функционирования в древнегерманском переводном тексте (дошедшие до нас готские рукописи представляют собой ранние переводы греческих новозаветных списков). Пристальное внимание к детерминативным композитам и именным словосочетаниям объясняется прозрачностью их морфологического оформления, стабильностью структурных моделей и возможностью использования в качестве альтернативных средств номинации.

i Надоели баннеры? Вы всегда можете отключить рекламу.