Цифровые синтезаторы и основные модели синтеза звука

Романова Василиса Андреевна

№ 6'2015 ВЕСТНИК МГУП ИМЕНИ ИВАНА ФЕДОРОВА ISSN ON-LINE: 2409-6652 © Московский государственный университет печати имени Ивана Федорова_vestnik.mgup.ru

УДК 004.942:78.022

ЦИФРОВЫЕ СИНТЕЗАТОРЫ И ОСНОВНЫЕ МОДЕЛИ СИНТЕЗА ЗВУКА

Романова Василиса Андреевна

студентка института принтмедиа и информационных технологий Московский государственный университет печати имени Ивана Федорова 127550 Россия, г. Москва, ул. Прянишникова, д. 2А romanova-vasili.sa@yandex. ги

Аннотация. В работе рассматриваются вопросы, связанные с синтезом звука, его реализацией в программных синтезаторах, и особенности работы основных моделей синтеза звука.

Ключевые слова: синтез звука, программный синтезатор, цифро-аналоговое преобразование, амплитудная огибающая, частотные модуляции, частотный диапазон воспроизведения, музыкальный звук.

Получение звука при помощи компьютера. Для

решения этой задачи применяются особые программы — цифровые синтезаторы, в основе которых заложены различные принципы синтеза звука. Цель данной статьи — ознакомление с работой такого программного обеспечения, как цифровой синтезатор, и основными моделями синтеза звука.

Программный (цифровой) синтезатор — это электронный музыкальный инструмент,

синтезирующий звук при помощи одного или нескольких генераторов звуковых волн, представленный в виде компьютерной программы. Результат работы такого типа синтезаторов достигается за счет настройки параметров процессора. В отличие от аналоговых, где происходит изменение электрического сигнала. Программы такого рода используют для создания звука центральный процессор и оперативную память, для вывода — звуковую карту, а также стандартные средства ввода-вывода, например: MIDI-клавиатуру, компьютерную мышь, монитор.

MIDI-клавиатура — это распространенный вид MIDI-контроллера, чаще всего представленный как клавиатура фортепиано с дополнительными органами управления. MIDI в данном случае расшифровывается как цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface) — стандарт цифровой звукозаписи для формата обмена между электронными музыкальными инструментами [1]. Основной особенностью MIDI является то, что интерфейс стандарта позволяет единообразно кодировать с привязкой во времени такие параметры как нажатие клавиш, громкость, тембр, темп и др.

Воспроизведение и запись стандартного MIDI-файла, расширение SFM, производится секвенсором, который, в свою очередь, может быть как аппаратным модулем, так и программой. Стоит отметить, что MIDI-файл является набором команд для исполнения синтезатором, а не готовым для воспроизведения комплектом аудиоданных.

Программные синтезаторы выпускают как в виде самостоятельного программного обеспечения, так и в виде специальных расширений для уже

существующих сред. Чаще всего такими средами выступают многоканальные рекодеры — такие как Cubase VST, CakewalkSonar, Pro Tools и др. Также программный синтезатор может представлять модель реально существующих синтезаторов — эмуляторы синтезаторов.

Какие конкретно характеристики звука должен использовать синтезатор для генерации? Чтобы ответить на этот вопрос, необходимо прибегнуть к анализу музыкальных звуков. Обычно для анализа сигнала в частотной области используется быстрое преобразование Фурье (БПФ), которое позволяет представить дискретный сигнал, состоящий из N отсчетов в виде суммы N гармонических колебаний. Эти колебания представлены формулой

где к — номер гармоники, целое число от 0 до N-1, Ак — амплитуда к-й гармоники, Fk — частота к-й гармоники, Фк — фаза, t — время в моменты дискретизации сигнала формула.

где i — номер дискретного отсчета сигнала, Тд — период дискретизации сигнала.

Следует отметить, что все частоты гармонических колебаний, представленных в виде суммы, связаны целочисленным отношением и являются гармониками первого колебания БПФ, частота которого равна:

Исходя из выше представленного анализа, необходимые для генерации звука параметры — частота, амплитуда и фаза. Другими словами, в основе синтеза звука лежит генерация волн различных форм.

Схема синтеза звуков в программных синтезаторах выглядит следующим образом. При помощи цифрового устройства, которое использует один из

№ 6'2015 ВЕСТНИК МГУП ИМЕНИ ИВАНА ФЕДОРОВА

ISSN ON-LINE: 2409-6652 _vestnik.mgup.ru

методов синтеза (о них подробнее будет рассказано далее) генерируется с заданной высотой звука сигнал возбуждения. Генерируемый сигнал должен иметь спектральные характеристики, максимально похожие на характеристики реального музыкального инструмента.

После генерации сигнал подается на фильтры, задача которых заключается в имитации амплитудно-частотных характеристик, излучающих звук поверхностей, например, дека. Также используются фильтры, управляемые сигналом амплитудной огибающей (рис. 1), создающие эффект присутствия большого количества высоких частот во время стадии атаки с последующим их уменьшением. Одновременно с этим производится генерация амплитудной огибающей с помощью умножения временных отсчетов сигнала на временные отсчеты образцовой для реального инструмента амплитудой огибающей.

Рис. 1. Общий вид ADSR-огибающей

ADSR-огибающая описывает изменения параметров звука при неизменной частоте сигнала. Часто в качестве параметров описания выбираются частота среза фильтра и громкости, реже высота тона и панорамы звука [2].

Для таких инструментов, как гитара и пианино, ADSR-огибающая имеет более выраженные максимумы, минимумы и длины промежутков, поэтому для синтеза звука этих инструментов огибающая наиболее явно показывает, как был сыгран тот или иной звук: отображает не только экспрессию звука, но и помогает распознать тип инструмента. Например, для органа характерно воспроизведение ноты с одинаковой громкостью все время нажатия клавиши, для духовых максимальная громкость достигается через некоторое время после взятия ноты.

На рис. 1 представлен общий вид ADSR-огибающей. Так выделяют четыре участка:

• Атака (Attack) — период начального нарастания громкости сигнала.

• Спад (Decay) — период ослабления сигнала после начального нарастания.

• Поддержка (Sustain) — уровень постоянной силы сигнала.

• Затухание (Release) — период окончательного затухания сигнала.

Более того ADSR-огибающие могут быть как упрощенными, так и многостадийными. Для синтезатора общее число используемых ADSR-огибающих является важной характеристикой.

После применения фильтров к полученному сигналу могут быть добавлены амплитудное и частотное вибрато. Обычно после обработки фильтрами над сигналом производится обработка электронными звуковыми пространственными эффектами реверберации, задержки, эха и модуляционными — хоруса. Реверберация (reverberation) представляет собой процесс постепенного уменьшения интенсивности звука при его многократных отражениях, а хорус (chorus) — это эффект, полученный путем добавления к исходному сигналу его копии (копий), но сдвинутой во времени при условии непрерывного изменения времени сдвига. В зависимости от ситуации могут быть использованы и другие эффекты: флэнджер, гармонайзер, эквалайзер, подавитель шумов и т.п. Использование различных фильтров и эффектов необходимо, чтобы придать звуку «натуральности».

При синтезе нескольких одновременно звучащих нот разных музыкальных инструментов расчет параметров в мощных цифровых устройствах производится отдельно для каждой ноты каждого инструмента. Итоговый сигнал является суммой в цифровом виде всех составляющих звуков, которая преобразуется из цифрового представления в аналоговое при помощи цифро-аналогового преобразователя.

Синтез звука классифицируется в зависимости от способа генерации и преобразования звуковых волн. Рассмотрим наиболее распространенные модели синтеза звука.

Аддитивный синтез (Additive synthesis, АД) — это синтез, в котором используется принцип наложения нескольких волн, зачастую синусоидальной формы, с различными частотами и амплитудами. Генерация звука таким образом возможна благодаря тому, что любой тембр может быть представлен в виде множества гармоник, число которых различно в отдельные моменты времени [3]. Суммирование множества волноформ, соответствующих по высоте разным гармоникам и имеющим свои огибающие, позволяют получать насыщенные богатые тембры. Часто для синтеза таких волн используются несколько осцилляторов, настроенных на разные частоты.

Такие волны называют регистрами и обозначают как 16' — тон на октаву ниже взятого, 8' — исходный тон, 4' — на октаву выше и т.д. Причем цифра представляет длину трубы соответствующего регистра органа, выраженную в футах. Соответственно звучание тем лучше, чем больше используемых регистров. [3]

Недостатком такого синтеза можно считать его ресурсоемкость. Для синтеза простого звука необходимо суммировать достаточно большое число волн, что требует высокой вычислительной мощности.

Частотно-модуляционный (Frequency Modulation, FM) синтез. Достаточно сложный способ синтеза звука, заключающийся в том, что несколько волн простой формы модулируют друг друга по частоте, после чего суммируются. Сложность метода состоит в том, что генерируют волны цифровые осцилляторы

№ 6'2015 ВЕСТНИК МГУП ИМЕНИ ИВАНА ФЕДОРОВА ISSN ON-LINE: 2409-6652 © Московский государственный университет печати имени Ивана Федорова_vestnik.mgup.ru

(операторы) причем их частоты должны быть строго кратными друг другу. Это необходимо для того, чтобы при суммировании волн они давали гармонический тон. Определенная конфигурация операторов в данном случае называется алгоритмом.

Вычитающий (субтрактивный) синтез. В этом типе синтеза исходная волна (синусоидальная, квадратная, пилообразная и треугольная), проходя через различные фильтры, позволяющие обрезать одни и выделять другие частоты, генераторы огибающих, регулирующие динамику тембра, процессоры эффектов и т.п., изменяет свою тембральную окраску [4]. Так можно сказать, что некоторые частоты вычитаются из основного сигнала, что и дало методу название. Одновременно с другими типами синтеза БМ-синтез широко применяется в современных моделях синтезаторов в качестве дополнения к основному.

Физический синтез. Для генерации звукового сигнала синтезаторы используют математическую модель устройства реального музыкального инструмента, т.е. генерируются процессы, происходящие в инструменте во время синтеза звука. Вычисления параметров звука при таком методе синтеза должно производиться в реальном времени, что требует больших вычислительных мощностей. Для моделирования физического синтеза необходимо знать математическую модель инструмента, а так же виды протекающих в нем физических процессов.

Волновой или табличный синтез. Звук при такого рода синтезе создается за счет воспроизведения записанных в память фрагментов звучания реальных музыкальных инструментов. В отличии от семплерного метода, где записанные семплы воспроизводятся циклично, подвергаясь какой-либо обработке, в табличном синтезе множество семплов распределяются по таблице и извлекаются в порядке надобности.

Так, для создания таблицы оцифровываются несколько разных по частоте сигналов реального музыкального инструмента, которые перекрывают весь его частотный диапазон. Причем шаг по частоте должен быть выбран таким образом, чтобы изменения тембра, при смещении частоты основного тона при варьировании частоты дискретизации, не были заметны на слух. При генерации звука определенной высоты определяется, во-первых, в каком частотном диапазоне находится звук, и используя отсчеты из таблицы, которые подстраиваются по частоте основного тона точно до требуемой, частично изменяется частота дискретизации. Другими словами, если звук дискретизирован с частотой 44,1 КГц, то для изменения высоты сигнала из таблицы необходимо выбрать отсчеты с частотой немного отличной от частоты дискретизации, но подавать на цифро-аналоговый преобразователь с частотой равной частоте дискретизации [5].

Табличные синтезаторы обычно содержат таблицы семплов для более сотни инструментов. Для хранения таблиц уменьшенного объема производятся следующие манипуляции с семплами. Звук оцифровывается с большим шагом по частоте

основного тона и подвергается различного рода компрессии. Более того, для хранения в таблице длина семпла всегда меньше одной секунды. В таком случае для синтеза длительной по времени ноты применяется зацикливание. Для гладкого без щелчков на стыке кольца воспроизведения производится дополнительная обработка.

Отрезок сигнала должен содержать целое число периодов основного тона. Также если отрезок слишком короткий, то при синтезе длинной ноты появляется эффект «умирания» звука. Обычно он появляется при повторе от 7 до 15 раз.

При коротком по длительности отрезке также сложно отобразить стадию атаки. Для решения этой проблемы применяются алгоритмы pitch-shifter и time-stretch. Pitch-shifter позволяет сдвинуть частоту основного тона оцифрованного образцового звука, записанного в таблицу, без изменения его длительности и других временных параметров. При таком подходе можно хранить сигнал со всеми стадиями ADSR, что позволяет генерировать звук любой ноты. Алгоритм time-stretch увеличивает длительность звучания стадии «поддержки» без изменения частоты основного тона.

Гибридный синтез. Как видно из названия, это такой тип синтеза, в котором применяется та или иная комбинация различных способов синтеза звука. Например, «аддитивный и субтрактивный», «волновой/табличный и субтрактивный», «FM-синтез и субтрактивный». Большинство эмуляторов и программных синтезаторов построены именно на основе гибридного синтеза.

Таким образом, в основе рассмотренных видов синтеза лежит моделирование звуковой волны: волна создается при помощи программных средств, например, при помощи цифровых осцилляторов в FM-синтезе, и подвергается различным модификациям (сложение, вычитание, обрезание некоторых частот и др.); или используется готовая запись звучания той или иной ноты, хранящаяся в таблице.

Программные синтезаторы позволяют получать звук, не отличающийся от звука, издаваемого реальным инструментом. Это возможно благодаря комбинированию различных методов синтеза, тем самым выделяя сильные стороны каждого. Более того, при помощи фильтров звук подвергается искажениям, что дает необычную окраску тембру. Также программы такого рода имеют высокие требования к вычислительным мощностям компьютеров, так как им необходимо производить множество модуляций и генераций для множества звуков в момент времени.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Swift, Andrew. A brief Introduction to MIDI, SURPRISE (Imperial College of Science Technology and Medicine), retrieved 22 August 2012.

2. Печатнов Б., Сабуров С. Синтез частотных и временных характеристик в ЭМС. — «Радио», 1980, № 12.

№ 6'2015 ВЕСТНИК МГУП ИМЕНИ ИВАНА ФЕДОРОВА ISSN ON-LINE: 2409-6652 © Московский государственный университет печати имени Ивана Федорова_vestnik.mgup.ru

3. Тюлин Ю.Н. Краткий теоретический курс гармонии. — М.: Музыка, 1978.

4. Phil Burk, Larry Polansky, Douglas Repetto, Mary Roberts, Dan Rockmore [Электронный ресурс] // Music and Computers. A Theoretical and Historical Approach: сайт. — URL: http://music.columbia.edu

/cmc/MusicAndComputers (дата обращения: 25.11.2015).

5. Miller Puckette The Theory and Technique of

Electronic Music [Электронный ресурс]. — Режим доступа: http://msp.ucsd.edu/

techniques/latest/book-html (дата обращения: 25.11.2015).

DIGITAL SYNTHESIZERS AND THE MOST USABLE MODELS

OF SOUND SYNTHESIS

Vasilisa Andreevna Romanova

Moscow State University of Printing Arts 127550Russia, Moscow, Pryanishnikova st., 2Ä

Annotation. Questions of sound .synthesis are examined in this work. Its realization in software synthesizer and features of the basic models of sound synthesis.

Keywords: sound synthesis, software synthesizer, digital-to-analog converter, ADSR envelope, frequency modulation, playback frequency range, pitch (music).

Цифровые синтезаторы и основные модели синтеза звука Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Романова Василиса Андреевна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Романова Василиса Андреевна

Digital synthesizers and the most usable models of sound synthesis

Текст научной работы на тему «Цифровые синтезаторы и основные модели синтеза звука»