Мария ГУЛЕНКО Дмитрий КАПЛУН
Цифровые фильтры
в полях Галуа
Введение
В операциях цифровой обработки сигналов особое внимание уделяется цифровой фильтрации, которая в среднем занимает до половины всего объема вычислений. В узком смысле цифровой фильтр — это частотно-избирательная цепь, обеспечивающая селекцию цифровых сигналов по частоте [1]. После выполнения цифровой фильтрации мы, как правило, получаем интересующий нас сигнал, то есть сигнал, несущий нужную нам информацию в виде, удобном для последующей обработки. Соответственно, к параметрам цифровых фильтров в современных системах цифровой обработки сигналов начинают предъявлять повышенные требования. Растет порядок значений фильтров, которые нередко представлены четырехзначным числом, постепенно возрастает и разрядность обрабатываемых данных. Это ведет к увеличению объема вычислений, а значит, и к резкому росту аппаратных затрат. При синтезе цифровых фильтров наибольшие затраты времени и оборудования приходятся на операции умножения и сложения [1]. Следовательно, от эффективности реализации этих арифметических операций (в первую очередь, операции умножения) зависят аппаратные и временные характеристики синтезируемого фильтра, а также практически все его основные параметры. Таким образом, задача минимизации времени вычислений и уменьшения аппаратных затрат сводится к оптимизации каждой из операций умножения и сложения, требуемых для вычисления очередного отфильтрованного отсчета.
Одним из решений поставленной задачи может стать реализация фильтров в конечных полях.
Поля Галуа
Полем называется множество с двумя операциями — сложением и умножением, которые удовлетворяют следующим аксиомам [2]:
1. Множество образует абелеву (коммутативную) группу по сложению.
2. Поле замкнуто относительно умножения, и множество ненулевых элементов образует абелеву группу по умножению.
3. Дистрибутивный закон выполняется для любых элементов поля.
Широко известны примеры полей с бесконечным числом элементов: множество вещественных чисел, множество комплексных чи-
сел, множество рациональных чисел. Имеются также поля с конечным числом элементов.
Поле с q элементами, если оно существует, называется конечным полем, или полем Галуа (Galois Fields — GF) в честь французского математика Эвариста Галуа, и обозначается GF (q) [2].
Конечные поля можно описывать с помощью таблиц сложения и умножения. Вычитание и деление однозначно определяются таблицами сложения и умножения. Приведем пример поля GF (5) = {0, 1, 2, 3, 4}:
4
0
4
3
2
1
+ 4
4
0
2
3
Для произвольного поля, как бесконечного, так и конечного, применимы почти все известные алгоритмы вычислений. Это происходит потому, что большинство процедур, используемых в полях вещественных и комплексных чисел, зависит только от даваемой определением (приведенным выше) формальной структуры поля и не зависит от частных характеристик конкретного поля. В произвольном поле Р есть даже преобразование Фурье [2]:
Я—1
'^ = Х®'Ч, к = 0, •••, п-1,
1=0
где ю — корень степени п из единицы в поле Р, а V и У — векторы длины п над полем Р. Преобразование Фурье длины п в поле Р существует тогда и только тогда, когда поле содержит корень степени п из единицы.
Теперь перейдем к непосредственному использованию конечных полей.
Китайская теорема об остатках
Любое неотрицательное целое число, не превосходящее произведения модулей (а это и будет нашим конечным полем), можно однозначно восстановить, если известны его вычеты по этим модулям. Этот результат был известен еще в Древнем Китае и носит название китайской теоремы об остатках [2].
Китайская теорема об остатках доказывается в два этапа. Сначала доказывается единственность решения, а затем его существование.
Теорема 1. Для заданного множества целых положительных попарно взаимно простых чисел m0, m1, ..., mk и множества неотрицательных чисел с0, с1, ., ck при с{ < т{ система:
с{ = с (mod т), i = 0, ..., к
имеет не более одного решения в интервале 0 < с < П k=1mi.
Доказательство приведено в [2].
Теорема 2. Пусть М = П \=1mi — произведение попарно взаимно простых положительных чисел, пусть Mf = М/т{ и пусть для каждого I N{ удовлетворяют равенствам N{ хМ;+п; xm; = 1. Тогда единственным решением системы сравнений:
с{ = с (mod m(), i = 0, ..., к является:
к
с = ^ ciNiMi (mod М)
>=0
Доказательство второй теоремы также приведено в [2].
Китайская теорема об остатках является основой представления целых чисел. При таком представлении достаточно просто выполняется операция умножения. Допустим, что надо выполнить умножение с = axb. Пусть a{ = Rmt [a], b{ = Rmt [b], q = Rmt [с ] для каждого i = 0, ..., к. Тогда с{ = щxb;(mod m), и это умножение вычислить легче, так как ai и bi являются малыми целыми числами. Аналогично, при сложении с = a+b имеем с{ = a.i+b;(mod m{) для всех i = 0, ., к. В обоих случаях для получения окончательного ответа с должно быть восстановлено по вычетам в соответствии с китайской теоремой об остатках.
Вообще переход к системе вычетов позволяет разбить целые числа на маленькие кусочки, которые легко складывать, вычитать и умножать. Если вычисления состоят только из этих операций, то такое представление является альтернативной арифметической системой. Если вычисления достаточно просты, то переход от естественной записи целых чисел к записи через систему остатков и обратное восстановление ответа в целочисленном виде могут свести на нет все возможные преимущества при вычислениях. В случаях же, когда объем вычислений достаточно велик, такой переход может оказаться выгодным. Это происходит потому, что при
вычислениях все промежуточные результаты можно сохранять в виде системы остатков, выполняя обратный переход к целочисленному виду только при окончательном ответе.
Реализация цифровых фильтров в конечных полях
Как известно, классический цифровой фильтр описывается выражением [З]:
N N
y(n)='£bix(n-i)-'£aiy(n-i), (і)
i=0 i=1
где y(n) — сигнал на входе фильтра; x(n) — сигнал на выходе фильтра; а{, Ъ{ — коэффициенты фильтра.
Все цифровые фильтры делятся на два обширных класса: нерекурсивные — фильтры с конечной импульсной характеристикой (КИХ) и рекурсивные — фильтры с бесконечной импульсной характеристикой (БИХ) [З]. Мы будем рассматривать только КИХ-филь-тры, фазовая характеристика которых, в отличие от БИХ-фильтров, линейна. Для КИХ-фильтров выражение (1) принимает следующий вид [З]:
N
y(n)='£bix(n-i). (2)
і=0
Таким образом, задача синтеза КИХ-филь-тра сводится к вычислению коэффициентов Ъ{ такого фильтра.
Теперь, зная китайскую теорему об остатках, перейдем к реализации КИХ-фильтра k-го порядка. Возьмем за основу стандартную структуру (рис. 1).
Для построения алгоритма цифровой фильтрации в полях Галуа воспользуемся китайской теоремой об остатках. Как уже было сказано, она позволяет сохранять при вычислениях все промежуточные результаты в виде системы остатков, выполняя обратный переход к целочисленному виду только при окончательном ответе, что при достаточно большом объеме вычислений может оказаться выгодным. А именно, все вычисления в фильтре будут производиться и сохраняться в системе остатков, и лишь окончательный результат будет восстановлен в привычном виде. В связи с этим структура фильтра будет преобразована к виду, представленному на рис. 2.
Входная последовательность x(n) распараллеливается на k потоков. В каждом потоке каждый отсчет берется по соответствующему модулю (m;), а потом поступает на блок “block i”. При этом в каждом из блоков будет реализована классическая структура фильтра, изображенная на рис. 1, но все вычисления в нем будут производиться по определенному модулю. Произведение всех модулей соответствует размеру конечного поля:
М = П \=1ш1.
Далее отсчеты с выходов блоков восстанавливаются по вышеприведенной формуле, а именно каждый из них перемножается на соответствующий множитель N хМ; (где N является решением уравнения N хМ;+щ х ш{ =1, а М{ = М/от;), и все эти произведения суммируются. Так образуется окончательный выходной отсчет у(п) в целочисленном виде. Заметим, что при внутренних вычислениях в эквивалентном фильтре в обычной системе исчисления значения отсчетов не должны превосходить размер поля М.
Рассмотрим пример синтеза КИХ-фильт-ра 10-го порядка (11 коэффициентов) в среде 81ти1тк пакета математического моделирования МАТЬАВ. Разрядность входного сигнала равна 10. Разрядность коэффициентов фильтра также будет равна 10. Рассчитаем с запасом необходимый размер поля М. Максимальное значение 10-разрядных входного сигнала и коэффициента равно 1023, всего 11 коэффициентов. Следовательно, максимальное значение отсчета не должно превзойти 1023x1023x11=11 511 819. Исходя из это-
го, подберем подходящий размер поля. Возьмем число M = 11 741 7З0 = 2x3x5xJx11x x13x1Jx23. Числа m0 = 2, m1 = З, m^ = 5, m5 = J, m4 = 11, m5 = 1З, m6 = 17 и m7 = 2З являются взаимно простыми, что удовлетворяет условиям китайской теоремы об остатках. Далее, в соответствии со структурой на рис. 2, каждый входной отсчет будет взят по модулю 2, З, 5, J, 11, 1З, 17 и 2З и поступит на фильтры, в которых все вычисления производятся по соответствующим модулям.
Пример фильтра по модулю m2 = 5 приведен на рис. З. Напомним, что в этом фильтре все вычисления производятся по модулю 5. Он состоит из 10 элементов задержки, 11 таблиц, в которые записаны векторы со всеми возможными значениями входного сигнала, умноженными на соответствующий коэффициент (по модулю 5) и 10 таблиц сложения для GF(5). И, таким образом, вместо операции умножения (и сложения) будет осуществляться операция выборки по адресу из таблицы умножения (сложения). Адресом же и будут служить перемножаемые числа. Все остальные блоки “block 0”, “block 1”, ...., “block J” имеют аналогичную структуру.
Рис. 4. АЧХ синтезированного фильтра
Для восстановления результата в целочисленном виде нам потребуется найти числа Ni и Mf.
Mi = M/m;,
M0 = 1174 1730/2 = 5870865,
M1 = 11741730/3 = 3913910,
M2 = 11741730/5 = 2348346,
M3 = 11741730/7 = 1677390,
M4= 11741730/11 = 1067430,
M5 = 11741730/13 = 903210,
M6 = 11741730/17 = 690690,
M7= 11741730/23 = 510510.
Воспользовавшись алгоритмом Евклида, получаем: N0 = N2 = N3 = N4 = 1, Nj = -1, N5 = 3, N6 = -6, N7 = -11. Итак, N;M; = [5870865 -3913910 2348346 1677390 10(57430 27096630 -4144140 -5615610]. Значения коэффициентов получаем с помощью утилиты Filter Design среды MATLAB, задав следующие параметры: фильтр низких частот, метод расчета — Kaizer Window, порядок фильтра — 10, частота дискретизации — 8 кГц, частота среза— 1 кГц, разрядность входных данных— 10. АЧХ такого фильтра изображена на рис. 4.
Аппаратная реализация цифровых фильтров
Классический цифровой КИХ-фильтр состоит из элементов задержки, умножителей и сумматора, на выходе которого мы получаем выходной отсчет (рис. 1). При этом если фильтр k-го порядка, то потребуется (k+1) умножение. А как известно, операция умножения требует больше всего времени и оборудования. Например, при реализации на ПЛИС, при n-разрядном сигнале для одного умножения потребуется n2 элементарных операций, то есть n2 логических элементов, следовательно, для фильтра k-го порядка только на умножение уйдет kx n2 элементов.
Порядки современных фильтров могут достигать десятков тысяч при 10-16-разрядном сигнале. Таким образом, только для умножения в подобном фильтре необходимо несколько миллионов логических элементов.
При аппаратной реализации КИХ-фильт-ра в конечных полях сокращение количества требуемых логических элементов достигается благодаря особенностям реализации операций сложения и умножения. Поскольку в каждом из блоков (рис. 2) используются модулярные операции, для высокой эффективности нужно применять специально спроектированные для таких систем сумматоры и умножители.
Существует большое количество подходов к реализации сумматоров по модулю m. Далее будут рассмотрены наиболее типичные и простые схемы модулярного суммирования [4].
Первая из них вычисляет модульную сумму x+y с помощью таблицы подстановок (LUT) размером nx22n (рис. 5). Для двух со-
X у
Рис. 5. Суммирование по модулю с помощью большой ШТ-таблицы
Рис. 6. Суммирование по модулю с предварительным обычным суммированием
ответствующих элементов просто выбирается ответ из большой таблицы. Это решение очень хорошо подходит для случаев, когда длина слова мала.
Для больших модулей память таблицы подстановок (ШТ) была бы значительного размера, и другие схемы для суммирования оказываются в этом случае более предпочтительны. Следующее предложение основывается на обычном суммировании х+у и одной таблице, содержащей все возможные значения для х+у по модулю т. При этом существенно сокращается размер подстановочной таблицы — с пх22п до пх2п+1, что дает возможность расширять набор модулей при необходимости большего динамического диапазона или избыточных модульных каналов для коррекции ошибок (рис. 6).
Третья схема суммирования — самая распространенная, она наиболее предпочтительна в большинстве случаев. В этой схеме используются два сумматора и мультиплексор для выбора результата в соответствии с выражением (рис. 7):
, , (х+у, 0<х+у<т
т [ х+у-т, т < х+у .
X у
Рис. 7. Без использования ШТ-таблиц: ^ — аппаратная разрядность сумматора
Теперь перейдем к реализации умножителей. Одним из вариантов реализации модулярного умножителя является, как и при сложении, использование большой таблицы подстановок, когда для двух соответствующих элементов просто выбирается ответ из этой таблицы. Это решение, как и при сложении, хорошо подходит, когда длина слова мала.
Другим вариантом является использование умножителей, основанных на арифметике указателей. Их использование ограничено простыми модулями и базируется на осуществлении преобразования в степенную форму (так называемое степенное исчисление), в котором умножение может более быстро осуществляться посредством операции суммирования.
Метод работы этого умножителя связан с математическими свойствами полей Галуа. Все ненулевые элементы поля Галуа могут быть получены путем многократного возведения в степень примитивного элемента — порождающего поле СДр) элемента gj. Это свойство полей Галуа можно использовать для умножения в ОР(ту) благодаря использованию изоморфизма между мультипликативной по модулю ту группой
<3 = {1, 2, т-1} и аддитивной по модулю
(т;--1) группой I = {0, 1, _, т-2}. Этот изоморфизм может быть установлен следующим образом:
и умножение над полем ОР(т) может производиться по формуле:
Таким образом, умножение двух чисел и qk можно производить, вычисляя модулярную сумму соответствующих указателей и ]к, а затем проводя обратное преобразование из степенного пространства в исходный вид. Необходимо специально обрабатывать случаи, когда один из операндов на входе умножителя равен нулю, и в этом случае назначать нулевой результат произведения. Это происходит потому, что не определен элемент в степенном пространстве, соответствующий нулевому элементу группы (р. Степени ;у и ]к для qj и qk, соответственно, могут быть заранее вычислены и помещены в ШТ. Сложение степе-
’ |Ч]-Чк1
Рис. 8. Умножитель, основанный на исчислении степеней (умножитель Галуа)
ней выполняет сумматор по модулю mj -1. Обратное преобразование из степенного представления ij и jk в исходное и qk также может быть выполнено с помощью предварительно вычисленных LUT. Такой умножитель показан на рис. 8.
Итак, преимущества при реализации цифровых фильтров в конечных полях достигаются благодаря замене умножителей и сумматоров эквивалентными схемами, которые при определенных условиях позволяют существенно сэкономить аппаратные ресурсы и реализовать фильтры с улучшенными параметрами. В частности, при реализации на ПЛИС вместо аппаратных умножителей и сумматоров используются структуры, которые могут строиться на основе памяти типа ROM (Read Only Memory). Стоимость же та-
кой памяти на порядок меньше стоимости ПЛИСа, который бы мог потребоваться для реализации эквивалентного по параметрам фильтра.
Кроме того, сама структура, изображенная на рис. 2, имеет ряд неоспоримых преимуществ:
1. Независимость каждого канала по отдельному модулю обеспечивает значительную гибкость при планировке и топологическом проектировании кристалла.
2. Реализация таких устройств на основе ПЛИС, обладающих меньшими вентильными ресурсами, может быть легко перепланирована и размещена в несколько кристаллов.
3. Трассировочные межсоединения распространяются только внутри отдельного вычислительного канала, что исключает наличие
длинных трасс и, как следствие, обеспечивает некоторое уменьшение потребляемой мощности и уменьшение задержек по критическим путям. ■
Литература
1. Солонина А. И., Улахович Д. А., Арбузов С. М., Соловьева Е. Б., Гук И. И.. Основы цифровой обработки сигналов: Курс лекций. СПб.: БХВ-Петербург, 2003.
2. Блейхут Р. Быстрые алгоритмы цифровой обработки сигналов: Пер. с англ. М.: Мир, 1989.
3. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1978.
4. Червяков Н. И., Дьяченко И. В. Принципы построения модулярных сумматоров и умножителей. Сборник научных трудов. Зеленоград: 2006.