В дальнейшем, по завершению всей запланированной функциональности, распределенная система хранения данных будет интегрирована с одной из популярных систем управления содержимым. Также в ближайшее время будет опубликован код системы, что позволит осуществлять совместную с открытым сообществом работу над улучшением системы, а также сделает доступным распределенную систему хранения данных любому желающему.
Литература
1. Лукьянов Н.М. Анализ факторов, влияющих на качественные и количественные показатели функционирования систем распределенного хранения данных // Научно-технический вестник СПбГУ ИТМО. - 2008. - № 56. - 9 с.
2. Hoff T. Google Architecture // HighScalability.com. - 2008. [Электронный ресурс] - URL: http://highscalability.com/google-architecture (дата обращения: 02.09.2010).
3. Корников В.В. Байесовская модель обработки нечисловой, неточной и неполной информации о весовых коэффициентах. - Санкт-Петербургский государственный университет, 2000 [Электронный ресурс] - URL: http://www.inftech.webservis.ru/it/conference/scm/2000/session3/kornikov.htm (дата обращения: 02.09.2010).
4. Vogt M., Troup J. Dynamic Mirror Decisions // ООО Canonical - 2006 [Электронный ресурс] - URL: https://wiki.ubuntu.com/DynamicMirrorDecisions (дата обращения: 02.09.2010).
5. Yokota H. A proposal of DNS-based adaptive load balancing method for mirror server systems and its implementation // Конференция Advanced Information Networking and Applications - США: IEEE Computer Society, 2004. - 208 с.
Лукьянов Николай Михайлович - Санкт-Петербургский государственный университет информационных
технологий, механики и оптики, аспирант, [email protected] Дергачев Андрей Михайлович - Санкт-Петербургский государственный университет информационных
технологий, механики и оптики, ст. преподаватель, [email protected]
УДК 778.38:777.6
МЕТОД СЖАТИЯ ДИНАМИЧЕСКОГО ДИАПАЗОНА ЦИФРОВЫХ ГОЛОГРАММ ФУРЬЕ В ЗАДАЧЕ ВСТРАИВАНИЯ СКРЫТЫХ ВОДЯНЫХ
ЗНАКОВ А.П. Старченко, Ю.А. Гатчин
Предлагается методика уменьшения искажений в изображении-контейнере со встроенной голограммой водяного знака, основанная на изменении динамического диапазона голограммы методом логарифмического преобразования. Предложенная методика позволяет снизить искажения, возникающие при восстановлении изображения водяного знака, по сравнению с традиционным методом голограммы Фурье. Выявлена линейная зависимость между изменением амплитуды сигнала водяного знака и средним квадратичным отклонением интенсивности цифровой голограммы Фурье.
Ключевые слова: водяной знак, голограмма, преобразование интенсивности.
Введение
Водяные знаки на основе голограмм устойчивы к различным преобразованиям изображения - масштабированию, геометрическим искажениям и др. При встраивании голограммы желательно уменьшить ее динамический диапазон для снижения искажений в изображении-контейнере.
В оптике для снижения динамического диапазона голограммы Фурье перед предметом устанавливают рассеиватель [1]. Рассеиватель не изменяет амплитуды, но изменяет случайным образом фазу в каждой точке, падающей на предмет волны. Случайная фаза не оказывает влияния на изображение предмета, получаемое при восстановлении амплитуды электромагнитной волны. В цифровой голографии тот же эффект достигается умножением исходного изображения водяного знака на произвольный фазовый множитель ехр^и, V)], где и, V - пространственные частоты. Случайная фаза 2(и, V) приводит к расширению спектра в частотной области голограммы и уменьшению диапазона изменения составляющих спектра [1], что значительно снижает требования к динамическому диапазону регистрирующего устройства.
Эффективность применения голограмм с рассеивателем бывает недостаточной в случае повышения требований к устойчивости скрытых водяных знаков, что на практике сводится к необходимости повышения отношения сигнал/шум за счет увеличения амплитуды сигнала водяного знака. При этом в изображении-носителе могут возникать сильные искажения, обусловленные внедрением голограммы водяного знака [2, 3].
Цель работы - показать возможность снижения искажений в изображении-контейнере при встраивании голограммы водяного знака за счет применения логарифмического преобразования интенсивности голограммы.
Анализ зависимости динамического диапазона интенсивности цифровой голограммы со случайной
фазой от амплитуды сигнала водяного знака
Для улучшения устойчивости скрытых водяных знаков требуется повышение амплитуды сигнала водяного знака, что неминуемо отражается на величине искажений в изображении-носителе. Для оценки зависимости величины искажений в изображении-носителе от повышения амплитуды сигнала водяного знака рассмотрим изменение интенсивности цифровой голограммы со случайной фазой х(и, V) от величины амплитуды сигнала водяного знака.
Распределение интенсивности в цифровой голограмме в рассматриваемом случае определяется соотношением
И(х,у) = (и - N, V-М)ехрО(и, V))}, (1)
где Ь - коэффициент, определяющий амплитуду сигнала водяного знака; v-M) - функция изо-
бражения водяного знака; N и М- пространственные несущие в плоскости частот (и, V); ^ _1 - оператор обратного преобразования Фурье. Формула (1) описывает голограмму Фурье с одной боковой полосой [3].
Были проведены экспериментальные исследования при встраивании голограммы водяного знака в изображение для двух значений амплитуды сигнала водяного знака Ь=50 и Ь=150 для значений интенсивности в 256 градаций. В качестве примера водяного знака был использован знак ©. Выполнены расчеты среднего квадратичного отклонения (СКО) с и дисперсии Б интенсивности голограммы Фурье водяного знака при изменении значений амплитуды сигнала водяного знака Ь в диапазоне от 50 до 150. Полученные расчеты представлены в табл. 1.
Ь с Б
50 2,67 7,13
60 3,21 10,27
70 3,74 13,98
80 4,27 18,26
90 4,81 23,12
100 5,34 28,54
110 5,88 34,53
120 6,41 41,10
130 6,94 48,23
140 7,48 55,93
150 8,01 64,21
Таблица 1. Результаты расчета СКО и дисперсии интенсивности голограммы Фурье водяного знака
Из данных табл. 1 следует наличие линейной зависимости СКО интенсивности голограммы Фурье от амплитуды сигнала водяного знака в довольно широком диапазоне изменений значений амплитуды, что позволяет устанавливать требуемое снижение динамического диапазона в голограмме.
Исследование логарифмического преобразования интенсивности цифровой голограммы Фурье
со случайной фазой
Для снижения динамического диапазона в голограмме предлагается использовать метод логарифмического преобразования, которое используется в задачах гомоморфной фильтрации [4] изображений. В ряде случаев используются нелинейные преобразования, которые подчиняются обобщенному принципу суперпозиции и получили название гомоморфных систем обработки сигналов. Применение гомоморфной обработки изображений позволяет, с одной стороны, повысить контрастность, а с другой стороны - сжать динамический диапазон [4].
Применительно к задаче уменьшения динамического диапазона интенсивности цифровых голограмм важной операцией при гомоморфной обработке является операция логарифмирования или вычис-
ления степенной функции вида xpq, где p/q<1. Как известно, эти операции имеют схожие характеристики: как логарифмическая функция, так и степенная функция при p/q<l обеспечивают снижение уровня сигналов с большей амплитудой по сравнению с сигналами незначительной амплитуды.
Для оценки зависимости логарифмического преобразования интенсивности цифровой голограммы Фурье от преобразования интенсивности без логарифмирования исследуем изменение СКО интенсивности цифровой голограммы со случайной фазой и изменение отношения сигнал/шум (С/Ш) при восстановлении водяного знака от величины амплитуды сигнала водяного знака. Для описания процедуры встраивания водяных знаков W(u, v) в предметной области будем использовать формулу
s( x, y) = g( x, y) + f {h(x, y)}, (2)
где s(x, y) - функция изображения со встроенной голограммой водяного знака; g(x, y) - функция изображения-контейнера; h(x, y) - функция цифровой голограммы Фурье, рассчитанная по формуле (l), которая имеет явную зависимость от амплитуды сигнала водяного знака b; f - функция логарифмического преобразования интенсивности голограммы.
Для оценки отношения С/Ш воспользуемся формулой
С/Ш = XZ [W(u, /) - a] [W1 (u,v) - a1 ] dud//£ ^ s2(x, y)dxdy , (3)
где W(u, v) и Wl (u, v) - сравниваемые сигналы водяного знака; a и al - средние значения сигналов W и W1, соответственно. Ковариация (3) вычисляется при полном совмещении исходного изображения водяного знака W и восстановленного изображения Wl.
В табл. 2 представлены результаты оценки зависимости СКО распределения интенсивности в голограммах со случайной фазой и зависимости отношения С/Ш при восстановлении водяных знаков от величины изменения амплитуды сигнала водяного знака b.
b СКО1 СКО2 С/Ш1 С/Ш2
50 2,67 3,55 2,11 2,26
60 3,21 3,88 2,21 2,31
70 3,74 4,46 2,27 2,38
80 4,27 4,62 2,36 2,40
90 4,81 5,00 2,42 2,44
100 5,34 5,21 2,47 2,46
110 5,88 5,75 2,52 2,51
120 6,41 6,21 2,56 2,55
130 6,94 6,62 2,60 2,57
140 7,48 6,81 2,62 2,59
150 8,01 6,97 2,65 2,60
Таблица 2. Оценки СКО интенсивности голограмм Фурье со случайной фазой и значения отношения С/Ш
при восстановлении водяных знаков
В табл. 2 столбцы значений СКО1 и СКО2 являются средними значениями СКО интенсивности голограмм для двух случаев: без применения амплитудного преобразования и с применением степенного преобразования вида
Р (X У) = УткРк(х' У) (4)
соответственно. Параметр ут определяется по формуле ут = Вт! ВрС1 и представляет собой, как будет рассмотрено ниже, угол наклона искомой зависимости, где Вт - максимальное значение интенсивности голограммы, Ит (х, у) - голограмма после нелинейного амплитудного преобразования. Столбцы
значений С/Ш1 и С/Ш2 являются средними значениями отношения С/Ш для этих двух случаев, соответственно. Результаты экспериментов в табл. 2 получены при р=5, д=8, ут =2,15, размере водяного знака
© 32^32 пикселей. В качестве контейнера использовалось тестовое изображение «Ьеппа» форматом 256^256 пикселей.
На рис. 1, а, и рис. 1, б, представлены изображение-контейнер со встроенной голограммой водяного знака без предварительного преобразования интенсивности и восстановленный водяной знак соответственно, а на рис. 2, а, и рис. 2, б, показаны изображение после нелинейного преобразования интенсивности голограммы и восстановленный водяной знак соответственно. В обоих случаях значение амплитуды сигнала водяного знака составляло ¿=150. Задание такого значения амплитуды сигнала водяного знака позволяет оценить полученный эффект снижения динамического диапазона интенсивности голограммы.
а б
Рис. 1. Изображение-контейнер со встроенной голограммой водяного знака без предварительного преобразования интенсивности голограммы (а) и восстановленный водяной знак (б)
а б
Рис. 2. Изображение-контейнер после нелинейного преобразования интенсивности голограммы (а)
и восстановленный водяной знак (б)
На рис. 3 представлен график зависимости СКО интенсивности голограммы Фурье от амплитуды сигнала водяного знака (на графике 1 - результат степенного преобразования, 2 - без логарифмического преобразования). Из анализа полученных зависимостей на рис. 3 видно, что результаты логарифмического преобразования интенсивности голограммы имеют как положительный, так и отрицательный эффект. Результаты, связанные со снижением динамического диапазона голограммы, встраиваемой в контейнер, начинают проявляться с порогового значения амплитуды сигнала Ьт водяного знака. При относительно небольших значениях амплитуды сигнала водяного знака СКО интенсивности голограммы, после нелинейного амплитудного преобразования, превышает соответствующее значение СКО голограммы без преобразования интенсивности. Однако при этом отношение С/Ш для голограммы с амплитудным нелинейным преобразованием превышает соответствующие значения для голограммы без нелинейного преобразования интенсивности.
8.00
50 60 70 80 90 100 110 120 130 140 150
Рис. 3. Зависимости СКО интенсивности голограммы Фурье от амплитуды сигнала водяного знака: 1 - результат степенного преобразования; 2 - без логарифмического преобразования
При увеличении значения амплитуды сигнала водяного знака ситуация меняется на противоположную, а именно, при больших значениях амплитуды сигнала водяного знака динамический диапазон интенсивности голограммы снижается, а СКО достигает 12% при значении амплитуды сигнала водяного знака ¿=150. Для выбранных параметров формирования голограммы и параметров степенного преобразования р/д=5/8, ут =2,15 положительный эффект сжатия интенсивности голограммы начинает наблюдаться со значений амплитуды сигнала водяного знака, примерно равных Ьт =95.
Из графика на рис. 3 следует, что коэффициент пропорциональности Ут определяет угол наклона
рассматриваемых зависимостей для случая применения нелинейного преобразования интенсивности голограммы. На рис. 4 представлены графики степенной функции уровней квантования Ь при р/д=5/8 для трех вариантов угла наклона Ут : 1,0; 2,15 и 5,0. При этом входное изменение уровней квантования В1
задавалось в диапазоне 0-255. Крутизна выходных характеристик В2 изменяется в зависимости от параметра Ут и может регулироваться в широких пределах.
Рис. 4. График степенной функции уровней квантования Ь при р/д=5/8 для трех вариантов угла
наклона у : 1,0; 2,15 и 5,0
т
Таким образом, в процессе экспериментов по применению логарифмического сжатия динамического диапазона интенсивности голограмм Фурье со случайной фазой установлено, что положительный эффект начинает выполняться с порогового значения амплитуды Ьт водяного знака, величина которого
определяется параметрами степенного преобразования хррС1 (р/д<1) и параметром наклона Ут , который влияет на крутизну характеристики преобразования.
Заключение
Установлена линейная зависимость между изменением амплитуды сигнала водяного знака и средним квадратичным отклонением интенсивности цифровой голограммы Фурье.
Проведенные эксперименты логарифмического сжатия интенсивности голограмм водяных знаков, встраиваемых в изображение-контейнер, показали существенное снижение динамического диапазона голограммы в области больших значений амплитуды сигнала водяного знака. Для значения амплитуды сигнала водяного знака Ь=150 и параметров степенного преобразования (4) р=5, q=8, Ут =2,15, получено
уменьшение динамического диапазона ДВ на 37%, при этом уменьшение среднего квадратичного отклонения интенсивности голограммы составило около 12%.
Установлено, что эффект логарифмического преобразования интенсивности голограммы не является однозначным по мере увеличения амплитуды сигнала водяного знака. В области небольших значений амплитуды сигнала водяного знака СКО превышает соответствующее значение для голограммы без преобразования интенсивности. При увеличении амплитуды сигнала водяного знака СКО интенсивности нелинейно преобразованных голограмм снижается и становится меньше соответствующей характеристики голограмм без этого преобразования.
Литература
1. Короленко П.В. Оптика когерентного излучения. - М.: Изд-во МГУ, 1997. - 222 с.
2. Гендин В.Г. Формирование и идентификация изображений со встроенными водяными знаками методами цифровой голографии // Труды научно-исследовательского центра фотоники и оптоинформатики. - СПб: СПбГУ ИТМО. - 2009. - С. 406^15.
ОЦЕНКА КОЛИЧЕСТВА ИНФОРМАЦИИ В БАЗАХ ЗНАНИЙ
3. Смирнов М.В. Голографический подход к встраиванию скрытых водяных знаков в фотоизображение // Оптический журнал. - 2005. - Т. 72. - № 6. - С. 51-56.
4. Оппенгеймер А.В., Шафер Р.В. Цифровая обработка сигналов. - М.: Связь, 1979. - 416 с.
Старченко Алексей Петрович - Санкт-Петербургский государственный университет информационных
технологий, механики и оптики, аспирант, [email protected] Гатчин Юрий Арменакович - Санкт-Петербургский государственный университет информационных
технологий, механики и оптики, доктор технических наук, профессор, зав. кафедрой, [email protected]
УДК 004.89
ОЦЕНКА КОЛИЧЕСТВА ИНФОРМАЦИИ В БАЗАХ ЗНАНИЙ
И.А. Бессмертный
Обсуждается проблема построения систем искусственного интеллекта (ИИ) в части измерения количества информации, содержащейся в формализованных знаниях в виде фактов. Рассматривается метод измерения информативности знаний, одинаково пригодный для оценки естественного и искусственного интеллекта. В целях устранения неопределенности пространства понятий в работе предлагается оценивать информативность понятий и фактов в рамках контекста.
Ключевые слова: искусственный интеллект, количество информации, контекст.
Введение
Задача оценки уровня ИИ возникла одновременно с введением данного понятия, и наиболее важный вклад в понимание этой проблемы внес А. Тьюринг [1]. Тест Тьюринга, однако, является сугубо качественной оценкой ИИ в сравнении с естественным интеллектом (ЕИ) и принципиально не может дать ответа на вопрос, каким объемом базы знаний должен располагать ИИ для решения тех или иных задач и в каких единицах этот объем следует измерять.
Существующие методы оценки объемов знаний, в основном, базируются либо на объемах текстовых документов в символах или словах, либо на измерении времени, затраченного на приобретение этих знаний. Эти методы широко применяются, например, в образовательной деятельности, хотя и обладают очевидными недостатками: объем текста далеко не всегда отражает его информативность, а время обучения характеризует лишь предоставленную возможность приобретения знаний, но не результат обучения. Кроме того, эти методы не могут применяться к оценке ИИ.
В качестве единицы знаний (атома знания) иногда выбирают факт, соответствующий триплету субъект-предикат-объект (СПО), используемому в семантических сетях. В работе [2] делается анализ производительности образовательного процесса в терминах усваиваемых фактов, что позволяет связать время обучения с объемом приобретаемых знаний. В [3] приведены результаты оценки информативности слабо формализованных знаний, содержащихся в энциклопедиях и словарях, в тех же единицах СПО.
Очевидно, однако, что информативность разных фактов не является одинаковой. Кроме того, данный подход не согласуется с теорией информации, созданной К. Шенноном. Таким образом, представляется целесообразным разработать систему метрик и методику измерения количества информации, содержащейся в отдельных высказываниях и в базах знаний в целом.
Количество информации в слове как смысловой единице
В текстах на естественном языке минимальной смысловой единицей является слово. Очевидно, что каждое слово несет определенную информацию, количество которой должно поддаваться измерению. Согласно Шеннону, единицей информации является бит как величина энтропии для одного из двух равновероятных событий. Общая формула энтропии Н(х) для п состояний случайной величины х имеет вид
п
н (х ) = "Е р(х р(х).
I=1
Для двоичной пары (0, 1) энтропия равна единице. Таким образом, число двоичных разрядов в точности соответствует числу битов информации при условии, что для всех разрядов вероятности нулей и единиц равны. Количество информации I определяется как двоичный логарифм числа состояний п:
I = ^2 П .
Слова (исключая иероглифическое письмо) состоят из букв. Количество информации в одной букве русского алфавита (в предположении, что вероятности всех букв равны) приблизительно равно пяти битам, что соответствует пяти двоичным разрядам, которыми русский алфавит как раз и может быть закодирован (если отбросить букву «ё»).
Следует признать, что механическое перенесение энтропии алфавита на составляемые с его помощью слова лишено смысла, иначе длинные слова всегда будут более информативными, а английский