Научная статья на тему 'Ущільнення звуку за допомогою нейромережних моделей геометричних перетворень'

Ущільнення звуку за допомогою нейромережних моделей геометричних перетворень Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
83
13
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — У В. Поліщук

Описано особливості ущільнення та відновлення даних (на прикладі звукових сигналів, зокрема мовних повідомлень) з використанням автоасоціативних нейроподібних структур геометричних перетворень для реалізації процедури виділення головних компонентів та відновлення початкових даних на їхній основі. Подано елементи архітектури розробленої нейромережної системи для ущільнення даних. Розглянуто приклади ущільнення різнотипних звукових файлів за допомогою програмної моделі ущільнення звукової інформації, розробленої на базі нейромережних структур моделі геометричних перетворень.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Audio compression using neurolike geometrical transformation machine structures

The features of data compression and decompression (for example, audio signals, including voice messages) using autoassociative neurolike geometrical transformation machine structures for principal component anylizing and restore the data based on them are being described. The architecture elements of the developed neural network system for data compression are being served. An examples of the polytypic audio files compression using audio compression program on the basis of neurolike geometrical transformation machine structures is concidered.

Текст научной работы на тему «Ущільнення звуку за допомогою нейромережних моделей геометричних перетворень»

2. Ганцюк В.М Iнтенсифiкацiя процесу пресування ДСП в установках безперервно!' ди : ав-тореф. дис. на здобуття наук. ступеня канд. техн. наук. - Львiв : Вид-во УкрДЛТУ. - 1996. - 18 с.

3. Отлев И.А. Интенсификация производства древесностружечных плит. - М. : Изд-во "Лесн. пром-сть", 1989. - 192 с.

Петрив О.М. Математическая модель оптимизации режимов прессования древесностружечной плиты

Построен алгоритм оптимизации режимов прессования. В результате решения оптимизационной задачи определяют параметры функции, которая задает изменение давления пресса в середине процесса прессования.

Petriv O.M. Mathematical model of optimisation of modes of pressing of particle board

Article is devoted construction of algorithm of optimisation of modes of pressing. Owing to the decision of an optimising problem parameters of function which defines change of pressure of a press throughout pressing process are defined

УДК 681.324 Астр. У.В. Полiщук1 - НЛТУ Украши, м. Львiв

УЩ1ЛЬНЕННЯ ЗВУКУ ЗА ДОПОМОГОЮ НЕЙРОМЕРЕЖНИХ МОДЕЛЕЙ ГЕОМЕТРИЧНИХ ПЕРЕТВОРЕНЬ

Описано особливосп ущшьнення та вщновлення даних (на прикладi звукових сигналiв, зокрема мовних повщомлень) з використанням автоасощативних нейропо-дiбних структур геометричних перетворень для реалiзацii процедури видшення го-ловних компонент та вщновлення початкових даних на 'хнш основь Подано еле-менти арх^ектури розроблено'' нейромережно'' системи для ущшьнення даних. Роз-глянуто приклади ущшьнення рiзнотипних звукових файшв за допомогою програм-но'' моделi ущiльнення звуково'' шформацп, розроблено'' на базi нейромережних структур моделi геометричних перетворень.

Вступ. На вщмшу вщ багатьох метод1в ущшьнення даних, зокрема по-будованих на видшенш частотних областей, застосуванню вейвлет1в, фрак-тальних перетворень, що ор1ентоваш виключно на певш об'екти застосування - зображення, звуков! файли та ш., розроблеш нейромережш шдходи з використанням модел1 геометричних перетворень [3] характеризуються ютотною ушверсальшстю. Тобто можуть бути застосоваш для ущшьнення даних р1з-номаштного походження без ютотних змш у алгоритмах та засобах.

Структура нейромережноУ системи ущшьнення - вщновлення даних. Штучш нейронш мереж1 (ШНМ) - це високопаралельш обчислювальш системи, що складаються 1з велико'' кшькоси простих обчислювальних еле-менив (нейрошв); загалом володдать бшьш потужними обчислювальними можливостями стосовно до окремого нейрона.

ШНМ забезпечують здшснення компреси завдяки властивостям уза-гальнення (генерал1заци), забезпечують отримання значних коефщ1ент1в компреси, демонструючи цим переваги над юнуючими традицшними методами ущшьнення [2]. Система ущшьнення - вщновлення даних, що базуеться на застосуванш нейропод1бних структур геометричних перетворень [1], вщповь дае певним критер1ям ушверсальносп застосування та мае таю властивосл:

1 Наук. кер1вник: проф. Ю.М. Рашкевич, д-р техн. наук - НУ "Льв1вська полггехшка"

• можлив1сть зд1иснення ущ1льнення даних та 1х в1дновлення для широкого д1-апазону коеф1щента компреси;

• рацюиальие поеднання показиишв компреси та якост ввдиовлюваиих даних;

• можлившть здшсиеиия ушдльнеиия без втрат шформаци;

• досить висок показники швидкоди.

На рис. 1 зображено структуру нейромережно! системи ущшьнення -вщновлення даних.

Рис. 1. Нейромережна системаущшьнення — вiдновлення даних

Блок даних, що шдлягае ущшьненню, подаеться повекторно на входи ущшьнюючо! ШНМ, яка при цьому навчаеться. У деяких випадках, зокрема для ущшьнення зображень, використовуеться попередньо навчена ШНМ [6]. Компоненти вектор1в ущшьнених даних I меншо! розм1рност1 формуються на виходах нейронних елемент1в прихованого шару. Однак, арх1в даних, що збер1гаеться, видаеться в бшьшост випадюв не лише векторами I, але 1 векторами параметр1в и* вихщно! частини ШНМ, необхщно! для вщновлення первинних вектор1в даних х. Отже, базовим елементом системи ущшьнення даних е ШНМ в автоасощативному режим! застосування.

1. Ущшьнення звуку за допомогою нейромережних моделей геомет-ричних перетворень. Метод навчання компресуючо! нейронно! мереж1 ге-ометричних перетворень е ушверсальним та симетричним, що дае змогу зас-тосовувати його до ущшьнення р1зного типу даних, зокрема звуку.

На вхщ нейронно! мереж1 подаються вектори даних, компонентами якого е значення звукових фрагменпв (семпл1в) [4, 5].

X ,3 = <

де / = 1, М, 3 = 1, N.

(1)

Розм1р компонент вектора залежить вщ характеристик звукового файлу та приймае значення 8, 16 та 32 бгг для високояюсного звуку. Кшь-юсть елеменлв вектора, що визначае кшьюсть вход1в та виход1в нейронно!

мережi, задаеться програмно перед виконанням етапу ущшьнення (навчання нейронно! мережi). Якщо шсля формування вхщно! матрицi реалiзацiй кшь-юсть елементiв останнього вектора е меншою, анiж початково задана, необ-хiдну кiлькiсть заповнюемо нулями.

Регулювання порогу втрат здiйснюеться шляхом вщкидання числа нейронiв прихованого шару мереж^ а також скорочення довжини розрядно! сiтки, що представляе значення головних компонент перетворення.

Розглянемо приклади ущшьнення рiзнотипних звукових файлiв за до-помогою програмно! моделi ущiльнення звуково! iнформацi!, розроблено! на базi нейромережних структур моделi геометричних перетворень. Програма ревизована в середовищi програмування Microsoft Visual Studio 2005 мовою C#.

Приклад. Ущiльнення звукового файлу iз записом мови.

Розмiр звукового семла дорiвнюе 16 бiт, 1 канал (моно звук), швид-юсть звукового потоку 126 Кбiт/сек. Представимо вхщний файл тривалiстю 14 сек у виглядi графiка звукових коливань, що демонструе змiну величини амплггуди звукового сигналу у певнi моменти часу (рис. 2).

Рис. 2. Запис мови. Графж звукових коливань

Нехай кшьюсть елеменпв вектора компресуючо! нейронно! мереж^ що вiдповiдае кшькост входiв та виходiв ШНМ, дорiвнюе 64. Здiйснимо процедуру ущшьнення при 10 нейронних елементах у прихованому шарь Коефь щент компреси, отриманий внаслiдок ущiльнення, дорiвнюе 4,5. Декодова-ний звуковий файл характеризуеться певною зашумленiстю, схожою на не-якiсну трансляцiю радiосигналу (рис. 3).

Рис. 3. Запис мови. Ущшьнення за 10 НЕ

Для шдвищення якост декомпресовано'' звуково'' шформацп, на еташ навчання ШНМ ГП збшьшимо число нейрошв у прихованому шарь На рис. 4. зображено графж амплггуди звукових коливань мовного сигналу, ущшьненого за 20 НЕ:

Рис. 4. Записмови. Ущтьнення за 20НЕ. CR=2.7

Коефщ1ент компреси дор1внюе 2,7. Мовний сигнал добре зрозумший, р1вень шуму пом1тно знизився.

Проанал1зуемо результати кодування даного звукового файлу за 20, 30 та 40 нейронах шляхом пор1вняння детал1зованих графтв звукових коливань на першш мшсек. запису.

Рис. 5. Запис мови. 1 мШсек. в1дл1ку

Рис. 6. Запис мови. Ущтьнення при 20 НЕ. 1 мШсек. в1длжу. CR=2,7.

Рис. 7. Записмови. Ущтьнення за 30 НЕ. 1 мШсек. eiÔRÎKy. CR=1,7

Рис. 8. Запис мови. Ущтьнення за 40 НЕ. 1 мШсек. eiÔRÎKy. CR=1,3

Як видно на рис. 5-8, ми спостер^аемо поступове зниження вщхилен-ня мiж ампл^удами сигнашв, що супроводжуеться зменшенням piBM шумо-вих завад звуково1 шформаци.

Вiдтворюванi пiсля компресiï звуковi файли анашзували на слухове сприйняття. Виявилося, що для ущшьнення мовних сигнашв з коефiцiентами компресiï до 1,3-1,5 жодних спотворень на слух не вщчуваеться, для коефь цiентiв вщ 2,7 спотворення стають очевидними.

Очевидно, показаш пiдходи можна застосувати практично в незмшно-му виглядi для ущшьнення часових послщовностей будь-якого походження, зокрема звукових файшв, фiнансових рядiв, дiагностичноï iнформацiï, зобра-жень, що може виявитися досить ефективним як в плат збереження даних, так i наступного використання скомпресованих файшв для розшзнавання, класифжаци або передбачення.

Лггература

1. Пол1щук У. Ущшьнення зображень за допомогою нейроподiбних структур моделi ге-ометричних перетворень / Полiщук У., Ткаченко О., Цимбал Ю. // Вiсник Нацiонального уш-верситету мЛьвiвська полiтехнiкам. - Сер.: Комп'ютерш науки та iнформацiйнi технологи. -2010. - № 663. - С. 275-280.

2. Verma B. A new compression technique using an artificial neural network / Verma B., Blumenstein M., Kulkarni S. // Faculty of Information and Communication Technology, Griffith University / Australia. - 2004. - С. 172-178.

3. Ткаченко Р.О. Нова парадигма штучних нейронних мереж прямого поширення / Р.О. Ткаченко // Вюник Державного ушверситету '^bBiBCbra полiтехнiкам. - Сер.: Комп'ютерна ш-женерiя та шформацшт технолога. - 1999. - № 386. - С. 43-54.

4. Сергеенко В.С. Сжатие данных, речи, звука и изображений в телекоммуникационных системах / В.С. Сергеенко, В.В. Баринов. - М. : Изд. предп. "РадиоСофт". - 2009. - С. 163-173.

5. Сэломон Д. Сжатие данных, изображений и звука / Д. Сэломон // Техносфера. - М., 2004. - С. 123-128.

6. Osovski S. Sieci neuronowe dla przetwarzania informacji / S. Osovski // Oficyna wydaw-nicza Politechniki Warszawskiej. - Warszawa. - 2000. - PP. 83-92.

Полищук У.В. Компрессия звука с помощью нейросетевых моделей геометрических преобразований

Описываются особенности компрессии и декомпрессии данных (на примере звуковых сигналов, в частности, речевых сообщений) с использованием автоассоциативных нейроподобных структур геометрических преобразований для реализации процедуры выделения главных компонент и восстановление исходных данных на их основе. Подаются элементы архитектуры разработанной нейросетевой системы для компрессии данных. Рассмотрены примеры компрессии разнотипных звуковых файлов с помощью программной модели компрессии звуковой информации, разработанной на базе нейросетевых структур модели геометрических преобразований.

Polishchuk i/.KAudio compression using neurolike geometrical transformation machine structures

The features of data compression and decompression (for example, audio signals, including voice messages) using autoassociative neurolike geometrical transformation machine structures for principal component anylizing and restore the data based on them are being described. The architecture elements of the developed neural network system for data compression are being served. An examples of the polytypic audio files compression using audio compression program on the basis of neurolike geometrical transformation machine structures is concidered.

УДК378.681.952 Астр. С.1. Степанюк1 -Волинський НУм. ЛесЬ Укратки

РОЗП1ЗНАВАННЯ ОБРАЗ1В НА ОСНОВ1 АНАЛОГОВИХ НЕЙРОННИХ МЕРЕЖ ВИЗНАЧЕННЯ МАКСИМАЛЬНИХ

СИГНАЛ1В

Розглянуто деяю тдходи до розв'язання задач розтзнавання образiв на основi аналоговых WTA-мереж. Зокрема, наведено мюце WTA-мереж у розтзнаванш ста-тичних зображень фшсовано! розмiрностi, сегментацп зображень, отриманих за до-помогою магштно-резонансно! томографа. Дослщжено переваги та обмеження таких пiдходiв, сформульовано вщкрип питання в цш область

Ключов1 слова: штучна нейронна мережа, розтзнавання образiв, сегментащя зображень, енергетична функщя, математична модель мережь

1. Вступ. Автоматичне розтзнавання, класифжащя, групування обра-зiв е ключовими задачами рiзних iнженерних та наукових дисциплш, таких як: бiологiя, медицина, маркетинг, комп'ютерний зiр, штучний iнтелект та ш-

1 Наук. кер1вник: доц. П.В. Тимощук, д-р техн. наук - НУ "Льв1вська полтгехшка"

i Надоели баннеры? Вы всегда можете отключить рекламу.