Научная статья на тему 'АНАЛИЗ МЕТОДОВ И ГОТОВЫХ БИБЛИОТЕК ВЫЧИСЛЕНИЯ ТЕМПА МУЗЫКИ'

АНАЛИЗ МЕТОДОВ И ГОТОВЫХ БИБЛИОТЕК ВЫЧИСЛЕНИЯ ТЕМПА МУЗЫКИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
оценка темпа музыки / BPM / процессирование аудиоданных / извлечение музыкальных характеристик / MIR.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Коськин С. И.

В статье рассматриваются существующие методы и готовые решения оценки темпа музыкальных композиций. Целью данного исследования является предоставление обзора различных методов и библиотек для оценки BPM музыки, их сравнение и выявление наиболее эффективных подходов. Результаты. В ходе работы был составлен набор методов и готовых решений, а также проведён сравнительный анализ точности комбинаций алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «АНАЛИЗ МЕТОДОВ И ГОТОВЫХ БИБЛИОТЕК ВЫЧИСЛЕНИЯ ТЕМПА МУЗЫКИ»

изменениям на рынке, внедряя инновации и повышая эффективность производства. Торговые барьеры и изменения в законодательстве также могут оказывать влияние на отрасль. Перспективы развития

Технологические инновации: Технологическое развитие открывает новые возможности для текстильной промышленности. Развитие новых материалов, таких как умные ткани и биополимеры, позволяет создавать продукты с уникальными свойствами. Автоматизация и цифровизация производственных процессов способствуют повышению производительности и снижению издержек.

Устойчивое развитие: Переход к устойчивому производству становится приоритетом для многих компаний. Это включает использование экологически чистых материалов, внедрение энергосберегающих технологий и улучшение систем переработки текстильных отходов. Компании, которые смогут адаптироваться к новым экологическим требованиям, получат конкурентные преимущества на рынке.

Локализация производства: Локализация производства, или возвращение производственных мощностей в страну происхождения, становится важной стратегией для многих текстильных компаний. Это позволяет сократить логистические издержки, улучшить контроль качества и оперативно реагировать на изменения потребительского спроса.

Заключение: Текстильная промышленность, несмотря на многочисленные вызовы, сохраняет важную роль в мировой экономике. Технологические инновации, устойчивое развитие и улучшение условий труда являются ключевыми направлениями, которые будут определять будущее отрасли. Компании, способные адаптироваться к изменениям и внедрять передовые решения, будут успешны в условиях глобальной конкуренции.

Список использованной литературы:

1. Chen, X., & Burns, L. D. (2019). Textile Sustainability: Principles and Practices. Springer.

2. Fletcher, K. (2014). Sustainable Fashion and Textiles: Design Journeys. Routledge.

3. Kadolph, S. J. (2016). Textiles. Pearson.

© Какабаева К.М., 2024

УДК 004.9

Коськин С.И.

магистрант 2 курса РТУ МИРЭА, г. Москва, РФ

АНАЛИЗ МЕТОДОВ И ГОТОВЫХ БИБЛИОТЕК ВЫЧИСЛЕНИЯ ТЕМПА МУЗЫКИ

Аннотация

В статье рассматриваются существующие методы и готовые решения оценки темпа музыкальных композиций.

Целью данного исследования является предоставление обзора различных методов и библиотек для оценки BPM музыки, их сравнение и выявление наиболее эффективных подходов.

Результаты. В ходе работы был составлен набор методов и готовых решений, а также проведён сравнительный анализ точности комбинаций алгоритмов.

Ключевые слова оценка темпа музыки, BPM, процессирование аудиоданных, извлечение музыкальных характеристик, MIR.

Музыка занимает большую часть жизни человечества и играет важную роль в нашей культуре, эмоциональном восприятии. Однако, с ростом объема музыкальных данных в цифровой эпохе, становится все более сложным и трудоемким процесс поиска и организации музыкальной информации. В контексте этой проблемы возникает потребность в эффективных и автоматизированных методах анализа информации о музыке.

Одним из важных аспектов анализа музыки является оценка ее темпа, чаще называемом BPM (beats per minute). BPM является мерой скорости музыкальной композиции и имеет важное значение не только в процессе создания и воспроизведения музыки, но и при её анализе.

Таким образом объектом исследования в данной работе является темп музыки. Исследуя предмет методов оценки темпа и готовые библиотеки, будет проводится сравнительный анализ точности их вычислений. Задачами в данной работе являются:

1. Проанализировать предметную область;

2. Подобрать методы и готовые решения;

3. Составить программу для оценки и анализа побранных алгоритмов.

Целью данного исследования является предоставление обзора различных методов и библиотек для оценки BPM музыки, их сравнение и выявление наиболее эффективных подходов.

Выбор ключевых методов. Одной из основных задач в области распознавания BPM является распознавание начала звуков ритма, в английской литературе «onset detection», в музыкальной теории также используется термин первая доля. В большинстве современных композиций бит сопровождается ударными. В момент начала основного удара чаще всего появляется и резкий скачок звуковой волны, который также можно увидеть, как и на спектрограмме, так и на звуковой волне.

¡4-J

I Пер&ЯОД \

Рисунок 1 - График сигнала пика

Определение данных скачков требует использования алгоритмов, которые могут определить начало каждого основного удара. Для этого прибегают к методам вычисления скачков сигнала « novelty functions», в прямом переводе «функция новизны»[1].

Функции новизны — это функции, которые обозначают локальные изменения в свойствах сигнала, таких как энергия или спектральный состав. На основе полученного графика в дальнейшем производится выбор пиков и вычисление темпа музыки.

В классе функций новизны большое количество функций оценки BPM, четырьмя основными из которых являются:

• функции новизны энергии;

• спектральные функции новизны;

• фазовые функции новизны;

• функции новизны комплексного домена.

Стоит также отметить, что параметры применения функций новизны могут отличаться и комбинироваться, также к ним могут применятся различные методы пост-обработки, например, логарифмическое сжатие.

Выбор пиков. В качестве первого алгоритма выбора пиков будет использован простой алгоритм, основанный на направлении движения значений входного дискретного сигнала с фиксированным уровнем порога. Библиотеки, содержащие реализацию алгоритмов выбора пиков: MSAF, Scipy, LibROSA, Boeck, Roeder. Основное различие данных алгоритмов в используемых методах подготовки сигнала, сглаживания сигнала, адаптивности оценки порога и выборе дистанции между последовательными пиками.

Методы оценки BPM. В данной работе также будут рассмотрены два метода оценки темпа на основе полученного массива индекса пиков. Первый алгоритм оперирует значением количества пиков в указанном промежутке в отношении к общему количеству семплов композиции:

BPMS = len(p)/(len(x) • sr)/60 , (1)

где len() - функция вычисления длинны массива; р - массив индексов позиций пиков; х - массив амплитудных значений дискретного сигнала; sr - частота дискретизации сигнала.

Второй алгоритм вычисляет BPM на основе средней разницы расстояний между каждым индексом

пика:

Т-.Г.И, Sr-60

ВРМт = ^--(2)

где N Е N - количество пиков в сигнале; р - массив индексов позиций пиков; sr - частота дискретизации сигнала.

Выбор готовых библиотек. В области получения музыкальных данных существует множество готовых решений, в том числе готовые библиотеки для различных языков. Самым популярным языком программирования для решения задач машинного обучения является Python, следовательно далее будут рассматриваться самые популярные и актуальные библиотеки, которые имеют функционал извлечения характеристики темпа звукового сигнала. В ходе данной работы были проанализированы библиотеки, исследованные на функциональное разнообразие в работе «Digital Audio Processing Tools for Music Corpus Studies».

Рисунок 2 - Сравнение библиотек для извлечения музыкальных характеристик^]

Среди данных библиотека лишь меньшая часть из них реализована на языке программирования Python. Другая часть библиотек имеют прекращённую поддержку и для своей работы требуют понижение версии языка программирование. По данной причине такие библиотеки не будут рассматриваться в работе. Библиотеками, подходящими для данной работы, являются:

• Aubio;

• Essentia;

• Librosa.

Анализ методов вычисления темпа. Для проведения анализа алгоритмов вычисления темпа музыки требуется подобрать банк данных, содержащий в себе музыкальные отрывки и аннотацию к ним в виде числового значения BPM. Для данной задачи был выбран один из самых популярных датасетов «GiantSteps», содержащий отрывки музыкальных композиций в жанре EDM[3].

Было произведено вычисление средней абсолютной ошибки для каждой комбинации функции новизны, функции вычисления пиков, вычисления BPM и отдельно для готовых функций из библиотек. Таким образов в итоговом результате сравнений функций представлено 28 комбинаций и готовых библиотек. Непосредственные их названия и итоговые значения ошибки представлены в таблице ниже.

Таблица 1

Результаты тестирования комбинаций алгоритмов

Номер Название комбинации Результат (MAE) Номер Название комбинации Результат (MAE)

1 Энврг+simple 68.431693 15 Фаз+scipy 39.326958

2 Энерг+MSAF 43.165645 16 Фаз+librosa 22.146521

3 Энерг+scipy 89.475985 17 Фаз+boeck 25.964339

4 Энерг+librosa 32.184576 18 Фаз+roeder 36.169635

5 Энврг+boeck 28.234418 19 Комплвкс+simple 33.428131

6 Энврг+roeder 34.609729 20 Комплекс+MSAF 34.482878

7 Спектр+прост 37.232552 21 Комплекс+scipy 68.816281

8 Спектр+MSAF 36.226401 22 Комплекс+librosa 32.489844

Номер Название комбинации Результат (MAE) Номер Название комбинации Результат (MAE)

9 Спектр+scipy 47.146413 23 Комплекс+boeck 27.768465

10 Спектр+librosa 26.873052 24 Комплекс+roeder 30.238213

11 Спектр+boeck 29.748824 25 aubio 20.526453

12 Спектр+roeder 29.872126 26 Rythm2013 25.902467

13 Фаз+simple 34.363172 27 Percival 35.509519

14 Фаз+MSAF 49.253127 28 librosa 22.438912

Также ниже представлена столбчатая диаграмма, которая является репрезентацией таблицы ошибок выше в сортированном виде.

Рисунок 3 - Диаграмма ошибок комбинаций методов вычисления темпа

Заключение. В результате данной работы была проанализирована предметная область оценки темпа музыки. Также были выбраны и проанализированы методы и готовые решения для вычисления темпа музыки. Была составлена программа, позволяющая сравнить существующие решения в данной области и их комбинации. На основе её вывода предоставлена информация о самых удачных алгоритмах оценки темпа музыки. Цель и задачи, поставленные в данной работе выполнены. Полученная в ходе работы информация позволит выбирать наиболее подходящие инструменты и методы для анализа музыкальной информации.

Список использованной литературы:

1. Mao-Yuan Kao, Chang-Biau Yang, Shyue-Horng Shiau. Tempo and beat tracking for audio signals with music genre classification // International Journal of Intelligent Information and Database Systems. 2009. №3. С. 275-290.

2. Johanna Devaney. Digital Audio Processing Tools for Music Corpus Studies // Oxford Handbook of Music and Corpus Studies. 2023.

3. Two data sets for tempo estimation and key detection in electronic dance music annotated from user correstions / Peter Knees [и др.] // International Society for Music Information Retrieval Conference. 2015. С. 364-367.

4. Meinard Müller. Fundamentals of Music Processing - Using Python and Jupyter Notebooks. Springer Verlag. 2021.

© Коськин С.И., 2024

i Надоели баннеры? Вы всегда можете отключить рекламу.