изменениям на рынке, внедряя инновации и повышая эффективность производства. Торговые барьеры и изменения в законодательстве также могут оказывать влияние на отрасль. Перспективы развития
Технологические инновации: Технологическое развитие открывает новые возможности для текстильной промышленности. Развитие новых материалов, таких как умные ткани и биополимеры, позволяет создавать продукты с уникальными свойствами. Автоматизация и цифровизация производственных процессов способствуют повышению производительности и снижению издержек.
Устойчивое развитие: Переход к устойчивому производству становится приоритетом для многих компаний. Это включает использование экологически чистых материалов, внедрение энергосберегающих технологий и улучшение систем переработки текстильных отходов. Компании, которые смогут адаптироваться к новым экологическим требованиям, получат конкурентные преимущества на рынке.
Локализация производства: Локализация производства, или возвращение производственных мощностей в страну происхождения, становится важной стратегией для многих текстильных компаний. Это позволяет сократить логистические издержки, улучшить контроль качества и оперативно реагировать на изменения потребительского спроса.
Заключение: Текстильная промышленность, несмотря на многочисленные вызовы, сохраняет важную роль в мировой экономике. Технологические инновации, устойчивое развитие и улучшение условий труда являются ключевыми направлениями, которые будут определять будущее отрасли. Компании, способные адаптироваться к изменениям и внедрять передовые решения, будут успешны в условиях глобальной конкуренции.
Список использованной литературы:
1. Chen, X., & Burns, L. D. (2019). Textile Sustainability: Principles and Practices. Springer.
2. Fletcher, K. (2014). Sustainable Fashion and Textiles: Design Journeys. Routledge.
3. Kadolph, S. J. (2016). Textiles. Pearson.
© Какабаева К.М., 2024
УДК 004.9
Коськин С.И.
магистрант 2 курса РТУ МИРЭА, г. Москва, РФ
АНАЛИЗ МЕТОДОВ И ГОТОВЫХ БИБЛИОТЕК ВЫЧИСЛЕНИЯ ТЕМПА МУЗЫКИ
Аннотация
В статье рассматриваются существующие методы и готовые решения оценки темпа музыкальных композиций.
Целью данного исследования является предоставление обзора различных методов и библиотек для оценки BPM музыки, их сравнение и выявление наиболее эффективных подходов.
Результаты. В ходе работы был составлен набор методов и готовых решений, а также проведён сравнительный анализ точности комбинаций алгоритмов.
Ключевые слова оценка темпа музыки, BPM, процессирование аудиоданных, извлечение музыкальных характеристик, MIR.
Музыка занимает большую часть жизни человечества и играет важную роль в нашей культуре, эмоциональном восприятии. Однако, с ростом объема музыкальных данных в цифровой эпохе, становится все более сложным и трудоемким процесс поиска и организации музыкальной информации. В контексте этой проблемы возникает потребность в эффективных и автоматизированных методах анализа информации о музыке.
Одним из важных аспектов анализа музыки является оценка ее темпа, чаще называемом BPM (beats per minute). BPM является мерой скорости музыкальной композиции и имеет важное значение не только в процессе создания и воспроизведения музыки, но и при её анализе.
Таким образом объектом исследования в данной работе является темп музыки. Исследуя предмет методов оценки темпа и готовые библиотеки, будет проводится сравнительный анализ точности их вычислений. Задачами в данной работе являются:
1. Проанализировать предметную область;
2. Подобрать методы и готовые решения;
3. Составить программу для оценки и анализа побранных алгоритмов.
Целью данного исследования является предоставление обзора различных методов и библиотек для оценки BPM музыки, их сравнение и выявление наиболее эффективных подходов.
Выбор ключевых методов. Одной из основных задач в области распознавания BPM является распознавание начала звуков ритма, в английской литературе «onset detection», в музыкальной теории также используется термин первая доля. В большинстве современных композиций бит сопровождается ударными. В момент начала основного удара чаще всего появляется и резкий скачок звуковой волны, который также можно увидеть, как и на спектрограмме, так и на звуковой волне.
¡4-J
I Пер&ЯОД \
Рисунок 1 - График сигнала пика
Определение данных скачков требует использования алгоритмов, которые могут определить начало каждого основного удара. Для этого прибегают к методам вычисления скачков сигнала « novelty functions», в прямом переводе «функция новизны»[1].
Функции новизны — это функции, которые обозначают локальные изменения в свойствах сигнала, таких как энергия или спектральный состав. На основе полученного графика в дальнейшем производится выбор пиков и вычисление темпа музыки.
В классе функций новизны большое количество функций оценки BPM, четырьмя основными из которых являются:
• функции новизны энергии;
• спектральные функции новизны;
• фазовые функции новизны;
• функции новизны комплексного домена.
Стоит также отметить, что параметры применения функций новизны могут отличаться и комбинироваться, также к ним могут применятся различные методы пост-обработки, например, логарифмическое сжатие.
Выбор пиков. В качестве первого алгоритма выбора пиков будет использован простой алгоритм, основанный на направлении движения значений входного дискретного сигнала с фиксированным уровнем порога. Библиотеки, содержащие реализацию алгоритмов выбора пиков: MSAF, Scipy, LibROSA, Boeck, Roeder. Основное различие данных алгоритмов в используемых методах подготовки сигнала, сглаживания сигнала, адаптивности оценки порога и выборе дистанции между последовательными пиками.
Методы оценки BPM. В данной работе также будут рассмотрены два метода оценки темпа на основе полученного массива индекса пиков. Первый алгоритм оперирует значением количества пиков в указанном промежутке в отношении к общему количеству семплов композиции:
BPMS = len(p)/(len(x) • sr)/60 , (1)
где len() - функция вычисления длинны массива; р - массив индексов позиций пиков; х - массив амплитудных значений дискретного сигнала; sr - частота дискретизации сигнала.
Второй алгоритм вычисляет BPM на основе средней разницы расстояний между каждым индексом
пика:
Т-.Г.И, Sr-60
ВРМт = ^--(2)
где N Е N - количество пиков в сигнале; р - массив индексов позиций пиков; sr - частота дискретизации сигнала.
Выбор готовых библиотек. В области получения музыкальных данных существует множество готовых решений, в том числе готовые библиотеки для различных языков. Самым популярным языком программирования для решения задач машинного обучения является Python, следовательно далее будут рассматриваться самые популярные и актуальные библиотеки, которые имеют функционал извлечения характеристики темпа звукового сигнала. В ходе данной работы были проанализированы библиотеки, исследованные на функциональное разнообразие в работе «Digital Audio Processing Tools for Music Corpus Studies».
Рисунок 2 - Сравнение библиотек для извлечения музыкальных характеристик^]
Среди данных библиотека лишь меньшая часть из них реализована на языке программирования Python. Другая часть библиотек имеют прекращённую поддержку и для своей работы требуют понижение версии языка программирование. По данной причине такие библиотеки не будут рассматриваться в работе. Библиотеками, подходящими для данной работы, являются:
• Aubio;
• Essentia;
• Librosa.
Анализ методов вычисления темпа. Для проведения анализа алгоритмов вычисления темпа музыки требуется подобрать банк данных, содержащий в себе музыкальные отрывки и аннотацию к ним в виде числового значения BPM. Для данной задачи был выбран один из самых популярных датасетов «GiantSteps», содержащий отрывки музыкальных композиций в жанре EDM[3].
Было произведено вычисление средней абсолютной ошибки для каждой комбинации функции новизны, функции вычисления пиков, вычисления BPM и отдельно для готовых функций из библиотек. Таким образов в итоговом результате сравнений функций представлено 28 комбинаций и готовых библиотек. Непосредственные их названия и итоговые значения ошибки представлены в таблице ниже.
Таблица 1
Результаты тестирования комбинаций алгоритмов
Номер Название комбинации Результат (MAE) Номер Название комбинации Результат (MAE)
1 Энврг+simple 68.431693 15 Фаз+scipy 39.326958
2 Энерг+MSAF 43.165645 16 Фаз+librosa 22.146521
3 Энерг+scipy 89.475985 17 Фаз+boeck 25.964339
4 Энерг+librosa 32.184576 18 Фаз+roeder 36.169635
5 Энврг+boeck 28.234418 19 Комплвкс+simple 33.428131
6 Энврг+roeder 34.609729 20 Комплекс+MSAF 34.482878
7 Спектр+прост 37.232552 21 Комплекс+scipy 68.816281
8 Спектр+MSAF 36.226401 22 Комплекс+librosa 32.489844
Номер Название комбинации Результат (MAE) Номер Название комбинации Результат (MAE)
9 Спектр+scipy 47.146413 23 Комплекс+boeck 27.768465
10 Спектр+librosa 26.873052 24 Комплекс+roeder 30.238213
11 Спектр+boeck 29.748824 25 aubio 20.526453
12 Спектр+roeder 29.872126 26 Rythm2013 25.902467
13 Фаз+simple 34.363172 27 Percival 35.509519
14 Фаз+MSAF 49.253127 28 librosa 22.438912
Также ниже представлена столбчатая диаграмма, которая является репрезентацией таблицы ошибок выше в сортированном виде.
Рисунок 3 - Диаграмма ошибок комбинаций методов вычисления темпа
Заключение. В результате данной работы была проанализирована предметная область оценки темпа музыки. Также были выбраны и проанализированы методы и готовые решения для вычисления темпа музыки. Была составлена программа, позволяющая сравнить существующие решения в данной области и их комбинации. На основе её вывода предоставлена информация о самых удачных алгоритмах оценки темпа музыки. Цель и задачи, поставленные в данной работе выполнены. Полученная в ходе работы информация позволит выбирать наиболее подходящие инструменты и методы для анализа музыкальной информации.
Список использованной литературы:
1. Mao-Yuan Kao, Chang-Biau Yang, Shyue-Horng Shiau. Tempo and beat tracking for audio signals with music genre classification // International Journal of Intelligent Information and Database Systems. 2009. №3. С. 275-290.
2. Johanna Devaney. Digital Audio Processing Tools for Music Corpus Studies // Oxford Handbook of Music and Corpus Studies. 2023.
3. Two data sets for tempo estimation and key detection in electronic dance music annotated from user correstions / Peter Knees [и др.] // International Society for Music Information Retrieval Conference. 2015. С. 364-367.
4. Meinard Müller. Fundamentals of Music Processing - Using Python and Jupyter Notebooks. Springer Verlag. 2021.
© Коськин С.И., 2024