https://libeldoc.bsuir.by/handle/123456789/43814
Title: | Акустическая локализация источника сигнала при помощи глубокого обучения |
Other Titles: | Acoustic source localization using deep learning |
Authors: | Калоша, А. Л. Стержанов, М. В. |
Keywords: | материалы конференций;библиотека Librosa;библиотека TensorFlow;нейронные сети;Librosa library;TensorFlow library;neural networks |
Issue Date: | 2021 |
Publisher: | БГУИР |
Citation: | Калоша, А. Л. Акустическая локализация источника сигнала при помощи глубокого обучения / А. Л. Калоша, М. В. Стержанов // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: VII Международная научно-практическая конференция [Электронный ресурс] : сборник материалов VII Международной научно-практической конференции, Минск, 19-20 мая 2021 года / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2021. – С. 137–140. – Режим доступа : http://bigdataminsk.bsuir.by/files/2021_materialy.pdf. |
Abstract: | Цель данной работы заключается в создании системы для определения источника аудио сигнала. Для достижения данной цели использовалась нейронная сеть, которая обучена на наборе метрик, описывающих значимые характеристики звука: MFCC, спектральный центроид, скорость пересечения нуля, частоты цветности, спад спектра. Для получения данных метрики использовалась библиотека Librosa, в которой уже реализовано получение метрик из аудиофайла. Данные записывались с использованием 2 микрофонов, работающих одновременно. Обучение нейронной сети производилось на 1 000 аудиофайлов. В результате обучения нейронная сеть способна предсказать координаты источника сигнала с точностью в 81%. Улучив качество оборудования для записи звука, размер обучающей выборки, или подобрав более точно гиперпараметры нейронной сети, можно увеличить точность системы. |
Alternative abstract: | The purpose of this paper is to create a system for identifying the source of an audio signal. This system uses a neural network, which is trained on a set of metrics describing significant characteristics of audio: MFCC, spectral centroid, zero crossing rate, chromaticity frequencies, and spectrum decay. The Librosa library was used to retrieve metric data, which already implements retrieval of metrics from an audio file. The data was recorded using 2 microphones working simultaneously. The neural network was trained on 1,000 audio files. As a result of training, the neural network is able to predict the coordinates of the signal source with 81% accuracy. By improving the equipment for audio recording, increasing the size of the learning samples, or by selecting the hyperparameters more accurately of the neural network, you can increase accuracy of the system. |
URI: | https://libeldoc.bsuir.by/handle/123456789/43814 |
Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2021) |
File | Description | Size | Format | |
---|---|---|---|---|
Kalosha_Akusticheskaya.pdf | 976.07 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.