Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/51271
Full metadata record
DC FieldValueLanguage
dc.contributor.authorZianouka, Y.-
dc.contributor.authorBialiauski, D.-
dc.contributor.authorKajharodava, L.-
dc.contributor.authorTrafimau, A.-
dc.contributor.authorChachlou, V.-
dc.contributor.authorHetsevich, J.-
dc.contributor.authorZahariev, V.-
dc.contributor.authorZhaksylyk, K.-
dc.coverage.spatialМинскru_RU
dc.date.accessioned2023-05-11T09:56:39Z-
dc.date.available2023-05-11T09:56:39Z-
dc.date.issued2023-
dc.identifier.citationZianouka, Y. Developing birds sound recognition system using an ontological approach = Разработка системы распознавания звуков птиц с использованием онтологического подхода / Y. Zianouka [et al.] // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS) : сборник научных трудов / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. В. Голенков [и др.]. – Минск, 2023. – Вып. 7. – С. 165–170.ru_RU
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/51271-
dc.description.abstractThe article presents an intelligent model of automated voice recognition systems (on the example of birds). To develop it, a dataset of birds’ voices was annotated and processed using Mel-Frequency Cepstral Coefficient as an effective tool for modelling the subjective pitch and frequency content of audio signals. For composing and training the model, Convolutional Neural Network is used to implement high level results. The possibilities of using ontological approaches and OSTIS technology for further improvement of the quality of ML models are shown.ru_RU
dc.language.isoenru_RU
dc.publisherБГУИРru_RU
dc.subjectматериалы конференцийru_RU
dc.subjectrecognition systemru_RU
dc.subjectmachine learningru_RU
dc.subjectMel-frequency cepstral coefficients (MFCCs)ru_RU
dc.titleDeveloping Birds Sound Recognition System Using an Ontological Approachru_RU
dc.title.alternativeРазработка системы распознавания звуков птиц с использованием онтологического подходаru_RU
dc.typeArticleru_RU
local.description.annotationВ работе предложена модель распознавания голосов птиц Республики Беларусь, основанная на анализе мел-спектрограмм (MFCC, mel-frequency cepstrum). Мелспектрограмма — это графическое представление звукового сигнала, в котором частоты представлены в мел-шкале вместо линейной шкалы частот, используемой в обычной спектрограмме. Шкала Mel — шкала высоты звуков, отсеивающая частоты звуков, которые человек не слышит, и оставляет самые характерные, находящихся на одинаковой дистанции для слушателя. Для машинного обучения модели была использована глубокая нейронная сеть типа CNN (Convolutional Neural Network) для распознавания класса изображения голоса птиц, так как именно этот вид сети большеподходитдлязадачраспознаванияизображений.Для построения сети CNN мы применили сеть EfficientNetB3, а также еще три слоя (Flatten, Dropout, Dense с функцией softmax в качестве выхода). Таким образом, окончательная модель была построена на основе EfficientNetB3 и 14 различных классов (видов птиц) с оптимизатором Адама (Adam optimizer), категориальной функцией потерь перекрестной энтропии (categorical cross-entropy loss function) и сбалансированными весами классов.ru_RU
Appears in Collections:OSTIS-2023

Files in This Item:
File Description SizeFormat 
Zianouka_Developing.pdf175.38 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.