https://libeldoc.bsuir.by/handle/123456789/52305
Title: | IT Diagnostics of Parkinson’s Disease Based on the Analysis of Voice Markers and Machine Learning |
Other Titles: | IТ-диагностика болезни Паркинсона на основе анализа голосовых маркеров и машинного обучения |
Authors: | Vishniakou, U. A. YiWei Xia |
Keywords: | доклады БГУИР;machine learning;neural networks;binary classification |
Issue Date: | 2023 |
Publisher: | БГУИР |
Citation: | Vishniakou, U. A. IT Diagnostics of Parkinson’s Disease Based on the Analysis of Voice Markers and Machine Learning=IТ-диагностика болезни Паркинсона на основе анализа голосовых маркеров и машинного обучения / U. A. Vishniakou, YiWei Xia // Доклады БГУИР. – 2023. – Т. 21, № 3. – С. 102-110. |
Abstract: | The results of studying the parameters of the spectra of speech signals by machine learning with the use of neural networks are presented. This study was carried out in order to confirm experimentally the possibility of performing an assessment of these parameters for the detection of Parkinson’s disease in the early stages (IT diagnostics). During the study, the public database was used, which systematized the spectra of vowel sounds uttered by patients with Parkinson’s disease. The applied method is binary data classification. In the course of the study, the speech data spectrum was first preprocessed, which consisted of filtering it in order to remove its noise components and eliminate bursts and gaps in it. Then the parameters of the processed spectrum of speech data were determined: average value, maximum and minimum, peak, wavelet coefficients, MFCC and TQWT. After that, the object was selected using the PCA algorithm. The model was trained using the Knn and Random Forest algorithms, as well as the Bayesian neural network. The Bayesian optimization algorithm and the GridSearch method were used to find the best model hyperparameters. It has been established that when using Knn, Random Forest and Bayesian neural network, it is possible to increase the accuracy of recognition of Parkinson’s disease by 94.7; 88.16 and 74.74 %, respectively. A similar study by other scientists showed that the recognition accuracy of data sets was only 86 %. |
Alternative abstract: | Представлены результаты исследования параметров спектров речевых сигналов с помощью машинного обучения с применением нейронных сетей, проведенного в целях экспериментального подтверждения возможности выполнения оценки этих параметров для выявления болезни Паркинсона на ранних стадиях (IТ-диагностика). В ходе исследования использовали общедоступную базу данных, в которой систематизированы спектры гласных звуков, произнесенных пациентами с болезнью Паркинсона. Примененный метод – бинарная классификация данных. Сначала выполняли предварительную обработку спектра речевых данных, состоявшую в его фильтрации, для удаления из него шумов и устранения присутствующих в нем всплесков и пробелов. Затем определяли параметры обработанного спектра речевых данных: среднее значение, максимум, минимум, пик, вейвлет-коэффициенты, MFCC и TQWT. После этого выбирали объект с помощью алгоритма PCA. Для обучения модели использовали алгоритмы Knn и Random Forest и нейронной сети Байеса. Для нахождения наилучших гиперпараметров модели применяли алгоритм оптимизации Байеса и метод GridSearch. Установлено, что при использовании Knn, Random Forest и нейронной сети Байеса можно обеспечить увеличение точности распознавания болезни Паркинсона на 94,7; 88,16 и 74,74 % соответственно. Аналогичное исследование, проведенное другими учеными, показало, что точность распознавания наборов данных составила всего 86 %. |
URI: | https://libeldoc.bsuir.by/handle/123456789/52305 |
DOI: | http://dx.doi.org/10.35596/1729-7648-2023-21-3-102-110Original |
Appears in Collections: | Том 21, № 3 |
File | Description | Size | Format | |
---|---|---|---|---|
Vishniakou_IT.pdf | 793.83 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.