Распределенная система потоковой обработки данных для задач распознавания речи

Жаксылык, К.; Захарьев, В. А.

Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/54876

Title:	Распределенная система потоковой обработки данных для задач распознавания речи
Other Titles:	Distributed stream data processing system for speech recognition tasks
Authors:	Жаксылык, К. Захарьев, В. А.
Keywords:	материалы конференций;распределенные системы;распознавание речи;речевые системы
Issue Date:	2024
Publisher:	БГУИР
Citation:	Жаксылык, К. Распределенная система потоковой обработки данных для задач распознавания речи = Distributed stream data processing system for speech recognition tasks / К. Жаксылык, В. А. Захарьев // BIG DATA и анализ высокого уровня = BIG DATA and Advanced Analytics : сборник научных статей X Международной научно-практической конференции, Минск, 13 марта 2024 г. : в 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2024. – С. 358–370.
Abstract:	Представлен обзор архитектурных решений для распределенных систем потоковой обработки данных, предназначенных для построения современных сервисов распознавания речи на основе глубоких нейросетевых моделей. Рассмотрены основные компоненты таких систем, включая слои хранения и обработки данных, а также особенности их программной реализации. Особое внимание уделено использованию «Apache Kafka» в качестве брокера сообщений для обеспечения эффективной передачи данных между компонентами системы. Показаны особенности применения «Mlflow» для развертывания модели распознавания речи «Whisper», что обеспечивает удобное управление жизненным циклом модели и ее метаданными. Рассмотрен процесс развёртывания приложения в раках концепции микросервисной архитектуры на базе системы управления вычислительным кластером «Kubernetes», предоставляющей широкие возможности масштабирования вычиcлительных ресурсов. Полученные результаты позволяют определить ключевые характеристики распределённых систем, влияющие на эффективность работы моделей распознавания речи, работающих в реальном времени.
Alternative abstract:	The review of architectural solutions for distributed streaming data processing systems aimed at speech recognition tasks is presented. The main components of such systems are considered, including the architectural structure of the part, as well as software implementation. Particular attention is paid to using Apache Kafka as a message broker to ensure efficient data transfer. It also describes how to use MLflow to deploy the Whisper speech recognition model, which allows for easy management of the model's lifecycle and metadata. A microservice architecture based on Kubernetes is considered, providing scalability and application management. The results obtained allow us to determine the key directions for the development of distributed streaming data processing systems for efficient and accurate speech recognition in real time.
URI:	https://libeldoc.bsuir.by/handle/123456789/54876
Appears in Collections:	BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2024)

Files in This Item:

File	Description	Size	Format
Zhaksylyk_Distributed_stream.pdf		469.78 kB	Adobe PDF	View/Open

Show full item record Google Scholar