Title: | Реализация и выбор параметров при использовании алгоритма выравнивания временных масштабов для систем конверсии голоса |
Other Titles: | Implementation and parameter selection of dynamic time warping algorithm for voice conversion |
Authors: | Тхай Чунг Киен |
Keywords: | доклады БГУИР;алгоритм выравнивания временных масштабов (DTW);конверсия голоса (VC);линейные спектральные частоты;кепстральный коэффициент |
Issue Date: | 2008 |
Publisher: | БГУИР |
Citation: | Тхай Чунг Киен.Реализация и выбор параметров при использовании алгоритма выравнивания временных масштабов для систем конверсии голоса / Тхай Чунг Киен // Доклады БГУИР. - 2008. - № 3 (33). - С. 96 - 102. |
Abstract: | Алгоритм выравнивания временных масштабов (Dynamic Time Warping — DTW) широко
применяется в распознавании речи. Целью DTW является нахождение функции выравнивания, которая минимизирует общее расстояние между соответствующими фреймами речевых сигналов. В статье рассматриваются алгоритм DTW и его применение в области конверсии голоса, где алгоритм DTW используется для совмещения речевых фреймов двух
различных дикторов. Данный алгоритм служит предварительной обработкой и используется
на этапе обучения, оказывая прямое влияние на точность функции конверсии. В данной работе предлагается способ выбора параметров тракта для нахождения совмещения. Алгоритм реализован как с использованием коэффициентов линейной спектральной частоты
(Line spectral frequencies — LSF), так и с использованием кепстральных коэффициентов.
Показано, что кепстральные коэффициенты дают наилучший результат, который исключает
получение вырожденных матриц и упрощает этап обучения, а так же существенно повышает качество конверсии речи. |
URI: | https://libeldoc.bsuir.by/handle/123456789/31592 |
Appears in Collections: | №3 (33)
|