https://libeldoc.bsuir.by/handle/123456789/31542
Title: | Система машинного чтения по губам с использованием алгоритмов глубокого обучения |
Authors: | Яценко, Д. В. Ивашенко, В. П. |
Keywords: | материалы конференций;чтение по губам;алгоритмы глубокого обучения;свёрточные нейронные сети;рекуррентные нейронные сети;Keras;Python;виземы;долгая краткосрочная память |
Issue Date: | 2018 |
Publisher: | БГУИР |
Citation: | Яценко, Д. В. Система машинного чтения по губам с использованием алгоритмов глубокого обучения / Д. В. Яценко, В. П. Ивашенко // BIG DATA Advanced Analytics: collection of materials of the fourth international scientific and practical conference, Minsk, Belarus, May 3 – 4, 2018 / editorial board: М. Batura [etc.]. – Minsk, BSUIR, 2018. – Р. 236 – 242. |
Abstract: | Чтение по губам — это задача распознавания текста по движению губ. Развитие компьютерной техники ведет к совершенствованию интерфейсов между человеком и компьютером. Один из важнейших способов человеческой коммуникации — речь, поэтому способность распознавания речи является важным направлением совершенствования человеко-машинных интерфейсов. Разрабатываемая модель преобразовывает последовательность видеофрагментов с переменной длиной слова в текст, используя пространственно-временные свёртки, рекуррентную нейронную сеть и функцию потерь нейросетевой временной классификации. Визуальное распознавание речи может применяться в биометрической идентификаций, распознавании речи двух и более человек, разработке улучшенных слуховых аппаратов, управлении интеллектуальными системами и т.д. |
URI: | https://libeldoc.bsuir.by/handle/123456789/31542 |
Appears in Collections: | BIG DATA and Advanced Analytics. Использование BIG DATA для оптимизации бизнеса и информационных технологий (2018) |
File | Description | Size | Format | |
---|---|---|---|---|
Yatsenko_Sistema.PDF | 878.07 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.