Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах
Статья в журнале
Статья посвящена программному комплексу для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах. В качестве основы для построения данного комплекса были использованы модели Гауссовых смесей и универсальная фоновая модель (GMM-UBM система). Разработанный комплекс позволяет производить обучение универсальной фоновой модели (UBM), моделей дикторов и производить тестирование речевых сегментов на принадлежность заданной модели диктора. Комплекс позволяет производить отбор речевых признаков с помощью алгоритмов жадного добавления-удаления и генетического алгоритма. Произведена экспериментальная оценка скорости работы модуля обучения универсальной фоновой модели в различных реализациях – на центральном процессоре, на процессоре видеокарты и в комбинированном варианте. Реализованный модуль обучения УФМ с комбинированными вычислениями на центральном процессоре и процессоре видеокарты, по сравнению с обучением УФМ на центральном процессоре, позволяет уменьшить время работы на 36,95%, по сравнению с обучением на процессоре видеокарты – на 10%.
Журнал:
- Доклады Томского государственного университета систем управления и радиоэлектроники
- Издательство Томского государственного университета систем управления и радиоэлектроники (Томск)
Библиографическая запись: Рахманенко И.А. Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах / И.А. Рахманенко // Доклады ТУСУРа. – 2017. – Т. 20, № 1. – С. 70–74.
Ключевые слова:
CUDA GPU ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ ПРОГРАММНЫЙ КОМПЛЕКС ОБРАБОТКА РЕЧИ GMM-UBM-СИСТЕМА ГАУССОВЫ СМЕСИ ВЕРИФИКАЦИЯ ДИКТОРА РАСПОЗНАВАНИЕ ДИКТОРАИндексируется в:
- ВАК ( https://cyberleninka.ru/article/n/programmnyy-kompleks-dlya-identifikatsii-diktora-po-golosu-s-primeneniem-parallelnyh-vychisleniy-na-tsentralnom-i-graficheskom )
- РИНЦ ( https://elibrary.ru/item.asp?id=29737712 )