Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах

Статья в журнале

Статья посвящена программному комплексу для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах. В качестве основы для построения данного комплекса были использованы модели Гауссовых смесей и универсальная фоновая модель (GMM-UBM система). Разработанный комплекс позволяет производить обучение универсальной фоновой модели (UBM), моделей дикторов и производить тестирование речевых сегментов на принадлежность заданной модели диктора. Комплекс позволяет производить отбор речевых признаков с помощью алгоритмов жадного добавления-удаления и генетического алгоритма. Произведена экспериментальная оценка скорости работы модуля обучения универсальной фоновой модели в различных реализациях – на центральном процессоре, на процессоре видеокарты и в комбинированном варианте. Реализованный модуль обучения УФМ с комбинированными вычислениями на центральном процессоре и процессоре видеокарты, по сравнению с обучением УФМ на центральном процессоре, позволяет уменьшить время работы на 36,95%, по сравнению с обучением на процессоре видеокарты – на 10%.

Журнал:

Доклады Томского государственного университета систем управления и радиоэлектроники
Издательство Томского государственного университета систем управления и радиоэлектроники (Томск)

Библиографическая запись: Рахманенко И.А. Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах / И.А. Рахманенко // Доклады ТУСУРа. – 2017. – Т. 20, № 1. – С. 70–74.

Ключевые слова:

CUDA GPU ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ ПРОГРАММНЫЙ КОМПЛЕКС ОБРАБОТКА РЕЧИ GMM-UBM-СИСТЕМА ГАУССОВЫ СМЕСИ ВЕРИФИКАЦИЯ ДИКТОРА РАСПОЗНАВАНИЕ ДИКТОРА

Индексируется в:

Автор: Рахманенко И. А.

Год издания: 2017

Страницы: 70 - 74

Язык: Русский

DOI: 10.21293/1818-0442-2017-20-1-70-74