Сайты ТУСУРа

Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах

Статья в журнале

Статья посвящена программному комплексу для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах. В качестве основы для построения данного комплекса были использованы модели Гауссовых смесей и универсальная фоновая модель (GMM-UBM система). Разработанный комплекс позволяет производить обучение универсальной фоновой модели (UBM), моделей дикторов и производить тестирование речевых сегментов на принадлежность заданной модели диктора. Комплекс позволяет производить отбор речевых признаков с помощью алгоритмов жадного добавления-удаления и генетического алгоритма. Произведена экспериментальная оценка скорости работы модуля обучения универсальной фоновой модели в различных реализациях – на центральном процессоре, на процессоре видеокарты и в комбинированном варианте. Реализованный модуль обучения УФМ с комбинированными вычислениями на центральном процессоре и процессоре видеокарты, по сравнению с обучением УФМ на центральном процессоре, позволяет уменьшить время работы на 36,95%, по сравнению с обучением на процессоре видеокарты – на 10%.

Журнал:

  • Доклады Томского государственного университета систем управления и радиоэлектроники
  • Издательство Томского государственного университета систем управления и радиоэлектроники (Томск)

Библиографическая запись: Рахманенко И.А. Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах / И.А. Рахманенко // Доклады ТУСУРа. – 2017. – Т. 20, № 1. – С. 70–74.

Индексируется в:

Год издания:  2017
Страницы:  70 - 74
Язык:  Русский
DOI:  10.21293/1818-0442-2017-20-1-70-74