3i Gender ID SDK

   Москва

Перейти на сайт производителя

Технология идентификации пола диктора по голосу основана на моделях из смесей гауссовых распределений.
Точность идентификации
- вероятность ошибки принять мужчину за женщину: 0,0096;
- вероятность ошибки принять женщину за мужчину: 0,0357.
Средний уровень ошибок при равном количестве мужчин и женщин оценивался на речевой базе, объёмом более двух тысяч фонограмм и составил 1,63%.
Тип обрабатываемого сигнала:
WAV-файлы, буфер отсчётов;
частота дискретизации 8 кГц;
разрядность квантования 8 или 16-бит;
тип кодирования: A-закон, m-закон или PCM.
Требования к качеству речевого сигнала - отношение сигнал/шум не менее 7 дБ.
SDK реализован в виде DLL-библиотеки, написанной на языке С++, позволяющей потокобезопасное встраивание функций автоматического определения пола в произвольные Windows-приложения.

Отзывы

Чтобы оставить отзыв, авторизуйтесь на ScienceID