Aplicación de una Red Neuronal Convolucional para el Reconocimiento de Personas a través de la Voz

Araujo, Alvaro; Pérez Angulo, Jesús Alberto; Rodriguez, Wladimir

Ver/

Texto completo (1.108Mb)

Fecha

2018-12-04

Autor

Araujo, Alvaro

Pérez Angulo, Jesús Alberto

Rodriguez, Wladimir

Palabras Clave

Espectrograma, Red Neuronal Convolucional, Reconocimiento de Personas, Red Neuronal Profunda

Metadatos

Mostrar el registro completo del ítem

Compartir por...

Resumen

El reconocimiento de personas a traves de la voz se ha popularizado recientemente en aplicaciones para telefonos moviles, seguridad, robótica social, entre otras. Los métodos convencionales de reconocimiento a partir de la voz utilizan coeficientes para generar vectores de características presentes en el audio que alimentan modelos de aprendizaje automático. Aunque se obtienen excelentes resultados con estos metodos convencionales, se requiere una alta cantidad de muestras de voz por persona para entrenar los modelos de aprendizaje automático, lo cual es una tarea tediosa para los usuarios. En ese sentido, el objetivo de este trabajo consiste en utilizar un método no convencional en aras de disminuir la cantidad de muestras requeridas para el entrenamiento. El método propuesto consiste en generar imágenes con los espectrogramas de la voz, para entrenar una red neuronal convolucional que las clasifique. En este trabajo se comparan los resultados de entrenamiento y validación para distintas cantidades de muestras con el propósito de identificar la cantidad adecuada. Luego, con la cantidad identificada se comparan los resultados de entrenamiento y validación para distintos valores de un parámetro utilizado en la generación de los espectrogramas denominado ganancia, con el objetivo de optimizar los resultados. Los mejores resultados obtenidos indican que deben utilizarse 5 muestras con una ganancia de 0.9, para obtener una exactitud de validacion del 93,34%.

URI

http://www.saber.ula.ve/handle/123456789/45433

Colecciones

Artículos, Pre-prints (Facultad de Ingeniería)

Información Adicional

Correo Electrónico	aalvaro@ula.ve jesuspangulo@ula.ve wladimir@ula.ve
Editor	Sexta Conferencia Nacional de Computación, Informática y Sistemas / CoNCISa 2018
ISBN	978-980-7683-04-3
Colación	77-81
Institución	Universidad de Los Andes