Aplicación del Reconocimiento de Voz de un Hablante Mediante una Red Neuronal Artificial Backpropagation y Coeficientes LPC sobre un Canal Telefónico

Luis A. Cruz Beltrán; Marco A. Acevedo-Mosqueda

doi:10.30973/progmat/2009.1.1/7

Aplicación del Reconocimiento de Voz de un Hablante Mediante una Red Neuronal Artificial Backpropagation y Coeficientes LPC sobre un Canal Telefónico

Autores/as

Luis A. Cruz Beltrán SEPI-Telecomunicaciones ESIME, IPN, Unidad Profesional Adolfo López Mateos, MÉXICO
Marco A. Acevedo-Mosqueda SEPI-Telecomunicaciones ESIME, IPN, Unidad Profesional Adolfo López Mateos, MÉXICO

DOI:

https://doi.org/10.30973/progmat/2009.1.1/7

Palabras clave:

RNA, Backpropagation, Wavelets, Haar Coiflet y Daubechies, LPC, WAV

Resumen

En esta investigación se presenta un método para el reconocimiento de personas en un canal telefónico. El cual se basa en el comportamiento de las Redes Neuronales Artificiales (RNA), en particular, sobre la arquitectura del Perceptrón Multicapa mediante el algoritmo de aprendizaje Backpropagation aunado con la aplicación de la teoría de las Wavelets (Haar, Daubechies y Coiflet) y el empleo de los Coeficientes de Código de Predicción Lineal (LPC) como parámetro para extraer las principales características de cada hablante. En este trabajo se utilizan archivos de voz con formato estándar *.wav. El método propuesto es implementado mediante el software de programación de Matlab.

Citas

L. R. Rabiner. A tutorial on hidden markov models and selected applications in speech recognition. Proc. of IEEE, Vol. 77, No. 2, pp. 257–286, Febrero 1989. https://doi.org/10.1109/5.18626

A. Amano, N. Hataoka, H. Kokubo. Development of robust speech recognition middleware on microprocessor. Proc. of IEEE, Vol. 26, pp.837–840, 1998. https://doi.org/10.1109/ICASSP.1998.675395

D. M. Kaynak and Q. Zhi. Analysis of lip geometric features for audio-visual speech recognition. IEEE Transactions on Systems, Vol. 34, No. 4, pp.564–570, July 2004. https://doi.org/10.1109/TSMCA.2004.826274

B. H. Juang. The past, present, and future of speech processing. Proc. of IEEE Signal Processing, pages 24–48, May 1998. https://doi.org/10.1109/79.671130

R. Gallart, V. Moreno J. Bestard y M. Laucirica. Algunas experiencias sobre reconocimiento de fonemas utilizando redes neuronales artificiales. Bioingeniería: Ingeniería Electrónica, Automática y Comunicaciones, Vol. 21, No. 2, pp.79– 84, Mayo 2000.

J.R. Hilera Martínez, Redes Neuronales Artificiales, Fundamentos, Modelos y Aplicaciones, Alfa Omega, México, (2000)

S. Haykin, Neural Networks, Prentice-Hall, New Jersey, (1999)

S. Furui, Digital Speech Processing Synthesis and Recognition, Cambridge University Press, (2001).

J. L. Oropeza Rodríguez y S. Suárez Guerra. Algorithms and methods for the automatic speech recognition in spanish language using syllables. Computación y Sistemas, Vol. 9, No. 3, pp. 270–286, 2006.

B. Martín del Rio, A. Sanz Molina. Redes Neuronales y Sistemas Borrosos, Ra-Ma, Madrid, (2001)

L. Fausett. Fundamentals Neuronal Network, architectures, algorithms, and applications, Prentice–Hall, New Jersey, (1995).

S. Mallat. A Wavelet Tour of SignalProcessing, Second Edition, New York. Academic Press (1999).

Descargas

Publicado

26-06-2009

Cómo citar

Cruz Beltrán, L. A., & Acevedo-Mosqueda, M. A. (2009). Aplicación del Reconocimiento de Voz de un Hablante Mediante una Red Neuronal Artificial Backpropagation y Coeficientes LPC sobre un Canal Telefónico. Programación matemática Y Software, 1(1), 110–129. https://doi.org/10.30973/progmat/2009.1.1/7

Descargar cita

Número

Vol. 1 Núm. 1 (2009): Junio 2009

Sección

Artículos

Licencia

Derechos de autor 2009 Programación Matemática y Software

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.

Usted es libre de:

Compartir — compartir y redistribuir el material publicado en cualquier medio o formato.

Adaptar — combinar, transformar y construir sobre el material para cualquier propósito, incluso comercialmente.

Bajo las siguientes condiciones:

Atribución — Debe otorgar el crédito correspondiente, proporcionar un enlace a la licencia e indicar si se realizaron cambios. Puede hacerlo de cualquier manera razonable, pero de ninguna manera que sugiera que el licenciador lo respalda a usted o a su uso.

Sin restricciones adicionales: no puede aplicar términos legales o medidas tecnológicas que restrinjan legalmente a otros a hacer cualquier cosa que permita la licencia.

Aplicación del Reconocimiento de Voz de un Hablante Mediante una Red Neuronal Artificial Backpropagation y Coeficientes LPC sobre un Canal Telefónico

Autores/as

DOI:

Palabras clave:

Resumen

Citas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Idioma

Indexado

Enviar un artículo

Información

Número actual