Aplicación del Reconocimiento de Voz de un Hablante Mediante una Red Neuronal Artificial Backpropagation y Coeficientes LPC sobre un Canal Telefónico

Autores/as

  • Luis A. Cruz Beltrán SEPI-Telecomunicaciones ESIME, IPN, Unidad Profesional Adolfo López Mateos, MÉXICO
  • Marco A. Acevedo-Mosqueda SEPI-Telecomunicaciones ESIME, IPN, Unidad Profesional Adolfo López Mateos, MÉXICO

DOI:

https://doi.org/10.30973/progmat/2009.1.1/7

Palabras clave:

RNA, Backpropagation, Wavelets, Haar Coiflet y Daubechies, LPC, WAV

Resumen

En esta investigación se presenta un método para el reconocimiento de personas en un canal telefónico. El cual se basa en el comportamiento de las Redes Neuronales Artificiales (RNA), en particular, sobre la arquitectura del Perceptrón Multicapa mediante el algoritmo de aprendizaje Backpropagation aunado con la aplicación de la teoría de las Wavelets (Haar, Daubechies y Coiflet) y el empleo de los Coeficientes de Código de Predicción Lineal (LPC) como parámetro para extraer las principales características de cada hablante. En este trabajo se utilizan archivos de voz con formato estándar *.wav. El método propuesto es implementado mediante el software de programación de Matlab.

Citas

L. R. Rabiner. A tutorial on hidden markov models and selected applications in speech recognition. Proc. of IEEE, Vol. 77, No. 2, pp. 257–286, Febrero 1989. https://doi.org/10.1109/5.18626

A. Amano, N. Hataoka, H. Kokubo. Development of robust speech recognition middleware on microprocessor. Proc. of IEEE, Vol. 26, pp.837–840, 1998. https://doi.org/10.1109/ICASSP.1998.675395

D. M. Kaynak and Q. Zhi. Analysis of lip geometric features for audio-visual speech recognition. IEEE Transactions on Systems, Vol. 34, No. 4, pp.564–570, July 2004. https://doi.org/10.1109/TSMCA.2004.826274

B. H. Juang. The past, present, and future of speech processing. Proc. of IEEE Signal Processing, pages 24–48, May 1998. https://doi.org/10.1109/79.671130

R. Gallart, V. Moreno J. Bestard y M. Laucirica. Algunas experiencias sobre reconocimiento de fonemas utilizando redes neuronales artificiales. Bioingeniería: Ingeniería Electrónica, Automática y Comunicaciones, Vol. 21, No. 2, pp.79– 84, Mayo 2000.

J.R. Hilera Martínez, Redes Neuronales Artificiales, Fundamentos, Modelos y Aplicaciones, Alfa Omega, México, (2000)

S. Haykin, Neural Networks, Prentice-Hall, New Jersey, (1999)

S. Furui, Digital Speech Processing Synthesis and Recognition, Cambridge University Press, (2001).

J. L. Oropeza Rodríguez y S. Suárez Guerra. Algorithms and methods for the automatic speech recognition in spanish language using syllables. Computación y Sistemas, Vol. 9, No. 3, pp. 270–286, 2006.

B. Martín del Rio, A. Sanz Molina. Redes Neuronales y Sistemas Borrosos, Ra-Ma, Madrid, (2001)

L. Fausett. Fundamentals Neuronal Network, architectures, algorithms, and applications, Prentice–Hall, New Jersey, (1995).

S. Mallat. A Wavelet Tour of SignalProcessing, Second Edition, New York. Academic Press (1999).

Descargas

Publicado

26-06-2009

Cómo citar

Cruz Beltrán, L. A., & Acevedo-Mosqueda, M. A. (2009). Aplicación del Reconocimiento de Voz de un Hablante Mediante una Red Neuronal Artificial Backpropagation y Coeficientes LPC sobre un Canal Telefónico. Programación matemática Y Software, 1(1), 110–129. https://doi.org/10.30973/progmat/2009.1.1/7

Número

Sección

Artículos