Aplicación del Reconocimiento de Voz de un Hablante Mediante una Red Neuronal Artificial Backpropagation y Coeficientes LPC sobre un Canal Telefónico
DOI:
https://doi.org/10.30973/progmat/2009.1.1/7Palabras clave:
RNA, Backpropagation, Wavelets, Haar Coiflet y Daubechies, LPC, WAVResumen
En esta investigación se presenta un método para el reconocimiento de personas en un canal telefónico. El cual se basa en el comportamiento de las Redes Neuronales Artificiales (RNA), en particular, sobre la arquitectura del Perceptrón Multicapa mediante el algoritmo de aprendizaje Backpropagation aunado con la aplicación de la teoría de las Wavelets (Haar, Daubechies y Coiflet) y el empleo de los Coeficientes de Código de Predicción Lineal (LPC) como parámetro para extraer las principales características de cada hablante. En este trabajo se utilizan archivos de voz con formato estándar *.wav. El método propuesto es implementado mediante el software de programación de Matlab.
Citas
L. R. Rabiner. A tutorial on hidden markov models and selected applications in speech recognition. Proc. of IEEE, Vol. 77, No. 2, pp. 257–286, Febrero 1989. https://doi.org/10.1109/5.18626
A. Amano, N. Hataoka, H. Kokubo. Development of robust speech recognition middleware on microprocessor. Proc. of IEEE, Vol. 26, pp.837–840, 1998. https://doi.org/10.1109/ICASSP.1998.675395
D. M. Kaynak and Q. Zhi. Analysis of lip geometric features for audio-visual speech recognition. IEEE Transactions on Systems, Vol. 34, No. 4, pp.564–570, July 2004. https://doi.org/10.1109/TSMCA.2004.826274
B. H. Juang. The past, present, and future of speech processing. Proc. of IEEE Signal Processing, pages 24–48, May 1998. https://doi.org/10.1109/79.671130
R. Gallart, V. Moreno J. Bestard y M. Laucirica. Algunas experiencias sobre reconocimiento de fonemas utilizando redes neuronales artificiales. Bioingeniería: Ingeniería Electrónica, Automática y Comunicaciones, Vol. 21, No. 2, pp.79– 84, Mayo 2000.
J.R. Hilera Martínez, Redes Neuronales Artificiales, Fundamentos, Modelos y Aplicaciones, Alfa Omega, México, (2000)
S. Haykin, Neural Networks, Prentice-Hall, New Jersey, (1999)
S. Furui, Digital Speech Processing Synthesis and Recognition, Cambridge University Press, (2001).
J. L. Oropeza Rodríguez y S. Suárez Guerra. Algorithms and methods for the automatic speech recognition in spanish language using syllables. Computación y Sistemas, Vol. 9, No. 3, pp. 270–286, 2006.
B. Martín del Rio, A. Sanz Molina. Redes Neuronales y Sistemas Borrosos, Ra-Ma, Madrid, (2001)
L. Fausett. Fundamentals Neuronal Network, architectures, algorithms, and applications, Prentice–Hall, New Jersey, (1995).
S. Mallat. A Wavelet Tour of SignalProcessing, Second Edition, New York. Academic Press (1999).
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2009 Programación Matemática y Software
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Usted es libre de:
Compartir — compartir y redistribuir el material publicado en cualquier medio o formato. |
Adaptar — combinar, transformar y construir sobre el material para cualquier propósito, incluso comercialmente. |
Bajo las siguientes condiciones:
Atribución — Debe otorgar el crédito correspondiente, proporcionar un enlace a la licencia e indicar si se realizaron cambios. Puede hacerlo de cualquier manera razonable, pero de ninguna manera que sugiera que el licenciador lo respalda a usted o a su uso. |
Sin restricciones adicionales: no puede aplicar términos legales o medidas tecnológicas que restrinjan legalmente a otros a hacer cualquier cosa que permita la licencia. |