Una Revisión de los Fundamentos de Aprendizaje Profundo – El Modelo de Red Neuronal XOR
DOI:
https://doi.org/10.30973/progmat/2023.15.1/5Palabras clave:
Deep learning, redes neuronales, función XOR, algoritmo de retropropagación, algoritmo gradiente descendente estocásticoResumen
Deep Learning mediante el seguimiento, en un simple modelo de Redes Neuronales de la función XOR, de las señales en forward y backward que fluyen a través de este modelo. Nuestro objetivo es alcanzar una comprensión más profunda de algunos conceptos sobresalientes de Deep Learning, lo que nos permitiría comprender su significado mientras el modelo de Redes Neuronales de la función XOR es entrenado por el algoritmo Retropropagación. El modelo elegido contiene una sola capa oculta con cuatro neuronas y una capa de salida con una neurona. Aunque este modelo no es una red neuronal profunda, su capa oculta lleva los conceptos suficientes de Deep Learning. Se utiliza la sigmoidea como función de activación en todas las neuronas. Se presenta una derivación de una versión simple del algoritmo Gradiente Descendente Estocástico, que se usa para minimizar el error de salida, y luego al retropropagarlo llegamos al algoritmo de retropropagación. Se presentan resultados numéricos, que muestran la convergencia del error de salida y el de un peso seleccionado y su análisis resume la comprensión de los conceptos fundamentales de Deep Learning.
Citas
Marvin Minsky and Seymour Papert (1969) Perceptrons - An introduction to computational geometry. The MIT Press.
W. McCulloch and W. Pitts (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics., Vol. 5, pp. 115–133. https://doi.org/10.1007/BF02478259
F. Rosenblatt (1958). The perceptron: A probabilistic model for information storage and organization in the brain, Psychological Review, Vol. 65, pp. 386–408. https://psycnet.apa.org/doi/10.1037/h0042519
Rumelhart, D.E., Hinton, G. E. and Williams, R. J. (1986). Learning Internal Representation by Error Propagation. In D. E. Rumelhart and J. L. McClelland. Parallel Distributed Processing: Explorations in the Microstructure of Cognition, MIT Press.
David E. E. Rumelhart, James L. Mcclelland, and PDP Research Group (1986). Parallel Distributed Processing - Explorations in the Microstructure of Cognition – Foundations. The MIT press.
Hinton, G. E., Osindero, S. and Yee-Whye The (2006). A Fast Learning Algorithm for Deep Belief Nets. Neural Computation 18, 1527–1554. Massachusetts Institute of Technology. https://doi.org/10.1162/neco.2006.18.7.1527
Phil Kim (2017). MATLAB Deep Learning - With Machine Learning, Neural Networks and Artificial Intelligence. Apress. https://doi.org/10.1007/978-1-4842-2845-6
Snyman, J A (2018). Practical Mathematical Optimization - Basic Optimization Theory and Gradient-Based Algorithms. Springer.
Nikhil Buduma and Nicholas Locascio (2017). Fundamentals of Deep Learning - Designing Next-Generation Machine Intelligence Algorithms. O'Reilly Media.
Mark F. Bear, Barry W. Connors, and Michael A. Paradiso (2020). Neuroscience - Exploring the Brain. Jones & Bartlett Learning.
Mirela Reljan-Delaney and Julie Wall (2017). Solving the Linearly Inseparable XOR Problem. School of Architecture Computing and Engineering University of East London, United Kingdom.
Valentina Emilia Balas, Sanjiban Sekhar Roy, Dharmendra Sharma, Pijush Samui – Editors (2019). Handbook of Deep Learning Applications. Springer. https://doi.org/10.1007/978-3-030-11479-4
Dong Yu and Li Deng (2015). Automatic Speech Recognition - A Deep Learning Approach. Springer. https://doi.org/10.1007/978-1-4471-5779-3
Hernandez J.A. , R.J. Romero, D. Juárez-Romero, R.F. Escobar, J. Siqueiros. A. (2009). Neural network approach and thermodynamic model of waste energy recovery in a heat transformer in a water purification processes. Desalination (ISSN: 0011-9164) 243, pp 273-285. https://doi.org/10.1016/j.desal.2008.05.015
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Alejo Mosso Vázquez, David Juárez-Romero, José Alfredo Hernández-Pérez, Darvi Echeverría Sosa, Jimer Emir Loría Yah, Ramiro José González Horta, Gerardo Israel de Atocha Pech Carveo, Carlos Alberto Decena Chan
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Usted es libre de:
Compartir — compartir y redistribuir el material publicado en cualquier medio o formato. |
Adaptar — combinar, transformar y construir sobre el material para cualquier propósito, incluso comercialmente. |
Bajo las siguientes condiciones:
Atribución — Debe otorgar el crédito correspondiente, proporcionar un enlace a la licencia e indicar si se realizaron cambios. Puede hacerlo de cualquier manera razonable, pero de ninguna manera que sugiera que el licenciador lo respalda a usted o a su uso. |
Sin restricciones adicionales: no puede aplicar términos legales o medidas tecnológicas que restrinjan legalmente a otros a hacer cualquier cosa que permita la licencia. |