ZoomBooks Smart: Sistema Digital para la Recuperación de Información relevante a escuelas de nivel medio superior
DOI:
https://doi.org/10.30973/progmat/2020.12.2/1Palabras clave:
Modelo booleano extendido, recuperación de información, aprendizaje automático, máquina de búsquedaResumen
En este artículo se presenta una propuesta para la construcción del prototipo de software ZoomBooks Smart, basado en un Sistema de Recuperación de Información orientado a sinconexión (SRI- off line) para el almacenamiento y recuperación de documentos relevantes a la carga curricular de los estudiantes de nivel medio superior, especialmente para los bachilleratos apartados de las tres Mixtecas de la República Mexicana que carecen de recursos de información digitales. La metodología planteada para su implementación tiene como base el modelo Booleano Extendido (BE) para la recuperación, además de aplicar aprendizaje automático para recomendar lecturas a los usuarios con base en sus perfiles, y técnicas del Procesamiento del Lenguaje Natural (PLN) para el tratado automático de tareas específicas como las sugerencias de frases mediante n-gramas y la expansión de consultas. Se presenta un primer prototipo de software que tiene la funcionalidad de almacenar, de manera semiautomática los documentos en formato PDF (formato de documento portátil) que son relevantes a las diferentes asignaturas de la carga curricular de los estudiantes u otros usuarios en el ambiente académico. Los documentos pueden ser recuperados en orden de relevancia consulta-documento, mediante consultas de texto libre.
Citas
Rodríguez, M. L. (2005). Modelos de recuperación de la información basados en información lingüística difusa y algoritmos evolutivos: Mejorando la representación de las necesidades de información (Doctoral dissertation, Universidad de Granada).
Zermeño, M. G. G. (2012). Bibliotecas digitales: recursos bibliográficos electrónicos en educación básica. Comunicar: Revista científica iberoamericana de comunicación y educación, (39):119–128.
Orera, L. O. (2003). Bibliotecas digitales de tesis doctorales: metodología para su planificación. Boletín de la Asociación Andaluza de Bibliotecarios, 18(72):55–72.
Manning, C., Raghavan, P., & Schütze, H. (2010). Introduction to information retrieval. Natural Language Engineering, 16(1), 100-103.
Kuna, H. D., Rey, M., Podkowa, L., Martini, E., & Solonezen, L. (2014, October). Expansión de Consultas basada en Ontologías para un Sistema de Recuperación de Información. In XVI Workshop de Investigadores en Ciencias de la Computación.
Zuva, K. and Zuva, T. (2012). Evaluation of information retrieval systems. International journal of computer science & information technology, 4(3):35.
Sánchez, E. P., Blanco, J. D., González, A. O., and Domínguez, N. A. (2017). Análisis de los procesos de tematización y estatizado en lingüística computacional.
Porter, M. F. (2006). An algorithm for suffix stripping. Program. https://doi.org/10.1108/eb046814
Reyna, Y. C. F. (2012). Recuperaciónde la información: taxonomía de sus modelos. Revista cubana de Ciencias Informáticas, 6(2):1–8.
Eraso, H. A. O. and Lozada, C. A. C. (2011). Stemming en español para documentos recuperados de la web* stemming in the spanish language for documents recovered from the web. Revista Unimar, (58):107–114.
Figuerola, C. G., Zazo, Á. F., de Aldana, E. R. V., and Berrocal, J. L. A. (2004). La recuperación de información en español y la normalización de términos. Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial, 8(22):135–145.
Reyna, Y. C. F. (2012). Recuperación de la información: taxonomía de sus modelos. Revista Cubana de Ciencias Informáticas, 6(2), 1-8.
Salton, G., Wong, A., and Yang, C.-S. (1975). A vector space model for automatic indexing. Communications of the ACM, 18(11):613–620. https://doi.org/10.1145/361219.361220
Robertson, S. E. (1977). The probability ranking principle in IR. Journal of documentation, 33(4):294–304. https://doi.org/10.1108/eb026647
Grefenstette, G. (1993). Automatic thesaurus generation from raw text using knowledge-poor techniques.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2020 Programación Matemática y Software
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Usted es libre de:
Compartir — compartir y redistribuir el material publicado en cualquier medio o formato. |
Adaptar — combinar, transformar y construir sobre el material para cualquier propósito, incluso comercialmente. |
Bajo las siguientes condiciones:
Atribución — Debe otorgar el crédito correspondiente, proporcionar un enlace a la licencia e indicar si se realizaron cambios. Puede hacerlo de cualquier manera razonable, pero de ninguna manera que sugiera que el licenciador lo respalda a usted o a su uso. |
Sin restricciones adicionales: no puede aplicar términos legales o medidas tecnológicas que restrinjan legalmente a otros a hacer cualquier cosa que permita la licencia. |