ZoomBooks Smart: Digital System for information retrieval relevant to upper- middle schools
DOI:
https://doi.org/10.30973/progmat/2020.12.2/1Keywords:
Extended boolean model, information retrieval, machine learning, search engineAbstract
This article presents a proposal for the construction of the ZoomBooks-Smart framework prototype, based on an offline-oriented Information Recovery System (SRI-offline) for the storage and retrieval of documents relevant to the curricular load of students upper level, especially for high school graduates of the three Mixtecas in the state of PueblaMexico that lack digital information resources. The methodology proposed for its implementation is based on the Extended Boolean (BE) model for recovery, in addition to applying machine learning to recommend readings to users based on their profiles, and Natural Language Processing (PLN) techniques for the treaty Automatic specific tasks such as n-gram phrase suggestions and query expansion. As a result, the system has the functionality to store semi-automatically, documents in PDF format (portable document format) that are relevant to the different subjects of the curriculum load of students or other users in the academic environment, and of this from can be retrieved in order of relevance query-document, through free text queries.
References
Rodríguez, M. L. (2005). Modelos de recuperación de la información basados en información lingüística difusa y algoritmos evolutivos: Mejorando la representación de las necesidades de información (Doctoral dissertation, Universidad de Granada).
Zermeño, M. G. G. (2012). Bibliotecas digitales: recursos bibliográficos electrónicos en educación básica. Comunicar: Revista científica iberoamericana de comunicación y educación, (39):119–128.
Orera, L. O. (2003). Bibliotecas digitales de tesis doctorales: metodología para su planificación. Boletín de la Asociación Andaluza de Bibliotecarios, 18(72):55–72.
Manning, C., Raghavan, P., & Schütze, H. (2010). Introduction to information retrieval. Natural Language Engineering, 16(1), 100-103.
Kuna, H. D., Rey, M., Podkowa, L., Martini, E., & Solonezen, L. (2014, October). Expansión de Consultas basada en Ontologías para un Sistema de Recuperación de Información. In XVI Workshop de Investigadores en Ciencias de la Computación.
Zuva, K. and Zuva, T. (2012). Evaluation of information retrieval systems. International journal of computer science & information technology, 4(3):35.
Sánchez, E. P., Blanco, J. D., González, A. O., and Domínguez, N. A. (2017). Análisis de los procesos de tematización y estatizado en lingüística computacional.
Porter, M. F. (2006). An algorithm for suffix stripping. Program. https://doi.org/10.1108/eb046814
Reyna, Y. C. F. (2012). Recuperaciónde la información: taxonomía de sus modelos. Revista cubana de Ciencias Informáticas, 6(2):1–8.
Eraso, H. A. O. and Lozada, C. A. C. (2011). Stemming en español para documentos recuperados de la web* stemming in the spanish language for documents recovered from the web. Revista Unimar, (58):107–114.
Figuerola, C. G., Zazo, Á. F., de Aldana, E. R. V., and Berrocal, J. L. A. (2004). La recuperación de información en español y la normalización de términos. Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial, 8(22):135–145.
Reyna, Y. C. F. (2012). Recuperación de la información: taxonomía de sus modelos. Revista Cubana de Ciencias Informáticas, 6(2), 1-8.
Salton, G., Wong, A., and Yang, C.-S. (1975). A vector space model for automatic indexing. Communications of the ACM, 18(11):613–620. https://doi.org/10.1145/361219.361220
Robertson, S. E. (1977). The probability ranking principle in IR. Journal of documentation, 33(4):294–304. https://doi.org/10.1108/eb026647
Grefenstette, G. (1993). Automatic thesaurus generation from raw text using knowledge-poor techniques.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2020 Programación Matemática y Software
This work is licensed under a Creative Commons Attribution 4.0 International License.
Usted es libre de:
Compartir — compartir y redistribuir el material publicado en cualquier medio o formato. |
Adaptar — combinar, transformar y construir sobre el material para cualquier propósito, incluso comercialmente. |
Bajo las siguientes condiciones:
Atribución — Debe otorgar el crédito correspondiente, proporcionar un enlace a la licencia e indicar si se realizaron cambios. Puede hacerlo de cualquier manera razonable, pero de ninguna manera que sugiera que el licenciador lo respalda a usted o a su uso. |
Sin restricciones adicionales: no puede aplicar términos legales o medidas tecnológicas que restrinjan legalmente a otros a hacer cualquier cosa que permita la licencia. |