ZoomBooks Smart: Digital System for information retrieval relevant to upper- middle schools

Authors

  • Cupertino Lucero-Álvarez Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información
  • Mariano Larios-Gómez Benemérita Universidad Autónoma de Puebla, Facultad en Ciencias de la Computación
  • Pascual Pérez-Cruz Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información
  • Carlos A. Ortíz-Ramírez Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información
  • Brian Manuel González Contreras Universidad Autónoma de Tlaxcala, Facultad de Ciencias Básicas, Ingeniería y Tecnología
  • Juventino Montiel-Hernández Universidad Autónoma de Tlaxcala, Facultad de Ciencias Básicas, Ingeniería y Tecnología

DOI:

https://doi.org/10.30973/progmat/2020.12.2/1

Keywords:

Extended boolean model, information retrieval, machine learning, search engine

Abstract

This article presents a proposal for the construction of the ZoomBooks-Smart framework prototype, based on an offline-oriented Information Recovery System (SRI-offline) for the storage and retrieval of documents relevant to the curricular load of students upper level, especially for high school graduates of the three Mixtecas in the state of PueblaMexico that lack digital information resources. The methodology proposed for its implementation is based on the Extended Boolean (BE) model for recovery, in addition to applying machine learning to recommend readings to users based on their profiles, and Natural Language Processing (PLN) techniques for the treaty Automatic specific tasks such as n-gram phrase suggestions and query expansion. As a result, the system has the functionality to store semi-automatically, documents in PDF format (portable document format) that are relevant to the different subjects of the curriculum load of students or other users in the academic environment, and of this from can be retrieved in order of relevance query-document, through free text queries.

Author Biographies

Cupertino Lucero-Álvarez, Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información

Cupertino Lucero Álvarez es estudiante de doctorado en Ciencias en Sistemas Computacionales y Electrónicos de la Universidad Autónoma de Tlaxcala UATX. Egresado de la Maestría en Ciencias de la Computación de la FCCBUAP. Actualmente labora como Profesor de Tiempo Completo en la Universidad Tecnológica de Izúcar de Matamoros en la Ingeniería en Tecnologías de la Información. Ha publicado varios artículos en el área de Recuperación de Información y Procesamiento del Lenguaje Natural. Desde 2015 cuenta con reconocimiento al perfil deseable que otorga PRODEP

Mariano Larios-Gómez, Benemérita Universidad Autónoma de Puebla, Facultad en Ciencias de la Computación

Originario de Puebla-México. Profesor investigador tiempo completo en la Benemérita Universidad Autónoma de Puebla (BUAP). Recibió su grado de licenciatura y maestría en ciencias de la computación en la facultad de ciencias de la computación (BUAP) 1997- 2001 y 2001-2003 respectivamente. Estudios de doctorado en sistemas en transportes inteligentes en Compiègne-Francia 2013. Desde 2004 es profesor en la facultad de ciencias de la computación (BUAP). Su interés en la investigación incluye tópicos en cómputo distribuido, blockchain, cómputo de alto rendimiento, sistemas de tiempo real y computo pervasivos. Actualmente colabora en proyectos de investigación sobre supercómputo en el laboratorio nacional del suroeste LNS.

Pascual Pérez-Cruz, Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información

Pascual Pérez Cruz, con Maestría en Sistemas Computacionales de la Universidad Popular Autónoma de Puebla en el año 2012. Obtuvo su Licenciatura en Informática en el Instituto Tecnológico Superior de Acatlán de Osorio en 2006 ha participado en varios proyectos de investigación, así como en artículos científicos de índole nacional e internacional.

Carlos A. Ortíz-Ramírez, Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información

Ingeniero Industrial en electrónica del Instituto Tecnológico de Puebla en 1993, Maestro en Ciencias con especialidad en Optoelectrónica de la FCFM de la BUAP en 1997 y pasante de Maestro en Dirección Escolar en el Colegio Latinoamericano de Posgrados. Participo en proyectos de telecomunicaciones de la sonda de Campeche con el Instituto Mexicano del Petróleo, más de 20 años como PTC en la UTIM donde realiza proyectos de trasferencia de Tecnología con financiamiento de la SDR, SAGARPA y UTIM. Asesor en Estadía Técnica de más de 140 alumnos de TSU e Ingeniería. Ha impartido conferencias en congresos, ponencias y talleres nacionales e internacionales con ISSN ONLINE y/o ISBN. PROMEP le Reconoce con Perfil deseable desde 2008 y vigencia al 2021

Brian Manuel González Contreras, Universidad Autónoma de Tlaxcala, Facultad de Ciencias Básicas, Ingeniería y Tecnología

Brian Manuel González Contreras maestro en ciencias en ingeniería electrónica, con especialidad en control automático. Obtuvo el grado de doctor en ciencias en control automático, procesamiento de señales e ingeniería informática por parte de la Universidad Henri Poincaré, Nancy I, en Francia. Ha participado en diversos proyectos nacionales e internacionales, entre los que destacan: diseño de alimentación eléctrica en alta y baja potencia para subestaciones eléctricas de CFE en Minatitlán, Veracruz; diseño de líneas de suministro de gas y electricidad en alta y baja potencia para PEMEX en Paraíso, Tabasco; diseño del SCADA para PEMEX de la red nacional de refinación, en ciudad de México; diseño de sistemas de control seguros y confiables para la compañía Neste-Jacobs Oy, en Finlandia. Sus líneas actuales de investigación consideran: el modelado de sistemas, la detección y diagnóstico de fallas, el control tolerante a fallas, la identificación/modelado de procesos industriales y el análisis de confiabilidad de sistemas ciber-físicos.

Juventino Montiel-Hernández, Universidad Autónoma de Tlaxcala, Facultad de Ciencias Básicas, Ingeniería y Tecnología

Juventino Montiel Hernández, es Maestro en ciencias en Ingeniería en Computación por la Universidad Autónoma de Tlaxcala Obtuvo el grado en diciembre del 2012. Actualmente es Profesor investigador y estudiante de doctorado en la Facultad de Ingeniería y Tecnología. Cuenta ya con varias publicaciones internacionales. Sus intereses de investigación son en las áreas de Inteligencia artificial, interacción HumanoRobot y desarrollo de aplicaciones bioinspiradas.

References

Rodríguez, M. L. (2005). Modelos de recuperación de la información basados en información lingüística difusa y algoritmos evolutivos: Mejorando la representación de las necesidades de información (Doctoral dissertation, Universidad de Granada).

Zermeño, M. G. G. (2012). Bibliotecas digitales: recursos bibliográficos electrónicos en educación básica. Comunicar: Revista científica iberoamericana de comunicación y educación, (39):119–128.

Orera, L. O. (2003). Bibliotecas digitales de tesis doctorales: metodología para su planificación. Boletín de la Asociación Andaluza de Bibliotecarios, 18(72):55–72.

Manning, C., Raghavan, P., & Schütze, H. (2010). Introduction to information retrieval. Natural Language Engineering, 16(1), 100-103.

Kuna, H. D., Rey, M., Podkowa, L., Martini, E., & Solonezen, L. (2014, October). Expansión de Consultas basada en Ontologías para un Sistema de Recuperación de Información. In XVI Workshop de Investigadores en Ciencias de la Computación.

Zuva, K. and Zuva, T. (2012). Evaluation of information retrieval systems. International journal of computer science & information technology, 4(3):35.

Sánchez, E. P., Blanco, J. D., González, A. O., and Domínguez, N. A. (2017). Análisis de los procesos de tematización y estatizado en lingüística computacional.

Porter, M. F. (2006). An algorithm for suffix stripping. Program. https://doi.org/10.1108/eb046814

Reyna, Y. C. F. (2012). Recuperaciónde la información: taxonomía de sus modelos. Revista cubana de Ciencias Informáticas, 6(2):1–8.

Eraso, H. A. O. and Lozada, C. A. C. (2011). Stemming en español para documentos recuperados de la web* stemming in the spanish language for documents recovered from the web. Revista Unimar, (58):107–114.

Figuerola, C. G., Zazo, Á. F., de Aldana, E. R. V., and Berrocal, J. L. A. (2004). La recuperación de información en español y la normalización de términos. Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial, 8(22):135–145.

Reyna, Y. C. F. (2012). Recuperación de la información: taxonomía de sus modelos. Revista Cubana de Ciencias Informáticas, 6(2), 1-8.

Salton, G., Wong, A., and Yang, C.-S. (1975). A vector space model for automatic indexing. Communications of the ACM, 18(11):613–620. https://doi.org/10.1145/361219.361220

Robertson, S. E. (1977). The probability ranking principle in IR. Journal of documentation, 33(4):294–304. https://doi.org/10.1108/eb026647

Grefenstette, G. (1993). Automatic thesaurus generation from raw text using knowledge-poor techniques.

Published

2020-06-30

How to Cite

Lucero-Álvarez, C., Larios-Gómez, M., Pérez-Cruz, P., Ortíz-Ramírez, C. A., González Contreras, B. M., & Montiel-Hernández, J. (2020). ZoomBooks Smart: Digital System for information retrieval relevant to upper- middle schools. Programación Matemática Y Software, 12(2), 1–13. https://doi.org/10.30973/progmat/2020.12.2/1

Issue

Section

Articles

Most read articles by the same author(s)