ZoomBooks Smart: Sistema Digital para la Recuperación de Información relevante a escuelas de nivel medio superior

Publicación:
Entidad Editora:
Director Editorial:
ISSN:
Ejemplar/Número:

Cateoría:
Páginas:
Colección:
Fecha de inicio:
Periodicidad:

Programación Matemática y Software
Universidad Autónoma del Estado de Morelos
Dr.Marco Antonio Cruz Chávez
2007-3283

Volumen 12, Número 2/Junio de 2020
Periodo Junio-Septiembre 2020
Artículo de Investigación
1-13
Computación

Junio del 2020

Cuatrimestral

 

 

 

 

PDF(1024 KB)

Cupertino Lucero-Álvarez1, Mariano Larios-Gómez2, Pascual Pérez-Cruz1, Carlos Ortiz-Ramírez1, Brian Manuel González-Contreras3, Juventino Montiel-Hernández3

1Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información.

2Benemérita Universidad Autónoma de Puebla, Facultad en Ciencias de la Computación.
3Universidad Autónoma de Tlaxcala, Facultad de Ciencias Básicas, Ingeniería y Tecnología.

Recibido: 10 de noviembre de 2019   Aceptado:8 de marzo de 2020  Publicado en línea: 30 de junio de 2020

Resumen. En este artículo se presenta una propuesta para la construcción del prototipo de software ZoomBooks Smart, basado en un Sistema de Recuperación de Información orientado a sin-conexión (SRI- off line) para el almacenamiento y recuperación de documentos relevantes a la carga curricular de los estudiantes de nivel medio superior, especialmente para los bachilleratos apartados de las tres Mixtecas de la República Mexicana que carecen de recursos de información digitales. La metodología planteada para su implementación tiene como base el modelo Booleano Extendido (BE) para la recuperación, además de aplicar aprendizaje automático para recomendar lecturas a los usuarios con base en sus perfiles, y técnicas del Procesamiento del Lenguaje Natural (PLN) para el tratado automático de tareas específicas como las sugerencias de frases mediante n-gramas y la expansión de consultas. Se presenta un primer prototipo de software que tiene la funcionalidad de almacenar, de manera semiautomática los documentos en formato PDF (formato de documento portátil) que son relevantes a las diferentes asignaturas de la carga curricular de los estudiantes u otros usuarios en el ambiente académico. Los documentos pueden ser recuperados en orden de relevancia consulta-documento, mediante consultas de texto libre.

Palabras Clave: Modelo booleano extendido, recuperación de información, aprendizaje automático, máquina de búsqueda.

 

Abstract.This article presents a proposal for the construction of the ZoomBooks-Smart framework prototype, based on an offline-oriented Information Recovery System (SRI-offline) for the storage and retrieval of documents relevant to the curricular load of students upper level, especially for high school graduates of the three Mixtecas in the state of Puebla-Mexico that lack digital information resources. The methodology proposed for its implementation is based on the Extended Boolean (BE) model for recovery, in addition to applying machine learning to recommend readings to users based on their profiles, and Natural Language Processing (PLN) techniques for the treaty Automatic specific tasks such as n-gram phrase suggestions and query expansion. As a result, the system has the functionality to store semi-automatically, documents in PDF format (portable document format) that are relevant to the different subjects of the curriculum load of students or other users in the academic environment, and of this from can be retrieved in order of relevance query-document, through free text queries.

Keywords:Extended boolean model, information retrieval, machine learning, search engine.

Cupertino Lucero-Álvarez(Autor de correspondencia)

Emails:clucero@utim.edu.mx