Por favor, use este identificador para citar o enlazar este ítem: http://dspace.espoch.edu.ec/handle/123456789/20796
Título : Desarrollo de un servicio web para la clasificación de noticias falsas, aplicando técnicas de aprendizaje automático
Autor : Chariguamán Cuji, Jefferson José
Director(es): Bastidas Guacho, Gisel Katerine
Tribunal (Tesis): Moreno Costales, Patricio Rene
Palabras claves : INGENIERÍA DE SOFTWARE;INTELIGENCIA ARTIFICIAL;API REST;METODOLOGÍA SCRUM;REDES NEURONALES;ISO/IEC 25010
Fecha de publicación : 20-ene-2023
Editorial : Escuela Superior Politécnica de Chimborazo
Citación : Chariguamán Cuji, Jefferson José. (2023). Desarrollo de un servicio web para la clasificación de noticias falsas, aplicando técnicas de aprendizaje automático. Escuela Superior Politécnica de Chimborazo. Riobamba.
Identificador : UDCTFIYE;18T00901
Abstract : The objective of this Curricular Integration Project was the development of a web service for the classification of false notifications in Spanish, integrating a machine learning model for the classification. We utilized the analytical and deductive methods in the development in order to determine the theoretical foundations, and we applied the SCRUM methodology for the web service, where we established the requirements, people and roles involved in the project. Seven technical stories and two user stories were defined, too and a sprint backlog was created to plan the period for the completion of the stories. On the other hand, we utilized the CRISP-DM methodology, covering tasks of data set collection, preprocessing, selection of the techniques to be implemented. Finally, we evaluated and selected the best performing technique for integration into the web service. Both the web service and the implementation of the model were carried out using the Python programming language, with the use of machine learning libraries. We based ourselves on the ISO/IEC 25010 standard to evaluate the performance efficiency of the web service, taking response time as a metric to evaluate the temporal behavior. The analysis determined that the web service has an average response time of 1.08 seconds. On the other hand, the F1 metric was utilized for the evaluation of the performance of the machine learning models, obtaining that the LSTM architecture has the best performance with a score of 0.746. Finally, we recommend that for the training of machine learning models, the size of the data set be taken into account, selecting data sets balanced in the number of existing data per class, so that the classification results will not be affected.
Resumen : El presente Trabajo de Integración Curricular planteó como objetivo el desarrollo de un servicio web para la clasificación de notificas falsas en Español, integrando un modelo de aprendizaje automático para la clasificación. En el desarrollo se utilizaron los métodos analítico y deductivo, para determinar los fundamentos teóricos, además se aplicó la metodología SCRUM para el servicio web, donde se estableció requerimientos, personas y roles involucrados en el proyecto, también se definieron 7 historias técnicas y 2 historias de usuarios, además se realizó el sprint backlog para la planificar el periodo de realización de las historias. Por otro lado, se utilizó la metodología CRISP-DM, cubriendo tareas de recolección del conjunto de datos, preprocesamiento, selección de las técnicas a implementar, finalmente se evaluó y seleccionó la técnica con mejor rendimiento para su integración en el servicio web. Tanto el servicio web como la implementación del modelo, fueron realizados mediante el lenguaje de programación Python, con el uso de librerías de machine learning. Para evaluar la eficiencia de desempeño en el servicio web, se basó en la norma ISO/IEC 25010, tomando como métrica el tiempo de respuesta, para evaluar el comportamiento temporal. En el análisis se determinó que el servicio web tiene un tiempo de respuesta promedio de 1.08 segundos. Por otra parte, para la evaluación del rendimiento de los modelos de aprendizaje automático se utilizó la métrica F1, obteniendo que la arquitectura LSTM tiene el mejor rendimiento con una puntuación de 0.746. Finalmente, se recomienda que, para el entrenamiento de modelos de aprendizaje automático, se tenga en cuenta el tamaño del conjunto de datos optando por conjuntos de datos balanceados en el número de datos existentes por clase, de tal forma que no se afecte los resultados de la clasificación.
URI : http://dspace.espoch.edu.ec/handle/123456789/20796
Aparece en las colecciones: Ingeniería en Sistemas Informáticos; Ingeniero/a de Software

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
18T00901.pdf3,45 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons