Por favor, use este identificador para citar o enlazar este ítem: http://dspace.espoch.edu.ec/handle/123456789/4321
Título : Estudio comparativo de algoritmos de predicción para la minería de datos aplicado al area académica FIE-ESPOCH.
Autor : Gallegos Carrillo, Katherine Maribel
Director(es): Menes Camejo, Ivan
Tribunal (Tesis): Arcos Medina, Gloria de Lourdes
Palabras claves : ANÁLISIS;MINERÍA DE DATOS;ALGORITMOS;REGRESIÓN LOGÍSTICA;ÁRBOL DE DECISIÓN;PREDICCIÓN;PATRONES
Fecha de publicación : 1-jun-2015
Editorial : Escuela Superior Politécnica de Chimborazo
Citación : Gallegos Carrillo, Katherine Maribel. (2015). Estudio comparativo de algoritmos de predicción para la minería de datos aplicado al area académica FIE-ESPOCH. Escuela Superior Politécnica de Chimborazo. Riobamba.
Identificador : UDCTFIYE;18T00589
Abstract : Comparative Study of data mining algorithms to determine the best algorithm performance applied to the academic area of the Faculty of computer science and electronics of Escuela Superior Politecnica de Chimborazo. To validate the hypothesis on the performance of the chosen algorithms, the scientific method and the following elements such as: a portable computer and software tools were used as well as Microsoft SQL Server, Microsoft Data Quality, Microsoft Data Tools, Microsoft Analysis Services, and the observation technique to carry out the measurements. The z-test for two-tailed, and a significance level of 5% were applied on the use of a Central Processing Unit (CPU), employ of the Random Access Memory (RAM), response time and accuracy of the algorithms. The result of the analysis showed that the decision tree algorithm has better performance than the logistic regression algorithm with 98.92% on 95.70% of performance. Under the guidance of the methodology Cross Industry Standard Process for Data Mining CRISPDM the project of data mining was implemented on the information of academic indicators of the Faculty of computer science and electronics, making use of the decision tree algorithm of Microsoft, to get the patterns of behavior required. It is concluded that the decision tree algorithm had better performance than the logistic regression algorithm on the academic data of the Faculty of computer science and electronics. An initial study of information prior to the choice of algorithms is recommended to avoid the discarding of data types in a data mining project.
Resumen : Estudio comparativo de algoritmos de minería de datos para determinar el algoritmo de mejor desempeño aplicado al área académica de la Facultad de Informática y Electrónica de la Escuela Superior Politécnica de Chimborazo. Para comprobar la hipótesis sobre el desempeño de los algoritmos seleccionados, se utilizó el método científico y los siguientes elementos: un computador portátil y herramientas software: Microsoft SQL Server, Microsoft Data Quality, Microsoft Data Tools y Microsoft Analisys Services, y la técnica de observación para realizar las mediciones. La prueba z para dos colas y un nivel de significancia del 5%, fue aplicado sobre el uso de la Unidad Central de Proceso (CPU), uso de la Memoria de Acceso Aleatorio (RAM), tiempo de respuesta y precisión de los algoritmos. El resultado del análisis arrojó que el algoritmo de Árbol de Decisión tiene mejor desempeño que el algoritmo de Regresión Logística con 98,92% sobre 95,70% de desempeño. Bajo la guía de la metodología Cross Industry Standard Process for Data Mining, CRISP-DM se implementó el proyecto de minería de datos sobre la información de indicadores académicos de la Facultad de Informática y Electrónica, haciendo uso del algoritmo Árbol de Decisión de Microsoft, para obtener los patrones de comportamiento requeridos. Se concluye que el algoritmo de Árbol de Decisión tiene mejor desempeño que el Algoritmo de Regresión Logística sobre los datos académicos de la Facultad de Informática y Electrónica. Se recomienda realizar un estudio inicial de datos previo a la elección de los algoritmos para evitar el descarte de tipos de datos existentes en un proyecto de minería de datos.
URI : http://dspace.espoch.edu.ec/handle/123456789/4321
Aparece en las colecciones: Ingeniería en Sistemas Informáticos

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
18T00589.pdf3,86 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons