Análisis Comparativo de Algoritmos de Machine Learning para Predecir el Rendimiento Académico en Estudiantes de Nivelación mediante Factores Socioeconómicos y Académicos

El estudio tuvo como objetivo identificar el algoritmo de machine learning que ofreciera la mayor precisión para predecir el rendimiento académico de estudiantes de nivelación universitaria, considerando variables académicas y socioeconómicas con el fin de apoyar a las instituciones educativas en la...

Disgrifiad llawn

Wedi'i Gadw mewn:
Manylion Llyfryddiaeth
Prif Awdur: Ortiz Quishpe, Laura Mariela (author)
Fformat: masterThesis
Cyhoeddwyd: 2025
Pynciau:
Mynediad Ar-lein:https://dspace.espoch.edu.ec/handle/123456789/25510
Tagiau: Ychwanegu Tag
Dim Tagiau, Byddwch y cyntaf i dagio'r cofnod hwn!
Disgrifiad
Crynodeb:El estudio tuvo como objetivo identificar el algoritmo de machine learning que ofreciera la mayor precisión para predecir el rendimiento académico de estudiantes de nivelación universitaria, considerando variables académicas y socioeconómicas con el fin de apoyar a las instituciones educativas en la toma de decisiones generales o personalizadas orientadas a mejorar dicho rendimiento. La investigación se desarrolló bajo un enfoque cuantitativo, explicativo y comparativo, y adoptó el paradigma de Ciencia del Diseño (Design Science Research, DSR), estructurado en los ciclos de relevancia, diseño y rigor. En el ciclo de relevancia se realizó una Revisión Sistemática de la Literatura (RSL) conforme a las pautas del protocolo PRISMA, mientras que en el ciclo de diseño se aplicó el modelo CRISP-DM, que brindó una guía clara y flexible para la construcción, implementación y evaluación de los modelos predictivos. En el ciclo del rigor se establecieron estrategias para manejar el sobreajuste, optimizar hiperparámetros, evaluar modelos y mitigar sesgos asociados con variables socioeconómicas. Los resultados evidenciaron que los modelos de ensamblaje, especialmente Random Forest y Stacking, superaron en desempeño a los modelos individuales; Random Forest alcanzó una precisión del 90% y un AUC-ROC de 0.92, mientras que Stacking mostró una mayor capacidad para identificar estudiantes en riesgo, con un recall del 65%. En conjunto, estos hallazgos permitieron concluir que los enfoques de ensamblaje ofrecían un rendimiento superior para la predicción del rendimiento académico en estudiantes de nivelación, demostrando el valor de integrar variables académicas y socioeconómicas en modelos avanzados de machine learning y aportando herramientas efectivas para el diseño de estrategias institucionales orientadas a disminuir la deserción estudiantil.