Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas

Se entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuent...

Fuld beskrivelse

Saved in:
Bibliografiske detaljer
Hovedforfatter: Conforme Paguay, Madelein Kristel (author)
Andre forfattere: Torres Ollague, Dilan Steven (author)
Format: article
Sprog:spa
Udgivet: 2025
Fag:
Online adgang:http://dspace.ups.edu.ec/handle/123456789/31104
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
Beskrivelse
Summary:Se entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuentes, preprocesamiento especifico por modalidad, con el fin de convertirlos en datasets multimodales que abarquen datos clínicos como imágenes médicas para mejorar la precisión diagnóstica. Durante el procesamiento de datos clínicos se pudieron evidenciar desbalanceo de clases y valores faltantes, por lo que se requirió aplicar técnicas de sobre muestreo como SMOTE eficientes pero susceptibles a introducir sesgos. Este estudio también incorpora técnicas de reducción de dimensionalidad como PCA, y ensemble learning, como hard voting, para mejorar la predicción. Además de realizar comparaciones de diversos modelos de aprendizaje automático hasta identificar el modelo con mejores resultados en métricas y viabilidad de implementación para cada dataset.