Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas

Se entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuent...

Fuld beskrivelse

Saved in:
Bibliografiske detaljer
Hovedforfatter: Conforme Paguay, Madelein Kristel (author)
Andre forfattere: Torres Ollague, Dilan Steven (author)
Format: article
Sprog:spa
Udgivet: 2025
Fag:
Online adgang:http://dspace.ups.edu.ec/handle/123456789/31104
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
_version_ 1862796152289624064
author Conforme Paguay, Madelein Kristel
author2 Torres Ollague, Dilan Steven
author2_role author
author_facet Conforme Paguay, Madelein Kristel
Torres Ollague, Dilan Steven
author_role author
collection Repositorio Universidad Politécnica Salesiana
dc.contributor.none.fl_str_mv León Veas, Joffre Luis
dc.creator.none.fl_str_mv Conforme Paguay, Madelein Kristel
Torres Ollague, Dilan Steven
dc.date.none.fl_str_mv 2025-09-15T20:07:27Z
2025-09-15T20:07:27Z
2025
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://dspace.ups.edu.ec/handle/123456789/31104
dc.language.none.fl_str_mv spa
dc.rights.none.fl_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Politécnica Salesiana
instname:Universidad Politécnica Salesiana
instacron:UPS
dc.subject.none.fl_str_mv FUSIÓN
OPTIMIZACIÓN
MACHINE LEARNING
DIAGNOSTICO
PREPROCESAMIENTO
dc.title.none.fl_str_mv Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/article
description Se entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuentes, preprocesamiento especifico por modalidad, con el fin de convertirlos en datasets multimodales que abarquen datos clínicos como imágenes médicas para mejorar la precisión diagnóstica. Durante el procesamiento de datos clínicos se pudieron evidenciar desbalanceo de clases y valores faltantes, por lo que se requirió aplicar técnicas de sobre muestreo como SMOTE eficientes pero susceptibles a introducir sesgos. Este estudio también incorpora técnicas de reducción de dimensionalidad como PCA, y ensemble learning, como hard voting, para mejorar la predicción. Además de realizar comparaciones de diversos modelos de aprendizaje automático hasta identificar el modelo con mejores resultados en métricas y viabilidad de implementación para cada dataset.
eu_rights_str_mv openAccess
format article
id UPS_a8727f3a8423a99ab583f6cdc4e20e75
instacron_str UPS
institution UPS
instname_str Universidad Politécnica Salesiana
language spa
network_acronym_str UPS
network_name_str Repositorio Universidad Politécnica Salesiana
oai_identifier_str oai:dspace.ups.edu.ec:123456789/31104
publishDate 2025
reponame_str Repositorio Universidad Politécnica Salesiana
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesiana
repository_id_str 1737
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
spelling Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosasConforme Paguay, Madelein KristelTorres Ollague, Dilan StevenFUSIÓNOPTIMIZACIÓNMACHINE LEARNINGDIAGNOSTICOPREPROCESAMIENTOSe entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuentes, preprocesamiento especifico por modalidad, con el fin de convertirlos en datasets multimodales que abarquen datos clínicos como imágenes médicas para mejorar la precisión diagnóstica. Durante el procesamiento de datos clínicos se pudieron evidenciar desbalanceo de clases y valores faltantes, por lo que se requirió aplicar técnicas de sobre muestreo como SMOTE eficientes pero susceptibles a introducir sesgos. Este estudio también incorpora técnicas de reducción de dimensionalidad como PCA, y ensemble learning, como hard voting, para mejorar la predicción. Además de realizar comparaciones de diversos modelos de aprendizaje automático hasta identificar el modelo con mejores resultados en métricas y viabilidad de implementación para cada dataset.Various machine learning models, such as SVM, XGBoost, Random Forest, decision tree, and others, were trained to diagnose cancer cells at different stages. To achieve this, three datasets were used, which required robust pipelines, source integration, and modality-specific preprocessing to transform them into multimodal datasets encompassing clinical data such as medical images to improve diagnostic accuracy. During clinical data processing, class imbalance and missing values were evident, necessitating the application of oversampling techniques such as SMOTE, which are efficient but susceptible to bias. This study also incorporates dimensionality reduction techniques such as PCA and ensemble learning, such as hard voting, to improve prediction. In addition, various machine learning models were compared until the model with the best results in terms of metrics and implementation feasibility for each dataset was identified.León Veas, Joffre Luis2025-09-15T20:07:27Z2025-09-15T20:07:27Z2025info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://dspace.ups.edu.ec/handle/123456789/31104spaAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Politécnica Salesianainstname:Universidad Politécnica Salesianainstacron:UPS2025-09-15T20:07:32Zoai:dspace.ups.edu.ec:123456789/31104Institucionalhttps://dspace.ups.edu.ec/Institución privadahttps://www.ups.edu.ec/https://dspace.ups.edu.ec/oai.Ecuador...opendoar:17372025-09-15T20:07:32Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesianafalse
spellingShingle Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
Conforme Paguay, Madelein Kristel
FUSIÓN
OPTIMIZACIÓN
MACHINE LEARNING
DIAGNOSTICO
PREPROCESAMIENTO
status_str publishedVersion
title Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
title_full Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
title_fullStr Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
title_full_unstemmed Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
title_short Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
title_sort Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
topic FUSIÓN
OPTIMIZACIÓN
MACHINE LEARNING
DIAGNOSTICO
PREPROCESAMIENTO
url http://dspace.ups.edu.ec/handle/123456789/31104