Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas
Se entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuent...
Saved in:
| Hovedforfatter: | |
|---|---|
| Andre forfattere: | |
| Format: | article |
| Sprog: | spa |
| Udgivet: |
2025
|
| Fag: | |
| Online adgang: | http://dspace.ups.edu.ec/handle/123456789/31104 |
| Tags: |
Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
|
| _version_ | 1862796152289624064 |
|---|---|
| author | Conforme Paguay, Madelein Kristel |
| author2 | Torres Ollague, Dilan Steven |
| author2_role | author |
| author_facet | Conforme Paguay, Madelein Kristel Torres Ollague, Dilan Steven |
| author_role | author |
| collection | Repositorio Universidad Politécnica Salesiana |
| dc.contributor.none.fl_str_mv | León Veas, Joffre Luis |
| dc.creator.none.fl_str_mv | Conforme Paguay, Madelein Kristel Torres Ollague, Dilan Steven |
| dc.date.none.fl_str_mv | 2025-09-15T20:07:27Z 2025-09-15T20:07:27Z 2025 |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | http://dspace.ups.edu.ec/handle/123456789/31104 |
| dc.language.none.fl_str_mv | spa |
| dc.rights.none.fl_str_mv | Atribución-NoComercial-SinDerivadas 3.0 Ecuador http://creativecommons.org/licenses/by-nc-nd/3.0/ec/ info:eu-repo/semantics/openAccess |
| dc.source.none.fl_str_mv | reponame:Repositorio Universidad Politécnica Salesiana instname:Universidad Politécnica Salesiana instacron:UPS |
| dc.subject.none.fl_str_mv | FUSIÓN OPTIMIZACIÓN MACHINE LEARNING DIAGNOSTICO PREPROCESAMIENTO |
| dc.title.none.fl_str_mv | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas |
| dc.type.none.fl_str_mv | info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/article |
| description | Se entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuentes, preprocesamiento especifico por modalidad, con el fin de convertirlos en datasets multimodales que abarquen datos clínicos como imágenes médicas para mejorar la precisión diagnóstica. Durante el procesamiento de datos clínicos se pudieron evidenciar desbalanceo de clases y valores faltantes, por lo que se requirió aplicar técnicas de sobre muestreo como SMOTE eficientes pero susceptibles a introducir sesgos. Este estudio también incorpora técnicas de reducción de dimensionalidad como PCA, y ensemble learning, como hard voting, para mejorar la predicción. Además de realizar comparaciones de diversos modelos de aprendizaje automático hasta identificar el modelo con mejores resultados en métricas y viabilidad de implementación para cada dataset. |
| eu_rights_str_mv | openAccess |
| format | article |
| id | UPS_a8727f3a8423a99ab583f6cdc4e20e75 |
| instacron_str | UPS |
| institution | UPS |
| instname_str | Universidad Politécnica Salesiana |
| language | spa |
| network_acronym_str | UPS |
| network_name_str | Repositorio Universidad Politécnica Salesiana |
| oai_identifier_str | oai:dspace.ups.edu.ec:123456789/31104 |
| publishDate | 2025 |
| reponame_str | Repositorio Universidad Politécnica Salesiana |
| repository.mail.fl_str_mv | . |
| repository.name.fl_str_mv | Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesiana |
| repository_id_str | 1737 |
| rights_invalid_str_mv | Atribución-NoComercial-SinDerivadas 3.0 Ecuador http://creativecommons.org/licenses/by-nc-nd/3.0/ec/ |
| spelling | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosasConforme Paguay, Madelein KristelTorres Ollague, Dilan StevenFUSIÓNOPTIMIZACIÓNMACHINE LEARNINGDIAGNOSTICOPREPROCESAMIENTOSe entrenaron diversos modelos de aprendizaje automático, como SVM, XGBoost, Random Forest, árbol de decisión, entre otros, con el objetivo de diagnosticar células cancerosas en distintos estadios. Para ello, se emplearon tres datasets, los cuales requirieron pipelines robustos, integración de fuentes, preprocesamiento especifico por modalidad, con el fin de convertirlos en datasets multimodales que abarquen datos clínicos como imágenes médicas para mejorar la precisión diagnóstica. Durante el procesamiento de datos clínicos se pudieron evidenciar desbalanceo de clases y valores faltantes, por lo que se requirió aplicar técnicas de sobre muestreo como SMOTE eficientes pero susceptibles a introducir sesgos. Este estudio también incorpora técnicas de reducción de dimensionalidad como PCA, y ensemble learning, como hard voting, para mejorar la predicción. Además de realizar comparaciones de diversos modelos de aprendizaje automático hasta identificar el modelo con mejores resultados en métricas y viabilidad de implementación para cada dataset.Various machine learning models, such as SVM, XGBoost, Random Forest, decision tree, and others, were trained to diagnose cancer cells at different stages. To achieve this, three datasets were used, which required robust pipelines, source integration, and modality-specific preprocessing to transform them into multimodal datasets encompassing clinical data such as medical images to improve diagnostic accuracy. During clinical data processing, class imbalance and missing values were evident, necessitating the application of oversampling techniques such as SMOTE, which are efficient but susceptible to bias. This study also incorporates dimensionality reduction techniques such as PCA and ensemble learning, such as hard voting, to improve prediction. In addition, various machine learning models were compared until the model with the best results in terms of metrics and implementation feasibility for each dataset was identified.León Veas, Joffre Luis2025-09-15T20:07:27Z2025-09-15T20:07:27Z2025info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://dspace.ups.edu.ec/handle/123456789/31104spaAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Politécnica Salesianainstname:Universidad Politécnica Salesianainstacron:UPS2025-09-15T20:07:32Zoai:dspace.ups.edu.ec:123456789/31104Institucionalhttps://dspace.ups.edu.ec/Institución privadahttps://www.ups.edu.ec/https://dspace.ups.edu.ec/oai.Ecuador...opendoar:17372025-09-15T20:07:32Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesianafalse |
| spellingShingle | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas Conforme Paguay, Madelein Kristel FUSIÓN OPTIMIZACIÓN MACHINE LEARNING DIAGNOSTICO PREPROCESAMIENTO |
| status_str | publishedVersion |
| title | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas |
| title_full | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas |
| title_fullStr | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas |
| title_full_unstemmed | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas |
| title_short | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas |
| title_sort | Evaluación comparativa de modelos de aprendizaje automático de bajo costo para diagnóstico de células cancerosas |
| topic | FUSIÓN OPTIMIZACIÓN MACHINE LEARNING DIAGNOSTICO PREPROCESAMIENTO |
| url | http://dspace.ups.edu.ec/handle/123456789/31104 |