Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn.
Gorde:
Egile nagusia: | |
---|---|
Beste egile batzuk: | |
Formatua: | bachelorThesis |
Hizkuntza: | spa |
Argitaratua: |
2022
|
Gaiak: | |
Sarrera elektronikoa: | http://repositorio.ug.edu.ec/handle/redug/65299 |
Etiketak: |
Etiketa erantsi
Etiketarik gabe, Izan zaitez lehena erregistro honi etiketa jartzen!
|
_version_ | 1839964400611491840 |
---|---|
author | Bajaña Diaz, Elena de los Angeles |
author2 | Loja Yagual, Rogelio David |
author2_role | author |
author_facet | Bajaña Diaz, Elena de los Angeles Loja Yagual, Rogelio David |
author_role | author |
collection | Repositorio Universidad de Guayaquil |
dc.contributor.none.fl_str_mv | Barzola Monteses, Julio |
dc.creator.none.fl_str_mv | Bajaña Diaz, Elena de los Angeles Loja Yagual, Rogelio David |
dc.date.none.fl_str_mv | 2022-12-09T20:35:55Z 2022-12-09T20:35:55Z 2022-10 |
dc.format.none.fl_str_mv | application/pdf |
dc.identifier.none.fl_str_mv | http://repositorio.ug.edu.ec/handle/redug/65299 |
dc.language.none.fl_str_mv | spa |
dc.publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:Repositorio Universidad de Guayaquil instname:Universidad de Guayaquil instacron:UG |
dc.subject.none.fl_str_mv | Enfermedad de Crohn Machine Learning, Factores de Riesgo Gradient Boosting Classification Árbol de Clasificación Metodología XP Crohn's disease Crohn's disease Risk Factors Gradient Boosting Classification Classification Tree XP Methodology |
dc.title.none.fl_str_mv | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. |
dc.type.none.fl_str_mv | info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis |
description | PDF |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | UG_cffaecb290d82d9c367158c284d7745f |
instacron_str | UG |
institution | UG |
instname_str | Universidad de Guayaquil |
language | spa |
network_acronym_str | UG |
network_name_str | Repositorio Universidad de Guayaquil |
oai_identifier_str | oai:repositorio.ug.edu.ec:redug/65299 |
publishDate | 2022 |
publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
reponame_str | Repositorio Universidad de Guayaquil |
repository.mail.fl_str_mv | . |
repository.name.fl_str_mv | Repositorio Universidad de Guayaquil - Universidad de Guayaquil |
repository_id_str | 0 |
spelling | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn.Bajaña Diaz, Elena de los AngelesLoja Yagual, Rogelio DavidEnfermedad de CrohnMachine Learning,Factores de RiesgoGradient Boosting ClassificationÁrbol de ClasificaciónMetodología XPCrohn's diseaseCrohn's diseaseRisk FactorsGradient Boosting ClassificationClassification TreeXP MethodologyPDFLa enfermedad de Crohn es determinada como preocupación a nivel mundial que como efecto puede ocasionar el deceso de un paciente. Por lo cual el fin de esta investigación es el desarrollo de un modelo predictivo de aprendizaje supervisado de machine learning (ML), que ayude a la toma de decisiones de los médicos nóveles durante el diagnóstico y prescripción de tratamientos, recomendados para mejorar la calidad de vida de los pacientes. Los modelos ML se implementan con el fin de predecir si un paciente padece o no la dolencia de Crohn, considerando las características de riesgos de la misma. Para este fin se consideran dos modelos ML muy difundidos en diferentes aplicaciones, el gradient boosting classification (GBC) y los Árboles de Clasificación (AC). Se utilizó un dataset con 5117 historias clínicas de pacientes con y sin la enfermedad. Esta información se dividió en dos set de datos para el entrenamiento y validación de los modelos, en la proporción 70% y 30%, respectivamente. Durante el entrenamiento el mejor modelo ML fue el GBC, obteniendo mejores métricas de validación tales como exactitud, sensibilidad y f1-score. Además, para corroborar este resultado favorable de GBC, el dataset fue sometido a la técnica de validación K-Fold Cross-Validation para ambos modelos GBC y AC, el cual evaluó la desviación estándar y media de las métricas de desempeño tales como exactitud, sensibilidad y F1-score; ratificando que el mejor modelo de clasificación ajustado al set de datos fue GBC. Finalmente, con estructuras GBC se probaron distintos valores de hiperparámetros, logrando una mejora alrededor de un 1,03% en cuanto al porcentaje de exactitud. Este último modelo ajustado fue utilizado en la ejecución de un sistema web usando Django para la predicción de la enfermedad a partir de los factores de riesgos de pacientes que son ingresados por el médico tratante.Crohn's disease is a worldwide concern that can result in the death of a patient. Therefore, the objective of this research is the development of a predictive machine learning (ML) supervised learning model, which helps the decision making of novice physicians during diagnosis and prescription of treatments, recommended to improve the quality of life of patients. ML models are implemented in order to predict whether or not a patient has Crohn's disease, considering the risk factors of Crohn's disease. For this purpose, two ML models widely used in different applications are considered: gradient boosting classification (GBC) and Classification Trees (CA). A dataset with 5117 clinical histories of patients with and without the disease was used. This information was divided into two datasets for training and validation of the models, in the proportion 70% and 30%, respectively. During training the best ML model was the GBC, obtaining better validation metrics such as accuracy, sensitivity, and f1-score. Furthermore, to corroborate this favorable result of GBC, the dataset was subjected to the K-Fold Cross-Validation technique for both GBC and AC models, which evaluated the mean and standard deviation of performance metrics such as accuracy, sensitivity, and F1-score; ratifying that the best classification model fitted to the dataset was GBC. Finally, different values of hyperparameters were tested with GBC structures, achieving an improvement of about 1.03% in terms of accuracy percentage. This last adjusted model was used in the implementation of a web application using Django for the prediction of the disease from the risk factors of patients who are admitted by the treating physician.Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Barzola Monteses, Julio2022-12-09T20:35:55Z2022-12-09T20:35:55Z2022-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/65299spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2022-12-10T13:08:48Zoai:repositorio.ug.edu.ec:redug/65299Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02025-08-09T07:11:07.244341Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue |
spellingShingle | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. Bajaña Diaz, Elena de los Angeles Enfermedad de Crohn Machine Learning, Factores de Riesgo Gradient Boosting Classification Árbol de Clasificación Metodología XP Crohn's disease Crohn's disease Risk Factors Gradient Boosting Classification Classification Tree XP Methodology |
status_str | publishedVersion |
title | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. |
title_full | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. |
title_fullStr | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. |
title_full_unstemmed | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. |
title_short | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. |
title_sort | Desarrollo de modelo predictivo basado en algoritmos de aprendizaje supervisado de Machine Learning, para el análisis de datos en pacientes con la enfermedad de Crohn. |
topic | Enfermedad de Crohn Machine Learning, Factores de Riesgo Gradient Boosting Classification Árbol de Clasificación Metodología XP Crohn's disease Crohn's disease Risk Factors Gradient Boosting Classification Classification Tree XP Methodology |
url | http://repositorio.ug.edu.ec/handle/redug/65299 |