Desarrollo de un modelo de clasificación automático en el software R para las etapas de la enfermedad renal crónica Mediante Machine Learning
En este proyecto se presenta el desarrollo de un modelo de clasificación automático para las etapas de la Enfermedad Renal Crónica (ERC) mediante algunas técnicas de machine learning, como las máquinas de soporte vectorial (MSV) y las redes neuronales (ANN). Se utilizó la base de datos de UCI Machin...
Na minha lista:
| Autor principal: | |
|---|---|
| Formato: | bachelorThesis |
| Idioma: | spa |
| Publicado em: |
2024
|
| Assuntos: | |
| Acesso em linha: | http://dspace.ups.edu.ec/handle/123456789/27120 |
| Tags: |
Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
|
| Resumo: | En este proyecto se presenta el desarrollo de un modelo de clasificación automático para las etapas de la Enfermedad Renal Crónica (ERC) mediante algunas técnicas de machine learning, como las máquinas de soporte vectorial (MSV) y las redes neuronales (ANN). Se utilizó la base de datos de UCI Machine Learning, con aproximadamente 400 instancias de pacientes con y sin ERC, para entrenar y probar el modelo. Se utilizó el software R para el modelado, pero previo a esto se realizó el preprocesamiento de la base de datos con el fin de identificar los datos faltantes y atípicos en cada una de las variables. De igual forma, se realizó un análisis y un procesamiento de los datos en el cual se añadieron nuevas variables, como la tasa de filtrado glomerular estimada (TFGe), calculada con la ecuación CKD-EPI, para clasificar instancias según su valor. Luego, se seleccionaron características en base al nivel de correlación de las variables con la TFGe, con el objetivo de mejorar el rendimiento del modelo, buscando clasificar instancias en las cinco etapas de ERC. De esta forma, se obtuvo como mejor modelo el uso de las ANN, con un total de 6 características, como la edad, urea en sangre, creatinina sérica, hemoglobina, volumen de células empaquetadas y la cantidad de células rojas. El modelo generó una precisión del 91% y una sensibilidad del 93% para clasificar instancias de prueba que no padecían ERC. En el caso de personas con etapas 1 y 2, el modelo tuvo un rendimiento por debajo del 70%, por lo cual no era tan fiable en estas etapas. En el caso de la etapa 3, el modelo llego a una precisión del 76% y una sensibilidad del 80%. En cambio, en la etapa 4, se tuvo una precisión del 82% y una sensibilidad del 95%. Además, con una precisión del 100% y una sensibilidad del 57% para las personas que se encontraban en un fallo renal grave. |
|---|