Aplicación de técnicas de aprendizaje de máquina para la predicción de riesgos en la salud ginecológica

Resumen: El cáncer cervical es una de las causas principales de muerte en las mujeres, en el año 2020, se diagnosticaron 604.127 casos de cáncer de cuello uterino, con una mortalidad de 341.831 casos en todo el mundo.El objetivodel presente trabajo es analizar, explorar, comparar e identificar el me...

Full description

Saved in:
Bibliographic Details
Main Author: Ortiz Torres, Christian Alfonso (author)
Format: bachelorThesis
Language:spa
Published: 2022
Subjects:
Online Access:http://dspace.utpl.edu.ec/handle/20.500.11962/29467
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Resumen: El cáncer cervical es una de las causas principales de muerte en las mujeres, en el año 2020, se diagnosticaron 604.127 casos de cáncer de cuello uterino, con una mortalidad de 341.831 casos en todo el mundo.El objetivodel presente trabajo es analizar, explorar, comparar e identificar el mejor método de predicción del cáncer cervical aplicando técnicas de machine learning. Para lograr dicho objetivo se analizaron 17 investigaciones obtenidas de seis bases de datos científicas de los últimos 5 años, y, se realizaron experimentos con 7 algoritmos: 1. Decision Tree (DT), 2. Random Forest (RF), 3. Logistic Regression (LR), 4. XGBoost (XG), 5. Naive Bayes (NB), 6. Multi-layer Perceptron (MLP), 7. K-Nearest Neighbors (KNN). Seaplicaron trestécnicas de balanceo de datos: 1. SMOTETomek, 2. SMOTE, 3.ROS, para las cuatro variables objetivo: Hinselmann, Schiller, Citology y Biopsy. Además,se trabajó con accuracy, precisión, recall, f-score, AUC y la curva ROC para evaluar los valores obtenidos de los algoritmos depredicción.El algoritmo que mejor destacó es Random Forestcon un accuracy de 94.57%paraselección de variablesy reducción de variables PCA.