Nuevo método de predicción de cáncer de seno mediante marcadores moleculares y un método ensemble

Antecedentes: Identificar relaciones entre biomarcadores de cáncer de seno es un tema vital en las ciencias oncológicas debido a su conexión con un correcto diagnóstico. Las herramientas basadas en modelos capaces de extraer con precisión estas asociaciones a partir de muestras procesadas son de gra...

ver descrição completa

Na minha lista:
Detalhes bibliográficos
Autor principal: Cedeño Gallardo, Adonis Jesús (author)
Formato: bachelorThesis
Publicado em: 2024
Assuntos:
Acesso em linha:https://repositorio.espe.edu.ec/handle/21000/38275
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
Descrição
Resumo:Antecedentes: Identificar relaciones entre biomarcadores de cáncer de seno es un tema vital en las ciencias oncológicas debido a su conexión con un correcto diagnóstico. Las herramientas basadas en modelos capaces de extraer con precisión estas asociaciones a partir de muestras procesadas son de gran utilidad para superar este reto. Dichos modelos pueden aprovechar datos de espectrometría de masas TOF para relacionar la composición general de aminoácidos y sus propiedades fisicoquímicas a fin de predecir una categoría de clasificación. Resultados: Este estudio propone aprendizaje en conjunto para clasificar proteínas de cáncer de mama utilizando datos de biomarcadores etiquetados y aprendizaje ensemble. El mejor modelo es un conjunto Bagging de diez Máquinas de Vectores de Soporte con un parámetro de regularización = 3 y un tamaño de kernel = 0.06 cada uno, que alcanza un accuracy de 0.968(0.936; 0.990), una métrica recall de 0.979(0.943; 0.990), una métrica precision de 0.960(0.914; 0.990), una puntuación de 0.968(0.936; 0.990) y un área bajo la curva de 0.992(0.981; 0.999), bajo validación cruzada con = 10. Los biomarcadores más importantes relacionados con la predicción son eventos de inserción/deleción asociados a la Prolina, Lisina y Leucina. Los pares Leucina/Glicina, Glutamina/Metionina y los cambios en la mutabilidad relativa se han convertido en características principales para aumentar la precisión de la predicción. Conclusiones: Un modelo basado en Bagging y Máquinas de Vectores de Soporte ha demostrado una clasificación precisa de proteínas a a través de la identificación de biomarcadores. Este modelo logró un área y un accuracy 1.23% 3.42% mayores que el clasificador propuesto por López-Cortés et al.,(2020) con 275 descriptores, al tiempo que agrega métricas de precision y recall.