Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos en documentos médicos digitales /

Resumen: Topic Modeling o Modelado de temas es una técnica no supervisada del aprendizaje de máquina que permite extraer tópicos o temas desde ciertos documentos y de esta manera poder clasificarlos. Para el presente trabajo de titulación se desarrolló una aplicación web que, con base en el modelo L...

Ամբողջական նկարագրություն

Պահպանված է:
Մատենագիտական մանրամասներ
Հիմնական հեղինակ: Mena Chamba, Andrea Estefanía (author)
Ձևաչափ: bachelorThesis
Լեզու:spa
Հրապարակվել է: 2020
Խորագրեր:
Առցանց հասանելիություն:http://dspace.utpl.edu.ec/handle/20.500.11962/26279
Ցուցիչներ: Ավելացրեք ցուցիչ
Չկան պիտակներ, Եղեք առաջինը, ով նշում է այս գրառումը!
Նկարագրություն
Ամփոփում:Resumen: Topic Modeling o Modelado de temas es una técnica no supervisada del aprendizaje de máquina que permite extraer tópicos o temas desde ciertos documentos y de esta manera poder clasificarlos. Para el presente trabajo de titulación se desarrolló una aplicación web que, con base en el modelo Latent Dirichlet Allocation (LDA) extrae tópicos de documentos con información médica. Se trabajó con un total de 220 documentos digitales que tratan de casos de pacientes con diversas condiciones de salud. Se realizó un pre-procesamiento, lo cual implica una limpieza y refinamiento de los datos para poder definir los datos o términos médicos que puedan representar a los documentos. Posteriormente, se realizó una representación de los documentos a través de una matriz documento-término. LDA se usa con esta matriz y se obtiene las matrices de documento-tópico y tópico-término. Una característica muy importante que se agregó a la aplicación es dar opciones para elegir el número de tópicos. Para esto se utilizó 4 métricas que en base gráficas permiten la selección del número de tópicos. Además, el empleo de terminología especializada en medicina resultó ser una mejor opción al momento de seleccionar el tipo de vocabulario que describa a los documentos. Los resultados se pueden evidenciar mediante mapa de calor, nubes de palabras y una herramienta interactiva llamada PyLDAvis.