Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos o temas de periódicos digitales /

Resumen: Actualmente existe gran cantidad de información de documentos en formato digital (periódicos, revistas, documentos médicos) de los cuales una tarea importante es identificar los principales tópicos automáticamente. LDA, es una técnica no supervisada que crea automáticamente tópicos basados...

全面介紹

Saved in:
書目詳細資料
主要作者: Pacheco Guevara, Lizbeth Carolina (author)
格式: bachelorThesis
語言:spa
出版: 2021
主題:
在線閱讀:http://dspace.utpl.edu.ec/handle/20.500.11962/27475
標簽: 添加標簽
沒有標簽, 成為第一個標記此記錄!
實物特徵
總結:Resumen: Actualmente existe gran cantidad de información de documentos en formato digital (periódicos, revistas, documentos médicos) de los cuales una tarea importante es identificar los principales tópicos automáticamente. LDA, es una técnica no supervisada que crea automáticamente tópicos basados en patrones de aparición de palabras en los documentos que se analizan. El objetivo del presente Trabajo de Titulación fue desarrollar una aplicación web en donde se aplica LDA para el análisis y extracción de temas automáticamente. Se trabajó con un total de 198 documentos de noticias digitales obtenidas del blog de noticias de la Universidad Técnica Particular de Loja, se aplica pre-procesamiento de datos y representación en espacios vectoriales, tarea importante a priori para optimizar el rendimiento del algoritmo. La aplicación está desarrollada en Django. Permite cargar una cantidad de documentos, elegir el número de tópicos para luego crear el modelo LDA en base a una referencia dada por la métrica Coherence Model. Finalmente,descargar y analizar los resultados obtenidos mediante la representación de nube de palabras, documento-tópico y tópico-términoypyLDAvis.