Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos o temas de periódicos digitales /

Resumen: Actualmente existe gran cantidad de información de documentos en formato digital (periódicos, revistas, documentos médicos) de los cuales una tarea importante es identificar los principales tópicos automáticamente. LDA, es una técnica no supervisada que crea automáticamente tópicos basados...

وصف كامل

محفوظ في:
التفاصيل البيبلوغرافية
المؤلف الرئيسي: Pacheco Guevara, Lizbeth Carolina (author)
التنسيق: bachelorThesis
اللغة:spa
منشور في: 2021
الموضوعات:
الوصول للمادة أونلاين:http://dspace.utpl.edu.ec/handle/20.500.11962/27475
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
الوصف
الملخص:Resumen: Actualmente existe gran cantidad de información de documentos en formato digital (periódicos, revistas, documentos médicos) de los cuales una tarea importante es identificar los principales tópicos automáticamente. LDA, es una técnica no supervisada que crea automáticamente tópicos basados en patrones de aparición de palabras en los documentos que se analizan. El objetivo del presente Trabajo de Titulación fue desarrollar una aplicación web en donde se aplica LDA para el análisis y extracción de temas automáticamente. Se trabajó con un total de 198 documentos de noticias digitales obtenidas del blog de noticias de la Universidad Técnica Particular de Loja, se aplica pre-procesamiento de datos y representación en espacios vectoriales, tarea importante a priori para optimizar el rendimiento del algoritmo. La aplicación está desarrollada en Django. Permite cargar una cantidad de documentos, elegir el número de tópicos para luego crear el modelo LDA en base a una referencia dada por la métrica Coherence Model. Finalmente,descargar y analizar los resultados obtenidos mediante la representación de nube de palabras, documento-tópico y tópico-términoypyLDAvis.