Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano

El presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una enc...

Descrición completa

Gardado en:
Detalles Bibliográficos
Autor Principal: Robinson Casierra, Ray Ricardo (author)
Formato: bachelorThesis
Idioma:spa
Publicado: 2019
Subjects:
Acceso en liña:http://www.dspace.uce.edu.ec/handle/25000/17569
Tags: Engadir etiqueta
Sen Etiquetas, Sexa o primeiro en etiquetar este rexistro!
Descripción
Summary:El presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una encuesta realizada en la Facultad de Ingeniería Ciencias Físicas y Matemáticas, de la Universidad Central del Ecuador. Posteriormente, se extrae los tweets de la cuenta de la Universidad Central, para someterlos a limpieza de texto y que estén listos para el análisis mediante minería de opinión. Para determinar la polaridad de los tweets se hizo una comparación de algoritmos supervisados, de los cuales se optó el mejor Random Forest, tanto para los tweets y la encuesta utilizando R. El sistema aborda resultados para definir el nivel de aceptación en los tweets y de la encuesta que presenta la cuenta, los mismos que pueden ser visualizados gráficamente mediante la librería Shiny que permite realizar aplicaciones web. El proyecto emplea la metodología CRISP-DM para proyectos de minería de datos y R como lenguaje de programación que tiene un enfoque estadístico y es pertinente para este campo de estudio.