Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano

El presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una enc...

תיאור מלא

שמור ב:
מידע ביבליוגרפי
מחבר ראשי: Robinson Casierra, Ray Ricardo (author)
פורמט: bachelorThesis
שפה:spa
יצא לאור: 2019
נושאים:
גישה מקוונת:http://www.dspace.uce.edu.ec/handle/25000/17569
תגים: הוספת תג
אין תגיות, היה/י הראשונ/ה לתייג את הרשומה!
_version_ 1824209430737059840
author Robinson Casierra, Ray Ricardo
author_facet Robinson Casierra, Ray Ricardo
author_role author
collection Repositorio de la Universidad Central del Ecuador
dc.contributor.none.fl_str_mv Herrera Flores, Boris Enrique
dc.creator.none.fl_str_mv Robinson Casierra, Ray Ricardo
dc.date.none.fl_str_mv 2019-02-13T01:42:38Z
2019-02-13T01:42:38Z
2019
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv Robinson Casierra, Ray Ricardo (2019). Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano. Trabajo de titulación previo a la obtención del Título de Ingeniero Informático. Carrera de Ingeniería Informática. Quito: UCE. 138 p.
BIBLIOTECA GENERAL - INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA
http://www.dspace.uce.edu.ec/handle/25000/17569
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Quito: UCE
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio de la Universidad Central del Ecuador
instname:Universidad Central del Ecuador
instacron:UCE
dc.subject.none.fl_str_mv ALGORITMOS SUPERVISADOS
TWITTER
MINERÍA DE OPINIÓN
METODOLOGÍA CRISP-DM
dc.title.none.fl_str_mv Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description El presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una encuesta realizada en la Facultad de Ingeniería Ciencias Físicas y Matemáticas, de la Universidad Central del Ecuador. Posteriormente, se extrae los tweets de la cuenta de la Universidad Central, para someterlos a limpieza de texto y que estén listos para el análisis mediante minería de opinión. Para determinar la polaridad de los tweets se hizo una comparación de algoritmos supervisados, de los cuales se optó el mejor Random Forest, tanto para los tweets y la encuesta utilizando R. El sistema aborda resultados para definir el nivel de aceptación en los tweets y de la encuesta que presenta la cuenta, los mismos que pueden ser visualizados gráficamente mediante la librería Shiny que permite realizar aplicaciones web. El proyecto emplea la metodología CRISP-DM para proyectos de minería de datos y R como lenguaje de programación que tiene un enfoque estadístico y es pertinente para este campo de estudio.
eu_rights_str_mv openAccess
format bachelorThesis
id UCE_79f099b78cd2e3830bfde534c7562c9c
identifier_str_mv Robinson Casierra, Ray Ricardo (2019). Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano. Trabajo de titulación previo a la obtención del Título de Ingeniero Informático. Carrera de Ingeniería Informática. Quito: UCE. 138 p.
BIBLIOTECA GENERAL - INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA
instacron_str UCE
institution UCE
instname_str Universidad Central del Ecuador
language spa
network_acronym_str UCE
network_name_str Repositorio de la Universidad Central del Ecuador
oai_identifier_str oai:dspace.uce.edu.ec:25000/17569
publishDate 2019
publisher.none.fl_str_mv Quito: UCE
reponame_str Repositorio de la Universidad Central del Ecuador
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio de la Universidad Central del Ecuador - Universidad Central del Ecuador
repository_id_str 2487
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/ec/
spelling Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatorianoRobinson Casierra, Ray RicardoALGORITMOS SUPERVISADOSTWITTERMINERÍA DE OPINIÓNMETODOLOGÍA CRISP-DMEl presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una encuesta realizada en la Facultad de Ingeniería Ciencias Físicas y Matemáticas, de la Universidad Central del Ecuador. Posteriormente, se extrae los tweets de la cuenta de la Universidad Central, para someterlos a limpieza de texto y que estén listos para el análisis mediante minería de opinión. Para determinar la polaridad de los tweets se hizo una comparación de algoritmos supervisados, de los cuales se optó el mejor Random Forest, tanto para los tweets y la encuesta utilizando R. El sistema aborda resultados para definir el nivel de aceptación en los tweets y de la encuesta que presenta la cuenta, los mismos que pueden ser visualizados gráficamente mediante la librería Shiny que permite realizar aplicaciones web. El proyecto emplea la metodología CRISP-DM para proyectos de minería de datos y R como lenguaje de programación que tiene un enfoque estadístico y es pertinente para este campo de estudio.The present Project aims to analyze the behavior of the feelings implementing supervised algorithms andn-grams (one-grama, bi-grama, tri-grama), comparingthe feeling analysis between the data obtained from the Twitter social network and the data obtained through a survey carried out in the Faculty of Engineering, Physical Sciences and Mathematics of the Central University of Ecuador. Later, the tweets of the Central University account are extracted, to be submitted to text cleaning and to be ready for an analysis through a mining opinion. To determine the polarity of the tweets, a comparison of the supervised algorithms was performed, of which the best, Random Forests, was chosen both for the tweets and the survey, using R. The system approaches results to define the acceptance level in the tweets and of the survey that the account presents, which can be visualized graphically through the Shiny library that allows to perform web applications. The Project uses the CRISP-DM methodology for projects of data mining and R as programming language, which has a statistical approach and is relevant for this study fieldQuito: UCEHerrera Flores, Boris Enrique2019-02-13T01:42:38Z2019-02-13T01:42:38Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfRobinson Casierra, Ray Ricardo (2019). Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano. Trabajo de titulación previo a la obtención del Título de Ingeniero Informático. Carrera de Ingeniería Informática. Quito: UCE. 138 p.BIBLIOTECA GENERAL - INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICAhttp://www.dspace.uce.edu.ec/handle/25000/17569spahttp://creativecommons.org/licenses/by-nc-sa/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio de la Universidad Central del Ecuadorinstname:Universidad Central del Ecuadorinstacron:UCE2024-12-11T12:37:19Zoai:dspace.uce.edu.ec:25000/17569Institucionalhttp://www.dspace.uce.edu.ec/Universidad públicahttps://www.uce.edu.ec/http://www.dspace.uce.edu.ec/oai.Ecuador...opendoar:24872024-12-11T12:37:19Repositorio de la Universidad Central del Ecuador - Universidad Central del Ecuadorfalse
spellingShingle Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
Robinson Casierra, Ray Ricardo
ALGORITMOS SUPERVISADOS
TWITTER
MINERÍA DE OPINIÓN
METODOLOGÍA CRISP-DM
status_str publishedVersion
title Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
title_full Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
title_fullStr Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
title_full_unstemmed Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
title_short Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
title_sort Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
topic ALGORITMOS SUPERVISADOS
TWITTER
MINERÍA DE OPINIÓN
METODOLOGÍA CRISP-DM
url http://www.dspace.uce.edu.ec/handle/25000/17569