Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
El presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una enc...
שמור ב:
| מחבר ראשי: | |
|---|---|
| פורמט: | bachelorThesis |
| שפה: | spa |
| יצא לאור: |
2019
|
| נושאים: | |
| גישה מקוונת: | http://www.dspace.uce.edu.ec/handle/25000/17569 |
| תגים: |
הוספת תג
אין תגיות, היה/י הראשונ/ה לתייג את הרשומה!
|
| _version_ | 1824209430737059840 |
|---|---|
| author | Robinson Casierra, Ray Ricardo |
| author_facet | Robinson Casierra, Ray Ricardo |
| author_role | author |
| collection | Repositorio de la Universidad Central del Ecuador |
| dc.contributor.none.fl_str_mv | Herrera Flores, Boris Enrique |
| dc.creator.none.fl_str_mv | Robinson Casierra, Ray Ricardo |
| dc.date.none.fl_str_mv | 2019-02-13T01:42:38Z 2019-02-13T01:42:38Z 2019 |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | Robinson Casierra, Ray Ricardo (2019). Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano. Trabajo de titulación previo a la obtención del Título de Ingeniero Informático. Carrera de Ingeniería Informática. Quito: UCE. 138 p. BIBLIOTECA GENERAL - INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA http://www.dspace.uce.edu.ec/handle/25000/17569 |
| dc.language.none.fl_str_mv | spa |
| dc.publisher.none.fl_str_mv | Quito: UCE |
| dc.rights.none.fl_str_mv | http://creativecommons.org/licenses/by-nc-sa/3.0/ec/ info:eu-repo/semantics/openAccess |
| dc.source.none.fl_str_mv | reponame:Repositorio de la Universidad Central del Ecuador instname:Universidad Central del Ecuador instacron:UCE |
| dc.subject.none.fl_str_mv | ALGORITMOS SUPERVISADOS MINERÍA DE OPINIÓN METODOLOGÍA CRISP-DM |
| dc.title.none.fl_str_mv | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano |
| dc.type.none.fl_str_mv | info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis |
| description | El presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una encuesta realizada en la Facultad de Ingeniería Ciencias Físicas y Matemáticas, de la Universidad Central del Ecuador. Posteriormente, se extrae los tweets de la cuenta de la Universidad Central, para someterlos a limpieza de texto y que estén listos para el análisis mediante minería de opinión. Para determinar la polaridad de los tweets se hizo una comparación de algoritmos supervisados, de los cuales se optó el mejor Random Forest, tanto para los tweets y la encuesta utilizando R. El sistema aborda resultados para definir el nivel de aceptación en los tweets y de la encuesta que presenta la cuenta, los mismos que pueden ser visualizados gráficamente mediante la librería Shiny que permite realizar aplicaciones web. El proyecto emplea la metodología CRISP-DM para proyectos de minería de datos y R como lenguaje de programación que tiene un enfoque estadístico y es pertinente para este campo de estudio. |
| eu_rights_str_mv | openAccess |
| format | bachelorThesis |
| id | UCE_79f099b78cd2e3830bfde534c7562c9c |
| identifier_str_mv | Robinson Casierra, Ray Ricardo (2019). Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano. Trabajo de titulación previo a la obtención del Título de Ingeniero Informático. Carrera de Ingeniería Informática. Quito: UCE. 138 p. BIBLIOTECA GENERAL - INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA |
| instacron_str | UCE |
| institution | UCE |
| instname_str | Universidad Central del Ecuador |
| language | spa |
| network_acronym_str | UCE |
| network_name_str | Repositorio de la Universidad Central del Ecuador |
| oai_identifier_str | oai:dspace.uce.edu.ec:25000/17569 |
| publishDate | 2019 |
| publisher.none.fl_str_mv | Quito: UCE |
| reponame_str | Repositorio de la Universidad Central del Ecuador |
| repository.mail.fl_str_mv | . |
| repository.name.fl_str_mv | Repositorio de la Universidad Central del Ecuador - Universidad Central del Ecuador |
| repository_id_str | 2487 |
| rights_invalid_str_mv | http://creativecommons.org/licenses/by-nc-sa/3.0/ec/ |
| spelling | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatorianoRobinson Casierra, Ray RicardoALGORITMOS SUPERVISADOSTWITTERMINERÍA DE OPINIÓNMETODOLOGÍA CRISP-DMEl presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una encuesta realizada en la Facultad de Ingeniería Ciencias Físicas y Matemáticas, de la Universidad Central del Ecuador. Posteriormente, se extrae los tweets de la cuenta de la Universidad Central, para someterlos a limpieza de texto y que estén listos para el análisis mediante minería de opinión. Para determinar la polaridad de los tweets se hizo una comparación de algoritmos supervisados, de los cuales se optó el mejor Random Forest, tanto para los tweets y la encuesta utilizando R. El sistema aborda resultados para definir el nivel de aceptación en los tweets y de la encuesta que presenta la cuenta, los mismos que pueden ser visualizados gráficamente mediante la librería Shiny que permite realizar aplicaciones web. El proyecto emplea la metodología CRISP-DM para proyectos de minería de datos y R como lenguaje de programación que tiene un enfoque estadístico y es pertinente para este campo de estudio.The present Project aims to analyze the behavior of the feelings implementing supervised algorithms andn-grams (one-grama, bi-grama, tri-grama), comparingthe feeling analysis between the data obtained from the Twitter social network and the data obtained through a survey carried out in the Faculty of Engineering, Physical Sciences and Mathematics of the Central University of Ecuador. Later, the tweets of the Central University account are extracted, to be submitted to text cleaning and to be ready for an analysis through a mining opinion. To determine the polarity of the tweets, a comparison of the supervised algorithms was performed, of which the best, Random Forests, was chosen both for the tweets and the survey, using R. The system approaches results to define the acceptance level in the tweets and of the survey that the account presents, which can be visualized graphically through the Shiny library that allows to perform web applications. The Project uses the CRISP-DM methodology for projects of data mining and R as programming language, which has a statistical approach and is relevant for this study fieldQuito: UCEHerrera Flores, Boris Enrique2019-02-13T01:42:38Z2019-02-13T01:42:38Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfRobinson Casierra, Ray Ricardo (2019). Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano. Trabajo de titulación previo a la obtención del Título de Ingeniero Informático. Carrera de Ingeniería Informática. Quito: UCE. 138 p.BIBLIOTECA GENERAL - INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICAhttp://www.dspace.uce.edu.ec/handle/25000/17569spahttp://creativecommons.org/licenses/by-nc-sa/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio de la Universidad Central del Ecuadorinstname:Universidad Central del Ecuadorinstacron:UCE2024-12-11T12:37:19Zoai:dspace.uce.edu.ec:25000/17569Institucionalhttp://www.dspace.uce.edu.ec/Universidad públicahttps://www.uce.edu.ec/http://www.dspace.uce.edu.ec/oai.Ecuador...opendoar:24872024-12-11T12:37:19Repositorio de la Universidad Central del Ecuador - Universidad Central del Ecuadorfalse |
| spellingShingle | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano Robinson Casierra, Ray Ricardo ALGORITMOS SUPERVISADOS MINERÍA DE OPINIÓN METODOLOGÍA CRISP-DM |
| status_str | publishedVersion |
| title | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano |
| title_full | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano |
| title_fullStr | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano |
| title_full_unstemmed | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano |
| title_short | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano |
| title_sort | Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano |
| topic | ALGORITMOS SUPERVISADOS MINERÍA DE OPINIÓN METODOLOGÍA CRISP-DM |
| url | http://www.dspace.uce.edu.ec/handle/25000/17569 |