Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano

En el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el e...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Albán Morales, María Fernanda (author)
Otros Autores: Gualoto Fuentes, Bryan Xavier (author)
Formato: bachelorThesis
Lenguaje:spa
Publicado: 2024
Materias:
Acceso en línea:http://dspace.ups.edu.ec/handle/123456789/27234
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
_version_ 1858355705170362368
author Albán Morales, María Fernanda
author2 Gualoto Fuentes, Bryan Xavier
author2_role author
author_facet Albán Morales, María Fernanda
Gualoto Fuentes, Bryan Xavier
author_role author
collection Repositorio Universidad Politécnica Salesiana
dc.contributor.none.fl_str_mv Vallejo Huanga, Diego Fernando
dc.creator.none.fl_str_mv Albán Morales, María Fernanda
Gualoto Fuentes, Bryan Xavier
dc.date.none.fl_str_mv 2024-03-08T21:40:51Z
2024-03-08T21:40:51Z
2024-02
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://dspace.ups.edu.ec/handle/123456789/27234
dc.language.none.fl_str_mv spa
dc.rights.none.fl_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Politécnica Salesiana
instname:Universidad Politécnica Salesiana
instacron:UPS
dc.subject.none.fl_str_mv COMPUTACIÓN
ANÁLISIS DE SISTEMAS
ALGORITMOS
SENTIMIENTOS
TEXTOS
dc.title.none.fl_str_mv Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description En el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el estado ha implementado acciones para promover el uso del idioma, incluyendo programas educativos bilingües y la creación de materiales culturales. Dada la naturaleza mayoritariamente oral de este idioma, existen pocos datos textuales disponibles, por lo que se presentan desafíos para el desarrollo de algoritmos de análisis computacional lingüístico. En esta investigación se generó un dataset en idioma Kichwa, etiquetado manualmente con criterios de valencia léxica, para evaluar la carga emocional de los tokens contenidos en el diccionario entre positivos, negativos o neutros. Este conjunto de datos permite realizar, a-posteriori, el análisis de sentimientos de un nuevo texto ingresado por el usuario, en un prototipo web desarrollado mediante Flask y Python. En la metodología de desarrollo, el pre-procesamiento de datos utiliza técnicas de Procesamiento del Lenguaje Natural (NLP) y se aplican métricas de similitud como el coeficiente de Jaccard y Coseno Vectorial para cuantificar la polaridad del texto ingresado en Kichwa. Para la validación de este sistema se llevó a cabo una fase de experimentación que permitió evaluar el rendimiento de nuestra herramienta frente a otras dos herramientas de análisis de sentimientos construidas con modelos de texto pre-entrenados. Los resultados muestran que, al analizar polaridades de textos en Kichwa, el modelo desarrollado alcanzó una exactitud máxima del 95\% y una mejora del 6% y 18% en comparación con los modelos de ChatGPT y Bard, respectivamente.
eu_rights_str_mv openAccess
format bachelorThesis
id UPS_ea12e1317536f975e36884105fb39d7e
instacron_str UPS
institution UPS
instname_str Universidad Politécnica Salesiana
language spa
network_acronym_str UPS
network_name_str Repositorio Universidad Politécnica Salesiana
oai_identifier_str oai:dspace.ups.edu.ec:123456789/27234
publishDate 2024
reponame_str Repositorio Universidad Politécnica Salesiana
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesiana
repository_id_str 1737
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
spelling Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatorianoAlbán Morales, María FernandaGualoto Fuentes, Bryan XavierCOMPUTACIÓNANÁLISIS DE SISTEMASALGORITMOSSENTIMIENTOSTEXTOSEn el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el estado ha implementado acciones para promover el uso del idioma, incluyendo programas educativos bilingües y la creación de materiales culturales. Dada la naturaleza mayoritariamente oral de este idioma, existen pocos datos textuales disponibles, por lo que se presentan desafíos para el desarrollo de algoritmos de análisis computacional lingüístico. En esta investigación se generó un dataset en idioma Kichwa, etiquetado manualmente con criterios de valencia léxica, para evaluar la carga emocional de los tokens contenidos en el diccionario entre positivos, negativos o neutros. Este conjunto de datos permite realizar, a-posteriori, el análisis de sentimientos de un nuevo texto ingresado por el usuario, en un prototipo web desarrollado mediante Flask y Python. En la metodología de desarrollo, el pre-procesamiento de datos utiliza técnicas de Procesamiento del Lenguaje Natural (NLP) y se aplican métricas de similitud como el coeficiente de Jaccard y Coseno Vectorial para cuantificar la polaridad del texto ingresado en Kichwa. Para la validación de este sistema se llevó a cabo una fase de experimentación que permitió evaluar el rendimiento de nuestra herramienta frente a otras dos herramientas de análisis de sentimientos construidas con modelos de texto pre-entrenados. Los resultados muestran que, al analizar polaridades de textos en Kichwa, el modelo desarrollado alcanzó una exactitud máxima del 95\% y una mejora del 6% y 18% en comparación con los modelos de ChatGPT y Bard, respectivamente.In the context of cultural and linguistic diversity in Ecuador, the Constitution officially recognizes Kichwa as a means to promote intercultural dialogue. However, this language has been the object of prejudice and stigmatization in the culture and identity of indigenous peoples. Therefore, the state has implemented actions to promote the use of the language, including bilingual educational programs and the creation of cultural materials. Given the primarily oral nature of this language, there is little textual data available, which presents challenges for the development of computational linguistic analysis algorithms. In this research, a dataset was generated in the Kichwa language, manually labeled with lexical valence criteria, to evaluate the emotional charge of the tokens contained in the dictionary between positive, negative, or neutral. This dataset allows performing a sentiment analysis of a new text entered by the user in a web prototype developed using Flask and Python. In the development methodology, data pre-processing uses Natural Language Processing (NLP) techniques and similarity metrics such as the Jaccard coefficient and Vector Cosine are applied to quantify the polarity of the text entered in Kichwa. To validate this system, an experimentation phase was carried out that allowed us to evaluate the performance of our tool against two other sentiment analysis tools built with pre-trained text models. The results show that, when analyzing polarities of Kichwa texts, the developed model achieved a maximum accuracy of 95% and an improvement of 6% and 18% compared to the ChatGPT and Bard models, respectively.Vallejo Huanga, Diego Fernando2024-03-08T21:40:51Z2024-03-08T21:40:51Z2024-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://dspace.ups.edu.ec/handle/123456789/27234spaAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Politécnica Salesianainstname:Universidad Politécnica Salesianainstacron:UPS2024-04-08T17:54:53Zoai:dspace.ups.edu.ec:123456789/27234Institucionalhttps://dspace.ups.edu.ec/Institución privadahttps://www.ups.edu.ec/https://dspace.ups.edu.ec/oai.Ecuador...opendoar:17372024-04-08T17:54:53Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesianafalse
spellingShingle Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
Albán Morales, María Fernanda
COMPUTACIÓN
ANÁLISIS DE SISTEMAS
ALGORITMOS
SENTIMIENTOS
TEXTOS
status_str publishedVersion
title Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_full Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_fullStr Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_full_unstemmed Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_short Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_sort Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
topic COMPUTACIÓN
ANÁLISIS DE SISTEMAS
ALGORITMOS
SENTIMIENTOS
TEXTOS
url http://dspace.ups.edu.ec/handle/123456789/27234