Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano

En el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el e...

Full description

Saved in:

Bibliographic Details
Main Author:	Albán Morales, María Fernanda (author)
Other Authors:	Gualoto Fuentes, Bryan Xavier (author)
Format:	bachelorThesis
Language:	spa
Published:	2024
Subjects:	COMPUTACIÓN ANÁLISIS DE SISTEMAS ALGORITMOS SENTIMIENTOS TEXTOS
Online Access:	http://dspace.ups.edu.ec/handle/123456789/27234
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1860256034836185088
author	Albán Morales, María Fernanda
author2	Gualoto Fuentes, Bryan Xavier
author2_role	author
author_facet	Albán Morales, María Fernanda Gualoto Fuentes, Bryan Xavier
author_role	author
collection	Repositorio Universidad Politécnica Salesiana
dc.contributor.none.fl_str_mv	Vallejo Huanga, Diego Fernando
dc.creator.none.fl_str_mv	Albán Morales, María Fernanda Gualoto Fuentes, Bryan Xavier
dc.date.none.fl_str_mv	2024-03-08T21:40:51Z 2024-03-08T21:40:51Z 2024-02
dc.format.none.fl_str_mv	application/pdf
dc.identifier.none.fl_str_mv	http://dspace.ups.edu.ec/handle/123456789/27234
dc.language.none.fl_str_mv	spa
dc.rights.none.fl_str_mv	Atribución-NoComercial-SinDerivadas 3.0 Ecuador http://creativecommons.org/licenses/by-nc-nd/3.0/ec/ info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv	reponame:Repositorio Universidad Politécnica Salesiana instname:Universidad Politécnica Salesiana instacron:UPS
dc.subject.none.fl_str_mv	COMPUTACIÓN ANÁLISIS DE SISTEMAS ALGORITMOS SENTIMIENTOS TEXTOS
dc.title.none.fl_str_mv	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
dc.type.none.fl_str_mv	info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis
description	En el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el estado ha implementado acciones para promover el uso del idioma, incluyendo programas educativos bilingües y la creación de materiales culturales. Dada la naturaleza mayoritariamente oral de este idioma, existen pocos datos textuales disponibles, por lo que se presentan desafíos para el desarrollo de algoritmos de análisis computacional lingüístico. En esta investigación se generó un dataset en idioma Kichwa, etiquetado manualmente con criterios de valencia léxica, para evaluar la carga emocional de los tokens contenidos en el diccionario entre positivos, negativos o neutros. Este conjunto de datos permite realizar, a-posteriori, el análisis de sentimientos de un nuevo texto ingresado por el usuario, en un prototipo web desarrollado mediante Flask y Python. En la metodología de desarrollo, el pre-procesamiento de datos utiliza técnicas de Procesamiento del Lenguaje Natural (NLP) y se aplican métricas de similitud como el coeficiente de Jaccard y Coseno Vectorial para cuantificar la polaridad del texto ingresado en Kichwa. Para la validación de este sistema se llevó a cabo una fase de experimentación que permitió evaluar el rendimiento de nuestra herramienta frente a otras dos herramientas de análisis de sentimientos construidas con modelos de texto pre-entrenados. Los resultados muestran que, al analizar polaridades de textos en Kichwa, el modelo desarrollado alcanzó una exactitud máxima del 95\% y una mejora del 6% y 18% en comparación con los modelos de ChatGPT y Bard, respectivamente.
eu_rights_str_mv	openAccess
format	bachelorThesis
id	UPS_ea12e1317536f975e36884105fb39d7e
instacron_str	UPS
institution	UPS
instname_str	Universidad Politécnica Salesiana
language	spa
network_acronym_str	UPS
network_name_str	Repositorio Universidad Politécnica Salesiana
oai_identifier_str	oai:dspace.ups.edu.ec:123456789/27234
publishDate	2024
reponame_str	Repositorio Universidad Politécnica Salesiana
repository.mail.fl_str_mv	.
repository.name.fl_str_mv	Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesiana
repository_id_str	1737
rights_invalid_str_mv	Atribución-NoComercial-SinDerivadas 3.0 Ecuador http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
spelling	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatorianoAlbán Morales, María FernandaGualoto Fuentes, Bryan XavierCOMPUTACIÓNANÁLISIS DE SISTEMASALGORITMOSSENTIMIENTOSTEXTOSEn el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el estado ha implementado acciones para promover el uso del idioma, incluyendo programas educativos bilingües y la creación de materiales culturales. Dada la naturaleza mayoritariamente oral de este idioma, existen pocos datos textuales disponibles, por lo que se presentan desafíos para el desarrollo de algoritmos de análisis computacional lingüístico. En esta investigación se generó un dataset en idioma Kichwa, etiquetado manualmente con criterios de valencia léxica, para evaluar la carga emocional de los tokens contenidos en el diccionario entre positivos, negativos o neutros. Este conjunto de datos permite realizar, a-posteriori, el análisis de sentimientos de un nuevo texto ingresado por el usuario, en un prototipo web desarrollado mediante Flask y Python. En la metodología de desarrollo, el pre-procesamiento de datos utiliza técnicas de Procesamiento del Lenguaje Natural (NLP) y se aplican métricas de similitud como el coeficiente de Jaccard y Coseno Vectorial para cuantificar la polaridad del texto ingresado en Kichwa. Para la validación de este sistema se llevó a cabo una fase de experimentación que permitió evaluar el rendimiento de nuestra herramienta frente a otras dos herramientas de análisis de sentimientos construidas con modelos de texto pre-entrenados. Los resultados muestran que, al analizar polaridades de textos en Kichwa, el modelo desarrollado alcanzó una exactitud máxima del 95\% y una mejora del 6% y 18% en comparación con los modelos de ChatGPT y Bard, respectivamente.In the context of cultural and linguistic diversity in Ecuador, the Constitution officially recognizes Kichwa as a means to promote intercultural dialogue. However, this language has been the object of prejudice and stigmatization in the culture and identity of indigenous peoples. Therefore, the state has implemented actions to promote the use of the language, including bilingual educational programs and the creation of cultural materials. Given the primarily oral nature of this language, there is little textual data available, which presents challenges for the development of computational linguistic analysis algorithms. In this research, a dataset was generated in the Kichwa language, manually labeled with lexical valence criteria, to evaluate the emotional charge of the tokens contained in the dictionary between positive, negative, or neutral. This dataset allows performing a sentiment analysis of a new text entered by the user in a web prototype developed using Flask and Python. In the development methodology, data pre-processing uses Natural Language Processing (NLP) techniques and similarity metrics such as the Jaccard coefficient and Vector Cosine are applied to quantify the polarity of the text entered in Kichwa. To validate this system, an experimentation phase was carried out that allowed us to evaluate the performance of our tool against two other sentiment analysis tools built with pre-trained text models. The results show that, when analyzing polarities of Kichwa texts, the developed model achieved a maximum accuracy of 95% and an improvement of 6% and 18% compared to the ChatGPT and Bard models, respectively.Vallejo Huanga, Diego Fernando2024-03-08T21:40:51Z2024-03-08T21:40:51Z2024-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://dspace.ups.edu.ec/handle/123456789/27234spaAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Politécnica Salesianainstname:Universidad Politécnica Salesianainstacron:UPS2024-04-08T17:54:53Zoai:dspace.ups.edu.ec:123456789/27234Institucionalhttps://dspace.ups.edu.ec/Institución privadahttps://www.ups.edu.ec/https://dspace.ups.edu.ec/oai.Ecuador...opendoar:17372024-04-08T17:54:53Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesianafalse
spellingShingle	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano Albán Morales, María Fernanda COMPUTACIÓN ANÁLISIS DE SISTEMAS ALGORITMOS SENTIMIENTOS TEXTOS
status_str	publishedVersion
title	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_full	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_fullStr	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_full_unstemmed	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_short	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
title_sort	Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
topic	COMPUTACIÓN ANÁLISIS DE SISTEMAS ALGORITMOS SENTIMIENTOS TEXTOS
url	http://dspace.ups.edu.ec/handle/123456789/27234

Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano

Similar Items