Desarrollo de un algoritmo para el análisis de sentimientos de textos en Kichwa en el ámbito ecuatoriano
En el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el e...
Saved in:
| Main Author: | |
|---|---|
| Other Authors: | |
| Format: | bachelorThesis |
| Language: | spa |
| Published: |
2024
|
| Subjects: | |
| Online Access: | http://dspace.ups.edu.ec/handle/123456789/27234 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Summary: | En el marco de la diversidad cultural y lingüística en Ecuador, la Constitución reconoce oficialmente al Kichwa como un medio para fomentar el diálogo intercultural. Sin embargo, este idioma ha sido objeto de prejuicios y estigmatización en la cultura e identidad de los pueblos indígenas, ergo, el estado ha implementado acciones para promover el uso del idioma, incluyendo programas educativos bilingües y la creación de materiales culturales. Dada la naturaleza mayoritariamente oral de este idioma, existen pocos datos textuales disponibles, por lo que se presentan desafíos para el desarrollo de algoritmos de análisis computacional lingüístico. En esta investigación se generó un dataset en idioma Kichwa, etiquetado manualmente con criterios de valencia léxica, para evaluar la carga emocional de los tokens contenidos en el diccionario entre positivos, negativos o neutros. Este conjunto de datos permite realizar, a-posteriori, el análisis de sentimientos de un nuevo texto ingresado por el usuario, en un prototipo web desarrollado mediante Flask y Python. En la metodología de desarrollo, el pre-procesamiento de datos utiliza técnicas de Procesamiento del Lenguaje Natural (NLP) y se aplican métricas de similitud como el coeficiente de Jaccard y Coseno Vectorial para cuantificar la polaridad del texto ingresado en Kichwa. Para la validación de este sistema se llevó a cabo una fase de experimentación que permitió evaluar el rendimiento de nuestra herramienta frente a otras dos herramientas de análisis de sentimientos construidas con modelos de texto pre-entrenados. Los resultados muestran que, al analizar polaridades de textos en Kichwa, el modelo desarrollado alcanzó una exactitud máxima del 95\% y una mejora del 6% y 18% en comparación con los modelos de ChatGPT y Bard, respectivamente. |
|---|