"Detección de creencias implícitas de violencia de género contra la mujer en redes sociales utilizando algoritmos de PLN y técnicas de clasificación en aprendizaje automático"

En el ámbito de las Redes Sociales, la presencia de violencia de género se ha hecho notar mediante la difusión de discursos de odio. Plataformas como X se han convertido en entornos peligrosos para las mujeres a nivel psicológico y emocional. La identificación y mitigación de discursos de odio ha en...

Fuld beskrivelse

Saved in:
Bibliografiske detaljer
Hovedforfatter: Calapaqui Portilla, Genesis Isabel (author)
Andre forfattere: Guarderas Leal, Andrés David (author)
Format: bachelorThesis
Udgivet: 2025
Fag:
Online adgang:https://repositorio.espe.edu.ec/handle/21000/42541
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
Beskrivelse
Summary:En el ámbito de las Redes Sociales, la presencia de violencia de género se ha hecho notar mediante la difusión de discursos de odio. Plataformas como X se han convertido en entornos peligrosos para las mujeres a nivel psicológico y emocional. La identificación y mitigación de discursos de odio ha enfrentado múltiples desafíos, a causa de factores como el elevado volumen de datos, el uso de sarcasmos y variaciones semánticas. Por este motivo, se planteó una solución para detectar y prevenir este tipo de agresiones a través de técnicas de Procesamiento de Lenguaje Natural (PLN) y Aprendizaje Automático. Para su desarrollo, se aplicó la metodología ágil SCRUM articulada con DSR (Desing Science Research). Como primer paso, se realizó una Revisión Sistemática de Literatura, para conocer las soluciones planteadas por otros investigadores frente a la misma problemática. Posterior a ello, se llevó a cabo la recolección de datos en plataformas digitales como Kaggle, tras lo cual se hizo un ETL de los datos recogidos. Así, se obtuvo un dataset de aproximadamente 400 000 datos. Se seleccionaron las técnicas a utilizar: BERT para el PLN y Árboles Aleatorios (Random Forest) para Aprendizaje Automático. Se realizó el entrenamiento de cada modelo por separado, obteniendo un porcentaje de precisión de 94% y 93% respectivamente. Sin embargo, para mejorar estos resultados, los modelos se combinaron mediante una ponderación por pesos, alcanzando una precisión del 96%. Para probar la integración del modelo, se desarrolló un prototipo de muro de publicaciones en la web, que permitía a un usuario hacer publicaciones basadas en texto. El contenido de dichas publicaciones era evaluado por el modelo combinado a través de una API Rest. Según su resultado, la publicación del texto era permitida o no. Finalmente, se realizaron pruebas de calidad y rendimiento en base a la norma ISO/IEC 25010. Estas pruebas demostraron que el prototipo desarrollado cumple con los estándares de calidad. Sin embargo, el rendimiento del modelo puede mejorarse para permitir una mayor concurrencia de solicitudes.