Diseño e Implementación de un Modelo de Inteligencia Artificial Basado en Procesamiento de Lenguaje Natural y Aprendizaje Automático que Identifique Patrones del Discurso de Odio

El crecimiento de discurso de odio en espacios digitales, y más concretamente en sistemas de mensajería instantánea, es un tema en auge con repercusiones sociales, técnicas y tecnológicas tales como la propagación de mensajes dañinos, violentos o con contenido discriminatorio que usualmente se denom...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Manzaba Carvajal, Jeyner Oswaldo (author)
Další autoři: Pacheco Ramírez, Nataly Marisol (author)
Médium: bachelorThesis
Vydáno: 2025
Témata:
On-line přístup:https://repositorio.espe.edu.ec/handle/21000/53412
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Popis
Shrnutí:El crecimiento de discurso de odio en espacios digitales, y más concretamente en sistemas de mensajería instantánea, es un tema en auge con repercusiones sociales, técnicas y tecnológicas tales como la propagación de mensajes dañinos, violentos o con contenido discriminatorio que usualmente se denominan discurso de odio. Este tipo de expresiones que ofenden a individuos por razones de raza, género, religión, nacionalidad, orientación sexual, entre otros, constituyen un problema de gran relevancia, y requieren de medidas específicas para prevenir y resolver esta problemática. Este trabajo presenta el diseño y la implementación de un modelo de Inteligencia Artificial basado en el Procesamiento de Lenguaje Natural (PLN) y en el Aprendizaje Automático (ML) para la identificación de patrones de discurso de odio en español. El sistema se integró en WhatsApp Web como espacio de prueba para no vulnerar la privacidad de los usuarios, aprovechando la inspección del Document Object Model (DOM) para extraer contenido de forma no invasiva. La implementación del sistema fue realizada siguiendo la metodología de CRISP-DM (Cross Industry Standard Process for Data Mining), integrando el modelo en un prototipo funcional que combina módulos de monitoreo de WhatsApp Web, un sistema de alertas a través de varios canales y un chatbot con el nombre de “PitBot”, que permite identificar mensajes ofensivos en tiempo real y brindar ayuda al usuario. Para el entrenamiento y la evaluación de diferentes modelos de clasificación se utilizó el corpus Spanish Hate Speech Superset, que engloba 29.855 registros. Se realizaron comparativas de algoritmos clásicos con modelos de arquitecturas Transformer, añadiendo procesos de preprocesamiento lingüístico, vectorización TF-IDF y técnica de balanceo de datos.