Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística

Logistic regression, while widely employed in text classification for fake news detection, shows suboptimal optimization practices in this specific domain. The limited systematic exploration of optimization algorithms—Gradient Descent (GD), Stochastic Gradient Descent (SGD), Mini-Batch Gradient Desc...

Full description

Saved in:

Bibliographic Details
Main Author:	Tene Castillo, Santiago Emanuel (author)
Format:	bachelorThesis
Language:	spa
Published:	2025
Subjects:	MACHINE LEARNING CLASIFICACION DE TEXTO AJUSTAR HIPERPARAMETROS
Online Access:	https://dspace.unl.edu.ec/jspui/handle/123456789/32452
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1857833064710799360
author	Tene Castillo, Santiago Emanuel
author_facet	Tene Castillo, Santiago Emanuel
author_role	author
collection	Repositorio Universidad Nacional de Loja
dc.contributor.none.fl_str_mv	Chamba Eras, Luis Antonio
dc.creator.none.fl_str_mv	Tene Castillo, Santiago Emanuel
dc.date.none.fl_str_mv	2025-04-23T22:43:01Z 2025-04-23T22:43:01Z 2025-04-23
dc.format.none.fl_str_mv	126 p. application/pdf
dc.identifier.none.fl_str_mv	https://dspace.unl.edu.ec/jspui/handle/123456789/32452
dc.language.none.fl_str_mv	spa
dc.publisher.none.fl_str_mv	Loja
dc.rights.none.fl_str_mv	http://creativecommons.org/licenses/by-nc-sa/3.0/ec/ info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv	reponame:Repositorio Universidad Nacional de Loja instname:Universidad Nacional de Loja instacron:UNL
dc.subject.none.fl_str_mv	MACHINE LEARNING CLASIFICACION DE TEXTO AJUSTAR HIPERPARAMETROS
dc.title.none.fl_str_mv	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística
dc.type.none.fl_str_mv	info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis
description	Logistic regression, while widely employed in text classification for fake news detection, shows suboptimal optimization practices in this specific domain. The limited systematic exploration of optimization algorithms—Gradient Descent (GD), Stochastic Gradient Descent (SGD), Mini-Batch Gradient Descent (MBGD), AdaGrad, Adam, and RMSProp—hinders the accurate assessment of their impact on classification metrics. This Curricular Integration Project (CIP) addressed this gap by applying these six algorithms to a logistic regression model for detecting Spanish-language political fake news, following the CRISP-ML methodology. The workflow included: 1) Data engineering to create a custom dataset, 2) Model optimization through hyperparameter tuning of the algorithms, and 3) Evaluation using confusion matrices and performance metrics (Sensitivity, Specificity, Precision, Accuracy, and F1-Score). Results revealed that the SGD-LR variant (Stochastic Gradient Descent) outperformed both the baseline non-optimized logistic regression model (73.7% vs. 80.3% precision) and other evaluated optimizers. This 6.6% improvement highlights how strategic algorithm selection directly enhances classification performance. The study not only validates SGD’s efficacy for this task but also sets a methodological precedent by integrating CRISP-ML into optimization workflows. These findings underscore the necessity of systematic experimentation with optimizers as a critical phase in developing misinformation detection systems, particularly for Spanish-language content where technical studies remain scarce.
eu_rights_str_mv	openAccess
format	bachelorThesis
id	UNL_e4e295502e57a585d95546dc6dbfa833
instacron_str	UNL
institution	UNL
instname_str	Universidad Nacional de Loja
language	spa
network_acronym_str	UNL
network_name_str	Repositorio Universidad Nacional de Loja
oai_identifier_str	oai:dspace.unl.edu.ec:123456789/32452
publishDate	2025
publisher.none.fl_str_mv	Loja
reponame_str	Repositorio Universidad Nacional de Loja
repository.mail.fl_str_mv	*
repository.name.fl_str_mv	Repositorio Universidad Nacional de Loja - Universidad Nacional de Loja
repository_id_str	0
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/3.0/ec/
spelling	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión LogísticaTene Castillo, Santiago EmanuelMACHINE LEARNINGCLASIFICACION DE TEXTOAJUSTAR HIPERPARAMETROSLogistic regression, while widely employed in text classification for fake news detection, shows suboptimal optimization practices in this specific domain. The limited systematic exploration of optimization algorithms—Gradient Descent (GD), Stochastic Gradient Descent (SGD), Mini-Batch Gradient Descent (MBGD), AdaGrad, Adam, and RMSProp—hinders the accurate assessment of their impact on classification metrics. This Curricular Integration Project (CIP) addressed this gap by applying these six algorithms to a logistic regression model for detecting Spanish-language political fake news, following the CRISP-ML methodology. The workflow included: 1) Data engineering to create a custom dataset, 2) Model optimization through hyperparameter tuning of the algorithms, and 3) Evaluation using confusion matrices and performance metrics (Sensitivity, Specificity, Precision, Accuracy, and F1-Score). Results revealed that the SGD-LR variant (Stochastic Gradient Descent) outperformed both the baseline non-optimized logistic regression model (73.7% vs. 80.3% precision) and other evaluated optimizers. This 6.6% improvement highlights how strategic algorithm selection directly enhances classification performance. The study not only validates SGD’s efficacy for this task but also sets a methodological precedent by integrating CRISP-ML into optimization workflows. These findings underscore the necessity of systematic experimentation with optimizers as a critical phase in developing misinformation detection systems, particularly for Spanish-language content where technical studies remain scarce.La regresión logística, ampliamente utilizada en clasificación de textos para detectar noticias falsas, presenta limitaciones en su optimización dentro de este campo específico. La escasa exploración sistemática de algoritmos de optimización Gradiente Descendente (GD), Gradiente Descendente Estocástico (SGD), Gradiente Descendente por Mini-Lotes (MBGD), AdaGrad, Adam y RMSProp dificulta determinar su impacto real en la mejora de métricas de clasificación. Este trabajo de integración curricular abordó dicho problema aplicando estos seis algoritmos a un modelo de regresión logística para la detección de noticias políticas falsas en español, bajo la metodología CRISP-ML. El proceso incluyó: 1) Ingeniería de datos para generar un conjunto personalizado, 2) Optimización mediante ajuste de hiperparámetros de los algoritmos, y 3) Evaluación con matriz de confusión y métricas (Sensibilidad, Especificidad, Precisión, Exactitud y F1-Score). Los resultados demostraron que la variante SGD-LR (Gradiente Descendente Estocástico) superó significativamente al modelo base no optimizado (73.7% vs. 80.3% en precisión), así como a las demás técnicas evaluadas. Este incremento del 6.6% evidencia que la selección estratégica de algoritmos de optimización impacta directamente en el rendimiento de modelos de clasificación. El estudio no solo valida la eficacia del SGD para esta tarea específica, sino que establece un precedente metodológico al integrar CRISP-ML en el proceso de optimización de modelos. Estos hallazgos resaltan la necesidad de incluir fases sistemáticas de experimentación con optimizadores como paso crítico en el desarrollo de sistemas de detección de desinformación, particularmente para contenidos en español donde los estudios técnicos siguen siendo escasos.LojaChamba Eras, Luis Antonio2025-04-23T22:43:01Z2025-04-23T22:43:01Z2025-04-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis126 p.application/pdfhttps://dspace.unl.edu.ec/jspui/handle/123456789/32452spahttp://creativecommons.org/licenses/by-nc-sa/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Nacional de Lojainstname:Universidad Nacional de Lojainstacron:UNL2025-05-02T15:48:29Zoai:dspace.unl.edu.ec:123456789/32452Institucionalhttps://dspace.unl.edu.ec/Universidad públicahttps://unl.edu.ec/https://dspace.unl.edu.ec/oaiEcuador**opendoar:02025-05-02T15:48:29falseInstitucionalhttps://dspace.unl.edu.ec/Universidad públicahttps://unl.edu.ec/https://dspace.unl.edu.ec/oaiEcuador***opendoar:02025-05-02T15:48:29Repositorio Universidad Nacional de Loja - Universidad Nacional de Lojafalse
spellingShingle	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística Tene Castillo, Santiago Emanuel MACHINE LEARNING CLASIFICACION DE TEXTO AJUSTAR HIPERPARAMETROS
status_str	publishedVersion
title	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística
title_full	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística
title_fullStr	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística
title_full_unstemmed	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística
title_short	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística
title_sort	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística
topic	MACHINE LEARNING CLASIFICACION DE TEXTO AJUSTAR HIPERPARAMETROS
url	https://dspace.unl.edu.ec/jspui/handle/123456789/32452

Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística

Similar Items