Predicción de preguntas cerradas en Stack Overflow en español.

PDF

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: García Chamba, Kevin Rafael (author)
Weitere Verfasser: Vallejos Castro, Melanie Krystel (author)
Format: bachelorThesis
Sprache:spa
Veröffentlicht: 2021
Schlagworte:
Online Zugang:http://repositorio.ug.edu.ec/handle/redug/56983
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
_version_ 1858988089427361792
author García Chamba, Kevin Rafael
author2 Vallejos Castro, Melanie Krystel
author2_role author
author_facet García Chamba, Kevin Rafael
Vallejos Castro, Melanie Krystel
author_role author
collection Repositorio Universidad de Guayaquil
dc.contributor.none.fl_str_mv Botto Tobar, Miguel
dc.creator.none.fl_str_mv García Chamba, Kevin Rafael
Vallejos Castro, Melanie Krystel
dc.date.none.fl_str_mv 2021-12-03T20:27:16Z
2021-12-03T20:27:16Z
2021
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://repositorio.ug.edu.ec/handle/redug/56983
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad de Guayaquil
instname:Universidad de Guayaquil
instacron:UG
dc.subject.none.fl_str_mv Stack OverFlow
Aprendizaje Automático
Dataset
Algoritmos
Procesamiento de lenguaje natural
Machine Learning
Algorithms
Natural Language Processing.
dc.title.none.fl_str_mv Predicción de preguntas cerradas en Stack Overflow en español.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description PDF
eu_rights_str_mv openAccess
format bachelorThesis
id UG_81efe3d71e0942fcccee1234f58e7c96
instacron_str UG
institution UG
instname_str Universidad de Guayaquil
language spa
network_acronym_str UG
network_name_str Repositorio Universidad de Guayaquil
oai_identifier_str oai:repositorio.ug.edu.ec:redug/56983
publishDate 2021
publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
reponame_str Repositorio Universidad de Guayaquil
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad de Guayaquil - Universidad de Guayaquil
repository_id_str 0
spelling Predicción de preguntas cerradas en Stack Overflow en español.García Chamba, Kevin RafaelVallejos Castro, Melanie KrystelStack OverFlowAprendizaje AutomáticoDatasetAlgoritmosProcesamiento de lenguaje naturalMachine LearningAlgorithmsNatural Language Processing.PDFStack Overflow en español es una comunidad en línea utilizada ampliamente para formular y responder preguntas sobre el desarrollo de software. No obstante, un problema en el que se encuentra inmersa la plataforma, es que, alrededor de 6000 preguntas publicadas al día, por lo menos un 6% de las mismas son cerradas por moderadores y usuarios expertos, debido a diferentes motivos de cierre seleccionados para el estudio como: duplicidad, falta de detalle o clarificación y preguntas basadas en opiniones. Por la gran cantidad datos, es difícil y se requiere mucho tiempo analizar todas las preguntas con el fin de determinar que publicaciones deben cerrarse. Por lo cual, se realizó un mapeo sistemático basado en la problemática expuesta, para conocer los métodos y técnicas de aprendizaje automático adecuados para la predicción de preguntas que serán cerradas, entre los cuales se destacan: Bosque Aleatorio, Regresión Logística y Redes Neuronales Convolucionales. De igual manera, se recolectaron los datos necesarios desde un repositorio digital para la creación de un dataset, posteriormente se realizó un preprocesado de datos agregando características nuevas que se obtuvieron mediante la revisión de publicaciones, esto con la finalidad de entrenar los modelos. Para determinar cuál algoritmo tiene mejor rendimiento, se realizaron pruebas y se compararon los resultados de predicción. En el proceso de validación de los algoritmos, se aplicó una encuesta comprobando la hipótesis planteada, dando como resultado, que el algoritmo Bosque Aleatorio alcanza una exactitud y exhaustividad satisfactoria, concluyendo que el modelo seleccionado cumple el objetivo general del presente estudio.Stack Overflow is an online community widely used to ask and answer questions about software development. However, a problem with the platform is that, with around 6000 questions posted per day, at least 6% of them are closed by moderators and expert users, due to different reasons for closure selected for the study such as: duplicity, lack of detail or clarification and opinion-based questions. Due to the large amount of data, it is difficult and time consuming to analyze all questions in order to determine which posts should be closed. Therefore, a systematic mapping was carried out based on the exposed problematic, in order to know the appropriate machine learning methods and techniques for the prediction of questions to be closed, among which the following stand out: Random Forest, Logistic Regression and Convolutional Neural Networks. Similarly, the necessary data were collected from a digital repository for the creation of a dataset, then a data preprocessing was performed by adding new features obtained through the review of publications, in order to train the models. In order to determine which algorithm has better performance, tests were performed and prediction results were compared. In the process of validation of the algorithms, a survey was applied verifying the hypothesis proposed, resulting in the Random Forest algorithm reaching a satisfactory accuracy and completeness, concluding that the selected model meets the general objective of this study.Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Botto Tobar, Miguel2021-12-03T20:27:16Z2021-12-03T20:27:16Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/56983spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2021-12-04T08:26:34Zoai:repositorio.ug.edu.ec:redug/56983Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02026-03-07T07:04:06.150163Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue
spellingShingle Predicción de preguntas cerradas en Stack Overflow en español.
García Chamba, Kevin Rafael
Stack OverFlow
Aprendizaje Automático
Dataset
Algoritmos
Procesamiento de lenguaje natural
Machine Learning
Algorithms
Natural Language Processing.
status_str publishedVersion
title Predicción de preguntas cerradas en Stack Overflow en español.
title_full Predicción de preguntas cerradas en Stack Overflow en español.
title_fullStr Predicción de preguntas cerradas en Stack Overflow en español.
title_full_unstemmed Predicción de preguntas cerradas en Stack Overflow en español.
title_short Predicción de preguntas cerradas en Stack Overflow en español.
title_sort Predicción de preguntas cerradas en Stack Overflow en español.
topic Stack OverFlow
Aprendizaje Automático
Dataset
Algoritmos
Procesamiento de lenguaje natural
Machine Learning
Algorithms
Natural Language Processing.
url http://repositorio.ug.edu.ec/handle/redug/56983