Predicción de preguntas cerradas en Stack Overflow en español.
Gespeichert in:
| 1. Verfasser: | |
|---|---|
| Weitere Verfasser: | |
| Format: | bachelorThesis |
| Sprache: | spa |
| Veröffentlicht: |
2021
|
| Schlagworte: | |
| Online Zugang: | http://repositorio.ug.edu.ec/handle/redug/56983 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| _version_ | 1858988089427361792 |
|---|---|
| author | García Chamba, Kevin Rafael |
| author2 | Vallejos Castro, Melanie Krystel |
| author2_role | author |
| author_facet | García Chamba, Kevin Rafael Vallejos Castro, Melanie Krystel |
| author_role | author |
| collection | Repositorio Universidad de Guayaquil |
| dc.contributor.none.fl_str_mv | Botto Tobar, Miguel |
| dc.creator.none.fl_str_mv | García Chamba, Kevin Rafael Vallejos Castro, Melanie Krystel |
| dc.date.none.fl_str_mv | 2021-12-03T20:27:16Z 2021-12-03T20:27:16Z 2021 |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | http://repositorio.ug.edu.ec/handle/redug/56983 |
| dc.language.none.fl_str_mv | spa |
| dc.publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
| dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
| dc.source.none.fl_str_mv | reponame:Repositorio Universidad de Guayaquil instname:Universidad de Guayaquil instacron:UG |
| dc.subject.none.fl_str_mv | Stack OverFlow Aprendizaje Automático Dataset Algoritmos Procesamiento de lenguaje natural Machine Learning Algorithms Natural Language Processing. |
| dc.title.none.fl_str_mv | Predicción de preguntas cerradas en Stack Overflow en español. |
| dc.type.none.fl_str_mv | info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis |
| description | PDF |
| eu_rights_str_mv | openAccess |
| format | bachelorThesis |
| id | UG_81efe3d71e0942fcccee1234f58e7c96 |
| instacron_str | UG |
| institution | UG |
| instname_str | Universidad de Guayaquil |
| language | spa |
| network_acronym_str | UG |
| network_name_str | Repositorio Universidad de Guayaquil |
| oai_identifier_str | oai:repositorio.ug.edu.ec:redug/56983 |
| publishDate | 2021 |
| publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
| reponame_str | Repositorio Universidad de Guayaquil |
| repository.mail.fl_str_mv | . |
| repository.name.fl_str_mv | Repositorio Universidad de Guayaquil - Universidad de Guayaquil |
| repository_id_str | 0 |
| spelling | Predicción de preguntas cerradas en Stack Overflow en español.García Chamba, Kevin RafaelVallejos Castro, Melanie KrystelStack OverFlowAprendizaje AutomáticoDatasetAlgoritmosProcesamiento de lenguaje naturalMachine LearningAlgorithmsNatural Language Processing.PDFStack Overflow en español es una comunidad en línea utilizada ampliamente para formular y responder preguntas sobre el desarrollo de software. No obstante, un problema en el que se encuentra inmersa la plataforma, es que, alrededor de 6000 preguntas publicadas al día, por lo menos un 6% de las mismas son cerradas por moderadores y usuarios expertos, debido a diferentes motivos de cierre seleccionados para el estudio como: duplicidad, falta de detalle o clarificación y preguntas basadas en opiniones. Por la gran cantidad datos, es difícil y se requiere mucho tiempo analizar todas las preguntas con el fin de determinar que publicaciones deben cerrarse. Por lo cual, se realizó un mapeo sistemático basado en la problemática expuesta, para conocer los métodos y técnicas de aprendizaje automático adecuados para la predicción de preguntas que serán cerradas, entre los cuales se destacan: Bosque Aleatorio, Regresión Logística y Redes Neuronales Convolucionales. De igual manera, se recolectaron los datos necesarios desde un repositorio digital para la creación de un dataset, posteriormente se realizó un preprocesado de datos agregando características nuevas que se obtuvieron mediante la revisión de publicaciones, esto con la finalidad de entrenar los modelos. Para determinar cuál algoritmo tiene mejor rendimiento, se realizaron pruebas y se compararon los resultados de predicción. En el proceso de validación de los algoritmos, se aplicó una encuesta comprobando la hipótesis planteada, dando como resultado, que el algoritmo Bosque Aleatorio alcanza una exactitud y exhaustividad satisfactoria, concluyendo que el modelo seleccionado cumple el objetivo general del presente estudio.Stack Overflow is an online community widely used to ask and answer questions about software development. However, a problem with the platform is that, with around 6000 questions posted per day, at least 6% of them are closed by moderators and expert users, due to different reasons for closure selected for the study such as: duplicity, lack of detail or clarification and opinion-based questions. Due to the large amount of data, it is difficult and time consuming to analyze all questions in order to determine which posts should be closed. Therefore, a systematic mapping was carried out based on the exposed problematic, in order to know the appropriate machine learning methods and techniques for the prediction of questions to be closed, among which the following stand out: Random Forest, Logistic Regression and Convolutional Neural Networks. Similarly, the necessary data were collected from a digital repository for the creation of a dataset, then a data preprocessing was performed by adding new features obtained through the review of publications, in order to train the models. In order to determine which algorithm has better performance, tests were performed and prediction results were compared. In the process of validation of the algorithms, a survey was applied verifying the hypothesis proposed, resulting in the Random Forest algorithm reaching a satisfactory accuracy and completeness, concluding that the selected model meets the general objective of this study.Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Botto Tobar, Miguel2021-12-03T20:27:16Z2021-12-03T20:27:16Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/56983spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2021-12-04T08:26:34Zoai:repositorio.ug.edu.ec:redug/56983Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02026-03-07T07:04:06.150163Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue |
| spellingShingle | Predicción de preguntas cerradas en Stack Overflow en español. García Chamba, Kevin Rafael Stack OverFlow Aprendizaje Automático Dataset Algoritmos Procesamiento de lenguaje natural Machine Learning Algorithms Natural Language Processing. |
| status_str | publishedVersion |
| title | Predicción de preguntas cerradas en Stack Overflow en español. |
| title_full | Predicción de preguntas cerradas en Stack Overflow en español. |
| title_fullStr | Predicción de preguntas cerradas en Stack Overflow en español. |
| title_full_unstemmed | Predicción de preguntas cerradas en Stack Overflow en español. |
| title_short | Predicción de preguntas cerradas en Stack Overflow en español. |
| title_sort | Predicción de preguntas cerradas en Stack Overflow en español. |
| topic | Stack OverFlow Aprendizaje Automático Dataset Algoritmos Procesamiento de lenguaje natural Machine Learning Algorithms Natural Language Processing. |
| url | http://repositorio.ug.edu.ec/handle/redug/56983 |