Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.

PDF

Sábháilte in:
Sonraí bibleagrafaíochta
Príomhchruthaitheoir: Arroba Salinas, Sandra Yanel (author)
Rannpháirtithe: Pozo Gonzabay, Luis Fernando (author)
Formáid: bachelorThesis
Teanga:spa
Foilsithe / Cruthaithe: 2021
Ábhair:
Rochtain ar líne:http://repositorio.ug.edu.ec/handle/redug/57212
Clibeanna: Cuir clib leis
Níl clibeanna ann, Bí ar an gcéad duine le clib a chur leis an taifead seo!
_version_ 1863426448292839424
author Arroba Salinas, Sandra Yanel
author2 Pozo Gonzabay, Luis Fernando
author2_role author
author_facet Arroba Salinas, Sandra Yanel
Pozo Gonzabay, Luis Fernando
author_role author
collection Repositorio Universidad de Guayaquil
dc.contributor.none.fl_str_mv Ortiz Zambrano, Jenny Alexandra
dc.creator.none.fl_str_mv Arroba Salinas, Sandra Yanel
Pozo Gonzabay, Luis Fernando
dc.date.none.fl_str_mv 2021-12-09T21:19:59Z
2021-12-09T21:19:59Z
2021
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://repositorio.ug.edu.ec/handle/redug/57212
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad de Guayaquil
instname:Universidad de Guayaquil
instacron:UG
dc.subject.none.fl_str_mv Características línguísticas
Complejidad léxica
Machine learning
Redes neuronales
Predicción
Linguistic characteristics
Lexical complexity
Supervised Learning
Neural networks
Prediction
dc.title.none.fl_str_mv Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description PDF
eu_rights_str_mv openAccess
format bachelorThesis
id UG_0fbdeb5c44ddf632e93e95f82a3ac1a7
instacron_str UG
institution UG
instname_str Universidad de Guayaquil
language spa
network_acronym_str UG
network_name_str Repositorio Universidad de Guayaquil
oai_identifier_str oai:repositorio.ug.edu.ec:redug/57212
publishDate 2021
publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
reponame_str Repositorio Universidad de Guayaquil
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad de Guayaquil - Universidad de Guayaquil
repository_id_str 0
spelling Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.Arroba Salinas, Sandra YanelPozo Gonzabay, Luis FernandoCaracterísticas línguísticasComplejidad léxicaMachine learningRedes neuronalesPredicciónLinguistic characteristicsLexical complexitySupervised LearningNeural networksPredictionPDFLa identificación de palabras complejas (CWI) es la tarea de detectar en el contenido de los documentos las palabras que son difíciles o complejas de entender por las personas de un determinado grupo. El objetivo de esta investigación es el desarrollo de un sistema de predicción de la complejidad léxica tanto del idioma inglés como del idioma español. El sistema se basa en la implementación de características lingüísticas a nivel de la palabra y oraciones, y en la implementación de las técnicas de redes neuronales BERT y XLM-RoBERTa para la generación de nuevas características que permitan resultados mucho más precisos. Se aplicó el algoritmo Random Forest Regressor. Para el entrenamiento de algoritmo se utilizó un conjunto de datos conformado por un corpus de textos en español y otro corpus de textos en inglés. La evaluación del algoritmo se lo realizó mediante la partición 90% - 10%. La metodología de desarrollo que se aplicó fue Kanban, y la metodología de investigación se basó en el Estudio de Caso por lo cual sus unidades de análisis se fundamentaron en las características lingüísticas generadas. Tras varias ejecuciones del algoritmo fue necesario implementar una validación cruzada de 5 variaciones para lograr resultados más precisos. El sistema será de mucho beneficio para la generación de soluciones dirigidas a los estudiantes con bajo nivel de comprensión lectora.Complex Word Identification (CWI) is the task of detecting in the content of documents words that are difficult or complex to understand by the people of a certain group. The objective of this research is the development of a system for predicting the lexical complexity of both the English and Spanish languages. The system is based on the implementation of linguistic characteristics at the level of the word and sentences, and in the implementation of BERT and XLM-RoBERTa neural network techniques for the generation of new features that allow much more accurate results. The Random Forest Regressor algorithm was applied. For the algorithm training, a dataset consisting of a corpus of texts in Spanish and another corpus of texts in English was used. The evaluation of the algorithm was performed by partitioning 90% - 10%. The development methodology that was applied was Kanban, and the research methodology was based on the Case Study, for which its units of analysis were based on the linguistic characteristics generated. After several runs of the algorithm, it was necessary to implement a cross validation of 5 variations to achieve more accurate results. The system will be of great benefit for the generation of solutions aimed at students with a low level of reading comprehension.Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Ortiz Zambrano, Jenny Alexandra2021-12-09T21:19:59Z2021-12-09T21:19:59Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/57212spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2021-12-10T08:27:44Zoai:repositorio.ug.edu.ec:redug/57212Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02026-04-25T06:45:30.406494Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue
spellingShingle Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
Arroba Salinas, Sandra Yanel
Características línguísticas
Complejidad léxica
Machine learning
Redes neuronales
Predicción
Linguistic characteristics
Lexical complexity
Supervised Learning
Neural networks
Prediction
status_str publishedVersion
title Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
title_full Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
title_fullStr Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
title_full_unstemmed Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
title_short Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
title_sort Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
topic Características línguísticas
Complejidad léxica
Machine learning
Redes neuronales
Predicción
Linguistic characteristics
Lexical complexity
Supervised Learning
Neural networks
Prediction
url http://repositorio.ug.edu.ec/handle/redug/57212