Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
Sábháilte in:
| Príomhchruthaitheoir: | |
|---|---|
| Rannpháirtithe: | |
| Formáid: | bachelorThesis |
| Teanga: | spa |
| Foilsithe / Cruthaithe: |
2021
|
| Ábhair: | |
| Rochtain ar líne: | http://repositorio.ug.edu.ec/handle/redug/57212 |
| Clibeanna: |
Cuir clib leis
Níl clibeanna ann, Bí ar an gcéad duine le clib a chur leis an taifead seo!
|
| _version_ | 1863426448292839424 |
|---|---|
| author | Arroba Salinas, Sandra Yanel |
| author2 | Pozo Gonzabay, Luis Fernando |
| author2_role | author |
| author_facet | Arroba Salinas, Sandra Yanel Pozo Gonzabay, Luis Fernando |
| author_role | author |
| collection | Repositorio Universidad de Guayaquil |
| dc.contributor.none.fl_str_mv | Ortiz Zambrano, Jenny Alexandra |
| dc.creator.none.fl_str_mv | Arroba Salinas, Sandra Yanel Pozo Gonzabay, Luis Fernando |
| dc.date.none.fl_str_mv | 2021-12-09T21:19:59Z 2021-12-09T21:19:59Z 2021 |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | http://repositorio.ug.edu.ec/handle/redug/57212 |
| dc.language.none.fl_str_mv | spa |
| dc.publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
| dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
| dc.source.none.fl_str_mv | reponame:Repositorio Universidad de Guayaquil instname:Universidad de Guayaquil instacron:UG |
| dc.subject.none.fl_str_mv | Características línguísticas Complejidad léxica Machine learning Redes neuronales Predicción Linguistic characteristics Lexical complexity Supervised Learning Neural networks Prediction |
| dc.title.none.fl_str_mv | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. |
| dc.type.none.fl_str_mv | info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis |
| description | PDF |
| eu_rights_str_mv | openAccess |
| format | bachelorThesis |
| id | UG_0fbdeb5c44ddf632e93e95f82a3ac1a7 |
| instacron_str | UG |
| institution | UG |
| instname_str | Universidad de Guayaquil |
| language | spa |
| network_acronym_str | UG |
| network_name_str | Repositorio Universidad de Guayaquil |
| oai_identifier_str | oai:repositorio.ug.edu.ec:redug/57212 |
| publishDate | 2021 |
| publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
| reponame_str | Repositorio Universidad de Guayaquil |
| repository.mail.fl_str_mv | . |
| repository.name.fl_str_mv | Repositorio Universidad de Guayaquil - Universidad de Guayaquil |
| repository_id_str | 0 |
| spelling | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.Arroba Salinas, Sandra YanelPozo Gonzabay, Luis FernandoCaracterísticas línguísticasComplejidad léxicaMachine learningRedes neuronalesPredicciónLinguistic characteristicsLexical complexitySupervised LearningNeural networksPredictionPDFLa identificación de palabras complejas (CWI) es la tarea de detectar en el contenido de los documentos las palabras que son difíciles o complejas de entender por las personas de un determinado grupo. El objetivo de esta investigación es el desarrollo de un sistema de predicción de la complejidad léxica tanto del idioma inglés como del idioma español. El sistema se basa en la implementación de características lingüísticas a nivel de la palabra y oraciones, y en la implementación de las técnicas de redes neuronales BERT y XLM-RoBERTa para la generación de nuevas características que permitan resultados mucho más precisos. Se aplicó el algoritmo Random Forest Regressor. Para el entrenamiento de algoritmo se utilizó un conjunto de datos conformado por un corpus de textos en español y otro corpus de textos en inglés. La evaluación del algoritmo se lo realizó mediante la partición 90% - 10%. La metodología de desarrollo que se aplicó fue Kanban, y la metodología de investigación se basó en el Estudio de Caso por lo cual sus unidades de análisis se fundamentaron en las características lingüísticas generadas. Tras varias ejecuciones del algoritmo fue necesario implementar una validación cruzada de 5 variaciones para lograr resultados más precisos. El sistema será de mucho beneficio para la generación de soluciones dirigidas a los estudiantes con bajo nivel de comprensión lectora.Complex Word Identification (CWI) is the task of detecting in the content of documents words that are difficult or complex to understand by the people of a certain group. The objective of this research is the development of a system for predicting the lexical complexity of both the English and Spanish languages. The system is based on the implementation of linguistic characteristics at the level of the word and sentences, and in the implementation of BERT and XLM-RoBERTa neural network techniques for the generation of new features that allow much more accurate results. The Random Forest Regressor algorithm was applied. For the algorithm training, a dataset consisting of a corpus of texts in Spanish and another corpus of texts in English was used. The evaluation of the algorithm was performed by partitioning 90% - 10%. The development methodology that was applied was Kanban, and the research methodology was based on the Case Study, for which its units of analysis were based on the linguistic characteristics generated. After several runs of the algorithm, it was necessary to implement a cross validation of 5 variations to achieve more accurate results. The system will be of great benefit for the generation of solutions aimed at students with a low level of reading comprehension.Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Ortiz Zambrano, Jenny Alexandra2021-12-09T21:19:59Z2021-12-09T21:19:59Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/57212spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2021-12-10T08:27:44Zoai:repositorio.ug.edu.ec:redug/57212Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02026-04-25T06:45:30.406494Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue |
| spellingShingle | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. Arroba Salinas, Sandra Yanel Características línguísticas Complejidad léxica Machine learning Redes neuronales Predicción Linguistic characteristics Lexical complexity Supervised Learning Neural networks Prediction |
| status_str | publishedVersion |
| title | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. |
| title_full | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. |
| title_fullStr | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. |
| title_full_unstemmed | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. |
| title_short | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. |
| title_sort | Sistema de predicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios. |
| topic | Características línguísticas Complejidad léxica Machine learning Redes neuronales Predicción Linguistic characteristics Lexical complexity Supervised Learning Neural networks Prediction |
| url | http://repositorio.ug.edu.ec/handle/redug/57212 |