Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.

PDF

Spremljeno u:
Bibliografski detalji
Glavni autor: Aroca Pincay, Diana Geovanna (author)
Daljnji autori: Bernal Yucailla, Diego Gabriel (author)
Format: bachelorThesis
Jezik:spa
Izdano: 2022
Teme:
Online pristup:http://repositorio.ug.edu.ec/handle/redug/59961
Oznake: Dodaj oznaku
Bez oznaka, Budi prvi tko označuje ovaj zapis!
_version_ 1863426489646579712
author Aroca Pincay, Diana Geovanna
author2 Bernal Yucailla, Diego Gabriel
author2_role author
author_facet Aroca Pincay, Diana Geovanna
Bernal Yucailla, Diego Gabriel
author_role author
collection Repositorio Universidad de Guayaquil
dc.contributor.none.fl_str_mv Ortiz Zambrano, Jenny Alexandra
dc.creator.none.fl_str_mv Aroca Pincay, Diana Geovanna
Bernal Yucailla, Diego Gabriel
dc.date.none.fl_str_mv 2022-05-17T17:14:57Z
2022-05-17T17:14:57Z
2022-03-18
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://repositorio.ug.edu.ec/handle/redug/59961
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad de Guayaquil
instname:Universidad de Guayaquil
instacron:UG
dc.subject.none.fl_str_mv Transformers
Datasets
Fine-Tuning
Machine Learning,
Algoritmos
Predicción de la complejidad léxica
Transformers
Algorithms
Lexical complexity prediction
dc.title.none.fl_str_mv Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description PDF
eu_rights_str_mv openAccess
format bachelorThesis
id UG_3001221c038adca4e22f15d10eae4b1a
instacron_str UG
institution UG
instname_str Universidad de Guayaquil
language spa
network_acronym_str UG
network_name_str Repositorio Universidad de Guayaquil
oai_identifier_str oai:repositorio.ug.edu.ec:redug/59961
publishDate 2022
publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
reponame_str Repositorio Universidad de Guayaquil
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad de Guayaquil - Universidad de Guayaquil
repository_id_str 0
spelling Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.Aroca Pincay, Diana GeovannaBernal Yucailla, Diego GabrielTransformersDatasetsFine-TuningMachine Learning,AlgoritmosPredicción de la complejidad léxicaTransformersAlgorithmsLexical complexity predictionPDFLa presente investigacion plantea la exploracion y evaluacion de los diferentes modelos de Transformers aplicados para el idioma español las cuales son BERT, XML-RoBERTa y RoBERTa-Large-BNE con el objetivo de evaluar el nivel de prediccion de las palabras complejas de los textos en español. Estos modelos pre-entrenados serán ejecutados con un corpus previamente creado de los textos Universitarios en español- ClexIS2 aplicando el algoritmo pre-entrenado generico del codigo abierto de cada Transformers. Esto permitiendo la generacion de embedding(incrustaciones-encodings) para la creacion de los Datasets que previamente seran enntrenados por los diferentes algoritmos de Machine Learning, obteniendo la prediccion de la complejidad Léxica(LCP).Ya realizado la exploracion de los Transformers se procedera a la realizacion del ajuste fino a cada modelo mediante la ejecucion de la tecnica de Fine-Tuning sobre los modelos pre-entrenados para la generacion de los Datasets basados en las nuevas representaciones numericas, que a su vez tambien procederan ser entrenados y evaluados por los diferentes algoritmos para obtener la prediccion de la complejidad Léxica.Ya obtenido los resultados de las diferentes combinaciones de los modelos pre-entrenados y ajustados de los modelos Transformers se evaluara su desempeño para determinar los mejores resultados de la prediccion de la complejidad Lexica del idioma español.This research proposes the exploration and evaluation of the different Transformers models applied to the Spanish language, which are BERT, XML-RoBERTa and RoBERTa-Large-BNE with the aim of evaluating the level of prediction of complex words in texts in Spanish. Spanish. These pretrained models will be executed with a previously created corpus of University texts in Spanish - ClexIS2 applying the open source generic pretrained algorithm of each Transformers. This allowed the generation of embedding (embeddings-encodings) for the creation of the Datasets that were previously trained by the different Machine Learning algorithms, obtaining the Lexical Complexity Prediction (LCP). Once the exploration of the Transformers has been carried out, we will proceed to the realization of the fine adjustment to each model by means of the execution of the Fine-Tuning technique on the pre-trained models for the generation of the Datasets based on the new numerical representations, which in turn will also proceed to be alterations and evaluated by the different algorithms to obtain the prediction of the Lexical complexity. You have already obtained the results of the different combinations of the pre-trained and adjusted models of the Transformers models, their performance will be evaluated to determine the best results of the prediction of the Lexical complexity of the language Spanish.Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Ortiz Zambrano, Jenny Alexandra2022-05-17T17:14:57Z2022-05-17T17:14:57Z2022-03-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/59961spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2022-05-18T08:17:37Zoai:repositorio.ug.edu.ec:redug/59961Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02026-04-25T06:47:18.150314Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue
spellingShingle Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
Aroca Pincay, Diana Geovanna
Transformers
Datasets
Fine-Tuning
Machine Learning,
Algoritmos
Predicción de la complejidad léxica
Transformers
Algorithms
Lexical complexity prediction
status_str publishedVersion
title Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
title_full Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
title_fullStr Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
title_full_unstemmed Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
title_short Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
title_sort Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
topic Transformers
Datasets
Fine-Tuning
Machine Learning,
Algoritmos
Predicción de la complejidad léxica
Transformers
Algorithms
Lexical complexity prediction
url http://repositorio.ug.edu.ec/handle/redug/59961