Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.
Spremljeno u:
| Glavni autor: | |
|---|---|
| Daljnji autori: | |
| Format: | bachelorThesis |
| Jezik: | spa |
| Izdano: |
2022
|
| Teme: | |
| Online pristup: | http://repositorio.ug.edu.ec/handle/redug/59961 |
| Oznake: |
Dodaj oznaku
Bez oznaka, Budi prvi tko označuje ovaj zapis!
|
| _version_ | 1863426489646579712 |
|---|---|
| author | Aroca Pincay, Diana Geovanna |
| author2 | Bernal Yucailla, Diego Gabriel |
| author2_role | author |
| author_facet | Aroca Pincay, Diana Geovanna Bernal Yucailla, Diego Gabriel |
| author_role | author |
| collection | Repositorio Universidad de Guayaquil |
| dc.contributor.none.fl_str_mv | Ortiz Zambrano, Jenny Alexandra |
| dc.creator.none.fl_str_mv | Aroca Pincay, Diana Geovanna Bernal Yucailla, Diego Gabriel |
| dc.date.none.fl_str_mv | 2022-05-17T17:14:57Z 2022-05-17T17:14:57Z 2022-03-18 |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | http://repositorio.ug.edu.ec/handle/redug/59961 |
| dc.language.none.fl_str_mv | spa |
| dc.publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
| dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
| dc.source.none.fl_str_mv | reponame:Repositorio Universidad de Guayaquil instname:Universidad de Guayaquil instacron:UG |
| dc.subject.none.fl_str_mv | Transformers Datasets Fine-Tuning Machine Learning, Algoritmos Predicción de la complejidad léxica Transformers Algorithms Lexical complexity prediction |
| dc.title.none.fl_str_mv | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. |
| dc.type.none.fl_str_mv | info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis |
| description | PDF |
| eu_rights_str_mv | openAccess |
| format | bachelorThesis |
| id | UG_3001221c038adca4e22f15d10eae4b1a |
| instacron_str | UG |
| institution | UG |
| instname_str | Universidad de Guayaquil |
| language | spa |
| network_acronym_str | UG |
| network_name_str | Repositorio Universidad de Guayaquil |
| oai_identifier_str | oai:repositorio.ug.edu.ec:redug/59961 |
| publishDate | 2022 |
| publisher.none.fl_str_mv | Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales. |
| reponame_str | Repositorio Universidad de Guayaquil |
| repository.mail.fl_str_mv | . |
| repository.name.fl_str_mv | Repositorio Universidad de Guayaquil - Universidad de Guayaquil |
| repository_id_str | 0 |
| spelling | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español.Aroca Pincay, Diana GeovannaBernal Yucailla, Diego GabrielTransformersDatasetsFine-TuningMachine Learning,AlgoritmosPredicción de la complejidad léxicaTransformersAlgorithmsLexical complexity predictionPDFLa presente investigacion plantea la exploracion y evaluacion de los diferentes modelos de Transformers aplicados para el idioma español las cuales son BERT, XML-RoBERTa y RoBERTa-Large-BNE con el objetivo de evaluar el nivel de prediccion de las palabras complejas de los textos en español. Estos modelos pre-entrenados serán ejecutados con un corpus previamente creado de los textos Universitarios en español- ClexIS2 aplicando el algoritmo pre-entrenado generico del codigo abierto de cada Transformers. Esto permitiendo la generacion de embedding(incrustaciones-encodings) para la creacion de los Datasets que previamente seran enntrenados por los diferentes algoritmos de Machine Learning, obteniendo la prediccion de la complejidad Léxica(LCP).Ya realizado la exploracion de los Transformers se procedera a la realizacion del ajuste fino a cada modelo mediante la ejecucion de la tecnica de Fine-Tuning sobre los modelos pre-entrenados para la generacion de los Datasets basados en las nuevas representaciones numericas, que a su vez tambien procederan ser entrenados y evaluados por los diferentes algoritmos para obtener la prediccion de la complejidad Léxica.Ya obtenido los resultados de las diferentes combinaciones de los modelos pre-entrenados y ajustados de los modelos Transformers se evaluara su desempeño para determinar los mejores resultados de la prediccion de la complejidad Lexica del idioma español.This research proposes the exploration and evaluation of the different Transformers models applied to the Spanish language, which are BERT, XML-RoBERTa and RoBERTa-Large-BNE with the aim of evaluating the level of prediction of complex words in texts in Spanish. Spanish. These pretrained models will be executed with a previously created corpus of University texts in Spanish - ClexIS2 applying the open source generic pretrained algorithm of each Transformers. This allowed the generation of embedding (embeddings-encodings) for the creation of the Datasets that were previously trained by the different Machine Learning algorithms, obtaining the Lexical Complexity Prediction (LCP). Once the exploration of the Transformers has been carried out, we will proceed to the realization of the fine adjustment to each model by means of the execution of the Fine-Tuning technique on the pre-trained models for the generation of the Datasets based on the new numerical representations, which in turn will also proceed to be alterations and evaluated by the different algorithms to obtain the prediction of the Lexical complexity. You have already obtained the results of the different combinations of the pre-trained and adjusted models of the Transformers models, their performance will be evaluated to determine the best results of the prediction of the Lexical complexity of the language Spanish.Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Ortiz Zambrano, Jenny Alexandra2022-05-17T17:14:57Z2022-05-17T17:14:57Z2022-03-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/59961spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2022-05-18T08:17:37Zoai:repositorio.ug.edu.ec:redug/59961Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02026-04-25T06:47:18.150314Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue |
| spellingShingle | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. Aroca Pincay, Diana Geovanna Transformers Datasets Fine-Tuning Machine Learning, Algoritmos Predicción de la complejidad léxica Transformers Algorithms Lexical complexity prediction |
| status_str | publishedVersion |
| title | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. |
| title_full | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. |
| title_fullStr | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. |
| title_full_unstemmed | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. |
| title_short | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. |
| title_sort | Evaluación de desempeño de los modelos transformadores para la predicción de la complejidad léxica para el Idioma Español. |
| topic | Transformers Datasets Fine-Tuning Machine Learning, Algoritmos Predicción de la complejidad léxica Transformers Algorithms Lexical complexity prediction |
| url | http://repositorio.ug.edu.ec/handle/redug/59961 |