Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.

PDF

Enregistré dans:
Détails bibliographiques
Auteur principal: Naranjo Reyes, Jackeline Estefania (author)
Autres auteurs: Verdesoto Alava, Andreina Lissette (author)
Format: bachelorThesis
Langue:spa
Publié: 2023
Sujets:
Accès en ligne:http://repositorio.ug.edu.ec/handle/redug/71289
Tags: Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
_version_ 1860251920865689600
author Naranjo Reyes, Jackeline Estefania
author2 Verdesoto Alava, Andreina Lissette
author2_role author
author_facet Naranjo Reyes, Jackeline Estefania
Verdesoto Alava, Andreina Lissette
author_role author
collection Repositorio Universidad de Guayaquil
dc.contributor.none.fl_str_mv Ortiz Zambrano, Jenny Alexandra
dc.creator.none.fl_str_mv Naranjo Reyes, Jackeline Estefania
Verdesoto Alava, Andreina Lissette
dc.date.none.fl_str_mv 2023-10-23T19:03:35Z
2023-10-23T19:03:35Z
2023-10
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://repositorio.ug.edu.ec/handle/redug/71289
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad de Guayaquil
instname:Universidad de Guayaquil
instacron:UG
dc.subject.none.fl_str_mv MODELOS DE LENGUAJE
COMPLEJIDAD LÉXICA
PREDICCIÓN
ESPAÑOL
FINE-TUNING
LANGUAGE MODELS
LEXICAL COMPLEXITY
PREDICTION
SPANISH
dc.title.none.fl_str_mv Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description PDF
eu_rights_str_mv openAccess
format bachelorThesis
id UG_fcf803e21897d3fb876cb4b134b2a3d6
instacron_str UG
institution UG
instname_str Universidad de Guayaquil
language spa
network_acronym_str UG
network_name_str Repositorio Universidad de Guayaquil
oai_identifier_str oai:repositorio.ug.edu.ec:redug/71289
publishDate 2023
publisher.none.fl_str_mv Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
reponame_str Repositorio Universidad de Guayaquil
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad de Guayaquil - Universidad de Guayaquil
repository_id_str 0
spelling Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.Naranjo Reyes, Jackeline EstefaniaVerdesoto Alava, Andreina LissetteMODELOS DE LENGUAJECOMPLEJIDAD LÉXICAPREDICCIÓNESPAÑOLFINE-TUNINGLANGUAGE MODELSLEXICAL COMPLEXITYPREDICTIONSPANISHPDFEl propósito de este proyecto de investigación es mejorar los resultados de la predicción del nivel de complejidad de las palabras en español mediante el uso de Deep Learning y modelos de lenguaje basados en arquitectura Transformers, específicamente enfocados al idioma español, como XLM- RoBERTa-Large, RoBERTa-Large-BNE, XLM-RoBERTa-base y BERT base. El objetivo principal pretende contribuir a la reducción de las barreras de comprensión lectora para los estudiantes de la carrera de Derecho en la Universidad de Guayaquil. Para lograr esto, se aplicaron las técnicas de Multimodal y Masked Language Modeling para aumentar la precisión para el entrenamiento y evaluación es el CEDUG (Complejidad léxica en los Estudios de Derecho de la Universidad de Guayaquil) y CLexIS² (Complejidad léxica en los Estudios de Software y Sistemas de la Universidad de Guayaquil), los cuales fueron etiquetados por estudiantes. El proceso de evaluación se basó en diversas métricas, como el error común MAE, MSE y RMSE, y otras enfocadas en evaluar la complejidad de las palabras, como R2. Se utilizó una metodología de investigación cuantitativa y un muestreo por estratos para llevar a cabo el proceso de entrenamiento y evaluación.The purpose of this research project is to improve the results of the prediction of the level of complexity of words in Spanish through the use of Deep Learning and language models based on Transformers architecture, specifically focused on the Spanish language, such as XLM-RoBERTa- Large, RoBERTa-Large-BNE, XLM-RoBERTa-base and BERT base. The main objective is to contribute to the reduction of reading comprehension barriers for students of the Law degree at the University of Guayaquil. To achieve this, Multimodal and Masked Language Modeling techniques were applied to increase accuracy for training and evaluation in CEDUG (Lexical Complexity in Law Studies at the University of Guayaquil) and CLexIS² (Lexical Complexity in Software Studies). and Systems of the University of Guayaquil), which were labeled by students. The evaluation process was based on various metrics, such as the common error MAE, MSE and RMSE, and others focused on evaluating the complexity of words, such as R2. A quantitative research methodology and stratified sampling were used to carry out the training and evaluation processUniversidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.Ortiz Zambrano, Jenny Alexandra2023-10-23T19:03:35Z2023-10-23T19:03:35Z2023-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://repositorio.ug.edu.ec/handle/redug/71289spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad de Guayaquilinstname:Universidad de Guayaquilinstacron:UG2023-10-24T10:39:14Zoai:repositorio.ug.edu.ec:redug/71289Institucionalhttp://repositorio.ug.edu.ec/Universidad públicahttps://www.ug.edu.ec/..Ecuador...opendoar:02026-03-21T05:46:10.762813Repositorio Universidad de Guayaquil - Universidad de Guayaquiltrue
spellingShingle Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
Naranjo Reyes, Jackeline Estefania
MODELOS DE LENGUAJE
COMPLEJIDAD LÉXICA
PREDICCIÓN
ESPAÑOL
FINE-TUNING
LANGUAGE MODELS
LEXICAL COMPLEXITY
PREDICTION
SPANISH
status_str publishedVersion
title Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
title_full Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
title_fullStr Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
title_full_unstemmed Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
title_short Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
title_sort Las características lingüísticas y su aporte en la predicción de la complejidad léxica en la ejecución de los modelos de lenguajes basados en Transformers.
topic MODELOS DE LENGUAJE
COMPLEJIDAD LÉXICA
PREDICCIÓN
ESPAÑOL
FINE-TUNING
LANGUAGE MODELS
LEXICAL COMPLEXITY
PREDICTION
SPANISH
url http://repositorio.ug.edu.ec/handle/redug/71289