Aplicación de modelos Transformers para clasificar textos en idioma español

La llegada de los modelos Transformers ha revolucionado el procesamiento del lenguaje natural (PLN) al introducir un innovador mecanismo de atención capaz de capturar de manera eficiente y simultánea dependencias a largo plazo en secuencias de datos. Este avance arquitectónico ha generado un camino...

Täydet tiedot

Tallennettuna:
Bibliografiset tiedot
Päätekijä: Merchán Pérez, Erick Lenin (author)
Aineistotyyppi: bachelorThesis
Kieli:spa
Julkaistu: 2024
Aiheet:
Linkit:https://repositorio.upse.edu.ec/handle/46000/11875
Tagit: Lisää tagi
Ei tageja, Lisää ensimmäinen tagi!
_version_ 1839378371013771264
author Merchán Pérez, Erick Lenin
author_facet Merchán Pérez, Erick Lenin
author_role author
collection Repositorio Universidad Estatal Península de Santa Elena
dc.contributor.none.fl_str_mv Haz López, Lídice Victoria
dc.creator.none.fl_str_mv Merchán Pérez, Erick Lenin
dc.date.none.fl_str_mv 2024-08-16T20:01:45Z
2024-08-16T20:01:45Z
2024-08-16
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv Merchán Pérez, Erick Lenin (2024). Aplicación de modelos Transformers para clasificar textos en idioma español. La Libertad. UPSE, Matriz. Facultad de Sistemas y Telecomunicaciones. 48p.
UPSE-TTI-2024-0035
https://repositorio.upse.edu.ec/handle/46000/11875
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv La Libertad: Universidad Estatal Península de Santa Elena, 2024
dc.rights.none.fl_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Estatal Península de Santa Elena
instname:Universidad Estatal Península de Santa Elena
instacron:UPSE
dc.subject.none.fl_str_mv PLN
TRANSFORMERS
KAGGLE
BERT
ROBERTA
DISTILBERT
ALBERT
dc.title.none.fl_str_mv Aplicación de modelos Transformers para clasificar textos en idioma español
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description La llegada de los modelos Transformers ha revolucionado el procesamiento del lenguaje natural (PLN) al introducir un innovador mecanismo de atención capaz de capturar de manera eficiente y simultánea dependencias a largo plazo en secuencias de datos. Este avance arquitectónico ha generado un camino para un progreso significativo en diversas aplicaciones de PLN. En consecuencia, el enfoque de este proyecto radica en aprovechar estos modelos Transformers Pysentimiento para la clasificación de texto en el idioma español. Para lograr este objetivo, se emplearán cuatro modelos distintos: BERT, RoBERTa, DistilBERT y AlBERT, utilizando un conjunto de datos obtenido de la plataforma en línea Kaggle. Estos conjuntos de datos serán sometidos a un procesamiento previo y posteriormente alimentados a cada modelo para su evaluación. Se llevará a cabo un análisis comparativo de los resultados utilizando diversas métricas, y los hallazgos experimentales revelarán que, después de un adecuado preprocesamiento, el modelo DistilBERT alcanzo una precisión del 78%, un recall del 75%, una exactitud del 75% y una puntuación f1 del 76%. Este resultado establece al modelo DistilBERT como la opción más adecuada para tareas de clasificación de texto en el idioma español.
eu_rights_str_mv openAccess
format bachelorThesis
id UPSE_1e598857d35587aea1cf18a823fceedc
identifier_str_mv Merchán Pérez, Erick Lenin (2024). Aplicación de modelos Transformers para clasificar textos en idioma español. La Libertad. UPSE, Matriz. Facultad de Sistemas y Telecomunicaciones. 48p.
UPSE-TTI-2024-0035
instacron_str UPSE
institution UPSE
instname_str Universidad Estatal Península de Santa Elena
language spa
network_acronym_str UPSE
network_name_str Repositorio Universidad Estatal Península de Santa Elena
oai_identifier_str oai:repositorio.upse.edu.ec:46000/11875
publishDate 2024
publisher.none.fl_str_mv La Libertad: Universidad Estatal Península de Santa Elena, 2024
reponame_str Repositorio Universidad Estatal Península de Santa Elena
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Estatal Península de Santa Elena - Universidad Estatal Península de Santa Elena
repository_id_str 6318
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
spelling Aplicación de modelos Transformers para clasificar textos en idioma españolMerchán Pérez, Erick LeninPLNTRANSFORMERSKAGGLEBERTROBERTADISTILBERTALBERTLa llegada de los modelos Transformers ha revolucionado el procesamiento del lenguaje natural (PLN) al introducir un innovador mecanismo de atención capaz de capturar de manera eficiente y simultánea dependencias a largo plazo en secuencias de datos. Este avance arquitectónico ha generado un camino para un progreso significativo en diversas aplicaciones de PLN. En consecuencia, el enfoque de este proyecto radica en aprovechar estos modelos Transformers Pysentimiento para la clasificación de texto en el idioma español. Para lograr este objetivo, se emplearán cuatro modelos distintos: BERT, RoBERTa, DistilBERT y AlBERT, utilizando un conjunto de datos obtenido de la plataforma en línea Kaggle. Estos conjuntos de datos serán sometidos a un procesamiento previo y posteriormente alimentados a cada modelo para su evaluación. Se llevará a cabo un análisis comparativo de los resultados utilizando diversas métricas, y los hallazgos experimentales revelarán que, después de un adecuado preprocesamiento, el modelo DistilBERT alcanzo una precisión del 78%, un recall del 75%, una exactitud del 75% y una puntuación f1 del 76%. Este resultado establece al modelo DistilBERT como la opción más adecuada para tareas de clasificación de texto en el idioma español.La Libertad: Universidad Estatal Península de Santa Elena, 2024Haz López, Lídice Victoria2024-08-16T20:01:45Z2024-08-16T20:01:45Z2024-08-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMerchán Pérez, Erick Lenin (2024). Aplicación de modelos Transformers para clasificar textos en idioma español. La Libertad. UPSE, Matriz. Facultad de Sistemas y Telecomunicaciones. 48p.UPSE-TTI-2024-0035https://repositorio.upse.edu.ec/handle/46000/11875spaAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Estatal Península de Santa Elenainstname:Universidad Estatal Península de Santa Elenainstacron:UPSE2024-08-16T20:01:53Zoai:repositorio.upse.edu.ec:46000/11875Institucionalhttps://repositorio.upse.edu.ec/Universidad públicahttps://www.upse.edu.ec/https://repositorio.upse.edu.ec/oai.Ecuador...opendoar:63182025-08-02T19:27:03.593064Repositorio Universidad Estatal Península de Santa Elena - Universidad Estatal Península de Santa Elenatrue
spellingShingle Aplicación de modelos Transformers para clasificar textos en idioma español
Merchán Pérez, Erick Lenin
PLN
TRANSFORMERS
KAGGLE
BERT
ROBERTA
DISTILBERT
ALBERT
status_str publishedVersion
title Aplicación de modelos Transformers para clasificar textos en idioma español
title_full Aplicación de modelos Transformers para clasificar textos en idioma español
title_fullStr Aplicación de modelos Transformers para clasificar textos en idioma español
title_full_unstemmed Aplicación de modelos Transformers para clasificar textos en idioma español
title_short Aplicación de modelos Transformers para clasificar textos en idioma español
title_sort Aplicación de modelos Transformers para clasificar textos en idioma español
topic PLN
TRANSFORMERS
KAGGLE
BERT
ROBERTA
DISTILBERT
ALBERT
url https://repositorio.upse.edu.ec/handle/46000/11875