Aplicación de modelos Transformers para clasificar textos en idioma español
La llegada de los modelos Transformers ha revolucionado el procesamiento del lenguaje natural (PLN) al introducir un innovador mecanismo de atención capaz de capturar de manera eficiente y simultánea dependencias a largo plazo en secuencias de datos. Este avance arquitectónico ha generado un camino...
Tallennettuna:
Päätekijä: | |
---|---|
Aineistotyyppi: | bachelorThesis |
Kieli: | spa |
Julkaistu: |
2024
|
Aiheet: | |
Linkit: | https://repositorio.upse.edu.ec/handle/46000/11875 |
Tagit: |
Lisää tagi
Ei tageja, Lisää ensimmäinen tagi!
|
_version_ | 1839378371013771264 |
---|---|
author | Merchán Pérez, Erick Lenin |
author_facet | Merchán Pérez, Erick Lenin |
author_role | author |
collection | Repositorio Universidad Estatal Península de Santa Elena |
dc.contributor.none.fl_str_mv | Haz López, Lídice Victoria |
dc.creator.none.fl_str_mv | Merchán Pérez, Erick Lenin |
dc.date.none.fl_str_mv | 2024-08-16T20:01:45Z 2024-08-16T20:01:45Z 2024-08-16 |
dc.format.none.fl_str_mv | application/pdf |
dc.identifier.none.fl_str_mv | Merchán Pérez, Erick Lenin (2024). Aplicación de modelos Transformers para clasificar textos en idioma español. La Libertad. UPSE, Matriz. Facultad de Sistemas y Telecomunicaciones. 48p. UPSE-TTI-2024-0035 https://repositorio.upse.edu.ec/handle/46000/11875 |
dc.language.none.fl_str_mv | spa |
dc.publisher.none.fl_str_mv | La Libertad: Universidad Estatal Península de Santa Elena, 2024 |
dc.rights.none.fl_str_mv | Atribución-NoComercial-SinDerivadas 3.0 Ecuador http://creativecommons.org/licenses/by-nc-nd/3.0/ec/ info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:Repositorio Universidad Estatal Península de Santa Elena instname:Universidad Estatal Península de Santa Elena instacron:UPSE |
dc.subject.none.fl_str_mv | PLN TRANSFORMERS KAGGLE BERT ROBERTA DISTILBERT ALBERT |
dc.title.none.fl_str_mv | Aplicación de modelos Transformers para clasificar textos en idioma español |
dc.type.none.fl_str_mv | info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis |
description | La llegada de los modelos Transformers ha revolucionado el procesamiento del lenguaje natural (PLN) al introducir un innovador mecanismo de atención capaz de capturar de manera eficiente y simultánea dependencias a largo plazo en secuencias de datos. Este avance arquitectónico ha generado un camino para un progreso significativo en diversas aplicaciones de PLN. En consecuencia, el enfoque de este proyecto radica en aprovechar estos modelos Transformers Pysentimiento para la clasificación de texto en el idioma español. Para lograr este objetivo, se emplearán cuatro modelos distintos: BERT, RoBERTa, DistilBERT y AlBERT, utilizando un conjunto de datos obtenido de la plataforma en línea Kaggle. Estos conjuntos de datos serán sometidos a un procesamiento previo y posteriormente alimentados a cada modelo para su evaluación. Se llevará a cabo un análisis comparativo de los resultados utilizando diversas métricas, y los hallazgos experimentales revelarán que, después de un adecuado preprocesamiento, el modelo DistilBERT alcanzo una precisión del 78%, un recall del 75%, una exactitud del 75% y una puntuación f1 del 76%. Este resultado establece al modelo DistilBERT como la opción más adecuada para tareas de clasificación de texto en el idioma español. |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | UPSE_1e598857d35587aea1cf18a823fceedc |
identifier_str_mv | Merchán Pérez, Erick Lenin (2024). Aplicación de modelos Transformers para clasificar textos en idioma español. La Libertad. UPSE, Matriz. Facultad de Sistemas y Telecomunicaciones. 48p. UPSE-TTI-2024-0035 |
instacron_str | UPSE |
institution | UPSE |
instname_str | Universidad Estatal Península de Santa Elena |
language | spa |
network_acronym_str | UPSE |
network_name_str | Repositorio Universidad Estatal Península de Santa Elena |
oai_identifier_str | oai:repositorio.upse.edu.ec:46000/11875 |
publishDate | 2024 |
publisher.none.fl_str_mv | La Libertad: Universidad Estatal Península de Santa Elena, 2024 |
reponame_str | Repositorio Universidad Estatal Península de Santa Elena |
repository.mail.fl_str_mv | . |
repository.name.fl_str_mv | Repositorio Universidad Estatal Península de Santa Elena - Universidad Estatal Península de Santa Elena |
repository_id_str | 6318 |
rights_invalid_str_mv | Atribución-NoComercial-SinDerivadas 3.0 Ecuador http://creativecommons.org/licenses/by-nc-nd/3.0/ec/ |
spelling | Aplicación de modelos Transformers para clasificar textos en idioma españolMerchán Pérez, Erick LeninPLNTRANSFORMERSKAGGLEBERTROBERTADISTILBERTALBERTLa llegada de los modelos Transformers ha revolucionado el procesamiento del lenguaje natural (PLN) al introducir un innovador mecanismo de atención capaz de capturar de manera eficiente y simultánea dependencias a largo plazo en secuencias de datos. Este avance arquitectónico ha generado un camino para un progreso significativo en diversas aplicaciones de PLN. En consecuencia, el enfoque de este proyecto radica en aprovechar estos modelos Transformers Pysentimiento para la clasificación de texto en el idioma español. Para lograr este objetivo, se emplearán cuatro modelos distintos: BERT, RoBERTa, DistilBERT y AlBERT, utilizando un conjunto de datos obtenido de la plataforma en línea Kaggle. Estos conjuntos de datos serán sometidos a un procesamiento previo y posteriormente alimentados a cada modelo para su evaluación. Se llevará a cabo un análisis comparativo de los resultados utilizando diversas métricas, y los hallazgos experimentales revelarán que, después de un adecuado preprocesamiento, el modelo DistilBERT alcanzo una precisión del 78%, un recall del 75%, una exactitud del 75% y una puntuación f1 del 76%. Este resultado establece al modelo DistilBERT como la opción más adecuada para tareas de clasificación de texto en el idioma español.La Libertad: Universidad Estatal Península de Santa Elena, 2024Haz López, Lídice Victoria2024-08-16T20:01:45Z2024-08-16T20:01:45Z2024-08-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMerchán Pérez, Erick Lenin (2024). Aplicación de modelos Transformers para clasificar textos en idioma español. La Libertad. UPSE, Matriz. Facultad de Sistemas y Telecomunicaciones. 48p.UPSE-TTI-2024-0035https://repositorio.upse.edu.ec/handle/46000/11875spaAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Estatal Península de Santa Elenainstname:Universidad Estatal Península de Santa Elenainstacron:UPSE2024-08-16T20:01:53Zoai:repositorio.upse.edu.ec:46000/11875Institucionalhttps://repositorio.upse.edu.ec/Universidad públicahttps://www.upse.edu.ec/https://repositorio.upse.edu.ec/oai.Ecuador...opendoar:63182025-08-02T19:27:03.593064Repositorio Universidad Estatal Península de Santa Elena - Universidad Estatal Península de Santa Elenatrue |
spellingShingle | Aplicación de modelos Transformers para clasificar textos en idioma español Merchán Pérez, Erick Lenin PLN TRANSFORMERS KAGGLE BERT ROBERTA DISTILBERT ALBERT |
status_str | publishedVersion |
title | Aplicación de modelos Transformers para clasificar textos en idioma español |
title_full | Aplicación de modelos Transformers para clasificar textos en idioma español |
title_fullStr | Aplicación de modelos Transformers para clasificar textos en idioma español |
title_full_unstemmed | Aplicación de modelos Transformers para clasificar textos en idioma español |
title_short | Aplicación de modelos Transformers para clasificar textos en idioma español |
title_sort | Aplicación de modelos Transformers para clasificar textos en idioma español |
topic | PLN TRANSFORMERS KAGGLE BERT ROBERTA DISTILBERT ALBERT |
url | https://repositorio.upse.edu.ec/handle/46000/11875 |