Swin Transformer V2 para clasificación de café lojano

Esta investigación presenta un modelo de clasificación binaria para granos de café verde de la variedad arábico procedentes de la región de Loja, Ecuador, basado en la arquitectura Swin Transformer V2. Se emplearon dos fuentes de datos, el conjunto de datos público USK-Coffee, de origen indonesio, y...

Szczegółowa specyfikacja

Zapisane w:
Opis bibliograficzny
1. autor: Betancourt, P. (author)
Kolejni autorzy: Cumbicus, O. (author)
Format: article
Język:spa
Wydane: 2026
Hasła przedmiotowe:
Dostęp online:http://dspace.ups.edu.ec/handle/123456789/31954
Etykiety: Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!
_version_ 1858988463241560064
author Betancourt, P.
author2 Cumbicus, O.
author2_role author
author_facet Betancourt, P.
Cumbicus, O.
author_role author
collection Repositorio Universidad Politécnica Salesiana
dc.creator.none.fl_str_mv Betancourt, P.
Cumbicus, O.
dc.date.none.fl_str_mv 2026-01-29T16:55:03Z
2026-01-29T16:55:03Z
2026-01
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://dspace.ups.edu.ec/handle/123456789/31954
dc.language.none.fl_str_mv spa
dc.rights.none.fl_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Politécnica Salesiana
instname:Universidad Politécnica Salesiana
instacron:UPS
dc.subject.none.fl_str_mv clasificación de café; coffee classification
inteligencia artificial; artificial intelligence
Vision Transformer; Vision Transformer
Swin Transformer; Swin Transformer
visión por computadora; computer vision
aprendizaje por transferencia; transfer learning
dc.title.none.fl_str_mv Swin Transformer V2 para clasificación de café lojano
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/article
description Esta investigación presenta un modelo de clasificación binaria para granos de café verde de la variedad arábico procedentes de la región de Loja, Ecuador, basado en la arquitectura Swin Transformer V2. Se emplearon dos fuentes de datos, el conjunto de datos público USK-Coffee, de origen indonesio, y un con junto de datos propio capturado bajo condiciones controladas. Se evaluaron dos estrategias de entre namiento: transferencia secuencial y entrenamiento unificado, siendo este último el que alcanzó una pre cisión de validación del 98,30 %. Tras la optimización de hiperparámetros, el modelo logró una precisión del 100 %enunconjunto de prueba de 150 imágenes y del 93 % en un conjunto de generalización externo de 400 imágenes con condiciones variables de iluminación y fondo. La interpretabilidad del modelo se validó mediante Grad-CAM, evidenciando que la red enfoca su atención en zonas defectuosas reales. Un análisis de ablación mostró que la disminución de rendimiento en escenarios no controlados se debe principalmente a la sensibilidad al ruido y a la iluminación extrema. Como principales aportes, se destaca la creación de un conjunto de datos especializado y un modelo eficiente para la clasificación automática de café verde arábico.//This study presents a binary classification model for green coffee beans of the Arabica variety from the Loja region in Ecuador, based on the Swin Trans former V2 architecture. Two datasets were used, the public USK-COFFEE dataset of Indonesian origin and a proprietary dataset captured under controlled conditions. Two training strategies were evaluated: sequential transfer learning and unified training, with the latter achieving a validation accuracy of 98.30%. After hyperparameter optimization, the model reached 100% accuracy on a test set of 150 images and 93% accuracy on an external generalization set of 400 images with varying lighting conditions and backgrounds. Model interpretability was validated using Grad-CAM, demonstrating that the network focuses on actual defective regions rather than back ground information. An ablation analysis revealed that performance degradation in unconstrained scenarios is mainly due to sensitivity to noise and ex treme lighting conditions. The main contributions of this work include the creation of a specialized dataset for Arabica green coffee from Loja and the development of an efficient model for its automatic classification.
eu_rights_str_mv openAccess
format article
id UPS_0933d206dcd2d6024d5feda720342f18
instacron_str UPS
institution UPS
instname_str Universidad Politécnica Salesiana
language spa
network_acronym_str UPS
network_name_str Repositorio Universidad Politécnica Salesiana
oai_identifier_str oai:dspace.ups.edu.ec:123456789/31954
publishDate 2026
reponame_str Repositorio Universidad Politécnica Salesiana
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesiana
repository_id_str 1737
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
spelling Swin Transformer V2 para clasificación de café lojanoBetancourt, P.Cumbicus, O.clasificación de café; coffee classificationinteligencia artificial; artificial intelligenceVision Transformer; Vision TransformerSwin Transformer; Swin Transformervisión por computadora; computer visionaprendizaje por transferencia; transfer learningEsta investigación presenta un modelo de clasificación binaria para granos de café verde de la variedad arábico procedentes de la región de Loja, Ecuador, basado en la arquitectura Swin Transformer V2. Se emplearon dos fuentes de datos, el conjunto de datos público USK-Coffee, de origen indonesio, y un con junto de datos propio capturado bajo condiciones controladas. Se evaluaron dos estrategias de entre namiento: transferencia secuencial y entrenamiento unificado, siendo este último el que alcanzó una pre cisión de validación del 98,30 %. Tras la optimización de hiperparámetros, el modelo logró una precisión del 100 %enunconjunto de prueba de 150 imágenes y del 93 % en un conjunto de generalización externo de 400 imágenes con condiciones variables de iluminación y fondo. La interpretabilidad del modelo se validó mediante Grad-CAM, evidenciando que la red enfoca su atención en zonas defectuosas reales. Un análisis de ablación mostró que la disminución de rendimiento en escenarios no controlados se debe principalmente a la sensibilidad al ruido y a la iluminación extrema. Como principales aportes, se destaca la creación de un conjunto de datos especializado y un modelo eficiente para la clasificación automática de café verde arábico.//This study presents a binary classification model for green coffee beans of the Arabica variety from the Loja region in Ecuador, based on the Swin Trans former V2 architecture. Two datasets were used, the public USK-COFFEE dataset of Indonesian origin and a proprietary dataset captured under controlled conditions. Two training strategies were evaluated: sequential transfer learning and unified training, with the latter achieving a validation accuracy of 98.30%. After hyperparameter optimization, the model reached 100% accuracy on a test set of 150 images and 93% accuracy on an external generalization set of 400 images with varying lighting conditions and backgrounds. Model interpretability was validated using Grad-CAM, demonstrating that the network focuses on actual defective regions rather than back ground information. An ablation analysis revealed that performance degradation in unconstrained scenarios is mainly due to sensitivity to noise and ex treme lighting conditions. The main contributions of this work include the creation of a specialized dataset for Arabica green coffee from Loja and the development of an efficient model for its automatic classification.2026-01-29T16:55:03Z2026-01-29T16:55:03Z2026-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://dspace.ups.edu.ec/handle/123456789/31954spaAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Politécnica Salesianainstname:Universidad Politécnica Salesianainstacron:UPS2026-01-29T16:55:04Zoai:dspace.ups.edu.ec:123456789/31954Institucionalhttps://dspace.ups.edu.ec/Institución privadahttps://www.ups.edu.ec/https://dspace.ups.edu.ec/oai.Ecuador...opendoar:17372026-01-29T16:55:04Repositorio Universidad Politécnica Salesiana - Universidad Politécnica Salesianafalse
spellingShingle Swin Transformer V2 para clasificación de café lojano
Betancourt, P.
clasificación de café; coffee classification
inteligencia artificial; artificial intelligence
Vision Transformer; Vision Transformer
Swin Transformer; Swin Transformer
visión por computadora; computer vision
aprendizaje por transferencia; transfer learning
status_str publishedVersion
title Swin Transformer V2 para clasificación de café lojano
title_full Swin Transformer V2 para clasificación de café lojano
title_fullStr Swin Transformer V2 para clasificación de café lojano
title_full_unstemmed Swin Transformer V2 para clasificación de café lojano
title_short Swin Transformer V2 para clasificación de café lojano
title_sort Swin Transformer V2 para clasificación de café lojano
topic clasificación de café; coffee classification
inteligencia artificial; artificial intelligence
Vision Transformer; Vision Transformer
Swin Transformer; Swin Transformer
visión por computadora; computer vision
aprendizaje por transferencia; transfer learning
url http://dspace.ups.edu.ec/handle/123456789/31954