Boosting image captioning using ConvNeXt deep neural networks

This work proposes a ConvNeXt backbone-based model for image captioning. Specifically, the ConvNeXt convolutional model, a state-of-the-art computer vision architecture, is integrated with a long short-term memory network enclosing a visual attention module. Diverse experiments were performed to eva...

Ամբողջական նկարագրություն

Պահպանված է:
Մատենագիտական մանրամասներ
Հիմնական հեղինակ: Ramos Granda, Leo Thomas (author)
Ձևաչափ: bachelorThesis
Լեզու:eng
Հրապարակվել է: 2023
Խորագրեր:
Առցանց հասանելիություն:http://repositorio.yachaytech.edu.ec/handle/123456789/627
Ցուցիչներ: Ավելացրեք ցուցիչ
Չկան պիտակներ, Եղեք առաջինը, ով նշում է այս գրառումը!