Boosting image captioning using ConvNeXt deep neural networks

This work proposes a ConvNeXt backbone-based model for image captioning. Specifically, the ConvNeXt convolutional model, a state-of-the-art computer vision architecture, is integrated with a long short-term memory network enclosing a visual attention module. Diverse experiments were performed to eva...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Tác giả chính: Ramos Granda, Leo Thomas (author)
Định dạng: bachelorThesis
Ngôn ngữ:eng
Được phát hành: 2023
Những chủ đề:
Truy cập trực tuyến:http://repositorio.yachaytech.edu.ec/handle/123456789/627
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!