Desarrollo de un modelo personalizado de Stable Diffusion para la generación de imágenes culturales ecuatorianas mediante fine-tuning con LoRA.

La creciente evolución de la inteligencia artificial generativa brinda una oportunidad innovadora para preservar y difundir el patrimonio cultural. En Ecuador, esta tecnología de generación de imágenes podría capturar y salvaguardar su vasta riqueza cultural. Este trabajo de titulación se justifica...

詳細記述

保存先:
書誌詳細
第一著者: Rodríguez Cervantes, Fausto Michael (author)
フォーマット: bachelorThesis
出版事項: 2025
主題:
オンライン・アクセス:https://repositorio.puce.edu.ec/handle/123456789/48264
タグ: タグ追加
タグなし, このレコードへの初めてのタグを付けませんか!
その他の書誌記述
要約:La creciente evolución de la inteligencia artificial generativa brinda una oportunidad innovadora para preservar y difundir el patrimonio cultural. En Ecuador, esta tecnología de generación de imágenes podría capturar y salvaguardar su vasta riqueza cultural. Este trabajo de titulación se justifica por la necesidad de conservar digitalmente dicho patrimonio y garantizar su acceso a las futuras generaciones (Ruoxi, Soyu, Matsunaga, Perot, & Pavllo, 2022). El poder de estas técnicas para la preservación digital auténtica del patrimonio queda patente en estudios recientes. Logros destacados incluyen la restauración de patrones cerámicos antiguos (vía Stable Diffusion + LoRA) conservando su estilo, y la generación de diseños de artesanía tradicional (ej.: cometas chinas) desde texto usando modelos de difusión afinados. Estas aplicaciones muestran que la IA es capaz de revitalizar el legado inmaterial e incluso optimizar procesos manuales sin perder autenticidad. Basándose en estos avances (Zhang X., 2024), es razonable proponer que un proyecto similar, dedicado a las tradiciones locales de Ecuador, ofrezca una contribución valiosa para su conservación y mayor difusión a través de medios digitales. Otro factor clave es la adopción de herramientas abiertas (open source) frente a soluciones propietarias. Stable Diffusion es un modelo de difusión de texto a imagen cuyos pesos y código fueron liberados públicamente, permitiendo su ejecución en hardware de consumo y su adaptación libre. Esto marca una diferencia fundamental respecto a plataformas cerradas como DALL-E o Midjourney, que no permiten a investigadores locales entrenar o personalizar los modelos según sus necesidades. Al emplear un modelo abierto, el proyecto puede aprovechar la flexibilidad para entrenarlo con datos culturales ecuatorianos, garantizando además que los resultados y el modelo ajustado puedan ser compartidos sin restricciones propietarias.