Generación de informes radiológicos mediante el reconocimiento de voz

La generación de informes radiológicos es un proceso crítico que, en muchos servicios, aún depende del dictado y la redacción manual o de soluciones ASR genéricas poco adaptadas al español clínico. Estos enfoques presentan desventajas recurrentes: latencias elevadas en la elaboración del reporte, er...

Полное описание

Сохранить в:

Библиографические подробности
Главный автор:	Benalcázar Cando, Ilan Patricio (author)
Формат:	bachelorThesis
Язык:	spa
Опубликовано:	2025
Предметы:	BIOMEDICINA INTELIGENCIA ARTIFICIAL MODELOS DE LENGUAJE FINE-TUNING
Online-ссылка:	http://dspace.ups.edu.ec/handle/123456789/31680
Метки:	Добавить метку Нет меток, Требуется 1-ая метка записи!

Описание
Итог:	La generación de informes radiológicos es un proceso crítico que, en muchos servicios, aún depende del dictado y la redacción manual o de soluciones ASR genéricas poco adaptadas al español clínico. Estos enfoques presentan desventajas recurrentes: latencias elevadas en la elaboración del reporte, errores ortográficos y de acentuación, confusiones terminológicas (acrónimos y abreviaturas), inconsistencias de estilo y, cuando se recurre a servicios en la nube, restricciones de privacidad y dependencia de conectividad. La variabilidad dialectal, el ruido ambiental y la falta de estandarización agravan el problema, incrementando la carga de posedición del radiólogo y afectando la eficiencia del flujo de trabajo. Por ello, se requiere una solución local, modular y especializada que reduzca errores, mantenga el registro radiológico y respete la confidencialidad de los datos. En este proyecto se implementó un sistema automático y on-premise para la generación de informes radiológicos en español a partir de dictado, integrado por cinco etapas: (i) adquisición de audio y preprocesamiento acústico (normalización y remuestreo) para reducir la variabilidad de entrada; (ii) transcripción automática con Whisper-small (Transformer multilingüe) configurado para español y con marcas temporales por palabra para asegurar trazabilidad; (iii) revisión léxica asistida por un modelo biomédico tipo RoBERTa, destinado a normalizar términos clínicos, diacríticos, acrónimos y unidades; (iv) adecuación estilística mediante Gemma-2B-IT ajustado finamente con LoRA/QLoRA (cuantización de 4 bits para eficiencia), con el fin de mantener la estructura y el tono propios del informe radiológico sin introducir hallazgos no dictados; y (v) postprocesamiento y entrega del informe con una interfaz gráfica que expone versiones intermedias (borrador, correcciones y final) y facilita la pos–edición por el especialista. La evaluación se realizó sobre un conjunto de 100 informes con pares prompt–target (dictado con errores vs. versión corregida por experto). Frente a la configuración base sin especialización, el sistema propuesto mostró mejoras sustanciales en métricas automáticas: incrementos de hasta +112 % en BLEU y +77 % en ROUGE-2, además de aumentos consistentes en ROUGE-1 y ROUGE-L, lo que se traduce en menor necesidad de correcciones y mejor preservación de la estructura narrativa (hallazgo → localización → características). La arquitectura local demostró ser desplegable en CPU/GPU modestas, disminuyendo la dependencia de servicios externos y fortaleciendo la confidencialidad. En conjunto, la propuesta confirma la factibilidad técnica y la utilidad aplicada del enfoque para acelerar la elaboración de informes, elevar la consistencia terminológica y reducir la carga de pos–edición, sentando una base robusta para extensiones futuras por subespecialidad y para la incorporación de métricas clínicas específicas.

Generación de informes radiológicos mediante el reconocimiento de voz

Схожие документы