Creación de una base de datos para la evaluación del desempeño de algoritmos de reconocimiento de fórmulas matemáticas extraídas desde un archivo en formato PDF

 

Authors
Baca Espinosa, Michael Renato
Format
BachelorThesis
Status
publishedVersion
Description

En la actualidad el paso de información científica en su mayoría se da mediante artículos que en gran parte de los casos se encuentran en formato PDF, lo cual ha hecho que crezca la popularidad de dicho formato y que hace necesario manipular este tipo de documentos, tareas como extraer texto, tablas, figuras y fórmulas son ineludibles para ser analizadas y procesadas. Una de las tareas más importantes en la detección y reconocimiento de fórmulas matemáticas es identificar correctamente su ubicación dentro de un documento, uno de los principales problemas en todos estos trabajos dedicados a la detección de fórmulas es validar su desempeño ya que los programas y las bases de datos con las que se puede realizar la validación no son válidas o no son de uso libre. En este proyecto se busca mediante el procesamiento de archivos pdf y procesamiento digital de imágenes crear una base de datos que contenga posición y caracteres de fórmulas matemáticas extraídas de un archivo en formato PDF. Para eso se usará como base el trabajo propuesto por (Xiaoyan Lin L. G., 2012) para que nuevos algoritmos y los ya existentes de reconocimiento posición y caracteres de fórmulas matemáticas puedan ser evaluados o probados para tener un criterio equitativo de rendimiento.

Publication Year
2018
Language
spa
Topic
ALGORITMOS
PROGRAMACIÓN (MATEMÁTICAS)
ANÁLISIS MATEMÁTICO
ARCHIVO PDF
Repository
Repositorio Universidad de las Fuerzas Armadas
Get full text
http://repositorio.espe.edu.ec/handle/21000/13987
Rights
openAccess
License