Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.

This study presents a comparative analysis between two prominent optical character recognition (OCR) technologies, Tesseract OCR and Abbyy FineReader, with the objective of determining which offers the best efficiency and speed in mass digitization of various documents. A comprehensive evaluation of...

Popoln opis

Shranjeno v:
Bibliografske podrobnosti
Glavni avtor: Ronquillo Duche, Gerson Daniel (author)
Format: bachelorThesis
Izdano: 2024
Teme:
Online dostop:http://dspace.utb.edu.ec/handle/49000/15668
Oznake: Označite
Brez oznak, prvi označite!
_version_ 1858410388213727232
author Ronquillo Duche, Gerson Daniel
author_facet Ronquillo Duche, Gerson Daniel
author_role author
collection Repositorio Universidad Técnica de Babahoyo
dc.contributor.none.fl_str_mv Ruiz Parrales, Iván Rubén
dc.creator.none.fl_str_mv Ronquillo Duche, Gerson Daniel
dc.date.none.fl_str_mv 2024-03-14T19:53:56Z
2024-03-14T19:53:56Z
2024
dc.format.none.fl_str_mv 46 p.
application/pdf
dc.identifier.none.fl_str_mv http://dspace.utb.edu.ec/handle/49000/15668
dc.language.none.fl_str_mv es
dc.publisher.none.fl_str_mv Babahoyo: UTB-FAFI. 2024
dc.rights.none.fl_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Técnica de Babahoyo
instname:Universidad Técnica de Babahoyo
instacron:UTB
dc.subject.none.fl_str_mv Tesseract OCR
Abbyy FineReader
Reconocimiento Óptico de Caracteres
Digitalización de Documentos
Eficiencia
Velocidad
Precisión
Adaptabilidad
dc.title.none.fl_str_mv Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description This study presents a comparative analysis between two prominent optical character recognition (OCR) technologies, Tesseract OCR and Abbyy FineReader, with the objective of determining which offers the best efficiency and speed in mass digitization of various documents. A comprehensive evaluation of both technologies was conducted using a representative sample of documents including contracts, reports, forms, and other formats common in business and government environments. The main variables measured were text recognition accuracy, processing speed, and adaptability to different document formats. Standard OCR metrics were applied, such as character and word error rate, as well as the time required to digitize batches of documents. Additionally, detailed surveys and comparative analyzes were conducted to evaluate the adaptability of each technology. The results show that Abbyy FineReader significantly outperforms Tesseract OCR in terms of accuracy, processing speed, and adaptability to different document formats, making it the preferred choice for mass scanning in business and government environments.
eu_rights_str_mv openAccess
format bachelorThesis
id UTB_ddf43d24d8d2f6e505d6c4badbb2a372
instacron_str UTB
institution UTB
instname_str Universidad Técnica de Babahoyo
language_invalid_str_mv es
network_acronym_str UTB
network_name_str Repositorio Universidad Técnica de Babahoyo
oai_identifier_str oai:dspace.utb.edu.ec:49000/15668
publishDate 2024
publisher.none.fl_str_mv Babahoyo: UTB-FAFI. 2024
reponame_str Repositorio Universidad Técnica de Babahoyo
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Técnica de Babahoyo - Universidad Técnica de Babahoyo
repository_id_str 0
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 3.0 Ecuador
http://creativecommons.org/licenses/by-nc-nd/3.0/ec/
spelling Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.Ronquillo Duche, Gerson DanielTesseract OCRAbbyy FineReaderReconocimiento Óptico de CaracteresDigitalización de DocumentosEficienciaVelocidadPrecisiónAdaptabilidadThis study presents a comparative analysis between two prominent optical character recognition (OCR) technologies, Tesseract OCR and Abbyy FineReader, with the objective of determining which offers the best efficiency and speed in mass digitization of various documents. A comprehensive evaluation of both technologies was conducted using a representative sample of documents including contracts, reports, forms, and other formats common in business and government environments. The main variables measured were text recognition accuracy, processing speed, and adaptability to different document formats. Standard OCR metrics were applied, such as character and word error rate, as well as the time required to digitize batches of documents. Additionally, detailed surveys and comparative analyzes were conducted to evaluate the adaptability of each technology. The results show that Abbyy FineReader significantly outperforms Tesseract OCR in terms of accuracy, processing speed, and adaptability to different document formats, making it the preferred choice for mass scanning in business and government environments.This study presents a comparative analysis between two prominent optical character recognition (OCR) technologies, Tesseract OCR and Abbyy FineReader, with the objective of determining which offers the best efficiency and speed in mass digitization of various documents. A comprehensive evaluation of both technologies was conducted using a representative sample of documents including contracts, reports, forms, and other formats common in business and government environments. The main variables measured were text recognition accuracy, processing speed, and adaptability to different document formats. Standard OCR metrics were applied, such as character and word error rate, as well as the time required to digitize batches of documents. Additionally, detailed surveys and comparative analyzes were conducted to evaluate the adaptability of each technology. The results show that Abbyy FineReader significantly outperforms Tesseract OCR in terms of accuracy, processing speed, and adaptability to different document formats, making it the preferred choice for mass scanning in business and government environments.Este estudio presenta un análisis comparativo entre dos tecnologías prominentes de reconocimiento óptico de caracteres (OCR), Tesseract OCR y Abbyy FineReader, con el objetivo de determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados. Se llevó a cabo una evaluación exhaustiva de ambas tecnologías utilizando una muestra representativa de documentos que incluyen contratos, informes, formularios y otros formatos comunes en entornos empresariales y gubernamentales. Las variables principales medidas fueron la precisión en el reconocimiento de texto, la velocidad de procesamiento y la adaptabilidad a diferentes formatos de documentos. Se aplicaron métricas estándar de OCR, como la tasa de error de caracteres y palabras, así como el tiempo necesario para digitalizar lotes de documentos. Además, se realizaron encuestas y análisis comparativos detallados para evaluar la adaptabilidad de cada tecnología. Los resultados muestran que Abbyy FineReader supera significativamente a Tesseract OCR en términos de precisión, velocidad de procesamiento y adaptabilidad a diferentes formatos de documentos, lo que lo convierte en la opción preferida para la digitalización masiva en entornos empresariales y gubernamentales.Babahoyo: UTB-FAFI. 2024Ruiz Parrales, Iván Rubén2024-03-14T19:53:56Z2024-03-14T19:53:56Z2024info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis46 p.application/pdfhttp://dspace.utb.edu.ec/handle/49000/15668esAtribución-NoComercial-SinDerivadas 3.0 Ecuadorhttp://creativecommons.org/licenses/by-nc-nd/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Técnica de Babahoyoinstname:Universidad Técnica de Babahoyoinstacron:UTB2024-03-15T08:01:26Zoai:dspace.utb.edu.ec:49000/15668Institucionalhttp://dspace.utb.edu.ec/Universidad públicahttps://utb.edu.ec/http://dspace.utb.edu.ec/oai.Ecuador...opendoar:02026-02-28T22:22:51.152528Repositorio Universidad Técnica de Babahoyo - Universidad Técnica de Babahoyotrue
spellingShingle Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
Ronquillo Duche, Gerson Daniel
Tesseract OCR
Abbyy FineReader
Reconocimiento Óptico de Caracteres
Digitalización de Documentos
Eficiencia
Velocidad
Precisión
Adaptabilidad
status_str publishedVersion
title Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
title_full Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
title_fullStr Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
title_full_unstemmed Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
title_short Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
title_sort Análisis comparativo entre las tecnologías Tesseract OCR y Abbyy FineReader, para determinar cuál ofrece la mejor eficiencia y velocidad en la digitalización masiva de documentos variados.
topic Tesseract OCR
Abbyy FineReader
Reconocimiento Óptico de Caracteres
Digitalización de Documentos
Eficiencia
Velocidad
Precisión
Adaptabilidad
url http://dspace.utb.edu.ec/handle/49000/15668