Desarrollo de un prototipo de dispositivo para reconocimiento de texto tipo imprenta y su conversión en audio orientado a personas con discapacidad visual mediante técnicas de visión artificial.
En el presente trabajo de titulación se desarrolló un prototipo para el reconocimiento de texto tipo imprenta con sintetizador de voz orientado a personas con discapacidad visual empleando técnicas de visión artificial. El prototipo fue construido utilizando una computadora de placa reducida denomin...
Salvato in:
| Autore principale: | |
|---|---|
| Natura: | bachelorThesis |
| Lingua: | spa |
| Pubblicazione: |
2022
|
| Soggetti: | |
| Accesso online: | https://dspace.espoch.edu.ec/handle/123456789/21272 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
| Riassunto: | En el presente trabajo de titulación se desarrolló un prototipo para el reconocimiento de texto tipo imprenta con sintetizador de voz orientado a personas con discapacidad visual empleando técnicas de visión artificial. El prototipo fue construido utilizando una computadora de placa reducida denominada Raspberry Pi 3B+, que es de fácil acceso, con un software libre de Linux llamado Raspbian. Se instalará en Raspbian el software Python que permitirá realizar el programa que consiste en reconocer caracteres partiendo de la captura de una imagen de texto a través del algoritmo Tesseract de OCR. El algoritmo extraerá de la imagen el texto para después por medio de GTTS (Google Text to Speech) convertirlo en audio en forma de voz para que el usuario pueda acceder a la información. En cuanto al hardware, se diseñó una estructura capaz de contener los elementos electrónicos que forman parte del dispositivo como: Raspberry pi 3B+, cámara Raspberry Pi, tarjeta de desarrollo Arduino nano, altavoces, sensor final de carrera, switch, pulsador, LCD y un panel led que se encargara de la iluminación del sistema. Se realizó pruebas de funcionamiento con los tres tipos de fuentes más utilizados, Calibri, Times New Roman, y Arial, conjuntamente se determinó la iluminación correcta y el rango de distancia en que debe estar la cámara con respecto a la hoja de texto para obtener una buena eficiencia. Es así como con una iluminación superior a los 180 lúmenes, a una distancia de 25 ± 5 cm de la cámara, Calibri con un tamaño de 12 pts., en formato normal con un texto de 150 ± 50 palabras, tiene una eficiencia superior al 95%. Se recomienda realizar un aprendizaje offline automático denominado entrenador, haciendo que el algoritmo pueda aprender por sí solo. |
|---|