Implementación de un ambiente de ciencia de datos a través de la librería Open Source Rapids

Resumen: La Librería Open Source RAPIDS ejecuta canalizaciones de datos y análisis de extremo a extremo utilizando las principales características del poder de la GPU de NVIDIA, la librería maneja grandes volúmenes de información en tiempo real y trabaja con computación acelerada, su principal enfoq...

Descripció completa

Guardat en:
Dades bibliogràfiques
Autor principal: Guarnizo Romero, José Alberto (author)
Format: bachelorThesis
Idioma:spa
Publicat: 2021
Matèries:
Accés en línia:http://dspace.utpl.edu.ec/handle/20.500.11962/28657
Etiquetes: Afegir etiqueta
Sense etiquetes, Sigues el primer a etiquetar aquest registre!
Descripció
Sumari:Resumen: La Librería Open Source RAPIDS ejecuta canalizaciones de datos y análisis de extremo a extremo utilizando las principales características del poder de la GPU de NVIDIA, la librería maneja grandes volúmenes de información en tiempo real y trabaja con computación acelerada, su principal enfoque es realizar una analítica de la información, utilizando el proceso de extracción, transformación y carga e implementar un conjunto de algoritmos Machine Learning; se da realce a sus principales funcionalidades, características y todo su conjunto de bibliotecas,además, se utilizó la Plataforma gratuita Cloud Blazing SQL para la implementación, donde resalta el proceso de construcción de un ambiente de ciencia de datos utilizando RAPIDS para los procesos deETL, Machine Learning y Visualización, se implemento una contraparte utilizando librerías que aún no tiene soporte para GPU como Pandas para el proceso de ETL, para el proceso de Machine Learning con Scikit-learny para la visualización con Matplotlib, la comparación con las librerías tradicionales permite resaltar la aceleración o rapidez que tiene RAPIDS cuando trabaja con grandes volúmenes de información.