Implementación de un ambiente de ciencia de datos a través de la librería Open Source Rapids

Resumen: La Librería Open Source RAPIDS ejecuta canalizaciones de datos y análisis de extremo a extremo utilizando las principales características del poder de la GPU de NVIDIA, la librería maneja grandes volúmenes de información en tiempo real y trabaja con computación acelerada, su principal enfoq...

Full description

Saved in:
Bibliographic Details
Main Author: Guarnizo Romero, José Alberto (author)
Format: bachelorThesis
Language:spa
Published: 2021
Subjects:
Online Access:http://dspace.utpl.edu.ec/handle/20.500.11962/28657
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Resumen: La Librería Open Source RAPIDS ejecuta canalizaciones de datos y análisis de extremo a extremo utilizando las principales características del poder de la GPU de NVIDIA, la librería maneja grandes volúmenes de información en tiempo real y trabaja con computación acelerada, su principal enfoque es realizar una analítica de la información, utilizando el proceso de extracción, transformación y carga e implementar un conjunto de algoritmos Machine Learning; se da realce a sus principales funcionalidades, características y todo su conjunto de bibliotecas,además, se utilizó la Plataforma gratuita Cloud Blazing SQL para la implementación, donde resalta el proceso de construcción de un ambiente de ciencia de datos utilizando RAPIDS para los procesos deETL, Machine Learning y Visualización, se implemento una contraparte utilizando librerías que aún no tiene soporte para GPU como Pandas para el proceso de ETL, para el proceso de Machine Learning con Scikit-learny para la visualización con Matplotlib, la comparación con las librerías tradicionales permite resaltar la aceleración o rapidez que tiene RAPIDS cuando trabaja con grandes volúmenes de información.