Implementación de un ambiente de ciencia de datos a través de la librería Open Source Rapids

Resumen: La Librería Open Source RAPIDS ejecuta canalizaciones de datos y análisis de extremo a extremo utilizando las principales características del poder de la GPU de NVIDIA, la librería maneja grandes volúmenes de información en tiempo real y trabaja con computación acelerada, su principal enfoq...

Cijeli opis

Spremljeno u:
Bibliografski detalji
Glavni autor: Guarnizo Romero, José Alberto (author)
Format: bachelorThesis
Jezik:spa
Izdano: 2021
Teme:
Online pristup:http://dspace.utpl.edu.ec/handle/20.500.11962/28581
Oznake: Dodaj oznaku
Bez oznaka, Budi prvi tko označuje ovaj zapis!
Opis
Sažetak:Resumen: La Librería Open Source RAPIDS ejecuta canalizaciones de datos y análisis de extremo a extremo utilizando las principales características del poder de la GPU de NVIDIA, la librería maneja grandes volúmenes de información en tiempo real y trabaja con computación acelerada, su principal enfoque es realizar una analítica de la información, utilizando el proceso de extracción, transformación y carga e implementar un conjunto de algoritmos Machine Learning; se da realce a sus principales funcionalidades, características y todo su conjunto de bibliotecas,además, se utilizó la Plataforma gratuita Cloud Blazing SQL para la implementación, donde resalta el proceso de construcción de un ambiente de ciencia de datos utilizando RAPIDS para los procesos deETL, Machine Learning y Visualización, se implemento una contraparte utilizando librerías que aún no tiene soporte para GPU como Pandas para el proceso de ETL, para el proceso de Machine Learning con Scikit-learny para la visualización con Matplotlib, la comparación con las librerías tradicionales permite resaltar la aceleración o rapidez que tiene RAPIDS cuando trabaja con grandes volúmenes de información.