Implementación de un Cluster Distribuido de Nodos a través de la herramienta Dask

Resumen:El crecimiento a pasos agigantados de la tecnología hace que el análisis y procesamiento de grandes volúmenes de datos sea un gran reto para muchos investigadores, según el sitio web Internet Live stats, que permite seguir Internet en directo, afirma que en un segundo se ha producido 58.836G...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Tác giả chính: Armijos Rengel, Dickson Fabian (author)
Định dạng: bachelorThesis
Ngôn ngữ:spa
Được phát hành: 2019
Những chủ đề:
Truy cập trực tuyến:http://dspace.utpl.edu.ec/handle/20.500.11962/24105
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Miêu tả
Tóm tắt:Resumen:El crecimiento a pasos agigantados de la tecnología hace que el análisis y procesamiento de grandes volúmenes de datos sea un gran reto para muchos investigadores, según el sitio web Internet Live stats, que permite seguir Internet en directo, afirma que en un segundo se ha producido 58.836GB de tráfico en Internet, que se han escrito 8.101 tweets, subido 855 fotos a Instagram, realizado 3.228 llamadas por Skype, 68.006 búsquedas de Google. Con la enorme cantidad de datos que se genera día a día produce que el tratamiento de grandes volúmenes de datos por parte de empresas y grupos de investigación, hagan uso de herramientas que permiten enfrentarse a estos nuevos retos tecnológicos, con la finalidad de realizar un análisis de dicha información. En el presente trabajo de titulación se propone el uso de una herramienta denominada Dask vinculada en la filosofía del lenguaje de programación Python, para el análisis de grandes volúmenes de información a través de un cluster Distribuido de Nodos.