Implementación del framework Apache Flink para el procesamiento de grandes cantidades de datos en tiempo real

Resumen: En la época actual existe la producción de grandes cantidades de información que son procedentes de diferentes fuentes como: bancos, entidades, negocios, páginas web, redes sociales, entro otros, siendo las redes sociales las que mayor volumen de informaciónproducen. El destino de estos gra...

وصف كامل

محفوظ في:
التفاصيل البيبلوغرافية
المؤلف الرئيسي: Solano Rivera, Elder Fidel (author)
التنسيق: bachelorThesis
اللغة:spa
منشور في: 2020
الموضوعات:
الوصول للمادة أونلاين:http://dspace.utpl.edu.ec/handle/20.500.11962/26651
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
الوصف
الملخص:Resumen: En la época actual existe la producción de grandes cantidades de información que son procedentes de diferentes fuentes como: bancos, entidades, negocios, páginas web, redes sociales, entro otros, siendo las redes sociales las que mayor volumen de informaciónproducen. El destino de estos grandes volúmenes de información es el almacenamiento y respaldo, provocandoque no exista un uso adecuado para el procesamiento y extracción de información de manera rápida y fiable. En el presente trabajo de titulación se realiza la implementación del Framework Apache Flink, que integra elAPI DataStream la cualpermite realizar el procesamiento de flujos de datos en tiempo real, utilizando operadores y funciones propias de esta API para cumplir con este tipo de procesamiento y mostrar resultados de forma automática. La implementación del entorno de operación de esta herramientase la realiza en un solo nodo o host, y mediante el uso de los diferentes escenarios de prueba planteados en el presente proyecto, se logradeterminar que Apache Flink realiza el procesamiento de flujos de datos de manera eficiente y cumple con las expectativas planificadas.