Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam

Este proyecto propone un modelo de análisis de los archivos que sigan el formato de un correo electrónico, según la norma RFC822 con el fin de determinar posibles mensajes spam. Para el filtrado de los mismos hemos utilizado la plataforma Apache Hadoop junto con la plataforma para analizar grandes c...

Descrizione completa

Salvato in:
Dettagli Bibliografici
Autore principale: ESPOL. FIEC (author)
Altri autori: Crespo Pinancela, Gustavo Javier (author), Veliz Moncada, Susana Maria (author)
Natura: bachelorThesis
Lingua:spa
Pubblicazione: 2012
Soggetti:
Accesso online:http://www.dspace.espol.edu.ec/xmlui/handle/123456789/45649
Tags: Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
_version_ 1858337407949078528
author ESPOL. FIEC
author2 Crespo Pinancela, Gustavo Javier
Veliz Moncada, Susana Maria
author2_role author
author
author_facet ESPOL. FIEC
Crespo Pinancela, Gustavo Javier
Veliz Moncada, Susana Maria
author_role author
collection Repositorio Escuela Superior Politécnica del Litoral
dc.contributor.none.fl_str_mv Mendoza Morales, Luis, Director
dc.creator.none.fl_str_mv ESPOL. FIEC
Crespo Pinancela, Gustavo Javier
Veliz Moncada, Susana Maria
dc.date.none.fl_str_mv 2012
2018-11-29T15:29:03Z
2018-11-29T15:29:03Z
dc.format.none.fl_str_mv application/pdf
68
application/pdf
dc.identifier.none.fl_str_mv Crespo Pinancela, Gustavo Javier; Veliz Moncada, Susana Maria (2012). Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam. Trabajo final para la obtención del título: Ingeniero en Ciencias Computacionales Especialización Sistemas de Información. ESPOL. FIEC, Guayaquil. 68p.
http://www.dspace.espol.edu.ec/xmlui/handle/123456789/45649
D-83398
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv ESPOL. FIEC
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Escuela Superior Politécnica del Litoral
instname:Escuela Superior Politécnica del Litoral
instacron:ESPOL
dc.subject.none.fl_str_mv HTML
MENSAJES ELECTRONICOS
HADOOP
WEB SPAM
dc.title.none.fl_str_mv Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description Este proyecto propone un modelo de análisis de los archivos que sigan el formato de un correo electrónico, según la norma RFC822 con el fin de determinar posibles mensajes spam. Para el filtrado de los mismos hemos utilizado la plataforma Apache Hadoop junto con la plataforma para analizar grandes cantidades de datos en un lenguaje de alto nivel Apache Pig. Para este estudio, obtuvimos una cantidad predeterminada de correos con y sin spam. Se realizó un análisis utilizando la metodología de filtros bayesianos aplicados a los mensajes electrónicas introducida por el ensayista, programador, diseñador de lenguajes y co-fundadador de viaweb Paul Graham, en modo stand alone así como en multinodo para ver las diferencias de tiempos de ejecución con uno y varios computadores. El conocimiento previo de la cantidad exacta de spam nos permitió determinar el grado de exactitud de nuestro filtro.
eu_rights_str_mv openAccess
format bachelorThesis
id ESPOL_4314d2e0ffc022a055f6f03a930e7900
identifier_str_mv Crespo Pinancela, Gustavo Javier; Veliz Moncada, Susana Maria (2012). Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam. Trabajo final para la obtención del título: Ingeniero en Ciencias Computacionales Especialización Sistemas de Información. ESPOL. FIEC, Guayaquil. 68p.
D-83398
instacron_str ESPOL
institution ESPOL
instname_str Escuela Superior Politécnica del Litoral
language spa
network_acronym_str ESPOL
network_name_str Repositorio Escuela Superior Politécnica del Litoral
oai_identifier_str oai:www.dspace.espol.edu.ec:123456789/45649
publishDate 2012
publisher.none.fl_str_mv ESPOL. FIEC
reponame_str Repositorio Escuela Superior Politécnica del Litoral
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Escuela Superior Politécnica del Litoral - Escuela Superior Politécnica del Litoral
repository_id_str 1479
spelling Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spamESPOL. FIECCrespo Pinancela, Gustavo JavierVeliz Moncada, Susana MariaHTMLMENSAJES ELECTRONICOSHADOOPWEB SPAMEste proyecto propone un modelo de análisis de los archivos que sigan el formato de un correo electrónico, según la norma RFC822 con el fin de determinar posibles mensajes spam. Para el filtrado de los mismos hemos utilizado la plataforma Apache Hadoop junto con la plataforma para analizar grandes cantidades de datos en un lenguaje de alto nivel Apache Pig. Para este estudio, obtuvimos una cantidad predeterminada de correos con y sin spam. Se realizó un análisis utilizando la metodología de filtros bayesianos aplicados a los mensajes electrónicas introducida por el ensayista, programador, diseñador de lenguajes y co-fundadador de viaweb Paul Graham, en modo stand alone así como en multinodo para ver las diferencias de tiempos de ejecución con uno y varios computadores. El conocimiento previo de la cantidad exacta de spam nos permitió determinar el grado de exactitud de nuestro filtro.GuayaquilIngeniero en Ciencias Computacionales Especialización Sistemas de InformaciónESPOL. FIECMendoza Morales, Luis, Director2018-11-29T15:29:03Z2018-11-29T15:29:03Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdf68application/pdfCrespo Pinancela, Gustavo Javier; Veliz Moncada, Susana Maria (2012). Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam. Trabajo final para la obtención del título: Ingeniero en Ciencias Computacionales Especialización Sistemas de Información. ESPOL. FIEC, Guayaquil. 68p.http://www.dspace.espol.edu.ec/xmlui/handle/123456789/45649D-83398spainfo:eu-repo/semantics/openAccessreponame:Repositorio Escuela Superior Politécnica del Litoralinstname:Escuela Superior Politécnica del Litoralinstacron:ESPOL2025-02-28T15:57:24Zoai:www.dspace.espol.edu.ec:123456789/45649Institucionalhttps://www.dspace.espol.edu.ec/Universidad públicahttps://www.espol.edu.ec/.https://www.dspace.espol.edu.ec/oaiEcuador...opendoar:14792025-02-28T15:57:24falseInstitucionalhttps://www.dspace.espol.edu.ec/Universidad públicahttps://www.espol.edu.ec/.https://www.dspace.espol.edu.ec/oai.Ecuador...opendoar:14792025-02-28T15:57:24Repositorio Escuela Superior Politécnica del Litoral - Escuela Superior Politécnica del Litoralfalse
spellingShingle Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
ESPOL. FIEC
HTML
MENSAJES ELECTRONICOS
HADOOP
WEB SPAM
status_str publishedVersion
title Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
title_full Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
title_fullStr Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
title_full_unstemmed Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
title_short Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
title_sort Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam
topic HTML
MENSAJES ELECTRONICOS
HADOOP
WEB SPAM
url http://www.dspace.espol.edu.ec/xmlui/handle/123456789/45649