Wikigrep distribuido: búsquedas avanzadas en la Wikipedia

En este proyecto se ha elaborado un motor de búsqueda que soporta expresiones regulares y cuyo repositorio de datos es la Wikipedia la enciclopedia libre, el sistema permite el ingreso de una expresión regular y por medio de un requerimiento asíncrono inicializa un clúster EC2, hace el grep dentro d...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: ESPOL. FIEC (author)
Weitere Verfasser: Varas Palomeque, Irene Carolina (author), Paladines Herrera, Gabriel Antonio (author)
Format: bachelorThesis
Sprache:spa
Veröffentlicht: 2009
Online Zugang:http://www.dspace.espol.edu.ec/handle/123456789/8701
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
_version_ 1858337415391870976
author ESPOL. FIEC
author2 Varas Palomeque, Irene Carolina
Paladines Herrera, Gabriel Antonio
author2_role author
author
author_facet ESPOL. FIEC
Varas Palomeque, Irene Carolina
Paladines Herrera, Gabriel Antonio
author_role author
collection Repositorio Escuela Superior Politécnica del Litoral
dc.contributor.none.fl_str_mv Abad, Cristina, Directora
dc.creator.none.fl_str_mv ESPOL. FIEC
Varas Palomeque, Irene Carolina
Paladines Herrera, Gabriel Antonio
dc.date.none.fl_str_mv 2009
2010-01-12
2010-01-12
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://www.dspace.espol.edu.ec/handle/123456789/8701
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv ESPOL. FIEC
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Escuela Superior Politécnica del Litoral
instname:Escuela Superior Politécnica del Litoral
instacron:ESPOL
dc.title.none.fl_str_mv Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description En este proyecto se ha elaborado un motor de búsqueda que soporta expresiones regulares y cuyo repositorio de datos es la Wikipedia la enciclopedia libre, el sistema permite el ingreso de una expresión regular y por medio de un requerimiento asíncrono inicializa un clúster EC2, hace el grep dentro de todos los documentos y cuando obtiene la respuesta muestra a manera de lista los resultados, cada línea contiene el patrón encontrado y un enlace a la página de la Wikipedia del artículo. En el desarrollo de este proyecto se hace uso de los servicios de Amazon, de librerías desarrolladas en java para la manipulación de páginas de la Wikipedia, Hadoop framework y los datasets previamente cargados en Amazon. Se realizaron pruebas de búsquedas con varias expresiones regulares, estas búsquedas no fueron posibles de realizar en los motores de búsqueda tradicionales, ni en el motor de búsqueda de la propia Wikipedia, puesto que las expresiones regulares buscan texto que siga un patrón y no un texto específico. Las pruebas realizadas muestran que un sistema de búsquedas avanzadas puede ser implementado con un bajo costo y alta escalabilidad utilizando servicios de cloud computing y procesamiento masivo de datos.
eu_rights_str_mv openAccess
format bachelorThesis
id ESPOL_6c48e0daaf887fcbf0b57dc08db61345
instacron_str ESPOL
institution ESPOL
instname_str Escuela Superior Politécnica del Litoral
language spa
network_acronym_str ESPOL
network_name_str Repositorio Escuela Superior Politécnica del Litoral
oai_identifier_str oai:www.dspace.espol.edu.ec:123456789/8701
publishDate 2009
publisher.none.fl_str_mv ESPOL. FIEC
reponame_str Repositorio Escuela Superior Politécnica del Litoral
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Escuela Superior Politécnica del Litoral - Escuela Superior Politécnica del Litoral
repository_id_str 1479
spelling Wikigrep distribuido: búsquedas avanzadas en la WikipediaESPOL. FIECVaras Palomeque, Irene CarolinaPaladines Herrera, Gabriel AntonioEn este proyecto se ha elaborado un motor de búsqueda que soporta expresiones regulares y cuyo repositorio de datos es la Wikipedia la enciclopedia libre, el sistema permite el ingreso de una expresión regular y por medio de un requerimiento asíncrono inicializa un clúster EC2, hace el grep dentro de todos los documentos y cuando obtiene la respuesta muestra a manera de lista los resultados, cada línea contiene el patrón encontrado y un enlace a la página de la Wikipedia del artículo. En el desarrollo de este proyecto se hace uso de los servicios de Amazon, de librerías desarrolladas en java para la manipulación de páginas de la Wikipedia, Hadoop framework y los datasets previamente cargados en Amazon. Se realizaron pruebas de búsquedas con varias expresiones regulares, estas búsquedas no fueron posibles de realizar en los motores de búsqueda tradicionales, ni en el motor de búsqueda de la propia Wikipedia, puesto que las expresiones regulares buscan texto que siga un patrón y no un texto específico. Las pruebas realizadas muestran que un sistema de búsquedas avanzadas puede ser implementado con un bajo costo y alta escalabilidad utilizando servicios de cloud computing y procesamiento masivo de datos.ESPOL. FIECAbad, Cristina, Directora2010-01-122010-01-122009info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://www.dspace.espol.edu.ec/handle/123456789/8701spainfo:eu-repo/semantics/openAccessreponame:Repositorio Escuela Superior Politécnica del Litoralinstname:Escuela Superior Politécnica del Litoralinstacron:ESPOL2025-09-23T21:09:02Zoai:www.dspace.espol.edu.ec:123456789/8701Institucionalhttps://www.dspace.espol.edu.ec/Universidad públicahttps://www.espol.edu.ec/.https://www.dspace.espol.edu.ec/oaiEcuador...opendoar:14792025-09-23T21:09:02falseInstitucionalhttps://www.dspace.espol.edu.ec/Universidad públicahttps://www.espol.edu.ec/.https://www.dspace.espol.edu.ec/oai.Ecuador...opendoar:14792025-09-23T21:09:02Repositorio Escuela Superior Politécnica del Litoral - Escuela Superior Politécnica del Litoralfalse
spellingShingle Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
ESPOL. FIEC
status_str publishedVersion
title Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
title_full Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
title_fullStr Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
title_full_unstemmed Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
title_short Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
title_sort Wikigrep distribuido: búsquedas avanzadas en la Wikipedia
url http://www.dspace.espol.edu.ec/handle/123456789/8701