Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW

Diseño e implementación de una aplicación y tres servicios web para la extracción de entidades a partir de contenido HTML, alojados en un del Laboratorio De Tecnologías Avanzadas en la Web y SBC de la UTPL e implementados mediante Python. Con este trabajo se busca facilitar la extracción de informac...

Fuld beskrivelse

Saved in:
Bibliografiske detaljer
Hovedforfatter: Zaruma Sozoranga, Jhonny Alonso (author)
Format: bachelorThesis
Sprog:spa
Udgivet: 2014
Fag:
Online adgang:http://dspace.utpl.edu.ec/handle/123456789/10879
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
_version_ 1858364452955488256
author Zaruma Sozoranga, Jhonny Alonso
author_facet Zaruma Sozoranga, Jhonny Alonso
author_role author
collection Repositorio Universidad Técnica Particular de Loja
dc.contributor.none.fl_str_mv Piedra Pullaguari, Nelson Oswaldo
dc.creator.none.fl_str_mv Zaruma Sozoranga, Jhonny Alonso
dc.date.none.fl_str_mv 2014-11-12T19:41:54Z
2014-11-12
2014
dc.identifier.none.fl_str_mv Zaruma Sozoranga, Jhonny Alonso. (2014). Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW. (Trabajo de Fin de Titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL. Loja. 114pp.
1152263
http://dspace.utpl.edu.ec/handle/123456789/10879
dc.language.none.fl_str_mv spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Técnica Particular de Loja
instname:Universidad Técnica Particular de Loja
instacron:UTPL
dc.subject.none.fl_str_mv Web
Servicios web
Recursos educativos abiertos
Web Semántica
Ingeniero en Sistemas Informáticos y Computación- Tesis – Disertaciones académicas
dc.title.none.fl_str_mv Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description Diseño e implementación de una aplicación y tres servicios web para la extracción de entidades a partir de contenido HTML, alojados en un del Laboratorio De Tecnologías Avanzadas en la Web y SBC de la UTPL e implementados mediante Python. Con este trabajo se busca facilitar la extracción de información clave dentro del contenido HTML y el enriquecimiento del mismo. Se desarrollaron tres servicios web para este fin: uno para descomponer el texto con la finalidad de etiquetar las palabras, un segundo para procesar las palabras etiquetadas y posteriormente extraer entidades y el contexto del que fueron tomadas, y un tercero para desambiguar y enlazar con la Dbpedia para enriquecer el contenido; los tres servicios han sido descritos con anotaciones semánticas, para que puedan permitir la interoperabilidad entre los servicios existentes. Al implementarse el piloto de este proyecto en sitios con recursos abiertos OCW, esta investigación constituye un referente para futuros proyectos que se desarrollen a partir de la extracción de entidades y el enriquecimiento de contenido.
eu_rights_str_mv openAccess
format bachelorThesis
id UTPL_1d4312fba929f37abca00621ea01ac39
identifier_str_mv Zaruma Sozoranga, Jhonny Alonso. (2014). Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW. (Trabajo de Fin de Titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL. Loja. 114pp.
1152263
instacron_str UTPL
institution UTPL
instname_str Universidad Técnica Particular de Loja
language spa
network_acronym_str UTPL
network_name_str Repositorio Universidad Técnica Particular de Loja
oai_identifier_str oai:dspace.utpl.edu.ec:123456789/10879
publishDate 2014
reponame_str Repositorio Universidad Técnica Particular de Loja
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Técnica Particular de Loja - Universidad Técnica Particular de Loja
repository_id_str 1227
spelling Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCWZaruma Sozoranga, Jhonny AlonsoWebServicios webRecursos educativos abiertosWeb SemánticaIngeniero en Sistemas Informáticos y Computación- Tesis – Disertaciones académicasDiseño e implementación de una aplicación y tres servicios web para la extracción de entidades a partir de contenido HTML, alojados en un del Laboratorio De Tecnologías Avanzadas en la Web y SBC de la UTPL e implementados mediante Python. Con este trabajo se busca facilitar la extracción de información clave dentro del contenido HTML y el enriquecimiento del mismo. Se desarrollaron tres servicios web para este fin: uno para descomponer el texto con la finalidad de etiquetar las palabras, un segundo para procesar las palabras etiquetadas y posteriormente extraer entidades y el contexto del que fueron tomadas, y un tercero para desambiguar y enlazar con la Dbpedia para enriquecer el contenido; los tres servicios han sido descritos con anotaciones semánticas, para que puedan permitir la interoperabilidad entre los servicios existentes. Al implementarse el piloto de este proyecto en sitios con recursos abiertos OCW, esta investigación constituye un referente para futuros proyectos que se desarrollen a partir de la extracción de entidades y el enriquecimiento de contenido.Design and implementation of an application and three Web services for extracting features from HTML content, housed in a SBC Advanced Technologies Laboratory Web and UTPL and implemented using Python. This work is to facilitate the extraction of key information within the HTML content and enrich it. Three web services for this purpose were developed: one to break the text in order to label the words a second to process the tagged words and then extract entities and the context from which they were taken, and a third to disambiguate and join the dbpedia to enrich the content; the three services are described with semantic annotations, so they can enable interoperability between existing services. By implementing the pilot project in open source OCW sites, this research provides a benchmark for future projects developed from entity extraction and enrichment of content.Piedra Pullaguari, Nelson Oswaldo2014-11-12T19:41:54Z2014-11-122014info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisZaruma Sozoranga, Jhonny Alonso. (2014). Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW. (Trabajo de Fin de Titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL. Loja. 114pp.1152263http://dspace.utpl.edu.ec/handle/123456789/10879spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad Técnica Particular de Lojainstname:Universidad Técnica Particular de Lojainstacron:UTPL2014-11-12T19:41:54Zoai:dspace.utpl.edu.ec:123456789/10879Institucionalhttps://dspace.utpl.edu.ec/Institución privadahttps://www.utpl.edu.ec/https://dspace.utpl.edu.ec/oai.Ecuador...opendoar:12272014-11-12T19:41:54Repositorio Universidad Técnica Particular de Loja - Universidad Técnica Particular de Lojafalse
spellingShingle Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
Zaruma Sozoranga, Jhonny Alonso
Web
Servicios web
Recursos educativos abiertos
Web Semántica
Ingeniero en Sistemas Informáticos y Computación- Tesis – Disertaciones académicas
status_str publishedVersion
title Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
title_full Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
title_fullStr Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
title_full_unstemmed Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
title_short Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
title_sort Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW
topic Web
Servicios web
Recursos educativos abiertos
Web Semántica
Ingeniero en Sistemas Informáticos y Computación- Tesis – Disertaciones académicas
url http://dspace.utpl.edu.ec/handle/123456789/10879