Text this: Servicios web para extracción de entidades desde contenido html. Piloto en sitios con recursos abiertos OCW