Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.

Along with the increasing number of digital documents that are generated daily in companies, organizations and institutions, arises the necessity to analyze and extract relevant information. This process leads to better management and organization of these data. Therefore this work is focused on est...

Fuld beskrivelse

Saved in:
Bibliografiske detaljer
Hovedforfatter: Ortega Capa, Walter Rodrigo (author)
Format: bachelorThesis
Sprog:spa
Udgivet: 2015
Fag:
Online adgang:http://dspace.utpl.edu.ec/handle/123456789/11679
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
_version_ 1858999266960211968
author Ortega Capa, Walter Rodrigo
author_facet Ortega Capa, Walter Rodrigo
author_role author
collection Repositorio Universidad Técnica Particular de Loja
dc.contributor.none.fl_str_mv Reátegui Rojas, Ruth María
dc.creator.none.fl_str_mv Ortega Capa, Walter Rodrigo
dc.date.none.fl_str_mv 2015-03-13T22:39:56Z
2015-03-13
2015
dc.identifier.none.fl_str_mv Ortega Capa, Walter Rodrigo. (2015). Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital. (Trabajo de fin de titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL. Loja. 90pp.
1156528
http://dspace.utpl.edu.ec/handle/123456789/11679
dc.language.none.fl_str_mv spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Técnica Particular de Loja
instname:Universidad Técnica Particular de Loja
instacron:UTPL
dc.subject.none.fl_str_mv Cuestionarios digitales
Lenguaje natural – Procesamiento
Minería de texto
CRISP-MD – Metodología
Ingeniero de sistemas informáticos y computación – Tesis y disertaciones académicas
dc.title.none.fl_str_mv Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description Along with the increasing number of digital documents that are generated daily in companies, organizations and institutions, arises the necessity to analyze and extract relevant information. This process leads to better management and organization of these data. Therefore this work is focused on establishing a reference guide for the automatic classification of digital questionnaires concerning Discrete Mathematics First Bimestre of the Open Method of the Universidad Técnica Particular de Loja. For the development of this project is the use the CRISP-DM methodology (acronym in English, Cross Industry Standard Process for Data Mining) using text mining techniques (Text Mining) and Natural Language Processing (Natural Language Processing) . The representation of the data is performed by the TDM (Matrix -Term Document) method. Among the best text classification algorithms in Weka, we can mention the DMNtext-I1 and NavieBayesMultinominalUpdateable as between the results of these two algorithms have similarities in their final values Accuracy 0.847, 0.824 and 0.436 Recall of accuary, so both have a 0177 error. These values are the product of the Percentage Split configuration of 66%, 66 training data and 34 test data.
eu_rights_str_mv openAccess
format bachelorThesis
id UTPL_325cd5f0cf6a298c74cc43559ca85f35
identifier_str_mv Ortega Capa, Walter Rodrigo. (2015). Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital. (Trabajo de fin de titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL. Loja. 90pp.
1156528
instacron_str UTPL
institution UTPL
instname_str Universidad Técnica Particular de Loja
language spa
network_acronym_str UTPL
network_name_str Repositorio Universidad Técnica Particular de Loja
oai_identifier_str oai:dspace.utpl.edu.ec:123456789/11679
publishDate 2015
reponame_str Repositorio Universidad Técnica Particular de Loja
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Técnica Particular de Loja - Universidad Técnica Particular de Loja
repository_id_str 1227
spelling Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.Ortega Capa, Walter RodrigoCuestionarios digitalesLenguaje natural – ProcesamientoMinería de textoCRISP-MD – MetodologíaIngeniero de sistemas informáticos y computación – Tesis y disertaciones académicasAlong with the increasing number of digital documents that are generated daily in companies, organizations and institutions, arises the necessity to analyze and extract relevant information. This process leads to better management and organization of these data. Therefore this work is focused on establishing a reference guide for the automatic classification of digital questionnaires concerning Discrete Mathematics First Bimestre of the Open Method of the Universidad Técnica Particular de Loja. For the development of this project is the use the CRISP-DM methodology (acronym in English, Cross Industry Standard Process for Data Mining) using text mining techniques (Text Mining) and Natural Language Processing (Natural Language Processing) . The representation of the data is performed by the TDM (Matrix -Term Document) method. Among the best text classification algorithms in Weka, we can mention the DMNtext-I1 and NavieBayesMultinominalUpdateable as between the results of these two algorithms have similarities in their final values Accuracy 0.847, 0.824 and 0.436 Recall of accuary, so both have a 0177 error. These values are the product of the Percentage Split configuration of 66%, 66 training data and 34 test data.Junto con el creciente número de documentos digitales que se generan día a día en las empresas, organizaciones e instituciones surge la necesidad de analizarlos y de extraer información relevante. Este proceso conlleva a una mejor gestión y organización de estos datos. Por tal motivo este trabajo está enfocado en establecer una guía de referencia para la clasificación automática de cuestionarios digitales de la materia de Matemáticas Discretas del Primer Bimestre de la Modalidad Abierta de la Universidad Técnica Particular de Loja. Para el desarrollo de este proyecto se ha utilizado la metodología CRISP-MD (Siglas en inglés, Cross Industry Standard Process for Data Mining) haciendo uso de técnicas de Minería de Texto y de Procesamiento de Lenguaje Natural (PLN). La representación de los datos se realizó mediante los métodos TDM (Matrix -Term Document). Dentro de los mejores algoritmos de clasificación de texto en Weka, se puede mencionar el DMNtext-I1 and NavieBayesMultinominalUpdateable, ya que entre los resultados obtenidos estos dos algoritmos presentan similitudes en sus valores finales Precisión de 0.847, Recall 0.824 y 0.436 de Accuary, por lo tanto se tiene un Error de 0.177. Estos valores son producto de la configuración Porcentaje Split de 66%, datos de entrenamiento 66 y 34 datos de prueba.Reátegui Rojas, Ruth María2015-03-13T22:39:56Z2015-03-132015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisOrtega Capa, Walter Rodrigo. (2015). Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital. (Trabajo de fin de titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL. Loja. 90pp.1156528http://dspace.utpl.edu.ec/handle/123456789/11679spainfo:eu-repo/semantics/openAccessreponame:Repositorio Universidad Técnica Particular de Lojainstname:Universidad Técnica Particular de Lojainstacron:UTPL2015-03-13T22:39:56Zoai:dspace.utpl.edu.ec:123456789/11679Institucionalhttps://dspace.utpl.edu.ec/Institución privadahttps://www.utpl.edu.ec/https://dspace.utpl.edu.ec/oai.Ecuador...opendoar:12272015-03-13T22:39:56Repositorio Universidad Técnica Particular de Loja - Universidad Técnica Particular de Lojafalse
spellingShingle Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
Ortega Capa, Walter Rodrigo
Cuestionarios digitales
Lenguaje natural – Procesamiento
Minería de texto
CRISP-MD – Metodología
Ingeniero de sistemas informáticos y computación – Tesis y disertaciones académicas
status_str publishedVersion
title Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
title_full Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
title_fullStr Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
title_full_unstemmed Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
title_short Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
title_sort Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.
topic Cuestionarios digitales
Lenguaje natural – Procesamiento
Minería de texto
CRISP-MD – Metodología
Ingeniero de sistemas informáticos y computación – Tesis y disertaciones académicas
url http://dspace.utpl.edu.ec/handle/123456789/11679