Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.

“Universidad Técnica de Cotopaxi” is a higher education institution that develops scientific production through its research professors, because the results obtained are reflected in scientific papers like: research papers, published books and lectures. Studies are made because it is fundamental to...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Allauca Chaquinga, Jonny Javier (author)
Další autoři: Chicaiza Haro, Elsa Marisol (author)
Médium: bachelorThesis
Jazyk:spa
Vydáno: 2019
Témata:
On-line přístup:http://repositorio.utc.edu.ec/handle/27000/5752
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
_version_ 1859064065085669376
author Allauca Chaquinga, Jonny Javier
author2 Chicaiza Haro, Elsa Marisol
author2_role author
author_facet Allauca Chaquinga, Jonny Javier
Chicaiza Haro, Elsa Marisol
author_role author
collection Repositorio Universidad Técnica de Cotopaxi
dc.contributor.none.fl_str_mv Cevallos, Alex
dc.creator.none.fl_str_mv Allauca Chaquinga, Jonny Javier
Chicaiza Haro, Elsa Marisol
dc.date.none.fl_str_mv 2019-02
2020-08-04T18:58:19Z
2020-08-04T18:58:19Z
dc.format.none.fl_str_mv 156 páginas
application/pdf
dc.identifier.none.fl_str_mv Allauca Chaquinga. J.J. (2019) Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi. U.T.C. Latacuga. 156 p.
T-001132
http://repositorio.utc.edu.ec/handle/27000/5752
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Ecuador: Latacunga: Universidad Técnica de Cotopaxi: Facultad de Ciencias de la Ingeniería y Aplicadas
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Técnica de Cotopaxi
instname:Universidad Técnica de Cotopaxi
instacron:UTC
dc.subject.none.fl_str_mv Sistemas
Gestión de información
Cienciometría
Clasificación de texto
dc.title.none.fl_str_mv Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description “Universidad Técnica de Cotopaxi” is a higher education institution that develops scientific production through its research professors, because the results obtained are reflected in scientific papers like: research papers, published books and lectures. Studies are made because it is fundamental to produce scientific knowledge, not only for commitment but also because it generates a personal and institutional benefit. That`s why this process leads to a better information administration because in case of the high proliferation of data that is managed for the institution, it results difficult to be organized according to the research parameters that it belongs because it contains series of inconveniences, for example: consumes effort, time, money and sometimes it could be unworkable if the amount to classify is excessive. That`s why the principal proposal of this technological project is about the development of a scientific platform that allow us to gather a specific amount of substantial information and later implement an automatic classifying algorithm of text with which is possible to structure relevant data in a specific domain (class or categories). In order to obtain the fact aforementioned, research methods were used regarding development and text mining. Firstly, a documentary and explanatory study was carried out. In addition, research techniques such as interview and survey were applied in order to obtain truthful information. Secondly, the Scrum methodology was used, which helped to define the product backlog, which allowed to determine 8 functionalities that conceived the scientific platform: "EcuCiencia" to collect relevant data and finally the methodology Knowledge Discovery in DataBases (KDD) was applied making use of Machine Learning techniques to prepare the text, filter them, normalize them, label them, apply the algorithm of SVM classification and evaluation. As a result of the proposal implemented, it is determined that the scientific platform is able of storing transcendental information, currently it has 468 research papers, 152 books and 430 indexed lectures from which they have been extracted and processed for the development of a training model that served as a base in the automatic classification applied in the Engineering Major in Computer Systems, provoking in such a way that access to information is easier, organized and in less time. However, it is necessary to emphasize that the technological proposal is part of the research study "Red de Estudios Cienciométricos REDEC".
eu_rights_str_mv openAccess
format bachelorThesis
id UTC_0d5d1a291a875e2df7bd76d02b91bb51
identifier_str_mv Allauca Chaquinga. J.J. (2019) Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi. U.T.C. Latacuga. 156 p.
T-001132
instacron_str UTC
institution UTC
instname_str Universidad Técnica de Cotopaxi
language spa
network_acronym_str UTC
network_name_str Repositorio Universidad Técnica de Cotopaxi
oai_identifier_str oai:repositorio.utc.edu.ec:27000/5752
publishDate 2019
publisher.none.fl_str_mv Ecuador: Latacunga: Universidad Técnica de Cotopaxi: Facultad de Ciencias de la Ingeniería y Aplicadas
reponame_str Repositorio Universidad Técnica de Cotopaxi
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Técnica de Cotopaxi - Universidad Técnica de Cotopaxi
repository_id_str 0
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/ec/
spelling Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.Allauca Chaquinga, Jonny JavierChicaiza Haro, Elsa MarisolSistemasGestión de informaciónCienciometríaClasificación de texto“Universidad Técnica de Cotopaxi” is a higher education institution that develops scientific production through its research professors, because the results obtained are reflected in scientific papers like: research papers, published books and lectures. Studies are made because it is fundamental to produce scientific knowledge, not only for commitment but also because it generates a personal and institutional benefit. That`s why this process leads to a better information administration because in case of the high proliferation of data that is managed for the institution, it results difficult to be organized according to the research parameters that it belongs because it contains series of inconveniences, for example: consumes effort, time, money and sometimes it could be unworkable if the amount to classify is excessive. That`s why the principal proposal of this technological project is about the development of a scientific platform that allow us to gather a specific amount of substantial information and later implement an automatic classifying algorithm of text with which is possible to structure relevant data in a specific domain (class or categories). In order to obtain the fact aforementioned, research methods were used regarding development and text mining. Firstly, a documentary and explanatory study was carried out. In addition, research techniques such as interview and survey were applied in order to obtain truthful information. Secondly, the Scrum methodology was used, which helped to define the product backlog, which allowed to determine 8 functionalities that conceived the scientific platform: "EcuCiencia" to collect relevant data and finally the methodology Knowledge Discovery in DataBases (KDD) was applied making use of Machine Learning techniques to prepare the text, filter them, normalize them, label them, apply the algorithm of SVM classification and evaluation. As a result of the proposal implemented, it is determined that the scientific platform is able of storing transcendental information, currently it has 468 research papers, 152 books and 430 indexed lectures from which they have been extracted and processed for the development of a training model that served as a base in the automatic classification applied in the Engineering Major in Computer Systems, provoking in such a way that access to information is easier, organized and in less time. However, it is necessary to emphasize that the technological proposal is part of the research study "Red de Estudios Cienciométricos REDEC".La Universidad Técnica de Cotopaxi es una Institución de Educación Superior que desarrolla producción científica por parte de los docentes investigadores puesto que los resultados obtenidos reflejan en documentos científicos, tales como: artículos, libros y ponencias. Investigaciones que se realiza porque es fundamental generar conocimiento científico, no solo por compromiso si no porque proporciona beneficio personal como institucional. Es entonces que este proceso conlleva a una mejor administración de información porque debido a la alta proliferación de datos que maneja la Institución resulta conflictivo organizarla de acuerdo a las sub-líneas de investigación a la que pertenece porque involucra una serie de inconvenientes como, por ejemplo: consume esfuerzo, tiempo, costo y en ocasiones impracticable si la cantidad a clasificar es extensa. Por tal motivo la presente propuesta tecnológica tiene como propósito desarrollar una plataforma científica que permita recolectar una cantidad determinada de información considerable y posteriormente implementar un algoritmo clasificador automático de textos que permite estructurar datos relevantes a un dominio específico (clase o categorías). Para conseguir lo mencionado, se utilizó métodos de investigación, de desarrollo y de minería de texto: en primer lugar, se realizó una investigación documental, explicativa, además técnicas de investigación como la entrevista y encuesta para obtener información veraz, en segundo lugar, se hizo uso de la metodología Scrum que ayudó a definir los product backlog lo que permitió determinar 8 funcionalidades que concibe la plataforma científica: “EcuCiencia” para recolectar datos relevantes y por último se aplicó la metodología Knowledge Discovery in DataBases ( KDD) haciendo uso de las técnicas de Machine Learning para preparar el texto, filtrarlas, normalizarlas, etiquetarlas, aplicación del algoritmo de clasificación SVM y evaluación. Como resultado de la propuesta implantada se determina que la plataforma científica es capaz de almacenar información trascendental, actualmente cuenta con 468 artículos científicos, 152 libros y 430 ponencias indexadas de los cuales han sido extraídos y procesados para el desarrollo de un modelo de entrenamiento que sirvió como base en la clasificación automática aplicada en la Carrera de Ingeniería en Sistemas Informáticos, provocando de tal manera que el acceso a la información sea más fácil, organizada y en menor tiempo. No obstante, se hace necesario destacar que la propuesta tecnológica forma parte del proyecto de investigación “Red de Estudios Cienciométricos REDEC”.Ecuador: Latacunga: Universidad Técnica de Cotopaxi: Facultad de Ciencias de la Ingeniería y AplicadasCevallos, Alex2020-08-04T18:58:19Z2020-08-04T18:58:19Z2019-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis156 páginasapplication/pdfAllauca Chaquinga. J.J. (2019) Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi. U.T.C. Latacuga. 156 p.T-001132http://repositorio.utc.edu.ec/handle/27000/5752spahttp://creativecommons.org/licenses/by-nc-sa/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Técnica de Cotopaxiinstname:Universidad Técnica de Cotopaxiinstacron:UTC2020-08-05T08:00:45Zoai:repositorio.utc.edu.ec:27000/5752Institucionalhttp://repositorio.utc.edu.ec/Universidad públicahttps://www.utc.edu.ec/..Ecuador...opendoar:02026-03-08T03:39:16.407991Repositorio Universidad Técnica de Cotopaxi - Universidad Técnica de Cotopaxitrue
spellingShingle Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
Allauca Chaquinga, Jonny Javier
Sistemas
Gestión de información
Cienciometría
Clasificación de texto
status_str publishedVersion
title Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
title_full Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
title_fullStr Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
title_full_unstemmed Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
title_short Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
title_sort Aplicación de algoritmo de extracción de textos en los perfiles de usuarios en caso de los investigadores de la Universidad Técnica de Cotopaxi.
topic Sistemas
Gestión de información
Cienciometría
Clasificación de texto
url http://repositorio.utc.edu.ec/handle/27000/5752