Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.

The occurrence of traffic accidents represents a public health problem at national and regional level, causing human losses, in addition to the fact that every day is increasing worldwide, which is why it is appropriate to propose a study to determine what are the factors that cause the occurrence o...

Full beskrivning

Sparad:
Bibliografiska uppgifter
Huvudupphovsman: Torres Quezada, Yulissa Stefania (author)
Materialtyp: bachelorThesis
Språk:spa
Publicerad: 2022
Ämnen:
Länkar:https://dspace.unl.edu.ec/jspui/handle/123456789/24502
Taggar: Lägg till en tagg
Inga taggar, Lägg till första taggen!
_version_ 1857833071708995584
author Torres Quezada, Yulissa Stefania
author_facet Torres Quezada, Yulissa Stefania
author_role author
collection Repositorio Universidad Nacional de Loja
dc.contributor.none.fl_str_mv Cumbicus Pineda, Oscar Miguel
dc.creator.none.fl_str_mv Torres Quezada, Yulissa Stefania
dc.date.none.fl_str_mv 2022-01-14T20:38:39Z
2022-01-14T20:38:39Z
2022-01-14
dc.format.none.fl_str_mv 153 p.
application/pdf
dc.identifier.none.fl_str_mv https://dspace.unl.edu.ec/jspui/handle/123456789/24502
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad Nacional de Loja
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/ec/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Nacional de Loja
instname:Universidad Nacional de Loja
instacron:UNL
dc.subject.none.fl_str_mv <MINERÍA DE DATOS>< METODOLOGÍA KDD>< ÁRBOLES DE DECISIÓN> <REDES NEURONALES>< REDES BAYESIANAS><SINIESTROS DE TRÁNSITO EN ECUADOR>
dc.title.none.fl_str_mv Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description The occurrence of traffic accidents represents a public health problem at national and regional level, causing human losses, in addition to the fact that every day is increasing worldwide, which is why it is appropriate to propose a study to determine what are the factors that cause the occurrence of traffic accidents. The objective of this thesis is to apply data mining to determine the most influential factors in the occurrence of traffic accidents in Ecuador in the year 2020, this was carried out through five phases of the methodology of Knowledge Discovery in Databases (KDD) consisting of: search for information, data collection, database cleaning, application of data mining techniques and interpretation and presentation of results, whereby, through the establishment of guidelines for the search for information, the set of data collected by the National Transit Agency (ANT) was obtained, which includes the collection of police reports, designed and approved by each of the control entities, under the technical parameters established by the same institution, which is available on its official website. Using the OpenRefine and RStudio tools, the obtained data set was debugged, evaluating and determining the most useful and relevant variables for the object of study. The software tools used for the application of the data mining algorithms were SPSS Statistics and Weka. Seven predictive data mining techniques were applied: CHAID, Exhaustive CHAID, CRT, Multilayer Perceptron, Radial Basis Function, Naive Bayes and BayesNet. The evaluation of these algorithms was performed by comparing the results obtained by each one, in relation to performance metrics with respect to percentages of correct classification of instances and accuracy. The CHAID Exhaustive algorithm was the one that obtained the best results with a percentage of correct classification of 58.38% and 44.60% accuracy, with which the most important patterns in the data were identified and the possible associations between the variables collected were evaluated. Finally, the human factor was determined to be the most influential factor with a probability of occurrence of 69.64%. Keywords: Data mining, KDD methodology, Decision Trees, Neural Networks, Bayesian Networks, Traffic Accidents in Ecuador.
eu_rights_str_mv openAccess
format bachelorThesis
id UNL_4bb4a5a7b8ffeb4745f7a60f274094b9
instacron_str UNL
institution UNL
instname_str Universidad Nacional de Loja
language spa
network_acronym_str UNL
network_name_str Repositorio Universidad Nacional de Loja
oai_identifier_str oai:dspace.unl.edu.ec:123456789/24502
publishDate 2022
publisher.none.fl_str_mv Universidad Nacional de Loja
reponame_str Repositorio Universidad Nacional de Loja
repository.mail.fl_str_mv *
repository.name.fl_str_mv Repositorio Universidad Nacional de Loja - Universidad Nacional de Loja
repository_id_str 0
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/ec/
spelling Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.Torres Quezada, Yulissa Stefania<MINERÍA DE DATOS>< METODOLOGÍA KDD>< ÁRBOLES DE DECISIÓN> <REDES NEURONALES>< REDES BAYESIANAS><SINIESTROS DE TRÁNSITO EN ECUADOR>The occurrence of traffic accidents represents a public health problem at national and regional level, causing human losses, in addition to the fact that every day is increasing worldwide, which is why it is appropriate to propose a study to determine what are the factors that cause the occurrence of traffic accidents. The objective of this thesis is to apply data mining to determine the most influential factors in the occurrence of traffic accidents in Ecuador in the year 2020, this was carried out through five phases of the methodology of Knowledge Discovery in Databases (KDD) consisting of: search for information, data collection, database cleaning, application of data mining techniques and interpretation and presentation of results, whereby, through the establishment of guidelines for the search for information, the set of data collected by the National Transit Agency (ANT) was obtained, which includes the collection of police reports, designed and approved by each of the control entities, under the technical parameters established by the same institution, which is available on its official website. Using the OpenRefine and RStudio tools, the obtained data set was debugged, evaluating and determining the most useful and relevant variables for the object of study. The software tools used for the application of the data mining algorithms were SPSS Statistics and Weka. Seven predictive data mining techniques were applied: CHAID, Exhaustive CHAID, CRT, Multilayer Perceptron, Radial Basis Function, Naive Bayes and BayesNet. The evaluation of these algorithms was performed by comparing the results obtained by each one, in relation to performance metrics with respect to percentages of correct classification of instances and accuracy. The CHAID Exhaustive algorithm was the one that obtained the best results with a percentage of correct classification of 58.38% and 44.60% accuracy, with which the most important patterns in the data were identified and the possible associations between the variables collected were evaluated. Finally, the human factor was determined to be the most influential factor with a probability of occurrence of 69.64%. Keywords: Data mining, KDD methodology, Decision Trees, Neural Networks, Bayesian Networks, Traffic Accidents in Ecuador.La ocurrencia de siniestros de tránsito representa un problema de salud pública a nivel nacional y regional, ocasionando pérdidas humanas, además de que cada día va en aumento a nivel mundial, es por ello que resulta oportuno plantear un estudio que permita determinar cuáles son los factores que ocasionan la ocurrencia de siniestros de tránsito. El objetivo del presente Trabajo de Titulación (TT) es aplicar minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020, esto se llevó a cabo mediante cinco fases de la metodología de Descubrimiento de Conocimiento en Bases de Datos (KDD) constituida por: búsqueda de información, obtención de datos, depuración de la base de datos, aplicación de técnicas de minería de datos e interpretación y presentación de resultados, por lo cual, por medio del establecimiento de lineamientos para la búsqueda de información se obtuvo el conjunto de datos recolectado por la Agencia Nacional de Tránsito (ANT), en el que consta la recopilación de los partes policiales, diseñados y aprobados por cada uno de los entes de control, bajo los parámetros técnicos establecidos por la misma institución, que reposa en su sitio web oficial. Utilizando las herramientas OpenRefine y RStudio se realizó la depuración del conjunto de datos obtenido, evaluando y determinando las variables más útiles y relevantes para el objeto de estudio. Las herramientas de software empleadas para la aplicación de los algoritmos de minería de datos fueron SPSS Statistics y Weka. Se aplicaron siete técnicas predictivas de minería de datos: CHAID, CHAID Exhaustivo, CRT, Perceptrón Multicapa, Función de Base Radial, Naive Bayes y BayesNet. La evaluación de estos algoritmos se realizó comparando los resultados obtenidos por cada uno, en relación a métricas de rendimiento con respecto a porcentajes de clasificación correcta de las instancias y de precisión. El algoritmo CHAID Exhaustivo fue el que obtuvo los mejores resultados con un porcentaje de clasificación correcta del 58,38% y 44,60% de precisión, con el cual se identificó los patrones más importantes en los datos y se evaluó las posibles asociaciones entre las variables recogidas. Finalmente, se determinó que el factor humano es el factor más influyente con una probabilidad de ocurrencia del 69,64%. Palabras clave: Minería de datos, metodología KDD, Árboles de Decisión, Redes Neuronales, Redes Bayesianas, Siniestros de Tránsito en Ecuador.Universidad Nacional de LojaCumbicus Pineda, Oscar Miguel2022-01-14T20:38:39Z2022-01-14T20:38:39Z2022-01-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis153 p.application/pdfhttps://dspace.unl.edu.ec/jspui/handle/123456789/24502spahttp://creativecommons.org/licenses/by-nc-sa/3.0/ec/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Nacional de Lojainstname:Universidad Nacional de Lojainstacron:UNL2025-05-02T15:57:23Zoai:dspace.unl.edu.ec:123456789/24502Institucionalhttps://dspace.unl.edu.ec/Universidad públicahttps://unl.edu.ec/https://dspace.unl.edu.ec/oaiEcuador***opendoar:02025-05-02T15:57:23falseInstitucionalhttps://dspace.unl.edu.ec/Universidad públicahttps://unl.edu.ec/https://dspace.unl.edu.ec/oai*Ecuador***opendoar:02025-05-02T15:57:23Repositorio Universidad Nacional de Loja - Universidad Nacional de Lojafalse
spellingShingle Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
Torres Quezada, Yulissa Stefania
<MINERÍA DE DATOS>< METODOLOGÍA KDD>< ÁRBOLES DE DECISIÓN> <REDES NEURONALES>< REDES BAYESIANAS><SINIESTROS DE TRÁNSITO EN ECUADOR>
status_str publishedVersion
title Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
title_full Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
title_fullStr Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
title_full_unstemmed Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
title_short Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
title_sort Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
topic <MINERÍA DE DATOS>< METODOLOGÍA KDD>< ÁRBOLES DE DECISIÓN> <REDES NEURONALES>< REDES BAYESIANAS><SINIESTROS DE TRÁNSITO EN ECUADOR>
url https://dspace.unl.edu.ec/jspui/handle/123456789/24502