Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores

Cuando dentro de una población se busca estudiar los diferentes aspectos sociales y económicos además de los factores que los provocan, las encuestas a hogares son la más usuales fuentes de información para la obtención de datos socieconómicos y demográficos. La recopilación de estos datos comúnment...

Fuld beskrivelse

Saved in:
Bibliografiske detaljer
Hovedforfatter: Pérez Jaime, Steeven Fabricio (author)
Andre forfattere: Mogro Ponce, Joan Fernando (author), González Narváez, Mariela, Directora (author)
Format: bachelorThesis
Udgivet: 2021
Fag:
Online adgang:http://www.dspace.espol.edu.ec/handle/123456789/54267
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
_version_ 1858337450039967744
author Pérez Jaime, Steeven Fabricio
author2 Mogro Ponce, Joan Fernando
González Narváez, Mariela, Directora
author2_role author
author
author_facet Pérez Jaime, Steeven Fabricio
Mogro Ponce, Joan Fernando
González Narváez, Mariela, Directora
author_role author
collection Repositorio Escuela Superior Politécnica del Litoral
dc.creator.none.fl_str_mv Pérez Jaime, Steeven Fabricio
Mogro Ponce, Joan Fernando
González Narváez, Mariela, Directora
dc.date.none.fl_str_mv 2021
2022-06-09T20:54:44Z
2022-06-09T20:54:44Z
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv Pérez, S.; Mogro, J. (2021). Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores.[Tesis]. Escuela Superior Politécnica del Litoral.
http://www.dspace.espol.edu.ec/handle/123456789/54267
dc.language.none.fl_str_mv es
dc.publisher.none.fl_str_mv ESPOL. FCNM
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Escuela Superior Politécnica del Litoral
instname:Escuela Superior Politécnica del Litoral
instacron:ESPOL
dc.subject.none.fl_str_mv Datos socioeconómicos
Datos demográficos
Error muestral
Encuesta de hogares
dc.title.none.fl_str_mv Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
description Cuando dentro de una población se busca estudiar los diferentes aspectos sociales y económicos además de los factores que los provocan, las encuestas a hogares son la más usuales fuentes de información para la obtención de datos socieconómicos y demográficos. La recopilación de estos datos comúnmente se lo realiza de forma manual y está sujeta a errores en la operación, esto puede ser un generador de sesgos que al final del proceso nos podrían ofrecer una información errónea de lo que queremos investigar. Por esto se ha hace precisa la implementación de técnicas que identifiquen estos sesgos para acciones inmediatas y que no afecten al resultado final del estudio. Una opción para la detección de estos, son métodos manuales y ordinarios como se ha venido haciendo, sin embargo con el fin de mejorar la productividad de esta validación de datos hemos optado por la utilización de técnicas de Machine Learning optimizando estos procesos con la oportunidad de mejorar la detección de estos errores muestrales. En este estudio se ejecutan técnicas de Machine Learning a partir del uso de datos de encuestas realizadas a hogares. Se hicieron pruebas con algoritmos de aprendizaje supervisado. También realizamos un análisis exploratorio con los datos donde incluimos una distribución de variables por encuestador para identificar en cuál de ellos no se sigue el patrón y por lo consiguiente se generaría el sesgo, todo esto previo al modelado. El mejor modelo fue el de Random Forest con una precisión del 0.8579 que quizás no fue la mejor entre todos los modelos, pero demostró una buena proporción entre la sensibilidad de 0.7530 y la especificidad del 0.9628, esto indica una adecuada capacidad de detección de verdaderos positivos.
eu_rights_str_mv openAccess
format bachelorThesis
id ESPOL_e1736cfb8a8ad61bcdabdf00de2c60d3
identifier_str_mv Pérez, S.; Mogro, J. (2021). Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores.[Tesis]. Escuela Superior Politécnica del Litoral.
instacron_str ESPOL
institution ESPOL
instname_str Escuela Superior Politécnica del Litoral
language_invalid_str_mv es
network_acronym_str ESPOL
network_name_str Repositorio Escuela Superior Politécnica del Litoral
oai_identifier_str oai:www.dspace.espol.edu.ec:123456789/54267
publishDate 2021
publisher.none.fl_str_mv ESPOL. FCNM
reponame_str Repositorio Escuela Superior Politécnica del Litoral
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Escuela Superior Politécnica del Litoral - Escuela Superior Politécnica del Litoral
repository_id_str 1479
spelling Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadoresPérez Jaime, Steeven FabricioMogro Ponce, Joan FernandoGonzález Narváez, Mariela, DirectoraDatos socioeconómicosDatos demográficosError muestralEncuesta de hogaresCuando dentro de una población se busca estudiar los diferentes aspectos sociales y económicos además de los factores que los provocan, las encuestas a hogares son la más usuales fuentes de información para la obtención de datos socieconómicos y demográficos. La recopilación de estos datos comúnmente se lo realiza de forma manual y está sujeta a errores en la operación, esto puede ser un generador de sesgos que al final del proceso nos podrían ofrecer una información errónea de lo que queremos investigar. Por esto se ha hace precisa la implementación de técnicas que identifiquen estos sesgos para acciones inmediatas y que no afecten al resultado final del estudio. Una opción para la detección de estos, son métodos manuales y ordinarios como se ha venido haciendo, sin embargo con el fin de mejorar la productividad de esta validación de datos hemos optado por la utilización de técnicas de Machine Learning optimizando estos procesos con la oportunidad de mejorar la detección de estos errores muestrales. En este estudio se ejecutan técnicas de Machine Learning a partir del uso de datos de encuestas realizadas a hogares. Se hicieron pruebas con algoritmos de aprendizaje supervisado. También realizamos un análisis exploratorio con los datos donde incluimos una distribución de variables por encuestador para identificar en cuál de ellos no se sigue el patrón y por lo consiguiente se generaría el sesgo, todo esto previo al modelado. El mejor modelo fue el de Random Forest con una precisión del 0.8579 que quizás no fue la mejor entre todos los modelos, pero demostró una buena proporción entre la sensibilidad de 0.7530 y la especificidad del 0.9628, esto indica una adecuada capacidad de detección de verdaderos positivos.ESPOL. FCNM2022-06-09T20:54:44Z2022-06-09T20:54:44Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPérez, S.; Mogro, J. (2021). Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores.[Tesis]. Escuela Superior Politécnica del Litoral.http://www.dspace.espol.edu.ec/handle/123456789/54267esinfo:eu-repo/semantics/openAccessreponame:Repositorio Escuela Superior Politécnica del Litoralinstname:Escuela Superior Politécnica del Litoralinstacron:ESPOL2022-06-09T20:54:45Zoai:www.dspace.espol.edu.ec:123456789/54267Institucionalhttps://www.dspace.espol.edu.ec/Universidad públicahttps://www.espol.edu.ec/.https://www.dspace.espol.edu.ec/oaiEcuador...opendoar:14792022-06-09T20:54:45falseInstitucionalhttps://www.dspace.espol.edu.ec/Universidad públicahttps://www.espol.edu.ec/.https://www.dspace.espol.edu.ec/oai.Ecuador...opendoar:14792022-06-09T20:54:45Repositorio Escuela Superior Politécnica del Litoral - Escuela Superior Politécnica del Litoralfalse
spellingShingle Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
Pérez Jaime, Steeven Fabricio
Datos socioeconómicos
Datos demográficos
Error muestral
Encuesta de hogares
status_str publishedVersion
title Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
title_full Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
title_fullStr Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
title_full_unstemmed Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
title_short Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
title_sort Aplicación de un modelo para detectar posibles sesgos en una investigación de hogares por parte de encuestadores
topic Datos socioeconómicos
Datos demográficos
Error muestral
Encuesta de hogares
url http://www.dspace.espol.edu.ec/handle/123456789/54267