Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows

Obfuscation is a technique in computer science that makes it difficult to understand source code in order to protect intellectual property and prevent reverse engineering; in the scope of this study, it is used to complicate malware detection. However, to address this problem, a model based on machi...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Ponce Velez , Iván Darío (author)
Format: masterThesis
Sprache:spa
Veröffentlicht: 2024
Schlagworte:
Online Zugang:https://repositorio.uteq.edu.ec/handle/43000/7844
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
_version_ 1859094217853239296
author Ponce Velez , Iván Darío
author_facet Ponce Velez , Iván Darío
author_role author
collection Repositorio Universidad Técnica Estatal de Quevedo
dc.contributor.none.fl_str_mv Zhuma Mera, Emilio Rodrigo
dc.creator.none.fl_str_mv Ponce Velez , Iván Darío
dc.date.none.fl_str_mv 2024-09-16T15:00:04Z
2024-09-16T15:00:04Z
2024
dc.format.none.fl_str_mv 113
application/pdf
dc.identifier.none.fl_str_mv Ponce Velez,Iván Darío(2024).Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows.Quevedo.UTEQ.113 paginas
1300017
https://repositorio.uteq.edu.ec/handle/43000/7844
dc.language.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Quevedo:UTEQ
dc.rights.none.fl_str_mv Attribution-NonCommercial-ShareAlike 3.0 United States
http://creativecommons.org/licenses/by-nc-sa/3.0/us/
info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:Repositorio Universidad Técnica Estatal de Quevedo
instname:Universidad Técnica Estatal de Quevedo
instacron:UTEQ
dc.subject.none.fl_str_mv Malware ofuscado
Aprendizaje automático
Ciberseguridad
Técnicas supervisadas
dc.title.none.fl_str_mv Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/masterThesis
description Obfuscation is a technique in computer science that makes it difficult to understand source code in order to protect intellectual property and prevent reverse engineering; in the scope of this study, it is used to complicate malware detection. However, to address this problem, a model based on machine learning techniques was built to identify threats that use obfuscation techniques. Therefore, in the development of this study, the “Knowledge Discovery in Databases” (KDD) methodology was used, which began with the preparation of the data set, where attribute selection based on correlation was applied. Through a literature review, supervised techniques were selected and applied in the data mining phase. The Random Forest, Decision Tree, SVM, KNN and Gradient Boosting algorithms were used to correctly identify the main groups of malicious software, thus demonstrating the performance of the model in identifying malware. Finally, the main contribution of this research is a model based on the Random Forest algorithm that presented a 99% accuracy in the classification of obfuscated malware, improving the capabilities of identifying cyber threats in this area
eu_rights_str_mv openAccess
format masterThesis
id UTEQ_e7241bd02b7e3455d8aeec3d30bf24a9
identifier_str_mv Ponce Velez,Iván Darío(2024).Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows.Quevedo.UTEQ.113 paginas
1300017
instacron_str UTEQ
institution UTEQ
instname_str Universidad Técnica Estatal de Quevedo
language spa
network_acronym_str UTEQ
network_name_str Repositorio Universidad Técnica Estatal de Quevedo
oai_identifier_str oai:repositorio.uteq.edu.ec:43000/7844
publishDate 2024
publisher.none.fl_str_mv Quevedo:UTEQ
reponame_str Repositorio Universidad Técnica Estatal de Quevedo
repository.mail.fl_str_mv .
repository.name.fl_str_mv Repositorio Universidad Técnica Estatal de Quevedo - Universidad Técnica Estatal de Quevedo
repository_id_str .
rights_invalid_str_mv Attribution-NonCommercial-ShareAlike 3.0 United States
http://creativecommons.org/licenses/by-nc-sa/3.0/us/
spelling Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windowsPonce Velez , Iván DaríoMalware ofuscadoAprendizaje automáticoCiberseguridadTécnicas supervisadasObfuscation is a technique in computer science that makes it difficult to understand source code in order to protect intellectual property and prevent reverse engineering; in the scope of this study, it is used to complicate malware detection. However, to address this problem, a model based on machine learning techniques was built to identify threats that use obfuscation techniques. Therefore, in the development of this study, the “Knowledge Discovery in Databases” (KDD) methodology was used, which began with the preparation of the data set, where attribute selection based on correlation was applied. Through a literature review, supervised techniques were selected and applied in the data mining phase. The Random Forest, Decision Tree, SVM, KNN and Gradient Boosting algorithms were used to correctly identify the main groups of malicious software, thus demonstrating the performance of the model in identifying malware. Finally, the main contribution of this research is a model based on the Random Forest algorithm that presented a 99% accuracy in the classification of obfuscated malware, improving the capabilities of identifying cyber threats in this areaLa ofuscación es una técnica en la informática que dificulta la comprensión del código fuente para proteger la propiedad intelectual y evitar la ingeniería inversa; en el ámbito del presente estudio, se utiliza para complicar la detección de malware. Sin embargo, para abordar este problema se construyó un modelo basado en técnicas de aprendizaje automático para identificar amenazas que utilizan técnicas de ofuscación. Por lo consiguiente, en el desarrollo del presente estudio se utilizó la metodología “Descubrimiento de conocimiento en bases de datos” (KDD, del inglés Knowledge Discovery in Databases), que inició con la preparación del conjunto de datos, donde se aplicó la selección de atributos con base en la correlación. Mediante una revisión de la literatura, se seleccionaron y aplicaron técnicas supervisadas en la fase de minería de datos. Los algoritmos Random Forest, Decision Tree, SVM, KNN y Gradient Boosting se utilizaron para identificar correctamente los grupos principales de software malicioso, demostrando así el rendimiento del modelo en la identificación de malware. Por último, el principal aporte de esta investigación es un modelo basado en el algoritmo Random Forest que presentó una precisión del 99% en la clasificación de malware ofuscado, mejorando las capacidades de identificar amenazas cibernéticas en este ámbito.Quevedo:UTEQZhuma Mera, Emilio Rodrigo2024-09-16T15:00:04Z2024-09-16T15:00:04Z2024info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis113application/pdfPonce Velez,Iván Darío(2024).Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows.Quevedo.UTEQ.113 paginas1300017https://repositorio.uteq.edu.ec/handle/43000/7844spaAttribution-NonCommercial-ShareAlike 3.0 United Stateshttp://creativecommons.org/licenses/by-nc-sa/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositorio Universidad Técnica Estatal de Quevedoinstname:Universidad Técnica Estatal de Quevedoinstacron:UTEQ2024-09-17T08:00:39Zoai:repositorio.uteq.edu.ec:43000/7844Institucionalhttp://repositorio.uteq.edu.ec/Universidad públicahttps://www.uteq.edu.ec/http://repositorio.uteq.edu.ec/oaiEcuador...opendoar:.2024-09-17T08:00:39falseInstitucionalhttp://repositorio.uteq.edu.ec/Universidad públicahttps://www.uteq.edu.ec/http://repositorio.uteq.edu.ec/oai.Ecuador...opendoar:.2024-09-17T08:00:39Repositorio Universidad Técnica Estatal de Quevedo - Universidad Técnica Estatal de Quevedofalse
spellingShingle Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
Ponce Velez , Iván Darío
Malware ofuscado
Aprendizaje automático
Ciberseguridad
Técnicas supervisadas
status_str publishedVersion
title Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
title_full Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
title_fullStr Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
title_full_unstemmed Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
title_short Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
title_sort Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows
topic Malware ofuscado
Aprendizaje automático
Ciberseguridad
Técnicas supervisadas
url https://repositorio.uteq.edu.ec/handle/43000/7844