Word Embedding en documentos médicos através dela aplicación de Word2Vec y Doc2Vec

Resumen: El uso de incrustación de palabras (Word Embedding) en el análisis de documentos desde hace unos años ha sido ampliamente utilizado, promoviendo el uso en diferentes documentos, como documentos médicos, con el fin de obtener una mejor información y utilidad de estos. La presente investigaci...

Deskribapen osoa

Gorde:
Xehetasun bibliografikoak
Egile nagusia: Jaramillo Uday, Luis Alfredo (author)
Formatua: bachelorThesis
Hizkuntza:spa
Argitaratua: 2022
Gaiak:
Sarrera elektronikoa:http://dspace.utpl.edu.ec/handle/20.500.11962/29493
Etiketak: Etiketa erantsi
Etiketarik gabe, Izan zaitez lehena erregistro honi etiketa jartzen!
Deskribapena
Gaia:Resumen: El uso de incrustación de palabras (Word Embedding) en el análisis de documentos desde hace unos años ha sido ampliamente utilizado, promoviendo el uso en diferentes documentos, como documentos médicos, con el fin de obtener una mejor información y utilidad de estos. La presente investigación consideró la aplicación de incrustación de palabras utilizando dos de sus algoritmos, el modelo Word2Vec que es usado para similitud de palabras y el modelo Doc2Vec para comparación de textos, ambos serán usados en el análisis de dataset médicos, un datas et en inglés sobre obesidad y diabetes y otro en español que contiene diferentes reportes médicos. Como resultado se obtuvo que el modelo Word2Vec usado en el conjunto de datos en inglés tuvo un resultado de similitud de 0,99. El mismo modelo utilizado en el conjunto de datos español obtuvo resultados de similitud de 0,25, esto se debe a que los documentos de este conjunto de datos tienen contenido de diferentes enfermedades. El modelo Doc2Vec reflejó un buen resultado tanto en el conjunto de datos en español como en el conjunto de datos en inglés.