Abstract:
La investigación se enfocó en diseñar un modelo de Machine Learning (ML) capaz de clasificar imágenes médicas del cáncer pulmonar, con la finalidad de apoyar el diagnóstico médico. Se ha utilizado una metodología deductiva, revisión documental, un enfoque cuantitativo, con un diseño no experimental, un nivel descriptivo y se basa en un paradigma positivista. El instrumento en el que se analiza es a través de la estadística descriptiva. El dataset está compuesto por tres categorías: cáncer de pulmón benigno y maligno, pulmones normales, el total de imágenes es de 1097. Se analizó el primer objetivo específico mediante una matriz de análisis documental, para escoger el modelo a través de la validación de los 5 expertos. Los resultados mostraron un tiempo de entrenamiento de 12.88 segundos, la división de los datos fue el 20% de prueba equivale a 220 imágenes y 80% entrenamiento corresponde a 877 imágenes. De las 220 imágenes de prueba se detectó el cáncer en 136 imágenes y sin cáncer en 84. En conclusión, el modelo Máquina de Vectores de Soporte (SVM) ha demostrado ser muy eficaz en la clasificación de imágenes médicas del cáncer pulmonar, superando problemas relacionados con la calidad y cantidad de datos. Se recomienda llevar a cabo una validación exhaustiva con datos adicionales y elaborar un informe detallado en 1 a 3 meses para asegurar la robustez del modelo antes de su implementación.