Metodología para le estimación robusta de la pérdida esperada en crédito de consumo mediante datos sintéticos y algoritmos de aprendizaje automático
Tesis
El presente proyecto aborda la optimización de la gestión del riesgo de crédito en instituciones financieras, enfrentando los desafíos críticos de la privacidad de la información y el desbalance de clases inherente a los portafolios de consumo. La metodología desarrollada implementa una arquitectura de Redes Generativas Antagónicas tipo WGAN-GP (Wasserstein GAN con Penalización de Gradiente) para generar un portafolio de datos sintéticos tabulares de alta fidelidad. Este enfoque permitió replicar exitosamente la estructura estadística multivariada y las correlaciones de los datos reales sin exponer información sensible, validando su calidad mediante pruebas de bondad de ajuste y consistencia estructural. Sobre este entorno de datos sintéticos y balanceados, se evaluó el desempeño predictivo de tres modelos de clasificación: Regresión Logística Multinomial, Redes Neuronales Artificiales (MLP) y XGBoost. Los resultados demostraron la clara superioridad de los algoritmos no lineales sobre los métodos tradicionales. Específicamente, el modelo XGBoost presentó el mejor rendimiento en términos de discriminación global y sensibilidad para la detección de la clase de Pérdida. Adicionalmente, se evidenció que la incorporación de variables de memoria temporal incrementa la capacidad discriminatoria del modelo a niveles de precisión casi perfecta. La investigación concluye con la materialización de estos hallazgos en una herramienta computacional para el cálculo de la Pérdida Esperada (PE) y la simulación de escenarios de estrés, proporcionando una solución robusta para la toma de decisiones financieras bajo un esquema de privacidad garantizada.