Prevención de fraude en apertura de cuentas bancarias con aprendizaje automático

dc.contributor.MentorFraiman, Daniel
dc.creator.AutorMolin, Gino
dc.date.accessioned2026-04-13T17:30:25Z
dc.date.available2026-04-13T17:30:25Z
dc.date.issued2025
dc.descriptionFil: Molin, Gino. Universidad de San Andrés. Departamento de Matemática y Ciencias; Argentina.
dc.description.abstractEste trabajo aborda la detección de fraude en la apertura de cuentas bancarias mediante modelos de aprendizaje automático, focalizándose en técnicas de Gradient Boosting (XGBoost, LightGBM y CatBoost) para enfrentar los desafíos asociados al desbalance de clases y a la deriva de datos. Se parte de un conjunto de datos, en el que la incidencia de fraude es extremadamente baja, lo que obliga a explorar estrategias de remuestreo como el submuestreo de la clase mayoritaria y técnicas de sobremuestreo (SMOTE) para mejorar la capacidad de los modelos de identificar solicitudes fraudulentas. La metodología propuesta incluye un riguroso preprocesamiento y validación cruzada, complementado con la optimización de hiperparámetros mediante la librería Optuna. Además, se emplean variaciones en la distribución de los datos para evaluar la robustez de los modelos ante cambios temporales y conceptuales. Los resultados experimentales demuestran que los tres algoritmos de Gradient Boosting alcanzan un rendimiento elevado, con ROC-AUC superior a 0,89 y PR-AUC en torno a 0,18, evidenciando una adecuada capacidad discriminatoria pese al desbalance de clases. Dentro de este conjunto, CatBoost se destaca ligeramente al ofrecer el mejor equilibrio entre capacidad de discriminación y estabilidad. No obstante, se evidencia que la presencia de deriva, especialmente en escenarios adversos, degrada significativamente el rendimiento de los modelos, lo que subraya la necesidad de implementar sistemas de monitoreo y actualización continua. En síntesis, esta investigación aporta un marco práctico y detallado para la detección de fraude en entornos financieros, combinando estrategias de remuestreo, uso de métricas especificas para el problema abordado y optimización de modelos, ofreciendo lineamientos para el desarrollo de sistemas robustos en la lucha contra el fraude digital.
dc.formatapplication/pdf
dc.identifier.urihttps://repositorio.udesa.edu.ar/handle/10908/26330
dc.languagespa
dc.publisherUniversidad de San Andrés. Departamento de Matemática y Ciencias
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.titlePrevención de fraude en apertura de cuentas bancarias con aprendizaje automático
dc.typeTesis
dc.typeinfo:eu-repo/semantics/masterThesis
dc.typeinfo:ar-repo/semantics/tesis de maestría
dc.typeinfo:eu-repo/semantics/updatedVersion
Files
Original bundle
Loading...
Thumbnail Image
Name:
[P][W] M. C.deD. Molin, Gino.pdf
Size:
1.28 MB
Format:
Adobe Portable Document Format
Description: