Clustering en alta dimensión : identificación de variables relevantes en datos mixtos

Date
2023
Authors
Martiarena, Griselda
relationships.isContributorOfPublication
Svarc, Marcela
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad de San Andrés. Departamento de Matemática y Ciencias
Abstract
La aceleración del progreso tecnológico ha generado nuevos desafíos y oportunidades para la supervisión bancaria. El desarrollo y la aplicación de herramientas que facilitan y potencian su tarea es una de ellas. En este sentido, este trabajo aborda la clusterización de las entidades financieras argentinas, a partir de una cantidad considerable de información pública estructurada, y la identificación de las variables relevantes en este proceso. Para ello, se apoya en el empleo de un algoritmo genético y de la metodología de blinding para la selección de variables. En particular, amplía la aplicación de este último enfoque, no sólo a conjuntos de datos con variables numéricas, categóricas y binarias, sino también a métodos de clustering por particiones, siendo este el principal aporte metodológico. Adicionalmente, procura ofrecer una herramienta que permita entender más a fondo el ecosistema bancario en un contexto de volúmenes crecientes de datos. Los resultados finales obtenidos son satisfactorios, confirmando la solidez y utilidad de la estrategia de ocultamiento.
Description
Fil: Martiarena, Griselda. Universidad de San Andrés. Departamento de Matemática y Ciencias; Argentina.
Keywords
Citation