Archetypes Core Clustering Method (ACCM) : procedimiento de clustering basado en los conceptos de profundidades locales integradas y la construcción de arquetipos

Date
2025
Authors
Ornat, Fernando Antonio
relationships.isContributorOfPublication
Svarc, Marcela
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad de San Andrés. Departamento de Matemática y Ciencias
Abstract
Este documento presenta una estrategia innovadora de asignación de grupos denominada ‘ACCM’ (Archetypes Core Clustering Method), que se basa en un procedimiento de clustering existente fundamentado en la noción de profundidad local. La propuesta introduce el concepto de estructuras arquetípicas de los datos, con el objetivo de optimizar los tiempos de ejecución. El método, implementado en R, tiene su código disponible en un repositorio público de GitHub. El caso de estudio principal se centra en la caracterización de trayectorias de partículas que luego de cinco días llegan a la Península de Byers, Antártida, representados como datos funcionales obtenidos mediante simulaciones en HYSPLIT. Este análisis requiere métodos específicos debido a la naturaleza no estándar del bouquet de trayectorias de partículas de aire en la región, lo que incluye el cálculo de la distancia de Frechet que se caracteriza por su alto costo computacional. El documento comienza con una introducción al marco conceptual, donde se realiza un estado del arte sobre técnicas relacionadas con profundidad de datos, core-clusters y arquetipos, así como también del procedimiento basado en profundidades locales que sirvió como inspiración para esta propuesta. Posteriormente, se detalla el método ACCM, explicando su algoritmo paso a paso, las simulaciones realizadas y las decisiones clave que dieron forma a la estrategia final. También se incluye una evaluación comparativa frente a un benchmark, analizando la precisión y los tiempos de ejecución del método. En cuanto al caso práctico, se aborda el problema de la llegada de microorganismos aéreos en la Antártida, utilizando la distancia de Fréchet en el algoritmo para identificar core-clusters y asignar observaciones fuera de estos. Se presentan resultados para el período 2005-2016, junto con un análisis de las decisiones intermedias y una interpretación exhaustiva de los hallazgos. Finalmente, la conclusión destaca el aporte de ACCM en este contexto específico, subrayando la razonabilidad de los resultados y la eficiencia en los tiempos de ejecución como sus principales contribuciones. Además, se proponen posibles mejoras y líneas futuras de investigación como punto de partida para trabajos posteriores.
Description
Fil: Ornat, Fernando Antonio. Universidad de San Andrés. Departamento de Matemática y Ciencias; Argentina.
Keywords
Citation