Institución:
Conjunto de herramientas e interfaces que implementan un acceso simple y eficiente a los almacenes de datos para aplicaciones de big data.
Data-Driven Scientific Computing
Yolanda Becerra
Hecuba proporciona abstracciones de programación sencillas que permiten a los desarrolladores gestionar datos distribuidos como si fueran memoria local. Con solo anotar una clase de Python una vez, los datos se almacenan y recuperan automáticamente desde sistemas escalables como bases de datos o sistemas en memoria. Este enfoque reduce el movimiento de datos al acercar el procesamiento a donde residen los datos, mejorando así el rendimiento y la eficiencia. Su diseño independiente del sistema permite que el mismo código se ejecute en máquinas locales, clústeres y plataformas en la nube, lo que facilita la portabilidad. El ahorro energético se deriva de la reducción de las transferencias de datos, aunque aún no incluye el seguimiento de las emisiones de CO₂.
Pipelines de genómica y transcriptómica, postprocesamiento de modelos climáticos, análisis de IoT en tiempo real, almacenes de características de IA, centros de datos de gemelos digitales, catálogos de astrofísica.
Centros de supercomputación que ejecutan investigación científica intensiva en datos; Proveedores de computación de alto rendimiento en la nube que ofrecen almacenamiento de objetos gestionado; I+D biotecnológica y farmacéutica que necesita pipelines de petabytes; Proveedores de software independientes de ingeniería que integran la persistencia transparente en los flujos de trabajo; Consorcios de investigación que construyen infraestructuras de datos FAIR.
Technology Readiness Level (1-9): 7
Protection:
Apache License (Version 2.0)
Si quieres saber más sobre este proyecto no dudes en contactarnos