Tecnología: Cómo mejorar la gestión de datos en los superordenadores del futuro

La Universidad Carlos III de Madrid (UC3M), en España, investiga cómo sentar las nuevas bases de la gestión de datos en los grandes sistemas de supercomputación del futuro. Y lo hace junto con uno de los centros científicos punteros en este área, el Laboratorio Nacional de Argonne (EEUU), en el marco del proyecto europeo CLARISSE. Esta tecnología podría aplicarse para aumentar el rendimiento, escalabilidad y fiabilidad de los superordenadores del futuro, ubicados en grandes centros de datos de todo el mundo.

En las últimas décadas, muchos descubrimientos científicos han dependido del análisis de un ingente volumen de datos, lo que se realiza fundamentalmente a través de simulaciones computacionales ejecutadas a gran escala en superordenadores. Este tipo de máquinas se emplean para el estudio de modelos climáticos, el desarrollo de nuevos materiales, investigaciones sobre el origen del universo, el genoma humano o nuevas aplicaciones de bioingeniería.

En la actualidad, a medida que se recaba y almacena cada vez más información, la gestión de datos científicos se enfrenta a un problema: el software que gestiona los superordenadores de última generación no ha sido diseñado para los requisitos de escalabilidad que se esperan en los próximos años. De hecho, en menos de una década estas infraestructuras van a ser dos órdenes de magnitud más rápidas que los supercomputadores de hoy.

“En la actualidad, estas aplicaciones experimentan grandes problemas de rendimiento y escalabilidad debido al aumento exponencial de datos por el empleo de mejores instrumentos, la creciente ubicuidad de sensores y la mayor conectividad entre dispositivos”, explica el profesor Florin Isaila, del grupo ARCOS del departamento de Informática de la UC3M. “Hoy en día es necesario un rediseño radical de las infraestructuras computacionales y del software de gestión para adecuarlos al nuevo paradigma de ciencia basada en procesamiento masivo de datos”, concluye.

El objetivo del proyecto CLARISSE (Cross-Layer Abstractions and Run-time for I/O Software Stack of Extreme-scale systems) es precisamente ese: aumentar el rendimiento, escalabilidad, programabilidad y fiabilidad de la gestión de datos de aplicaciones científicas con el fin de ofrecer soporte al diseño de los superordenadores de la próxima generación. Para ello, este proyecto coordinado por la UC3M cuenta con financiación del Séptimo Programa Marco de la Unión Europea (FP7/2007-2013, bajo el acuerdo de subvención número 328582), además de la colaboración del Laboratorio Nacional de Argonne (EEUU), uno de los principales actores a nivel mundial en I+D de software de sistemas para supercomputadores de gran escala.

Históricamente, el desarrollo de software de gestión de datos se ha realizado en capas con poca coordinación en la gestión global de recursos. “Hoy en día, esta falta de coordinación representa uno de los mayores obstáculos para el aumento de la escalabilidad de los sistemas actuales. En este sentido, en CLARISSE investigamos soluciones a estos problemas a través del diseño de nuevos mecanismos para coordinar la gestión de datos de las diferentes capas”, comenta el profesor Isaila.

 

“En la actualidad ARCOS está muy involucrado en varias iniciativas a nivel mundial para reformar el software de gestión de los futuros supercomputadores, incluyendo la coordinación tanto del proyecto CLARISSE como de la red de colaboración de investigación NESUS. Las sinergias resultantes de estos esfuerzos van a contribuir de forma sustancial a acelerar los descubrimientos científicos de las próximas décadas”, explica el investigador principal del proyecto, Jesús Carretero, catedrático de la UC3M y responsable de ARCOS. (Fuente: UC3M)