Buscan nuevas estrategias a los retos en las simulaciones en supercomputadoras
Por Génesis Gatica Porcayo
Ciudad de México. 6 de abril de 2017 (Agencia Informativa Conacyt).- Hacer simulaciones de modelos climáticos, estudiar el universo o crear combustibles son algunos de los usos que se le pueden atribuir a las supercomputadoras debido a que poseen la cualidad de tener un gran poder de cálculo.
Sin embargo, el uso de estas máquinas de alto poder de trabajo implica también una gran probabilidad de que algún componente falle en el proceso de uso, lo que trae consecuencias económicas que a largo plazo pueden causar un impacto negativo en los proyectos de investigación de las instituciones.
Alfredo Parra Hinojosa, originario de Puebla, inició el doctorado en la Universidad Técnica de Múnich en 2013 y actualmente está en la fase final de su tesis que está enfocada en el área de simulaciones computacionales con aplicaciones en física, declaró para la Agencia Informativa Conacyt cómo ha sido el proceso de encontrar métodos para poder correr simulaciones exitosamente a pesar de posibles fallas en el sistema.
En su trabajo busca estrategias para que estas fallas en las supercomputadoras, que son inevitables, tengan el menor impacto negativo en los resultados de las simulaciones para reducir su costo y, además, incrementar la precisión y confiabilidad de sus resultados.
Algunos de los principales beneficios que esto traería particularmente en su aplicación al desarrollo de reactores de fusión nuclear es que con simulaciones más precisas y menos costosas se pueden hacer mejores diseños de reactores en la vida real.
Agencia Informativa Conacyt (AIC): ¿De qué se tratan las simulaciones de alta definición en supercomputadoras?
Alfredo Parra Hinojosa (APH): Una gran parte de la comunidad de físicos está interesada en el tema de la energía de fusión, es decir, tratar de construir un reactor de fusión basado en plasma, lo cual es una tecnología que aún no existe pero que está en desarrollo. La energía basada en fusión de plasma es una alternativa limpia y con muy poco peligro de generar desperdicios tóxicos.
El problema con esta tecnología es que se requieren reactores extremadamente complejos, muy caros y es difícil experimentar con ellos.
Aún no se ha logrado extraer más energía de la que se requiere para hacer funcionar estos reactores. Por esta razón, a los físicos les interesa entender más estos procesos de fusión de plasma.
Sin embargo, ya que es tan costoso llevar a cabo este tipo de experimentos en la vida real con reactores existentes, una alternativa es hacerlos por computadora y tratar de simular por este medio los procesos que ocurren dentro de un reactor de fusión nuclear, y así entender mejor los procesos de fusión dentro de estos reactores.
La idea entonces es correr simulaciones por computadora que sean lo más cercanas a la realidad. Pero estas simulaciones a su vez son muy costosas, ya que requieren muchos recursos computacionales.
En una computadora personal es imposible correr estas simulaciones. Para esto se necesita precisamente una supercomputadora, que es simplemente un sistema mucho más poderoso, con mayor capacidad de cómputo. Esto trae, a su vez, varias complicaciones, ya que no es fácil correr una simulación en una supercomputadora porque son sistemas muy complejos donde pueden suceder varias cosas.
A fin de cuentas lo que hacen estas simulaciones son operaciones matemáticas que necesitan recursos que puedan realizar estas operaciones. Entre más procesadores se tengan a disposición, más rápido se llevan a cabo estas simulaciones.
AIC: ¿Qué estrategias llevas a cabo para resolver los retos que se plantean en tu trabajo?
APH: Mi tarea específica en el doctorado tiene que ver con el problema de fallas técnicas en las supercomputadoras. Debido a que tienen tantos componentes (tienen cientos de miles de procesadores), la probabilidad de que algo falle durante una simulación es muy alta y mi trabajo es tratar de ver qué hacer en esas situaciones.
Normalmente si un componente falla, toda la simulación se termina y hay que correrla de nuevo, acción que involucra mucha inversión de tiempo y dinero, ya que las supercomputadoras consumen mucha energía.
A nosotros nos interesa correr estas simulaciones complejas durante muchas horas y que terminen exitosamente a pesar de que ciertos componentes fallen, que finalmente es inevitable por la cantidad de componentes que hay en máquinas de esta magnitud.
AIC: ¿Cómo describirías el sector a quien afecta directamente este tipo de fallas?
APH: Afecta más que nada a los usuarios de supercomputadoras, científicos cuyo trabajo es correr ciertas simulaciones en estos sistemas. Mucha gente usa supercomputadoras para simulaciones de clima y en otras áreas.
AIC: ¿Cómo se beneficiaría el sector al que está llevado a cabo este estudio de estrategias?
APH: El propósito de nuestro proyecto es que al final podamos llevar a cabo simulaciones de alta definición, que no fallen, que sean confiables y con la esperanza de que los físicos puedan entender mejor el proceso de fusión de plasma.
Primero que nada nos beneficia a nosotros como investigadores porque sabemos que nuestras simulaciones terminarán exitosamente y el objetivo es que los físicos puedan usar nuestros resultados para entender mejor el proceso de fusión nuclear.
AIC: ¿Podrías describir algunas de estas estrategias?
APH: Cuando ocurre este tipo de fallas, la información que estaba guardada en alguno de los procesadores se pierde, entonces una idea que se ha venido usando desde hace años es tratar de guardar toda la información que tenemos durante ciertos intervalos de tiempo, y si algo vuelve a fallar se puede volver a empezar desde el último momento en que se guardaron los resultados sin correr la simulación desde el principio.
El problema con esta estrategia es que las supercomputadoras de la siguiente generación siguen creciendo en tamaño y la probabilidad de que un componente falle es mayor.
A mayores procesadores que tenga una computadora, las fallas son más seguidas. Por ejemplo, si sabemos que en un futuro los procesadores van a fallar cada treinta segundos, no podemos guardar los resultados cada diez segundos porque toma mucho tiempo, esfuerzo y recursos.
La siguiente estrategia a esta problemática es tratar de no guardar nuestros resultados cada cierto intervalo de tiempo sino tratar de reconstruir la información que se perdió en esa falla usando los datos que hay a la mano y así tratar de averiguar la información perdida para poder reconstruirla y demostrar que no representa un daño en término de precisión.
AIC: ¿Quiénes te asesoran en este trabajo?
APH: El proyecto es financiado por una institución pública alemana llamada Deutsche Forschungsgemeinschaft (DFG), la cual respalda ciertos proyectos en el área de supercomputación. Son alrededor de catorce proyectos que están financiados por esta organización y en este proyecto en particular somos cuatro colaboradores: la Universidad de Múnich, la Universidad de Stuttgart, la Universidad de Bonn y el Instituto Max Planck de Física del Plasma.
Mi supervisor de tesis es el profesor Hans-Joachim Bungartz, quien dirige la cátedra de computación científica en la Facultad de Informática y también es decano de la Facultad de la Escuela de Graduados.
AIC: ¿Para ti qué significa participar en un proyecto de esta índole?
APH: Me llamó la atención este tema cuando buscaba una opción para mi tesis de doctorado porque creo que tiene una aplicación bastante interesante. Si logramos entender mejor el proceso de fusión nuclear, podríamos resolver los problemas de generación de energía limpia por muchas generaciones.
Para mí es importante contribuir en el área de simulaciones computacionales porque nos permite entender mejor los procesos físicos, en mi caso la fusión nuclear, y esto abre muchas puertas a otras áreas de investigación que tal vez no serían posibles en la vida real.
Aún hay experimentos con reactores nucleares que no pueden llevarse a cabo por computadora, y si logramos correr simulaciones de alta definición al término de estos tres años siguientes, es posible que tenga un gran impacto en la comunidad de física de plasmas y se puedan desarrollar mejores reactores nucleares para el futuro.
De ser esto posible, se consideraría la fusión de plasma como una de las alternativas más prometedoras para generar energía, porque es limpia y se tienen los recursos para producir estas reacciones.
AIC: ¿De qué manera puede ser aplicada esta energía limpia?
APH: Para sustituir las fuentes de energía de las que hoy en día dependemos, como el petróleo. Aunque hay otras fuentes de energía renovable como la energía solar o eólica, la energía de fusión nuclear podría resolver nuestros problemas de energía, ya que los recursos son casi ilimitados y es una tecnología sumamente limpia y segura.
Es por esta razón que teniendo simulaciones precisas y económicas, se podría facilitar y acelerar el desarrollo de este tipo de tecnología.
Las supercomputadoras son equipos muy utilizados dentro del campo de la ciencia, sobre todo en la realización de simulaciones e investigaciones científicas que requieren grandes volúmenes de cálculo. La velocidad de estos equipos es medida en teraflops, que equivalen a billones de operaciones por segundo, lo que permite tener una idea de la potencia y la velocidad de estas máquinas. |
Esta obra cuyo autor es Agencia Informativa Conacyt está bajo una licencia de Reconocimiento 4.0 Internacional de Creative Commons.