Un programari desenvolupat per científics de la UB millora la gestió de grans processos de càlcul mitjançant sistemes comercials de computació

Imatge de l'Experiment LHCb
Imatge de l'Experiment LHCb
(29/06/2010)

Investigadors de lʼInstitut de Ciències del Cosmos de la Universitat de Barcelona (ICCUB) han desenvolupat DIRAC, un programari que gestiona el processament de les dades dʼun dels grans experiments fets al Gran Col·lisionador dʼHadrons (LHC) de lʼOrganització Europea per a la Recerca Nuclear, per utilitzar sistemes comercials de provisió de potència de càlcul i optimitzar el cost dels recursos computacionals necessaris per dur a terme grans processos de càlcul. Lʼobjectiu del treball, finançat pel Projecte CPAN (Centre Nacional de Física de Partícules, Astropartícules i Nuclear), dins del marc Consolider - Ingenio 2010, és desenvolupar el programari DIRAC per gestionar els recursos de computació en qualsevol disciplina científica i per a qualsevol grup dʼusuaris. El programari desenvolupat sʼha provat amb èxit en simulacions de lʼexperiment Belle (Japó), utilitzant 2.000 processadors dʼAmazon Elastic Compute Cloud (EC2).

Imatge de l'Experiment LHCb
Imatge de l'Experiment LHCb
29/06/2010

Investigadors de lʼInstitut de Ciències del Cosmos de la Universitat de Barcelona (ICCUB) han desenvolupat DIRAC, un programari que gestiona el processament de les dades dʼun dels grans experiments fets al Gran Col·lisionador dʼHadrons (LHC) de lʼOrganització Europea per a la Recerca Nuclear, per utilitzar sistemes comercials de provisió de potència de càlcul i optimitzar el cost dels recursos computacionals necessaris per dur a terme grans processos de càlcul. Lʼobjectiu del treball, finançat pel Projecte CPAN (Centre Nacional de Física de Partícules, Astropartícules i Nuclear), dins del marc Consolider - Ingenio 2010, és desenvolupar el programari DIRAC per gestionar els recursos de computació en qualsevol disciplina científica i per a qualsevol grup dʼusuaris. El programari desenvolupat sʼha provat amb èxit en simulacions de lʼexperiment Belle (Japó), utilitzant 2.000 processadors dʼAmazon Elastic Compute Cloud (EC2).

DIRAC gestiona lʼexecució dels programes de processament de la informació dels detectors del Large Hadron Collider beauty experiment (LHCb) per identificar els diversos tipus de partícules mesurats. També controla lʼexecució dels algoritmes informàtics per seleccionar les dades més rellevants entre la gran quantitat de dades registrades (calen 10 milions de col·lisions per reconstruir una partícula B, que ens permetrà estudiar la asimetria entre matèria i antimatèria a lʼUnivers). Així mateix, distribueix les dades a través dʼuna xarxa de centres de càlcul anomenada Worldwide LHC Computing Grid (WLCG), que té més de 300 centres de càlcul (120 utilitzats per lʼLHCb) a 57 països de tot el món i permet recuperar les dades necessàries per fer-ne una anàlisi posterior. En el desenvolupament del programari DIRAC hi han participat, entre dʼaltres, científics de lʼICCUB i de la Universitat de Santiago de Compostel·la.  

Tal com explica el responsable del projecte, Ricardo Graciani, professor del departament d'Estructura i Constituents de la Matèria i investigador de lʼICCUB, «la simulació de les col·lisions mitjançant eines informàtiques i la resposta del detector són fonamentals per a la nostra investigació, però necessiten una gran quantitat de recursos de càlcul». En realitat, construir una xarxa de computació (grid) amb recursos dedicats exclusivament a processar dades dʼun experiment és una mica costós i no és plenament eficient perquè, en paraules de Graciani, «lʼús té pics i valls en la demanda». Graciani pren com a exemple Belle, una col·laboració internacional desenvolupada a lʼaccelerador de partícules KEK (Japó) que porta a terme estudis similars als de lʼLHCb. A Belle es recullen dades durant sis mesos a lʼany i després es necessiten tres mesos més per fer les simulacions informàtiques corresponents. «Aquesta necessitat de computació requereix sobredimensionar els recursos informàtics durant la resta de lʼany», explica Graciani, cosa que implica «costos extres» dʼinstal·lació i funcionament.
 
Relació cost-benefici
 
Per optimitzar el cost dʼaquests recursos, els investigadors espanyols, amb el suport del projecte CPAN, han adaptat el programari DIRAC perquè pugui utilitzar recursos de computació dʼAmazon, un dels líders de vendes dʼaquests serveis per Internet. En col·laboració amb científics de la Universitat de Melbourne (Austràlia), que participen a Belle, els investigadors de lʼICCUB han fet simulacions informàtiques per a lʼexperiment Belle, per la qual cosa han utilitzat 250 màquines virtuals dʼAmazon EC2, que equivalen a 2.000 processadors interconnectats. «Els primers resultats demostren que lʼeficiència de lʼús dʼaquests recursos computacionals ha estat superior al 95 %», afirma Graciani. 
La prova, desenvolupada al llarg de deu dies i els resultats de la qual sʼhan enviat perquè es publiquin al Journal of Grid Computing, ha consistit en unes 7.500 hores de càlcul amb un pic de funcionament de 2.000 processadors utilitzats de manera simultània durant unes divuit hores. «DIRAC ha permès aprofitar lʼelasticitat del sistema dʼAmazon per optimitzar els recursos utilitzats segons les necessitats», explica lʼinvestigador. Lʼexercici que sʼha dut a terme ha permès determinar un cost preliminar dʼuns 6.000 dòlars per fer 1.426 tasques de simulació (cosa que equival a 120 milions de col·lisions o a 2.700 GB dʼinformació de lʼexperiment). 

«Aquesta relació de cost-benefici, que encara presenta marges de millora, permetrà valorar la idoneïtat dʼutilitzar els recursos oferts per Amazon o altres empreses, adquirir recursos en grid per al projecte, o bé combinar diverses solucions», explica Graciani. Les grans col·laboracions científiques internacionals, com ara els experiments de lʼLHC o les que es duen a terme en biotecnologia, necessiten grans sistemes de càlcul per desenvolupar-se. Lʼobjectiu final del projecte de lʼICCUB és completar DIRAC perquè pugui gestionar grans necessitats de computació en qualsevol disciplina científica usant sistemes comercials de provisió de capacitat de càlcul com els que ofereixen Amazon o Google, juntament amb recursos compartits en grid o recursos propis dʼuna manera transparent. Segons Graciani, això permetria «optimitzar el cost dels recursos computacionals».