La lutte contre le cancer dopée par le calcul haute performance

Référence européenne dans le domaine de la recherche et de la lutte contre le cancer, l'Institut Gustave Roussy mise énormément sur le séquençage à haut débit, très gourmand en puissance d'analyse. Pour l'aider dans cette démarche, Dell a fait don à l'établissement d'une infrastructure de calcul haute performance.
PublicitéDepuis quelques années, l'analyse biomédicale a énormément progressé, tout comme elle a fait progresser la recherche. À la pointe de celle-ci pour ce qui concerne le cancer, l'Institut Gustave Roussy, à Villejuif en banlieue parisienne, a bien évidemment suivi le mouvement. Comme l'explique Daniel Gautheret, directeur de la plateforme bioinformatique de l'établissement, la lutte contre le cancer passe par une analyse poussée du patrimoine génétique, notamment chez l'enfant. « Les cancers naissent de fractures dans le génome issues de causes pouvant aussi bien relever de l'environnement que de l'hérédité en passant par la simple vieillesse. Nous devons trouver quelles sont les cassures qui ont des conséquences sur le développement des cancers », détaille l'enseignant-chercheur.
Or, il est acquis qu'un génome est un enchevêtrement de milliards de données qu'il faut alors être en mesure d'analyser. Pour y parvenir, l'Institut Gustave Roussy s'appuie sur le séquençage à haut débit qui consiste à décrypter le génome d'un tissus malade, à le comparer à celui d'un autre tissus sain du même patient ainsi qu'à un génome de référence.
Suivant les situations, ces analyses peuvent porter sur 400 à 32 000 millions de bases d'ADN, soit une quantité colossale de données. Au fil des années, une suite de logiciels et de workflows a été mise en place par différents instituts à travers le monde afin d'automatiser le processus. Il va du contrôle de la qualité des analyses à leur pré-traitement en passant par leurs mises en relation avec des bases de données internationales.
Un système surpuissant
Reste que pour réaliser toutes ces opérations, une formidable puissance de calcul est nécessaire. Jusqu'à il y a peu, l'Institut Gustave Roussy s'appuyait sur un cluster Unix de 8 noeuds, chacun doté de 12 Go de Ram. Avec 8 coeurs dédiés à chaque analyse, le système était capable de réaliser toute la chaine d'opérations pour 12 personnes simultanément en 35 heures.
Ce n'était toutefois pas suffisant face aux enjeux de la lutte contre le cancer. Dell, dont les actions gracieuses dans le monde médical se font de plus en plus fréquentes, a décidé de donner un coup de pouce à l'Institut Gustave Roussy. Alors que le fabricant avait déjà fait don à l'établissement de PC pour le service pédiatrie et d'une bibliothèque numérique, c'est une infrastructure complète de calcul haute performance qui est venue s'ajouter à cette liste.
Publicité
L'infrastructure de calcul haute performance fournie par Dell embarque 16 serveurs PowerEdge R630 et un serveur PowerEdge R820.
Le système repose sur deux types de serveurs Dell PowerEdge. Il compte ainsi 16 racks R630 embarquant chacun 2 processeurs et 128 Go de RAM et qui développent tous ensemble une puissance de calcul de 12,3 Tflop/s. Ils sont accoudés à un PowerEdge R820 équipé de quatre processeurs et de 1 To de RAM. Il développe à lui seul 768 Gflop/s.
A ces serveurs, Dell a ajouté une solution de stockage en parallèle sur le protocole BGFS alliant disques classiques et SSD ainsi qu'une solution de stockage d'archivage. Elles reposent toutes deux sur les produits Dell PowerVault et procurent à l'ensemble une capacité de stockage de 220 To. Le tout est accompagné d'une solution de supervision et de solutions réseaux, elles aussi fournies par le constructeur.
Les 16 serveurs PowerEdge R630 et le R820 sont annoncés sur le site web du constructeur à partir de 126 000 euros HT en tout.
Des performances multipliées par onze
En place depuis trois mois, cette nouvelle infrastructure a déjà fait ses preuves. « Nous pouvons aujourd'hui traiter les analyses de 96 patients en 25 heures », déclare Daniel Gautheret. Le système est assidûment utilisé par les équipes de recherche des projets BIOMED et MOSCATO, respectivement dédiées à la lutte contre les cancers rares des enfants et aux thérapies ciblées.
D'autres projets jouissent dans une moindre mesure de cette puissance de calcul. Celle-ci devrait d'ailleurs augmenter dans les mois à venir. « Nous devions nous attaquer, avec Dell, à l'optimisation du code des différentes applications qui permettent la chaine d'analyse. S'il y a certaines phases qui sont incompressibles, nous pouvons gagner sur d'autres », se réjouie Daniel Gautheret.
Article rédigé par

Oscar Barthe, Journaliste
Suivez l'auteur sur Linked In, Twitter
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire