Accueil / A la Une / CloudButton met le Big Data à portée de clic

CloudButton met le Big Data à portée de clic

Projets européens H2020Lancé en janvier 2019 pour une durée de 3 ans, le projet européen H2020 CloudButton entend démocratiser le Big Data en simplifiant drastiquement le modèle de programmation. Pour cela, il s’appuie sur un service cloud qui dispense le client final de gérer physiquement des serveurs. Pierre Sutra, chercheur à Télécom SudParis, partenaire de ce projet, nous en dévoile les enjeux.

 

Quel est l’objectif général de ce projet ?

Pierre Sutra : Les programmes informatiques actuels sont massivement répartis entre plusieurs ordinateurs, et un simple clic peut nécessiter un calcul de la part de centaines de machines. Construire un tel système est cependant très difficile, car il requiert de lier un grand nombre de services entre eux. CloudButton a pour objectif de simplifier drastiquement cette façon de programmer.

Comment comptez-vous vous y prendre ? 

PS : Pour ce faire, le projet s’appuie sur un concept récent qui va changer profondément les architectures informatiques : les fonctions en tant que service (en anglais FaaS, Function-as-a-Service). Le FaaS permet d’invoquer à la demande une fonction dans le cloud, comme si on le faisait sur une machine locale. Comme c’est le cloud, le nombre de fonctions invoquées en parallèle peut être immense, et seule l’utilisation est facturée — à la milliseconde près. C’est un peu comme si on avait son propre supercalculateur à la demande.

Comment est née l’idée du projet CloudButton ?

PS : L’idée est partie d’une discussion avec des collègues de l’Université espagnole Rovira i Virgili (URV) lors du congrès ICDCS 2017 à Atlanta (International Conference on Distributed Computing Systems). Nous venions de présenter des travaux sur une couche de stockage pour programmer les systèmes répartis. Le modèle de programmation était séduisant mais il manquait une application apportant une véritable rupture technologique.

À ce moment, l’université de Berkeley proposait une approche pour écrire des applications parallèles au-dessus du FaaS. Nous nous sommes dit qu’il y avait là matière à aller plus loin en utilisant notre système de stockage, avec un but à terme : porter les applications mono-machine vers le cloud en un minimum d’effort. La métaphore du bouton illustre ce propos.

Qui sont vos partenaires dans ce projet ?

PS : Le consortium réunit cinq partenaires académiques : URV (Tarragone, Espagne), Imperial College (Londres, GB), EMBL (European Molecular Biology Laboratory, Heidelberg, Allemagne), The Pirbright Institute (Surrey, GB) et l’IMT, ainsi que plusieurs partenaires industriels, dont IBM et RedHat. Les instituts de génomiques (The Pirbright Institute) et de biologie moléculaire (EMBL) sont les utilisateurs finaux du logiciel. De plus, ils nous fournissent des cas d’usage et des problématiques nouvelles.

Pouvez-vous donner un exemple de cas d’usage ?

PS : EMBL propose à ses chercheurs associés de consulter une large banque d’images collectées à travers le monde. Ces images sont estampillées avec des informations relatives à la composition chimique du sujet, en utilisant de l’intelligence artificielle conjointement à l’expertise des chercheurs de l’EMBL. Pour l’instant, le système nécessite de calculer en amont les estampilles. Un cas d’utilisation de CloudButton est de faire ce calcul à la demande, par exemple afin de personnaliser les requêtes de l’utilisateur.

En quoi consiste la contribution des chercheurs de Télécom SudParis ?

PS : Télécom SudParis travaille sur la partie stockage des données dans CloudButton. Le but est de concevoir des abstractions pour programmer qui soient aussi proches que possible de ce qu’offre un langage de programmation classique pour une machine. Bien sûr, ces abstractions se doivent aussi d’être efficaces pour le modèle d’exécution du FaaS. Ces travaux sont menés notamment en collaboration avec IBM et RedHat.

Quels défis technologiques et scientifiques se présentent à vous ?

PS : Dans l’état actuel, le stockage n’est pas fait pour un calcul massivement parallèle durant un laps de temps court. Le premier défi est donc l’adaptabilité du stockage au modèle FaaS. Un second défi est de réduire la synchronisation des tâches parallèles au strict minimum dans le but d’améliorer les performances. Un troisième enjeu est la tolérance aux fautes. Le calcul tournant sur des infrastructures de grandes tailles, celles-ci sont soumises périodiquement à des erreurs. Cependant, afin d’exposer une interface de programmation simplifiée, les fautes doivent être masquées.

Quelles sont les retombées attendues ?

PS : La réussite d’un projet comme CloudButton peut prendre plusieurs formes. Notre premier objectif est de permettre aux instituts et entreprises présentes dans le projet de résoudre leurs problématiques de calcul et de volume des données. D’autre part, les logiciels que nous développons peuvent aussi connaître un succès dans le monde open source. Enfin, nous espérons à travers ce projet résoudre des questions qui feront sens à moyen terme dans l’architecture des systèmes informatiques.

Quelles sont les prochaines étapes importantes pour ce projet ?

PS : Nous avons rendez-vous avec la commission européenne dans un an pour une évaluation de mi-parcours. Jusqu’à présent, les prototypes et applications que nous avons développés sont encourageants. À cette date, j’espère que nous aurons la possibilité de montrer une plateforme de calcul ambitieuse à travers un cas d’utilisation innovant.

Les partenaires du consortium CloudButton

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *