Accueil / A la Une / PAPAYA : un projet européen pour une plateforme d’analyse de données confidentielles
Papaya

PAPAYA : un projet européen pour une plateforme d’analyse de données confidentielles

Projets européens H2020EURECOM coordonne le projet européen PAPAYA, lancé le 1er mai pour une durée de trois ans. Son but ? Rendre possible le traitement de données chiffrées ou anonymisées par des services cloud sans que ceux-ci aient besoin d’accéder à la donnée en clair. Melek Önen, chercheuse en cryptographie appliquée, pilote le projet et nous explique plus en détail les objectifs de ce projet H2020.

 

Quel est l’objectif du projet H2020 Papaya ?

Melek Önen : Les petites et moyennes entreprises n’ont pas toujours les moyens de traiter de grandes quantités de données — souvent personnelles ou confidentielles — en interne. Elles font donc appel à des services cloud pour leur faciliter la tâche, mais perdent le contrôle sur leurs données. Le challenge que nous voulons relever avec PAPAYA (pour PlAtform for PrivAcY preserving data Analytics) est de pouvoir appliquer des méthodes de traitement et de classification des données tout en les gardant chiffrées et/ou anonymisées. Cela garantirait aux entreprises plus de sécurité et de confidentialité lorsqu’elles font appel aux services cloud de tiers, puisque ceux-ci ne pourront plus accéder aux données en clair. C’est un grand enjeu avec l’arrivée en Europe du règlement général pour la protection des données personnelles (RGPD).

Quelle est la principale difficulté à laquelle vous êtes confrontés ?

MÖ : Aujourd’hui lorsque nous chiffrons des données avec des méthodes classiques, elles sont protégées de manière randomisée — c’est-à-dire avec un caractère aléatoire sur lequel nous n’avons pas de visibilité. Il est impossible de faire des opérations dessus. En 2009, le chercheur en cryptographie Craig Gentry a proposé une méthode de chiffrement particulière dite entièrement homomorphe. Elle permet de faire plusieurs opérations sur des données chiffrées. Le problème c’est que les traitements sur les données chiffrées de cette manière ne sont pas très efficaces en matière d’utilisation de mémoire et de processus. L’essentiel de notre travail va consister à concevoir des variantes des algorithmes de traitement pour qu’ils fonctionnent bien sur des données protégées par chiffrement homomorphe.

Concrètement, en quoi consiste la conception de variantes des algorithmes de traitement ?

MÖ : Par exemple, un réseau de neurones comporte à la fois des opérations linéaires faciles à gérer avec des méthodes de chiffrement adaptées, et des opérations non-linéaires. On ne sait pas traiter des données chiffrées par les opérations non-linéaires. Or, la précision du réseau dépend de ces opérations non-linéaires, il faut donc les garder. Ce que nous allons faire, c’est approximer ces opérations, qui sont en réalité des fonctions, par d’autres fonctions linéaires au comportement similaire. Plus l’approximation est efficace, plus nous conservons la précision du réseau de neurones, et nous gagnons la possibilité de traiter des données chiffrées.

Quels sont les cas d’usage sur lesquels vous allez travailler ?

MÖ : Nous avons deux cas d’usage. Le premier est le cas du chiffrement de données médicales. C’est une situation qui concerne de nombreux hôpitaux qui possèdent les données de leurs patients mais ne sont pas assez grands pour avoir un service de traitement en interne. Ils utilisent alors des services cloud. Le second concerne le « web analytics » qui pourrait être utile pour le secteur du tourisme. En effet, les données collectées des smartphones des utilisateurs sont très utiles pour ce secteur qui analyse le flux des touristes d’un point d’intérêt à un autre. Pour les deux, nous imaginons plusieurs scénarios progressifs. D’abord un propriétaire des données qui possède toutes les données en clair des utilisateurs et qu’il chiffre avec la même clé et envoie au cloud. Puis plusieurs propriétaires et plusieurs clés. Et enfin des données qui viennent directement des utilisateurs.

Qui est impliqué à vos côtés dans ce projet ?

MÖ : PAPAYA rassemble 6 partenaires, dont EURECOM qui coordonne les actions. Les entreprises impliquées à nos côtés pour nous accompagner dans les cas d’usage et la réalisation de cette nouvelle plateforme sont Atos, IBM Haifa Research Lab, Orange Labs, et MediaClinics — une PME qui fait des capteurs pour le contrôle de patients en hôpital. Au niveau académique nous travaillons avec l’université de Karlstad en Suède. Nous travaillerons ensemble pendant toute la durée du projet qui est de trois ans.

Un commentaire

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *