🌐 Exemples
Il existe plusieurs exemples différents de mise en place de pipelines de données qui peuvent être instructifs :
- En Estonie, un processeur de données autorisé est recherché par le biais d'un concours ouvert qui agit en tant que fournisseur technique pour le stockage, le nettoyage et le traitement des données. Jusqu'en 2027, ce fournisseur est Positium, une société privée. L'autorité statistique et l'opérateur ont convenu de partager les données par le biais d'une API au format .csv chiffré, où tous les identifiants des abonnés ont été hachés (pseudonymisés).
Pendant la pandémie de COVID-19, l'Estonie a mis en œuvre un modèle de réponse d'urgence pour l'utilisation des données des réseaux mobiles. En raison des contraintes de temps, une approche simplifiée a été adoptée au lieu d'un partage direct des données. Statistics Estonia, agissant en tant qu'intermédiaire, a demandé aux opérateurs d'effectuer des calculs de base sur les données de mobilité agrégées, sur la base de la méthodologie développée par Positium, et de soumettre les résultats. Le rôle d'intermédiaire de Statistics Estonia (entre l'opérateur de réseau mobile et l'équipe du projet) était crucial car les opérateurs ne voulaient pas se montrer mutuellement la distribution régionale de leur clientèle.
- Au Ghana, Telecel Ghana (autrefois connu sur le nom Vodafone Ghana) a fourni un accès gratuit à des données de télécommunications pseudonymisées. En utilisant son logiciel de traitement open-source, Flowminder a agrégé et analysé les données pour le compte du Service statistique du Ghana. Les détails techniques de la mise en place du pipeline de données sont décrits dans l'accord de partage des données.
- En Indonésie, les données restent chez l'opérateur de réseau mobile qui investit (et est rémunéré pour) le temps du personnel, le stockage et la technologie. Statistics Indonesia a accès à des échantillons de données qui lui permettent de créer et d'améliorer la méthodologie que l'opérateur met en œuvre. Des sociétés comme Positium et des organismes de recherche publics indonésiens contribuent aux développements méthodologiques, avec ou sans accès aux données.
- En Gambie, l'organisme de réglementaire des télécommunications PURA a joué le rôle de partie chargée du stockage et du traitement des données, avec l'aide de l'Université de Tokyo en tant que fournisseur technique. Un ensemble de statistiques sur la mobilité est produit à partir des données EDA dans les locaux de la PURA et mis à jour au fur et à mesure de l'arrivée de nouvelles données. Les données EDA sont dépersonnalisées par les opérateurs de réseaux mobiles respectifs afin de garantir qu'aucune information personnelle identifiable n'est incluse dans les données utilisées pour produire des statistiques par PURA, qui gère tous les accès aux données. Le BNS reçoit des agrégats pour la production de statistiques et la publication.
❗Astuces
✅ Étudier les pratiques de partage des données d'autres pays, par le biais de ressources en ligne, de groupes de travail internationaux ou de discussions directes avec les pays qui ont mis en place des pipelines de données sur les opérateurs.
✅ A ce stade, il est préférable de faire appel à un prestataire technique ou à un consultant pour vous aider dans les discussions techniques sur la mise en place du pipeline de données. Vous devriez être en mesure de trouver un expert disposant d'une expertise technique pertinente et d'une expérience dans deux pays ou plus.
✅ Lors des discussions techniques, assurez-vous que l'approche finale du partage des données permet la production de statistiques de qualité. Pour cela, il est important de garantir l'adéquation à l'objectif, la minimisation des données, le contrôle de la qualité des données, les méthodologies validées et la transparence du traitement.
📖 Ressources
Voir une description de l'organisation du projet et des principes appliqués dans les projets de l'Estonie, du Ghana et de la Gambie dans Principes directeurs pour maintenir la confiance du public dans l'utilisation des données des opérateurs mobiles à des fins politiques, Data for Policy, 2021.
Voir les différentes options d'accès aux données décrites dans le chapitre 3 de l’ONU Manuel de sur l'utilisation des données de téléphones mobiles pour les statistiques officielles 'ONU (2019).
⏩ Actions suivantes
- En concert avec le comité technique, organiser des réunions de travail dans le but de convenir des principes de partage des données et de la configuration du pipeline.
- Fixer une fréquence de réunion régulière pour finaliser toutes les conditions de partage des données.
- Transmettre les conditions de partage des données au comité de pilotage pour approbation.