Les partenariats de partage de données se caractérisent par l'ouverture de l'accès aux informations et leur partage. Cependant, cela soulève des problèmes de sécurité, qui peuvent être particulièrement graves dans le contexte des données personnelles, définies comme toute information qui se rapporte à une personne vivante identifiée ou identifiable. Même si la plupart des initiatives réussies de partage de données dans le secteur du développement n'utilisent que des données anonymes, agrégées ou non personnelles, les fournisseurs de données restent préoccupés par la faillibilité des méthodes d'anonymisation et le risque de ré-identification. 

Les politiques de sécurité et de stockage visent à répondre à ces préoccupations et constituent les principaux outils permettant de garantir la mise en place de protections techniques.

Les initiatives de partage des données peuvent se concentrer sur la sécurité des données en mettant en place les personnes, les processus et les outils nécessaires pour protéger la confidentialité et l'intégrité des données contre les attaques malveillantes ou les accidents involontaires tout au long du cycle de vie des données.

Création d'environnements de données contrôlés pour garantir la confidentialité des données

Depuis 2014, le défi LinkedIn Economic Graph invite les partenariats de recherche et d'analyse dans lesquels les données de LinkedIn peuvent être exploitées pour identifier les tendances macroéconomiques du travail et de l'économie. 

Pour garantir la sécurité des données de ses membres, le défi fournit une formation approfondie en matière de sécurité à chaque équipe participante et exige que le travail soit effectué uniquement sur des ordinateurs portables fournis par LinkedIn sur le réseau LinkedIn dans un environnement de bac à sable surveillé. Les données téléchargées en dehors de ce réseau font l'objet de restrictions importantes et un collaborateur de LinkedIn supervise l'accès aux données et leur utilisation. L'utilisation des données est limitée à l'objectif spécifique identifié dans le partenariat de recherche. En outre, un comité d'examen interne évalue tous les produits de recherche créés dans le cadre du partenariat. 

Des recherches récentes menées sur les données de LinkedIn, par exemple, montrent que les compétences vertes sont de plus en plus demandées sur le marché du travail, au moins 10 % des offres d'emploi de l'année dernière les exigeant. Elles suggèrent également qu'un plus grand nombre de travailleurs acquièrent des compétences vertes et passent à des emplois verts ou dans des secteurs écologiques, ce qui entraîne des transitions nettes positives vers ces emplois.

Les approches de stockage sécurisé des données peuvent être centralisées, fédérées ou distribuées, chacune utilisant des moyens différents pour assurer la sécurité des données concernées. Si la plupart des initiatives analysées s'appuient sur des systèmes de stockage centralisés, il n'existe pas d'approche unique et, dans le secteur du développement et au-delà, une tendance croissante à la décentralisation du stockage est liée aux préoccupations grandissantes concernant les déséquilibres de pouvoir et la thésaurisation des données.

Passage d'un stockage centralisé à un stockage décentralisé des données

Le réseau INSPIRE (Implementation Network for Sharing Population Information from Research Entities) est un partenariat visant à partager les données des sites de surveillance sanitaire et démographique de cinq pays d'Afrique de l'Est. Au départ, INSPIRE a été mis en place pour créer un grand dépôt de données sur la santé, et les données ont été stockées de manière centralisée dans une installation Cloud, l'initiative, dirigée par le Centre africain de recherche sur la population et la santé, étant le dépositaire des données.

Toutefois, l'équipe INSPIRE, conformément à sa stratégie visant à accroître la capacité des fournisseurs de données et à renforcer les compétences des instituts de recherche participant à l'initiative, a l'intention de passer du statut de dépôt de données à celui de plateforme de services. Cela implique une évolution vers un système de stockage fédéré dans lequel les fournisseurs de données restent les gardiens de leurs propres données. La plateforme INSPIRE exploitera ensuite les données à distance pour des cas d'utilisation particuliers.

Comme le dit l'une des principales parties prenantes de l'initiative, l'objectif de cette transition est d'explorer une approche dans laquelle aucun partenaire ne détient toutes les données.