Las asociaciones de intercambio de datos se caracterizan por abrir el acceso a la información y compartirla. Sin embargo, hacerlo plantea problemas de seguridad, que pueden ser especialmente graves en el contexto de los datos personales, definidos como cualquier información relacionada con una persona viva identificada o identificable. Aunque la mayoría de las iniciativas de intercambio de datos en el sector del desarrollo utilizan únicamente datos anonimizados, agregados o no personales, los proveedores de datos siguen preocupados por la falibilidad de los métodos de anonimización y el riesgo de reidentificación. 

Las políticas de seguridad y almacenamiento pretenden dar respuesta a estas preocupaciones y son las principales herramientas para garantizar la existencia de salvaguardas técnicas.

Las iniciativas de puesta en común de datos pueden centrarse en garantizar la seguridad de los datos mediante el establecimiento de las personas, los procesos y las herramientas necesarias para proteger la confidencialidad y la integridad de los datos frente a ataques malintencionados o accidentes involuntarios a lo largo del ciclo de vida de los datos.

Creación de entornos de datos controlados para garantizar la privacidad de los datos

Desde 2014, el reto LinkedIn Economic Graph ha invitado a colaboraciones de investigación y análisis en las que se pueden aprovechar los datos de LinkedIn para identificar tendencias macroeconómicas laborales y económicas. 

Para garantizar la seguridad de los datos de sus miembros, el reto ofrece una amplia formación en materia de seguridad a cada equipo participante y exige que el trabajo se realice únicamente en los ordenadores portátiles de la red de LinkedIn dentro de un entorno controlado. Los datos descargados fuera de esta red están fuertemente restringidos, y un empleado colaborador de LinkedIn supervisa todo el acceso y uso de los datos. El uso de los datos está restringido al objetivo específico identificado en la asociación de investigación. Además, una junta de revisión interna evalúa todos los productos de investigación creados a través de la asociación. 

Una investigación reciente realizada a partir de datos de LinkedIn, por ejemplo, muestra que las competencias ecológicas son cada vez más demandadas en el mercado laboral, ya que al menos el 10 % de las ofertas de empleo del último año las requieren. También sugiere que cada vez hay más trabajadores con cualificaciones ecológicas y en transición hacia empleos verdes y ecológicos, lo que impulsa transiciones netas positivas hacia estos empleos.

Los enfoques para almacenar datos de forma segura pueden ser centralizados, federados o distribuidos, y cada uno de ellos utiliza diferentes formas de garantizar la seguridad y protección de los datos en cuestión. Aunque la mayoría de las iniciativas analizadas se basan en sistemas de almacenamiento centralizados, no existe un enfoque único y, en el sector del desarrollo y fuera de él, la creciente tendencia hacia la descentralización del almacenamiento está vinculada a la creciente preocupación por los desequilibrios de poder y el acaparamiento de datos.

Pasar del almacenamiento de datos centralizado al descentralizado

 

La Implementation Network for Sharing Population Information from Research Entities (INSPIRE) es una asociación para compartir datos de sitios de vigilancia sanitaria y demográfica en cinco países de África Oriental. Inicialmente, INSPIRE se estableció para crear un gran repositorio de datos sanitarios, y los datos se almacenaron de forma centralizada en una instalación basada en la nube, con la iniciativa, dirigida por el Centro Africano de Investigación en Población y Salud, como custodio de los datos.

Sin embargo, el equipo de INSPIRE, en línea con su estrategia de aumentar la capacidad de los proveedores de datos y reforzar las competencias de los institutos de investigación que participan en la iniciativa, pretende pasar de ser un repositorio de datos a servir de plataforma de servicios. Esto implica un cambio hacia un sistema de almacenamiento federado en el que los proveedores de datos sigan siendo custodios de sus propios datos. La plataforma INSPIRE extraería los datos a distancia para casos de uso particulares.

En palabras de una de las principales partes interesadas en la iniciativa, el objetivo de esta transición es explorar un enfoque en el que ningún socio posea todos los datos.