La Maison Blanche s’intéresse à la menace du Big Data sur la vie privée de ses citoyens (partie 1/2)

, Partager

Terme très à la mode, le Big Data symbolise notre capacité exponentielle à générer et collecter des quantités massives de données. Ces données, associées à l’utilisation de logiciels et de complexes algorithmes mathématiques, permettent l’extraction d’informations et de ressources jusqu’alors inexploitées. Si l’on accueille à bras ouvert les applications pouvant permettre de considérables avancées scientifiques, certaines utilisations connues, et d’autres moins connues, posent de sérieuses questions sur la protection de la vie privée.


Crédits : maxkabakov


En réponse à cette problématique et face aux inquiétudes des citoyens américains [1], Barack Obama a commandé à son conseiller, John Podesta, de réaliser une étude sur les enjeux liés à la fois au Big Data et à la protection des données. C’est ainsi que la Maison Blanche a publié le 1er mai deux rapports matérialisant les 90 jours de réflexion d’experts autour de la régulation des applications du Big Data aux Etats Unis. Le premier, intitulé "Big Data : Seizing Opportunities, Preserving Values" [2] analyse les répercussions du Big Data sur la vie privée tandis que le second, titré "Big Data and privacy : a technological perspective" porte un regard plus technique sur les technologies liées au Big Data, dont l’analyse sera l’objet de la suite de ce bulletin.

Le Big data et vie privée ne font souvent pas bon ménage

En structurant les flux considérables de données générées par chaque individu, le Big Data se propose aujourd’hui comme solution à un grand nombre de problématiques actuelles. Dans les sciences de la vie, le Big Data permet d’accélérer les recherches en génomique, comme le montre l’exemple du "Cancer Genome Atlas" [3]). Dans les projets d’urbanisation et notamment pour les Smarts Cities, on structure les données issues de smartphones, GPS et caméras pour prédire et prévenir de futures congestions de réseaux de transports [4].

Si le but principal de ces applications est d’être au service d’avancées scientifiques, technologiques et sociales, ces fantastiques innovations ont pour base la collecte d’informations souvent très personnelles, et beaucoup s’interrogent sur la protection de ces données. Prenons l’exemple du web marketing. Aujourd’hui, de très grandes entreprise telles que Axciom [5] sont spécialisées dans la collecte et la construction d’énormes bases de données remplies d’informations sur des centaines de millions de personnes. La société recueille ces informations auprès de sources publiques et privées et les organise ensuite sous forme de profils d’utilisateurs. En effet, l’idée n’est pas de recueillir des données par utilisateur mais de pouvoir extraire des usages définis en fonction du genre, des intérêts, de la tranche d’âge etc. On parle de "personnalisation parfaite".

Au même titre que le web marketing, la collecte massive de données et la création de profils offrent d’importantes opportunités dans des applications telles que la santé, l’éducation ou l’urbanisation. Cependant et comme identifiée par la Maison Blanche, elle laisse également place à des risques de discrimination en termes de prix, de services ou d’opportunités [6].

Des solutions pour se protéger vis-à-vis de cette course effrénée à la collecte d’informations ont pourtant été mises en oeuvre depuis quelques années. Toutefois, aucune solution satisfaisante n’a encore été trouvée pour donner la possibilité à l’internaute que ses données ne soient pas utilisées à des fins publicitaires. Les projets de mise en place de "Do Not track System" ou "Opt-out" se sont révélés jusqu’à présent inefficaces. Pire, la multiplication et l’ubiquité des données ont rendu difficile leur suppression, entrainant l’effet "persistence of data" : les données personnelles, qui sont par défaut confidentielles, restent ainsi enregistrées sur internet parfois à l’insu de l’utilisateur.

Une réflexion globale à l’initiative de la Maison Blanche

Le 17 janvier 2014 et lors de sa conférence de presse sur les réformes de la NSA, le Président Obama a annoncé l’ouverture d’une grande étude visant à faire un état des lieux sur ce qu’est le Big Data aujourd’hui, d’en comprendre les enjeux et surtout d’anticiper les problématiques à venir sur le thème de la vie privée (la vidéo de son discours est disponible en ligne [7]).

Barack Obama a confié à son conseiller, John Podesta, le pilotage d’un examen complet en sollicitant représentants du gouvernement, technologues, chefs d’entreprise et experts de la vie privée. L’objectif de cette étude étant de pouvoir "tisser" des normes internationales sur la façon de gérer les données.

Pour ce faire, la Maison Blanche a fait appel à l’ensemble de la communauté concernée à travers un appel à commentaire ouvert au public, des entretiens avec de grands acteurs nationaux et internationaux (on recense par exemple la French National Commission on Informatics and Liberty) ainsi que des symposiums académiques dans 3 célèbres universités américaines (également disponibles en ligne) :

a. Au MIT le 3 mars 2014 : "Advancing the State of the Art in Technology and Practice" :
http://web.mit.edu/bigdata-priv/webcast.html

b. A la New York University le 17 mars 2014 : "The Social, Cultural & Ethical Dimensions of Big Data" :
http://www.datasociety.net/initiatives/2014-0317/

c. A Berkeley le 1 Avril 2014 : "Values and Gouvernance"
http://redirectix.bulletins-electroniques.com/yfnhe

Quelques points mis en avant dans le rapport

Le rapport de la Maison Blanche propose des réponses sur quelques points clefs. Il est par exemple mis en avant que les méthodes d’anonymisation pour la protection des données des individus ne fonctionnent pas toujours (page 8 du rapport [2]). L’intégration de plusieurs sources peut permettre d’aisément déduire les informations personnelles issues de données supposées non identifiables (on parle d’effet mosaïque), et c’est là la puissance du Big Data !

Sont également abordés les risques associés à l’utilisation du Big Data pour la médecine prédictive. En effet, et si son utilisation offre des résultats très prometteurs pour la prédiction de contraction de maladie ou de la réponse d’un organisme face à un traitement, les informations recueillies par la médecine préventive sont particulièrement sensibles. A terme, l’objectif sera de recueillir des données sur des groupes ou catégories de personnes et de les utiliser pour identifier les maladies avant ou très tôt après l’apparition des symptômes cliniques. L’un des problèmes est alors que l’information collectée s’étend au-delà des données propres à un individu, et s’étend également à d’autres personnes, telles que celles ayant potentiellement des gènes similaires (enfants ou famille proche). Sur ce thème, le rapport fait état d’un cadre réglementaire peut-être mal adapté pour répondre aux développements futurs tout en favorisant les innovations (page 23 du rapport [2]).

Le rapport met également en garde à propos de la "surrèglementation" de la collecte des données. Le Big Data permet aux scientifiques d’amasser des quantités massives de données, y compris de données non structurées. Par exemple en génétique, les chercheurs peuvent bénéficier d’un accès à de plus grands ensembles de données d’informations génétiques sensibles, mais les lois de la vie privée peuvent limiter leur accès à ces données. Des chercheurs en génétique donnent l’exemple de la détection d’une variante génétique liée à la schizophrénie : impossible avec 3500 jeux de données génétiques, mais rendue possible avec une base de 35.000 cas (page 7 du rapport [2]).

Un grand public qui en sait finalement peu sur le Big Data

Si le Big Data est aujourd’hui une réalité pour tous, on s’aperçoit qu’une importante partie du grand public est très peu (ou pas) sensibilisée aux mécanismes et applications liées à la collecte de données.

L’une des recommandations suggérée par la Maison Blanche est d’avancer le projet de loi sur les consommateurs et leur vie privée (Consumer Privacy Bill of Rights [8]), qui comprend par exemple l’idée que les consommateurs ont le droit d’exercer un contrôle sur les données personnelles que les entreprises collectent et utilisent, ainsi que le droit d’accès et de rectification. Le rapport préconise l’utilisation du "Consumer Privacy Bill of Rights" afin que les parties prenantes (associations, ONG, agences fédérales) proposent des mesures applicables et qu’à terme, une proposition de loi soit présentée au Congrès.

De même, le Congrès est encouragé à voter un texte définissant le cadre législatif en matière de data breach. La loi devrait en particulier disposer que les entreprises aient obligation de notifier les incidents (piratage, compromission de données personnelles…) à leurs clients, sous un délai imposé, et prioriser les notifications pour les incidents les plus importants. Cette loi devrait prendre en compte les recommandations de la proposition du Gouvernement de 2011 sur la cybersécurité. Le rapport recommande que le Privacy Act de 1974 qui dispose de la protection de la vie privée des citoyens américains lors du traitement de données par les agences fédérales, soit applicable aux personnes non ressortissantes des Etats-Unis. A défaut d’une telle mise à jour, des moyens alternatifs devraient être trouvés afin de protéger les données personnelles des citoyens non américains, quelle que soit leur nationalité.

Dans cette logique, le géant du courtage de données Axciom a récemment lancé un outil de transparence qui permet aux résidents américains de parcourir les informations les concernant [9]. Si ce geste audacieux semble être avant tout un fort coup marketing, il va certainement permettre aux internautes de reconsidérer la manière dont ils diffusent leurs informations personnelles sur le net [10]. Autre initiative d’un géant du courtage de données, Facebook vient d’annoncer l’offre d’un "Privacy Checkup" sur sa plateforme en ligne. Un tutorial permettra à chacun des 1.28 milliards d’utilisateurs de retracer (facilement) les différents paramètres de vie privée, réputés très peu accessibles et parfois jugés comme tournés vers l’ouverture des données des utilisateurs [11].

Sources :


- [1] Enquête de la maison blanche sur les inquiétudes des citoyens américains : http://www.whitehouse.gov/issues/technology/big-data-review
- [2] Le rapport complet : http://www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf
- [3] Le projet "Cancer Genome Atlas" : http://cancergenome.nih.gov/
- [4] Une initiative Smart Cities/Big Data d’IBM : http://siliconangle.com/blog/2013/12/26/ibm-smarter-cities-initiative-using-big-data-for-better-traffic-flow/
- [5] http://blogs.avg.com/privacy/acxiom-opens-data-vaults/
- [6] https://www.hsdl.org/blog/newpost/view/big-data-potential-to-deliver-perfect-personalization-or-discrimination-and-segregation
- [7] Le discours de Barack Obama : http://www.washingtonpost.com/politics/full-text-of-president-obamas-jan-17-speech-on-nsa-reforms/2014/01/17/fa33590a-7f8c-11e3-9556-4a4bf7bcbd84_story.html
- [8] http://online.wsj.com/news/articles/SB10001424052702304178104579535970497908560
- [9] http://www.aboutthedata.com
- [10] http://blogs.avg.com/privacy/acxiom-opens-data-vaults/
- [11] http://www.nytimes.com/2014/05/23/technology/facebook-offers-privacy-checkup-to-all-1-28-billion-users.html?_r=0

Rédacteurs :


- Maxime HUYNH, Attaché Scientifique Adjoint, maxime.huynh@ambascience-usa.org ;
- Guilhem FENIEYS, Service Economique Régional, Guilhem.FENIEYS@dgtresor.gouv.fr ;
- Suivre le secteur Nouvelles Technologie de l’Information, Communication, Sécurité sur twitter @MST_USA_NTICS ;
- Retrouvez toutes nos activités sur http://france-science.org.

Voir en ligne : http://www.bulletins-electroniques….