Big data : de quoi parle-t-on ?!
Il faut prendre en considération qu’un site internet est rarement une pièce unique sur un serveur unique. Pour afficher une page, le site va le plus souvent vous demander d’aller charger des éléments sur d’autres serveurs : une police de caractère sur un serveur Google, des images stockées sur un serveur Amazon, une appli pour « liker » votre page Facebook en lien avec Facebook, etc.
Ainsi, quand vous naviguez sur internet, vous envoyez des informations aux Géants du Net lors de la quasi totalité de votre navigation, même si vous n’utilisez pas le moteur de recherche de Google, ni aucun de ses services. Amazon n’est pas seulement un vendeur de produits sur internet, il est également devenu un géant du stockage de données (33 % des données numériques internet mondiales sont stockées chez Amazon Web Services – source).
L’intérêt de ce type d’information, multiplié par les milliards d’humains qui utilisent internet – autrement dit : intérêt de ce big data – c’est de créer des profils type d’utilisateurs. En collectant et en analysant l’ensemble des données que nous leur transmettons en naviguant sur internet, ils peuvent savoir quel est notre âge, notre catégorie sociale, ce que nous aimons, ce qui nous intéresse, nos hobbys, nos opinons politiques, mais également les lieux depuis lesquels nous nous connectons – donc où nous habitons, où nous travaillons, l’évolution de toutes ces informations au fil des ans, etc.
Ajoutons à cela les informations transmises notre téléphone portable ainsi que tous nos objets connectés. Pour peu que nous ayons un smartphone Android, qui nécessite généralement l’utilisation d’un compte Google et que nous n’avez pas supprimé volontairement l’utilisation de notre position GPS par Google (et/ou une application du groupe Meta – Facebook, Instagram – ou tout autre application mobile), ces derniers savent également les lieux que nous fréquentez, qui sont les personnes qui fréquentent les mêmes lieux, qui nous avons rencontré, quand, où et pendant combien de temps, à quelle heure nous nous couchons et nous nous réveillons, quel est l’usage de notre téléphone portable, potentiellement qui nous appelons, à quelle fréquence et pendant combien de temps, etc ; une montre connectée mesure en temps réel notre état de santé, etc.
Enfin, ces données ne sont pas accessibles uniquement par les Géants d’internet dont nous acceptons l’utilisation et les politiques de confidentialité. L’affaire Wikileaks sortie en 2011 a révélé que la NSA et le FBI pouvaient se connecter directement sur les serveurs des 9 entreprises leaders du numérique dont Microsoft, Yahoo, Google, Facebook et Apple. Ils peuvent extraire les fichiers audio, vidéo, photo, mails, documents et codes d’accès qui leur permet de suivre tous les individus et leurs contacts en temps réel (plus d’infos).
Au final, grâce à la quantité de données que nous laissons derrière nous et qu’il utilisent, tous ces organismes nous connaissent sans doute mieux que n’importe lequel de nos amis, et peut-être même que nous-même car ils gardent en mémoire chacune de ces données pour longtemps. Avant de répondre à la question suivante, prenez le temps de fermer les yeux et concentrez-vous : accepteriez-vous que vos proches aient entre ses mains toutes ces informations et connaissent le détail de votre vie ?
Nous avons besoin de notre vie privée pour nous sentir en sécurité. Nous avons besoin de savoir qu’à certains moment s de notre vie, nous sommes seuls et nous pouvons faire ce que nous souhaitons sans être surveillés par quelqu’un d’autre. Pourtant lorsque l’on parle de la thématique du big data et de l’importance qu’elle prend au niveau planétaire, une réponse courante que j’entends est :
« Je n’ai rien à cacher.
Google et le gouvernement peuvent bien tout savoir de ma vie, quelle importance ?! »
N’avons-nous vraiment rien à cacher ?
Ce big data, couplé à ce qu’ils appellent intelligence artificielle, c’est à dire des algorithmes mathématiques prenant en compte de nombreux facteurs, permettent d’analyser les comportements humains et d’apprendre énormément sur les groupes de personnes, leurs idées, leurs actions. Comme toute technologie, on y retrouve des aspects positifs et des aspects négatifs. Utilisée à des fins dictatoriales, on retrouve la mise en place d’un système de « crédit social » en Chine qui pousse à la surveillance permanente des citoyens qui gagnent ou perdent des points en fonction des comportement jugés positifs ou négatifs par le pouvoir en place. Des comportements qui ne rentrent pas dans les normes édictées par le Parti induisent de mauvaises notes qui empêchent, par exemple, de voyager ou d’obtenir un emprunt bancaire. Par exemple, il est possible de perdre 5 points de crédit social si on brûle nos ordures ménagères, ou de gagner 5 points de crédit social si on dénonce une personne ayant participé à une manifestation illégale.
Au sein des sociétés occidentales, le scandale de Cambridge Analytica a démontré que les données de 87 millions d’utilisateurs de Facebook ont été utilisées pour influencer l’opinion dans un but favorable au Brexit et à l’élection de Donald Trump à la présidence des États-Unis. Leur outil : afficher sur leur mur Facebook les informations qui pourraient les faire changer d’avis (plus d’infos).
Une forme sournoise de manipulation ciblée. Nous sommes nombreux et nombreuses à penser que nous avons acquis un esprit critique qui nous permet de lire des informations, de les vérifier, de les analyser et de prendre du recul face à ce que l’on lit au quotidien. Si vous pensez cela, je vais être assez dure : c’est faux. Nous pouvons avoir acquis une expérience plus ou moins importante dans le recoupement d’informations et l’analyse de discours, cela n’empêche que nous ne faisons et ne pouvons pas faire ce travail de méta-réflexion pour l’ensemble des données que l’on reçoit au quotidien. Si notre mur Facebook affiche un grand pourcentage d’informations sur une thématique, nous aurons quoi qu’il en soit le sentiment que cette thématique est une thématique importante et notable, et cela influera sur notre vision du monde. Quoi que cela coûte à notre ego, nous sommes toutes et tous manipulables. Et l’admettre permet justement de mettre en place les outils appropriés pour s’en prémunir.
Les données que nous partageons n’impactent pas que nous, elles impactent également nos proches ainsi que l’ensemble de la société.
Nous ne sommes pas uniquement des individus pris isolément. Nous sommes identifiés dans un tout qui correspond à notre famille, nos amis, nos relations professionnelles et les gens que l’on croise dans n’importe quelle situation. Si nous connaissons ou que nous croisons régulièrement une ou plusieurs personnes qui ont des activités illégales ou militantes, notre score de risque va augmenter quelles que soient nos actions personnelles. Le profilage permet de recouper les informations spécifiques de plusieurs milliers d’individus. Il apporte une connaissance de l’humain et des groupes sociaux absolument extraordinaire. Plus la base de donnée est importante, plus les profils de chaque groupe sera fin. Grâce aux informations que nous apportons tous au big data et à l’analyse de celui-ci, quelques rares données sur un individu permettent d’extrapoler énormément de caractéristiques de cette personne. Donc permettre la collecte de nos données aujourd’hui impacte aussi la vie de personnes qui ne produisent pas ou peu de données.
Les informations que l’on transmet sur nos actions et notre personnalité sont des informations utiles pour ceux qui souhaitent nous manipuler ou nous contrôler. Qu’on le veuille ou non : les informations que nous transmettons et recevons impactent notre réalité. La manipulation de nos comportements sans que nous nous en rendions compte est une réalité à laquelle nous ne pouvons pas échapper, quoi qu’on fasse.
« Dire que la vie privée ne vous intéresse pas parce que vous n’avez « rien à cacher », c’est comme dire que la liberté d’expression ne vous intéresse pas parce que vous n’avez « rien à dire ». Car même si vous n’utilisez pas vos droits à un moment précis, d’autres en ont besoin. Dire que vos droits ne vous intéressent pas parce que vous n’en faites pas l’usage est la chose la plus asociale que vous puissiez dire. Cela revient à dire : « les autres ne m’intéressent pas ». Particulièrement si vous occupez une place sociale privilégiée. Si vous êtes vieux, riche, blanc, en haut de la pyramide sociale, alors la loi et les droits vous importent peu parce que la société est dessinée pour répondre à vos intérêts. Ce sont toujours les minorités qui sont les plus à risque. » Édouard Snowden (source)
De manière générale, la numérisation de nos données pose question. Si l’informatisation rend des services indéniablement utiles, le fonctionnement actuel des entreprises et des administrations tend à la centralisation des données personnelles. Trop bien connaître les citoyens et avoir la possibilité de les surveiller et de les suivre où qu’ils sont et quoi qu’ils font est un rêve pour nombre de de régimes totalitaires. Ce n’est pas moi qui le dit, c’est William Binney, un ancien directeur technique de la NSA – l’agence de sécurité nationale étasunienne : « Récolter les données de toute la population peut rendre un gouvernement très dangereux. Les gens ne comprennent pas ça. Il faut alors espérer qu’il respecte les principes démocratiques et qu’il ne tombe pas dans le totalitarisme. » (cité dans le film Nothing to Hide, de Marc Meillassoux)
Quelles preuves avons-nous que Google, Facebook, Amazon et tous les autres acteurs utilisent, et utiliseront toujours, nos données uniquement à des fins éthiques ? Quelles preuves avons-nous que nos États n’agissent pas et n’agiront jamais de manière anti-démocratiques ?
Il me semble important d’être informé de ces enjeux pour prendre conscience de l’implication des choix que nous faisons au quotidien lorsque nous utilisons des outils numériques. Car il est possible de laisser moins de traces, ou au moins de brouiller les pistes afin de rendre plus compliqué notre pistage.
Personnellement, j’utilise et je promeus logiciels et sites internet qui ont pris acte de ces questions et qui travaillent à proposer des alternatives aux Géants. Les propositions que je fais dans la suite de l’ouvrage prennent en compte ces caractéristiques et, comme elles ne sont pas parfaites, je préciserai pour chaque objet quels sont les avantages et inconvénients de la méthode proposée.
Il me semble important d’être informé de ces enjeux pour prendre conscience de l’implication des choix que nous faisons au quotidien lorsque nous utilisons des outils numériques.
Anecdote
Message de Mark Zuckeberg à un ami, peu après avoir créé Facebook sur le campus d’Havard aux États-Unis :
Zuck: Yeah, si tu as besoin d’infos sur n’importe à Harvard, tu me demandes.
Zuck: J’ai plus de 4000 mails, photos, adresses, etc.
[L’ami]: Quoi ? Comment t’a eu ça ?
Zuck: Les gens me les ont juste envoyé. Je ne sais pas pourquoi.
Zuck: Ils me « font confiance »
Zuck: Put** d’idiots.
Source : The New Yorker, The Face of Facebook, le 20 septembre 2010 (article disponible en ligne)
Chiffres clés
Big Data : 5,3 milliards d’utilisateurs d’internet dans le monde SOIT 64 % de la population mondiale. Temps moyen passé par internaute : 192 minutes par jour.
50 000 Go / seconde de données enregistrées
Alphabet : Fondateur du moteur de recherche Google (92 % des parts de marché des recherches sur internet – 99 000 utilisations par seconde). Possède notamment YouTube (2,5 milliards d’utilisateurs), a développé le système d’exploitation Android (3 milliards d’utilisateurs) et le navigateur Chrome.
283 milliards de dollars de chiffre d’affaire en 2022
Amazon possède notamment Alexa, Twitch. L’entreprise gère un tiers des données numériques mondiales, via Amazon web services. Parmi ses clients : Engie, Airbus, Netflix, Goldman Sachs, Société Générale, Radio France, Veolia, Renault, SNCF, TF1, Bouygues Telecom, Canal +, Decathlon, Le bon coin, Axa, etc.
Meta : La société mère de Facebook, possède notamment Instagram et Whatsapp
3 milliards d’utilisateurs des différentes applications | 118 milliards de dollars de chiffre d’affaire en 2021
Microsoft : Créateur de Windows (utilisé sur 1,5 milliards de PC dans le monde). Possède aussi LinkedIn (500 millions de membres), Skype, Xbox, Bing | 198 milliards de dollars de chiffre d’affaire en 2022
Apple : Créateur de Macintosh, iPhone, iPad, Apple Watch (2 milliards d’appareils Apple actifs dans le monde) | 392 milliards de dollars de chiffre d’affaire en 2022
Sources : Statista, Blog du Modérateur, Wikipédia
Les conditions d’utilisation d’Instagram
Jenny Afia, juriste experte en protection des données personnelles a réécrit les conditions d’utilisation du réseau Instagram dans un langage accessible pour les enfants, et plus compréhensible pour leurs parents.
– Officiellement, vous possédez chacune des photos et des vidéos originales que vous postez, mais nous sommes autorisés à les utiliser et nous pouvons laisser d’autres les utiliser également, partout dans le monde. D’autres peuvent nous payer pour la réutilisation de vos images, mais nous ne vous paierons pas pour ça.
– […] Nous pouvons garder, utiliser et partager vos informations personnelles avec des entreprises connectées à Instagram. Ces informations incluent : votre nom, adresse mail, école, adresse, photo, numéro de téléphone, vos likes et dislikes, où vous allez, où sont vos amis, le nombre de fois où vous venez sur Instagram et toutes les autres données personnelles que nous avons telle que votre date de naissance ou les personnes avec lesquelles vous chattez, y compris vos messages privés (Dms).
– Nous pouvons vous envoyer des publicités liées aux centres d’intérêt que nous avons détectés. Vous ne pouvons pas nous empêcher de faire ça et ce que ne sera pas toujours évident qu’il s’agit d’une publicité.
– Nous pouvons modifier ou supprimer Instagram, ou vous empêcher d’accéder à nos services à tout moment, pour n’importe quelle raison et sans vous avertir en amont. Nous pouvons également supprimer des posts ou d’autres contenus de manière aléatoire, sans vous avertir, quelle qu’en soit la raison. Si nous le faisons, nous n’aurons pas à vous indemniser et vous n’aurez aucun droit de vous plaindre.
– Nous pouvons vous imposer de changer de nom d’utilisateur qu’elle qu’en soit la raison.
– Nous pouvons, mais nous ne sommes pas obligés, de supprimer, éditer, bloquer et/ou surveiller tout ce qui est posté et tous les comptes qui enfreindraient l’une de ces règles. Nous ne sommes pas responsables si quelqu’un enfreint la loi ou enfreint ces règles; mais si vous les enfreignez, vous en êtes responsable.
article Précédent
article Suivant
S’abonner au blog