Big Data : la révolution qui va transformer la vie, la pensée, le travail

big data revolutionPeu de personnes imaginent à quel point ce qu’on met derrière ce nom fourre-tout de big data va transformer nos vies à l’avenir. Bien sur d’un point de vue professionnel mais également d’un point de vue personnel et, surtout, collectif, remettant parfois en cause des choses que nous pensions immuables et sur lesquels ont été bâtis certains principes de la vie en société et du travail.
Dans Big Data: A Revolution That Will Transform How We Live, Work, and Think, Viktor Mayer-Schönberg et Kenneth Cukier font un rapide et exhaustif tour du propriétaire et tentent de nous faire percevoir les usages futurs et les impacts que cela aura dans le futur. Un sujet majeur car on ne peut pas rester à l’écart du phénomène : on sera tous demain utilisateurs et sujets du big data alors qu’il sera impossible de rester à l’écart même en s’enfuyant une île déserte et cela aura un impact considérable sur la manière dont on travaille, sur la manière dont on gère notre vie privée et dont on agira et sera traité au sein d’un système global et connecté qui n’est autre que la société.

Le livre commence par remettre en cause trois piliers structurants de notre pensée qui vont voler en éclat.

1°) On a toujours cru que le meilleur moyen de traiter des données était de procéder par échantillonnage. Une méthode qui a des limites dès lors qu’on veut affiner par sous-populations et découvrir des tendances très fines. Aujourd’hui on est capables de traiter quasiment l’intégralité des données sur un sujet et la capacité de traitement n’est plus une limite dans un grand nombre de cas et le sera de moins en moins.

2°) Peu importe la précision. Moins on utilise de données plus elles doivent être qualifiées et le résultat précis. Travailler sur du « big data » fait perdre en précision absolue mais la grande quantité de données permet au contraire d’arriver à des résultats qu’on aurait jamais eu auparavant. Il faut apprendre sacrifier la précision à la tendance. Ce qui prouve également que le big data n’est pas fait pour tous les usages. On est dans un système de probabilités, pas dans une prévision certaine, mais une probabilité qu’on essaie de maximiser en accroissant le volume de données traitées.

Avec le Big Data il va falloir croire sans comprendre

3°) On passe d’un monde de causalité à un monde de corrélation. Alors là je vois déjà les spécialistes hurler car le sujet fait débat. Je vous renvoie sur ce point à l’excellent billet de Christian Faure, Big Data Bullshit, qui nous dit qu’il n’y a finalement rien de nouveau, la causalité n’étant que la plus forte expression de la corrélation. Je vous renvoie également à cet excellent article de la Paritech Review qui met en avant, lui, la révolution consiste à passer d’une pensée déductive (on part d’une hypothèse, on déduit les conséquences et on vérifie) à une pensée inductive (on projette des situations connues). Ce sur quoi on peut par contre s’entendre c’est que déduction et induction ne s’appliquent pas aux mêmes situations et ne répondent pas aux mêmes besoins d’une part, et plus que le passage de la corrélation à la causalité c’est le fait qu’on se passe d’explication qui est le changement le plus fondamental. Le Big Data n’explique pas pourquoi une chose est ou a de grandes d’arriver. Il dit que A impacte B, qu’ »en fonction de ce qu’on sait on peut prédire que », mais il ne décrit pas le processus qui fait que quand A varie, B varie. Il dit simplement que quand A varie (ou varie d’une certaine manière avec des centaines d’autres variables) B varie. Point. Une grande claque pour nos esprits cartésiens. Il va nous falloir apprendre à admettre sans comprendre.

Pourquoi prêter autant d’importance au phénomène ? Déjà parce que la technologie le rend désormais possible. Ensuite parce que la matière première, la donnée, est plus nombreuse de jour en jour, phénomène décrit sous le nom de datification. Bien sur il y a les données qu’on connait, générées par nos systèmes d’information au quotidien. Mais la numérisation de nos vies fait que chaque action, chaque chose qui arrive est – et sera encore plus à l’avenir – productrice de données. De nos assistants numériques qui vont aller jusqu’à enregistrer nos signaux vitaux, aux comptes rendus médicaux en passant le trafic enregistré sur les routes : il faudrait un annuaire, que dis-je, une bibliothèque pour lister toutes les données potentiellement disponibles et qu’on peut désormais utiliser pour comprendre comment les choses fonctionnent, qu’est ce qui impacte quoi, sur quoi porter notre attention et agir prioritairement.

Les données : les rejets d’un monde qui vit

Si chaque action ayant lieu dans le monde donne lieu à l’émission de données  (et c’est pratiquement le cas : interventions des urgences ou de la police, arrosage des espaces publics, présence à un cours, consultation d’un site web mais aussi phénomènes naturels, météo, vitesse des vents, température de l’eau…), ces données sont en quelque sorte les « rejets » de notre activité, des rejets qu’on peut analyser pour comprendre notre environnement dans toute sa complexité, comme on analyse des sédiments pour comprendre ce qu’était la terre il y a 200 000 ans et prédire ce qui va arriver dans le futur. Sauf que là c’est en temps réel, tout de suite et maintenant.

Alors bien sur, dans cet inventaire à la Prevert, encore faut il trouver les bonnes données, celles qui sont pertinentes, et les traiter convenablement. C’est une autre partie très intéressante du livre qui s’intéresse aux nouveaux métiers induits par le big data mais également à sa chaine de valeur. Entre le propriétaire, celui qui traite et celui qui tire profit de la donnée il y a toute une chaine de valeur nouvelle qui se crée…et qui bouge avec le temps. Qui joue quel rôle et qui en tirera le fruit sur le long terme ? Il semble bien que ce soit à terme le propriétaire de la donnée qui tire les marrons du feux, pas celui qui sait l’exploiter ni celui qui trouve les usages les plus inventifs. En tout cas les cas de valorisation des données sont nombreux et vont donner lieu au développement de nouvelles activités. Les nombreux cas d’usage cités dans le livre donnent déjà le vertige et on n’imagine pas ce qu’il sera possible de faire une fois qu’on aura vraiment compris ce qu’on a en main.

L’individu voit sa vie privée menaçée et est exclu de la chaine de valeur

Et le particulier dans tout ça ? C’est la dernière dimension qu’on oublie souvent ou qu’on ne traite que que manière parcellaire. Le livre traite bien sur des questions de confidentialité des données et des risques avérés d’une société qui juge et traite ses membres de manière prédictive. La loi devra garantir que Minority Report ne soit jamais qu’une fiction car cela remet en cause le fondement même de notre pacte social : on doit rendre responsables les gens de ce qu’ils font, pas les sanctionner a priori pour quelque chose qu’ils n’ont pas fait. De manière générale il va falloir renforcer le respect de la confidentialité et faire porter la responsabilité de l’usage des données au delà de la raison première de leur collecte aux exploitants. Là encore l’arsenal juridique est aujourd’hui inadapté.

Plus rare, le livre questionne également la place de l’individu dans la chaine de valeur. Car on est devant une grande première : celui qui au départ produit la matière première, une matière première dont on le dessaisit sans autre forme de procès, est totalement exclu du partage de la valeur qu’elle contribue à créer. Double peine même : cette donnée peut même être utilisée contre lui (banque, assurance, police) ou afin de lui faire consommer davantage. Selon les auteurs s’il n’est pas envisageable à terme que les particuliers puissent négocier au cas par car la mise à disposition de leurs données (ce serait ingérable) on peut imaginer que demain des intermédiaires, des « data brokers » le fassent pour eux.

Il est difficile d’appréhender de manière exhaustive un tel sujet en un peu plus de 200 pages. je pense que ce livre permet au moins de poser le décor et sensibiliser aux enjeux afin que tout un chacun puisse avoir une vision à peu près complète de ce qui se passe et de à quel point cela va transformer notre quotidien. Ensuite, point par point, chaque partie pourrait être l’objet d’un livre en soi. Un livre qui, à mon avis, constitue un bon départ pour commencer à se construire une culture « big data ». Libre ensuite à chacun de creuser  les points qui l’intéressent plus spécifiquement.

Une bonne entrée, donc, dans ce qui est notre monde de demain. Car autant – et même si c’est compliqué – on peut refuser le monde connecté et social et vivre plus ou moins à l’écart du web social autant je ne vois pas comment on échappera demain au monde des données. Comme sujet ou comme acteur. Pour le meilleur (services, santé, criminalité, efficacité décisionnelle) et pour le pire (confidentialité, normalisation forcenée des comportements, exclusion de ceux qui ne rentrent pas dans le « modèle idéal et inoffensif »)

Vous pouvez trouver Big Data: A Revolution That Will Transform How We Live, Work, and Think sur Amazon.

 

 
  • Chabannes

    Excellent. Merci beaucoup.