Big ou Bug Data?


« Pour les entreprises, le Big Data est une révolution aussi importante qu’Internet » assure Jérémie Wagner, le directeur commercial d’une société informatique. Il résume bien là l’engouement général du milieu des affaires pour ce qu’on annonce depuis quelques années comme « l’or noir du XXIe siècle ». Et pour cause, selon le cabinet d’étude IDC, le business du Big Data devrait atteindre 652 millions d’euros en France, d’ici 2018.

Les applications du recueil de données sont très vastes. Pour certaines entreprises, c’est un moyen d’améliorer la connaissance des clients, afin mieux cibler ses ventes. Dans le domaine de la santé, on prévoit déjà la création d’une médecine prédictive et personnalisée grâce aux données. Mais derrière ces « lendemains qui chantent », existent des raisons de s’inquiéter face au développement du Big Data.

Corrélation ne signifie pas causalité

La quantité gigantesque de données recueillies, grâce au Big Data, facilite la création de modèles prédictifs. Ceux-ci permettent de ranger les individus dans des cases. Exemple : sur Facebook, vous êtes fan du FC Metz, on vous classe dans la catégorie des sportifs. Mais l’un des problèmes majeurs avec le Big Data est le risque d’établir des modèles totalement erronés. De voir des liens sans les comprendre, puisque corrélation ne signifie pas causalité. En guise d’illustration : le graphique ci-dessous montre la corrélation entre la chute du taux de criminalité aux États-Unis et la baisse de l’utilisation du navigateur Internet Explorer.

internet-explorer-ie-murder-rate-graph

Le corollaire du Big Data est l’interprétation des données. Mais celle-ci, comme toute chose est sujette aux erreurs. Ce que confirme Viktor Mayer Schönberger, professeur à Oxford dans un livre sur le sujet: « l’analyse de données volumineuses ne permet pas toujours de connaître la cause, mais simplement la corrélation entre deux choses ».

Les risques en RH

Loin de la panacée souvent décrite le Big Data n’est donc pas exempt de tout reproche. Or, dans des domaines comme celui du recrutement, les conséquences pourraient être grave pour le salarié. C’est ce qu’avait démontré Jennifer Goldbeck, une chercheuse de l’Université du Maryland, lors d’une conférence TED Talks en 2014 : « Dans mon laboratoire, avec mes collègues, nous avons développé des mécanismes qui nous permettent de prédire certaines choses très précisément, comme votre penchant politique, votre sexe, orientation sexuelle, religion, âge, intelligence (…) Un exemple que je donne souvent est que si un jour ça m’ennuie d’être professeur, je lancerai une entreprise qui prédit tous ces attributs et des choses comme le fait de bien travailler en équipe et si vous prenez des drogues ou êtes alcoolique. Nous savons comment prédire tout ça. Et je vendrais ces rapports à de grandes entreprises ou à des compagnies R.H. qui voudraient vous engager. Je pourrais commencer ça demain, et vous n’auriez absolument aucun contrôle sur le fait que j’utilise vos données comme ça ».

Si l’on ne veut pas que le Big Data se transforme en Bug Data ou en Big Brother, un encadrement plus poussé du recueil de données devra être mis en place dans nos législations. Malheureusement, cette problématique est encore balbutiante dans les milieux politiques. Au XVIe siècle, le philosophe britannique Francis Bacon disait : « La connaissance est un pouvoir car elle permet d’agir sur l’objet étudié de façon à obtenir ce que l’on veut de lui ». Un adage étonnamment d’actualité.


A propos Paul Veronique

Etudiant en Master Journalisme et Médias Numérique. Passé par un Master 2 en Droit Public et Sciences Politiques. A travaillé pour L'Est Républicain de Nancy.