Skynet : l’algorithme à double tranchant


Michael Hayden, ancien patron de l’agence de renseignement américaine NSA (National Security Agency) et de la CIA a déclaré « Oui, nous tuons des gens en nous basant sur des métadonnées ». Le programme en question qui décrypte les métadonnées s’appelle Skynet. Inspiré du système informatique de « Terminator », conçu pour détruire toute trace d’humanité avec des bombes nucléaires, Skynet se base sur les données mobiles pour repérer des terroristes au Pakistan.

Dominique Cardon (@Karmacoma), spécialiste numérique, l’affirme dans son ouvrage « De quoi rêvent les algorithmes » : il est essentiel de comprendre comment la multitude de données personnelles collectées confère une place de plus en plus centrale aux algorithmes. Grâce à ces informations des programmes comme Skynet sont en capacité d’analyser tous nos déplacements et nos contacts afin de trouver d’éventuels profils terroristes. Au Pakistan, elle est utilisée pour repérer des membres ou des coursiers d’Al-Qaïda. Une technologie redoutable, d’autant qu’elle conduit à des tirs de drone qui ont une issue fatale, et irréversible. Alors peut-on se fier à ces algorithmes ?

 

Skynet : programmé pour récolter, analyser et comparer des données mobiles

C’est Edward Snowden qui a, en avril 2015, parlé de l’analyse des données mobiles par l’algorithme Skynet. Dans son rapport il explique que la NSA utilise ce programme ultra secret au Pakistan, et qu’il permet d’identifier de « présumés terroristes ». Une fois localisés, le gouvernement américain envoyait un drone pour les éliminer. Au total, Skynet surveillerait près de 55 millions d’abonnés mobiles pakistanais d’après The Intercept. L’algorithme recueille des informations sur les appels effectués, sur leur localisation, et ce même si les cartes SIM sont échangées pour brouiller les pistes. Cela lui permet de retracer la journée type de chacun des utilisateurs, et de repérer les différents profils. Il part du principe que le quotidien d’une personne innocente est strictement différent d’un suspect. La logique de l’algorithme est binaire. En fonction des informations récoltées Skynet attribue à chaque individu un score. S’il dépasse le seuil fixé, celui-ci est considéré comme appartenant à un réseau terroriste, sinon il est innocent.

 

Quelles sont les données « suspectes » ?

Pour établir la routine quotidienne des habitants, Skynet se focalise sur les liens qui les relient. L’algorithme repère ceux qui voyagent ensembles, qui partagent les mêmes contacts, ceux qui vont dormir régulièrement chez des amis, ceux qui déménagent souvent, ou ceux qui partent à l’étranger. Les trajets de l’utilisateur sont établis grâce à la puce GPS de la carte SIM. Cette technologie permet à Skynet, qui connait les lieux suspects, d’indexer les personnes qui les visitent régulièrement en indiquant le moment exact de leur présence. Les lieux de réunions réguliers qui sont suspectés d’abriter des terroristes sont aussi identifiés par ce processus. Il suffit alors d’y déposer des IMSI Catcher, des antennes qui interceptent toutes les conversations échangées autour d’elle. Certaines personnes sont considérées suspectes lorsqu’elles changent régulièrement de cartes SIM, ou éteignent fréquemment leur téléphone en enlevant la batterie.
Néanmoins, cette méthode pose quelques soucis. Avec l’étude des trajets GPS, tous les chauffeurs de taxis ont été considérés comme suspects par l’algorithme. Un journaliste d’Al Jazzera spécialisé dans la couverture de l’actualité reliée aux talibans et aux terroristes a été affilié par Skynet à Al-Qaïda et aux frère Musulmans. Au total c’est près d’un million de personnes qui ont été repérées par les algorithmes comme étant en lien avec le terrorisme.

Une méthode controversée

Dans son rapport, la NSA nous prouve que la méthode employée par Skynet tend à obtenir des résultats optimums en effectuant un test sur un échantillon de personnes. Sur la population générale du Pakistan, l’agence de renseignement tire au sort 100 000 personnes au hasard et rajoute 7 personnes identifiées avec certitude comme terroristes. Sur les 100 007 individus, l’algorithme ne se trompe quasiment jamais, il trouve rapidement les suspects.
Néanmoins Le Monde parle de « résultats scientifiques invalides » et la raison est simple. Le programme trouve facilement les terroristes car ce sont les seuls à être connectés les uns aux autres. Il n’y a que 0,008% de « faux positifs », d’innocents accusés à tort, car sur l’échantillon de 100 000 personnes très peu ont autant de contacts que deux terroristes affiliés au même réseau. Si on appliquait le taux d’erreur de 0,008% de l’algorithme à l’échelle de la population du Pakistan, ça représenterait 15 000 personnes tuées alors qu’elles étaient innocentes. Ce qui n’est pas négligeable.

Pour effectuer des tests plus fiables, la NSA aurait dû noyer les 7 profils terroristes dans la population totale du Pakistan, puis tirer au sort 100 000 personnes. La probabilité d’avoir un terroriste ou deux serait très faible. L’algorithme, en conditions réelles, aurait beaucoup de mal à les repérer puisqu’il se base sur les communications réalisées au sein d’un réseau. Skynet identifierai parmi les innocents ceux qui communiquent le plus entre eux et les accuserait de terrorisme.

On ignore aujourd’hui si tous les individus sélectionnés par Skynet ont été visés par des tirs de drone. Même si le scénario catastrophe de Terminator est loin d’arriver, il est certain que les algorithmes méritent d’être développés davantage pour être appliqué à notre quotidien.

Source : Le Monde, Les Echos, l'Humanité.
Article sur Dominique Cardon "En calculant nos traces les algorithmes 
reproduisent les inégalités entre les individus"