Le risque algorithmique
Brève histoire de l’informatique
1 – La rencontre de l’algorithme et de la machine
L’histoire des algorithmes remonte à l’Antiquité. Même s’ils n’étaient pas encore désignés en tant que tel sous cette dénomination, des scribes de Mésopotamie et d’Egypte utilisaient déjà des processus mathématiques pour faciliter de nombreux calculs comme en matière agricole ou pour répartir une succession8 . En ce sens, l’algorithme est un « ensemble de règles opératoires dont l’application permet de résoudre un problème énoncé au moyen d’un nombre fini d’opérations » 9 . Bien que les Grecs poursuivirent d’importants travaux en algorithmique, il faudra attendre le célèbre mathématicien médiéval perse Al-Khwârizmî, notamment père de l’algèbre, pour que le terme « algorithme » apparaisse, étant issu de la traduction latine de son patronyme. Toutefois, la rencontre de l’algorithme et de l’informatique est plus tardive puisqu’elle implique la découverte des premières machines et la volonté de s’en servir pour aboutir à la résolution automatique de problèmes.
François Pellegrini et Sebastien Canevet notent que les premières machines à tisser automatiques commercialisées par Joseph-Marie Jacquard en 1801 peuvent être considérées comme les ancêtres des ordinateurs. Mais leur fonctionnement ne dépendait pas d’un programme informatique. Les machines programmables feront leur apparition plus tardivement, et ouvriront ensuite la voie à la machine universelle d’Alan Turing en 1936, notamment par le calcul binaire de l’information. C’est la fusion de la machine et de la « programmabilité » qui aboutira à la naissance de l’ordinateur moderne, et donc du mariage entre le traditionnel algorithme et l’informatique. Le passage du signal analogique au numérique marque donc une révolution13 et un changement de paradigme.
– Le fonctionnement d’un ordinateur
. Mais avant d’évoquer les incidences de ces algorithmes sur les personnes et la société, il est nécessaire d’aborder brièvement et le plus simplement possible le fonctionnement d’un ordinateur, ne serait-ce que parce que le droit est amené à recourir à ces notions, pour comprendre les termes clés que nous utiliserons tout au long de ces travaux. Un ordinateur se définit comme « une machine programmable de traitement de l’information. Il est constitué d’une mémoire permettant de stocker les programmes et leurs données, et d’un processeur exécutant les instructions des programmes, afin d’effectuer des calculs sur les données ». Il est alors constitué d’une partie matérielle et logicielle. Un ordinateur peut exécuter une pluralité d’algorithmes retranscrits dans un programme.
Ainsi, « on qualifie de numérique un algorithme qui a été conçu pour être implémenté dans un code informatique destiné à faire tourner une simulation ou un calcul sur un ou plusieurs microprocesseurs d’un ordinateur ». En d’autres termes, nous avons choisi le qualificatif de traitement algorithmique car il s’agit de la rencontre d’un code informatique et de son exécution par un ordinateur. Comme le note François Pellegrini16, l’algorithme renvoie à une abstraction pour résoudre un problème, tandis qu’un programme informatique est ce que l’on souhaite faire faire à un ordinateur. Enfin, le traitement est « ce qui s’exécute effectivement et peut être soumis à des aléas et erreurs transitoires issues de l’environnement ».
Une attention particulière doit donc être donnée au code source puisqu’il est la retranscription en informatique de l’abstraction des algorithmes composants le logiciel. La commission d’accès aux documents administratifs (CADA) définit le code source comme « un ensemble de fichiers informatiques qui contient les instructions devant être exécutées par un micro-processeur » 18 . 14. Bien que nous y revenions plus tard, il convient donc d’affirmer dès à présent que les algorithmes ne sont pas neutres puisqu’ils sont conçus pour résoudre un problème identifié19 . La programmation consiste à implanter dans un logiciel le ou les algorithme(s) devant être exécutés par un ordinateur, ce qui sera effectué par l’intermédiaire d’un compilateur dont l’objectif est de retranscrire le programme sous forme binaire afin qu’il soit lisible par la machine. Cette étape est délicate, car il convient de mettre dans un langage informatique les algorithmes que l’on cherche à exécuter par l’ordinateur. Pour cela, certains arbitrages doivent être opérés pour qu’ils soient en adéquation avec ce que la machine permet. Comme l’indique un adage en informatique, « cette machine m’énerve, elle fait ce que je lui ai dit de faire, et pas ce que je veux qu’elle fasse » 20. On comprend donc d’ores et déjà que les logiciels permettent l’automatisation de la résolution de problèmes, mais dans les limites matérielles de l’ordinateur.
L’informatique est aussi une pluralité de processus complexes et difficilement observables, demandant une solide expérience pour être comprise, lorsque l’état de l’art le permet, et susceptible de se heurter à des erreurs. Des erreurs peuvent interférer à chaque étape du processus, c’est-à-dire de la conception de l’algorithme à son implémentation, puis à son exécution par l’ordinateur. Il peut donc arriver qu’un code informatique soit bien conçu, mais son exécution va engendrer des effets tout autres que ce qui était prévu. Prendre connaissance des algorithmes qui ont vocation à être implantés dans un programme informatique ou d’un code source ne renseigne pas avec exactitude que le résultat généré par la machine est correct. D’autres problèmes peuvent également apparaître sans constituer des erreurs de programmation, mais plutôt en amont lors de la conception des modèles de l’algorithme. Il peut s’agir de biais algorithmiques. Aurélie Jean indique que « toute modélisation reste une approximation de la réalité » 22. Ainsi, ce qui n’est pas prévu dans le modèle, n’est pas pris en compte par l’ordinateur, et le développement de ce modèle est susceptible de biais .
Les incidences des algorithmes sur la société et le droit
Cette étude ne vise pas l’exhaustivité en matière de caractéristiques et d’effets juridiques induits par la révolution numérique dans la mesure où toutes les conséquences issues du recours aux algorithmes sont évolutives et n’ont pas encore été découvertes. En revanche, il convient d’évoquer l’émergence de nouveaux enjeux, du fait du déploiement des traitements algorithmiques dans tous les domaines de la société, ce qui constitue une problématique de nature démocratique et juridique. 19. Il ne fait nul doute que la révolution numérique s’accélère. Comme le note Dominique Cardon, 27 Ibid. 28 Loi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés. 29 Loi n° 2016-1321 du 7 octobre 2016 pour une République numérique. 8 « Avec l’augmentation massive des données numériques, la pertinence des services offerts par les grandes plateformes du Web se concentre de plus en plus dans leur capacité à trier, hiérarchiser, recommander ou personnaliser les informations au terme d’un ensemble de calculs qui n’ont jamais connu un déploiement à si grande échelle.
Plus que la simple collecte des données numériques, souvent figurée comme le principal enjeu du Big Data, c’est donc la force et la précision des calculs (notamment leur capacité à effectuer des traitements massifs en temps réel) qui expliquant l’émergence des algorithmes comme une nouvelle figure du pouvoir » 30 . 20. Mais avant d’aborder les géants privés du numérique qui exercent par l’intermédiaire des algorithmes un certain pouvoir, il convient de revenir à la genèse des incidences du numérique sur le droit. Car comme tout fait juridique ayant des conséquences significatives sur la société, il implique ensuite une réaction. Les enjeux spécifiques au numérique ont émergé dès l’après Seconde Guerre mondiale lors de l’avènement de l’ordinateur lorsqu’il est aussi bien apparu comme vecteur de progrès que d’inquiétude, posant nécessairement la question de l’éthique des chercheurs et ingénieurs développant et mettant en œuvre ces nouveaux outils.
Accompagnant la sortie du célèbre ouvrage de Norbert Wiener en 1948 en France, le journaliste Dominique Dubarle publie dans « Le monde » un article intitulé « Une nouvelle science : la cybernétique. Vers la machine à gouverner…La manipulation mécanique des réactions humaines créera-t-elle un jour « le meilleur des mondes » ? » 33. Le numérique est alors très rapidement associé au pouvoir, et aux incidences qu’il est susceptible d’exercer, y compris pour régir les comportements de la vie en société. Ces réflexions demeurent cependant abstraites et théoriques tant l’informatique n’en est qu’à ses balbutiements. Comme nous l’avons vu, les progrès menés en la matière ont abouti à des ordinateurs de plus en plus performants, mais aussi à des usages plus grand public et à des prix attractifs, ce qui assurera leur démocratisation. Très rapidement, il apparait que le numérique peut menacer les libertés du fait de son déploiement. Car la tentation d’automatiser certaines tâches, tout en recoupant toujours plus informations, dépasse les capacités humaines sur certains points, et intéresse les gouvernants.
L’Etat étant classiquement vu comme une potentielle menace pour les libertés, du fait de la force qu’il peut exercer sur les individus, la modernisation de l’administration par la voie de l’informatique est dans un premier temps observée avec inquiétude. Il s’agit également d’un contexte dans lequel l’action administrative exerce son activité avec une relative opacité34, ce qui engendre d’importantes suspicions. Cette prise de conscience aboutit assez rapidement à ce que les démocraties libérales se dotent d’un régime juridique pour accompagner cette révolution. Les années soixante-dix marquent cette prise de conscience par le public, notamment en France par l’émoi suscité par l’affaire SAFARI (Système automatisé pour les fichiers administratifs et le répertoire des individus) en 1974.
C’est après de nombreuses propositions législatives36, lors de la décennie soixante-dix, que le gouvernement présentera par la suite un projet de loi aboutissant à la LIL de 197837. Mais l’intelligence du texte est qu’il appréhende et soumet à son régime juridique les traitements de données nominatives mis en œuvre ou allant l’être, aussi bien par la puissance publique que par les acteurs privés. Sa neutralité technique, par le qualificatif de « traitement », permet de saisir les algorithmes informatiques au sens large, sans faire l’erreur de désigner une technologie particulière.