Atelier « Fairness Accountability and Transparency in Machine Learning »

La Conférence internationale sur l’apprentissage automatique (International Conference on Machine Learning ou ICML) est la conférence de référence au niveau mondial sur l’apprentissage automatique, ces algorithmes  qui, à partir d’un ensemble de données, induisent automatiquement des modèles. Ces technologies sont par exemple utilisées en vision par ordinateur ou en reconnaissance de la parole.
Pendant la dernière conférence ICML qui s’est tenue récemment à Lille, un atelier intitulé « Fairness Accountability and Transparency in Machine Learning«  s’est tenu.
Il est intéressant de voir que ces questions font leur chemin aussi dans la communauté de l’apprentissage. Cependant, ne nous emballons pas, il y avait 30 personnes maximum pendant cet atelier alors qu’ICML a rassemblé plus de 1000 personnes.
Voici quelques exemples de communications (en ligne sur le site) :
-Nick Diakopoulo.s Algorithmic Accountability and Transparency in Journalism
-Sara Hajian. Discrimination- and Privacy-Aware Data Mining
-Salvatore Ruggieri.  Privacy Attacks and Anonymization Methods as Tools for Discrimination Discovery and Fairness
-Toshihiro Kamishima and Kazuto Fukuchi. Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, and Theoretical Aspects

Vous avez dit progrès ?

Par : Jean-Yves Antoine

Drawing of an old Raschel machine - Source: Josef Worm: Die Wirkerei und Strickerei. 2. Aufl. Leipzig, 1920

Il y a quelques semaines, le responsable de formation que je suis a été sollicité par un étudiant en Master Entrepreneuriat. En relation avec une entreprise dite innovante, il désirait que je diffuse auprès de mes étudiants un questionnaire sur leurs attentes en matière d’objets connectés. Vous savez, ces smartwatch qui vous permettent de suivre vos déplacements quotidiens, vos paramètres physiologiques et enregistrer sur le cloud ces informations pour votre confort. Ayant refusé poliment de donner suite à sa demande pour des raisons éthiques, un débat s’est amorcé sur la portée de ces dispositifs mobiles. Mon interlocuteur n’avait aucune notion d’éthique, qui semblait se rapprocher d’un jugement négatif sur les profits de sa future entreprise dans son esprit. Après quelques échanges la conclusion est tombée, cinglante : « oui je comprends vos réserves, mais je ne suis pas comme vous, je suis pour le progrès ».

Ah cher Progrès, que ne justifie-t-on en ton nom ! L’Etat, la société dans son ensemble, finance nos activités de recherche au motif que nous devons être moteurs d’innovation et de progrès techniques. Chercheurs en technologies langagières, nous travaillons ainsi sous une injonction permanente de contribuer au mouvement perpétuel du progrès. Nous nous en réclamons d’ailleurs le plus souvent. Mais nous interrogeons-nous sur ce qu’est le progrès ?

La question peut étonner tant progrès rime avec civilisation dans l’inconscient collectif. Pourtant, le concept de progrès n’est pas toujours allé de soi. Tout en développant un corpus scientifique conséquent, mais aussi une technologie trop ignorée, la Grèce antique n’associait pas une idée de progrès linéaire à sa recherche de connaissance : le monde grec apparaissait comme indépassable, simplement contraint par des limites religieuses qu’il convenait de ne pas enfreindre. Au Moyen-Age, Chine, Inde et Europe ont également développé un savoir technique de plus en plus poussé. En Europe, ces innovations étaient pourtant adoptées avec prudence, la société médiévale prenant le temps de jauger leur utilité globale. Refusant une notion de progrès utilitariste au profit du maintien d’un équilibre entre Terre et Ciel, la Chine laissa de son côté d’autres civilisations profiter de son inventivité technique. La Renaissance, pourtant avide de connaissance, ne changea rien à cette situation et un Louis XIV pouvait encore à l’aube du XVIII° siècle interdire tout simplement par décret la dissémination d’une nouvelle technologie menaçant l’équilibre du système corporatiste de l’Ancien Régime. Ainsi, en dépit d’un indéniable esprit d’innovation, ces siècles ne se vivaient pas comme participant à la grande marche d’une évolution humaine guidée par le progrès techniques.

A la suite de la révolution mécaniste amorcée par Descartes, ce n’est qu’avec les Lumières que le «Progrès » se construisit comme parfait symbole de l’action bénéfique humaine. Avec la révolution industrielle, il allait rapidement tenir lieu de gloire et phare de l’humanité. Presque deux siècles plus tard, le piédestal du progrès technique vacille quelque peu à l’aune du réchauffement climatique, mais cette construction intellectuelle reste solide. Notre jeune étudiant peut ainsi justifier sa démarche : le Progrès est le moteur perpétuel de l’évolution humaine, rien ne saurait le remettre en question.

Dans cette affaire, le progrès technique auquel nous participons comme chercheurs se pare de toutes les vertus : témoignage de l’esprit d’inventivité d’homo sapiens sapiens, il n’influe pas sur une civilisation humaine dont il n’est que le produit. On parle ainsi de neutralité de la technologie comme on parlerait de neutralité du net : lorsqu’une technologie pose souci, ce sont uniquement ses mésusages qui sont discutables.

Neutralité du progrès technique ? Voire… A l’heure où les émissions carbonées menacent la planète, j’aime à citer l’exemple du moteur à explosion, extrait du livre très éclairant de François Jarrige, Technocritiques (Jarrige, 2014). Devenu fiable au début du XX° siècle, le moteur à explosion permit l’apparition de véhicules individuels, mais aussi d’utilitaires robustes. Il est très éclairant d’observer comment cette innovation fut adoptée par les populations occidentales. L’adhésion pour le camion fut immédiate : d’une puissance de traction bien supérieure, il pouvait suppléer utilement au cheval dont la présence dans les villes posait par ailleurs des problèmes d’hygiène de plus en plus importants. A l’opposé, l’utilité de la voiture individuelle fut tout de suite questionnée. Face aux premiers accidents routiers, de multiples arrêtés ont été pris par des municipalités pour limiter la vitesse des automobiles, au grand dam de leurs promoteurs : le président de l’Automobile Club de France clame ainsi que « le progrès réclame des victimes » ! Les défenseurs de l’automobile caricaturent alors la position de leurs opposants en mettant en exergue une résistance passéiste au Progrès. Pourtant, ces critiques étaient justifiées dans la société de l’époque : la mobilité des populations était faible et assurée efficacement par le chemin de fer. La famille et les amis habitant dans un environnement proche, les congés payés n’existant pas encore, l’objet technique « automobile » n’était d’aucune utilité, à l’opposé de l’objet technique « camion », mu pourtant par le même dispositif thermique. De fait, l’automobile ne répondait qu’au désir d’autonomie individuelle de la société aisée des Années Folles, qui pesa de tout son poids pour une acclimatation sociale de cette nouvelle technologie. Ce ne sera qu’au tournant des années 1960 que la démocratisation de l’automobile sera acquise, avec les conséquences que l’on connait sur nos modes de vie quotidiens.

Voiturette Renault - domaine public

Ainsi, l’invention du moteur à explosion était une innovation technique qui avait une utilité tout de suite perçue par ses contemporains. Mais l’automobile individuelle par elle-même ne répondait pas aux besoins de la société de l’époque. Peut-on dès lors parler de progrès inéluctable à l’arrivée d’une Renault Type A en 1898 ? Je me permets d’en douter. On ne peut de même nier que les automobiles furent de tout temps utilisées pour ce à quoi elles sont été conçues (je ne parle pas ici des courses de Rallye-Cross avec 2CV démolies au milieu de champs boueux). La pollution automobile ne peut donc être considérée comme un mésusage du moteur à explosion. Non, simplement, la technologie automobile, comme toute technologie, n’est pas neutre. Et ses opposants s’interrogeaient simplement sur le sens du progrès, en se demandant quelles technologies étaient vraiment bénéfiques en termes de bien-être. Est-ce là une attitude passéiste que de prendre le temps d’une telle réflexion ? En tous cas, nous sommes loin ici de notre jeune étudiant obéissant à la loi supérieure du Progrès. Ce qui ne veut pas dire que nous le refusons…

Que peut enseigner ce retour historique sur nos activités de chercheurs en TALN ? Comme Louis Renault, nous sommes des créateurs de nouvelles technologies. Comme lui, nous participons à la marche d’un progrès technique qui est questionnable de par ses impacts. Les technologies numériques telles que le TALN revêtent une dimension virtuelle qui les rend plus propres, plus acceptables a priori aux yeux du public. Pourtant, leur impact n’en est pas moins réel. Il peut même être physique ! Pour le montrer, je vais prendre un exemple que j’aime beaucoup car il est inattendu mais parfaitement documenté. Il s’agit de l’utilisation des technologies vocales par les préparateurs de commande des grands centres logistiques tels que ceux d’Amazon. Afin de permettre un travail mains libres, les préparateurs de commande sont guidés dans leur mission grâce à un dialogue oral homme-machine : dès qu’un produit a été récupéré, le système de dialogue envoie immédiatement une commande vocale guidant le préparateur vers un nouveau produit commandé. Ce mode de gestion entraîne une densification du travail intéressante en termes de productivité. Il se trouve que l’Institut National de Recherche et Sécurité a monté que ce mode de gestion du travail par une technologie langagière peut entraîner une augmentation des lombalgies ou des troubles musculo-squelettiques de par la surcharge de travail qu’elle induit (INRS 2009). Voilà un bel exemple à mes yeux : l’utilisation d’une commande vocale à la place d’une bête fiche papier de mission est-elle vraiment un progrès portant la marque du génie humain ? Le choix d’une augmentation de la productivité au mépris de la santé de l’employé n’est-il pas plutôt un exemple de choix sociétal permis par le progrès technique ?

Cet exemple peut paraître isolé, caricatural du point de vue du TALN. Il n’en est rien. De nombreuses études en sociologie du travail ont montré que l’automatisation des tâches permises par les machines, puis les robots automates ont successivement profondément changé les conditions de travail tout d’abord des ouvriers et artisans, puis des professions intermédiaires (cols blancs). Les technologies numériques intelligentes, parmi lesquelles se trouvent le TALN, s’intéressent désormais à des activités complexes relevant de professions intellectuelles supérieures : les analystes financiers sont désormais remplacés par des algorithmes, de même que Google lance des «Google Award for Computational Journalism» où les technologies langagières vont suppléer au travail d’investigation du journalisme ? Au vu de ces exemples, l’impact de nos recherches ne peut être nié…

Dès lors quelle attitude pour le chercheur en traitement automatique des langues, mais aussi le citoyen intéressé par l’émergence des technologies langagières dans un contexte big data ? Doit-on refuser tout progrès technique ? Doit-on devenir schizophrène et créer de nouveaux systèmes tout en étant persuadés de leurs effets néfastes ? La question n’est jamais facile à trancher, mais avoir un regard lucide sur nos activités serait déjà utile : ne pas penser que le progrès technique est un Moloch aveugle auquel on doit se plier, se dire que chaque innovation est l’occasion d’un choix de société qui nous permet de réfléchir au sens de nos actions et aux priorités que l’on se donne dans nos modes de vie. Et lorsque des choix ont été faits, consciemment ou non, par la société, être toujours aux aguets sur leurs conséquences éventuellement néfastes.

Ma grand-mère pensait que les systèmes de dialogue homme-machine que je concevais allaient mettre des employés au chômage. Si elle savait qu’en plus, ces derniers iraient chercher leurs allocations avec une lombalgie…

Pour aller plus loin

INRS (2009) Fiche pratique de sécurité ED 135. Préparation de commande guidée par reconnaissance vocale.

JARRIGE F. (2014) Technocritiques : du refus des machines à la contestation des technosciences. La Découverte.

Avis du comité d’éthique du CNRS (COMETS) sur les sciences participatives

Jean-Gabriel Ganascia, membre du Comité d’éthique du CNRS (COMETS), nous a envoyé l’avis que vient d’émettre cette instance concernant les sciences participatives (ou citoyennes). Nous en reproduisons ici le résumé, l’avis complet étant disponible sur le site du COMETS.

Nous reviendrons sur cet avis un peu plus tard pour en fournir un éclairage, en attendant, voici de quoi alimenter la réflexion :

Résumé : Les relations de la science avec la société se sont profondément modifiées au cours de l’histoire. A partir des années 70, la notion de progrès est réinterrogée face aux nouveaux défis environnementaux et sanitaires. Ceci met aujourd’hui au premier plan les questions posées par les citoyens aux chercheurs et aux institutions de recherche, ainsi que le besoin des chercheurs de faire comprendre la nature et l’importance de leur démarche à l’ensemble de la société. Le COMETS affirme ici qu’il y a urgence à construire une relation de confiance entre les citoyens et les scientifiques. Deux voies sont abordées : celle des sciences participatives et celle d’un dialogue science-citoyens renouvelé.

La voie des sciences participatives, en grand développement aujourd’hui grâce à internet, associe les citoyens amateurs aux activités scientifiques pour la collecte des données et parfois la co-création ou l’interprétation des résultats. Il en résulte un apport mutuel considérable, d’une part pour l’enrichissement de la production des connaissances, d’autre part pour la formation des citoyens aux méthodes et à l’esprit scientifique. Cette voie encourage les vocations pour les sciences chez les jeunes. Le COMETS formule des recommandations portant sur l’encadrement des pratiques des réseaux amateurs, sur l’importance de la validation des résultats, sur le respect de l’anonymat lorsqu’il s’agit de données privées, enfin sur le statut et la reconnaissance dus aux contributeurs.

Dans un monde secoué de crises successives et traversé par des controverses sur des sujets sensibles, le COMETS est d’avis que les chercheurs et leurs institutions doivent être à l’écoute des questionnements du public sur l’impact de leurs choix. Tout en réaffirmant l’autonomie du champ scientifique, il estime nécessaire d’engager une réflexion sur les formes à donner au débat public autour des questions de recherche. Il souligne fortement l’importance de la diffusion de la culture scientifique et de sa promotion active à tous les niveaux de la société. Il recommande que les expertises exercées par les scientifiques sur des questions ayant un impact sociétal soient menées à l’abri des conflits d’intérêt, dans un cadre interdisciplinaire et si possible international. Il préconise que le CNRS soutienne l’implication d’équipes de recherche dans l’analyse des perceptions des sciences et encourage les initiatives abordant des thèmes sensibles. Il suggère enfin que le CNRS développe une expertise collective mobilisable pour répondre aux sollicitations des décideurs publics et des instances démocratiques.

Armons notre pensée

À l’heure où nous refermons la première édition de l’atelier ETeRNAL, je veux croire que cette idée, pourtant tout à fait ancienne, que ce que nous étudions et la manière dont nous l’étudions est le plus important.

Nous avons constaté que nous abordions naturellement la question de l’éthique par celle de l’anonymisation, trop souvent considérée comme réglée. Force est de constater que ce n’est pas le cas, et d’autant moins que nous conservons de grandes difficultés à définir le problème. Et il n’est qu’une porte ouverte sur un constat, celui que lorsque les données sont devenues un enjeu économique et politique, les outils transformant intelligemment ces données deviennent de facto des objets économiques et politiques. En cela, notre travail de chercheur, de penseur, se décale de nos habitudes et nous oblige. Il ne nous oblige certainement pas à courir après plus de réussite ou de succès, mais bien à reconsidérer l’importance de notre travail.

Le traitement automatique des langues est divers d’histoires très différentes. À la fois issu de la tradition de la linguistique, sciences fort ancienne, et de l’informatique, science tout à fait moderne.
D’aucuns font le constat de notre éloignement de nos objets de recherche. Est-ce que la langue, pour ce qu’elle dit de notre capacité cognitive, de notre évolution, de notre relation au monde peut seulement se traiter par le biais de modèles purement mathématiques ? Est-ce que nous pouvons nous faire croire raisonnablement que nos outils n’ont pas de finalité en dehors des desseins que nous leur prêtons ? Est-ce que comprendre et transformer les données linguistiques est tout à fait anodin ?
Probablement pas.

Il nous appartient, en tant qu’individu, mais également en tant que communauté scientifique de nous inscrire dans une histoire, au moins celle de la science. Ne tentons pas de nous cacher derrière l’argument de la jeunesse, et de ce qu’elle justifie insouciance. Nous ne sommes plus les contemporains de la naissance de l’informatique. Et aujourd’hui, plus qu’hier, notre travail est devenu économique et politique.

Il ne s’agit pas de reproduire au sein de la communauté les habitus de la société, mais d’être en mesure de parler librement, de penser librement nos objets et les conséquences même de notre pensée. Il ne s’agit certainement pas de revendiquer les uns contre les autres, ou de trouver là le vecteur d’une forme de militantisme. Il s’agit certainement là d’une opportunité de s’enthousiasmer.

Alors, oui, il nous faut un espace pour prendre la parole et porter aux débats, celui de la communauté que nous formons, et celui de la société entière, dans sa diversité, les questions qui nous traversent. Reprenons les exercices difficiles de la réflexion, de la vulgarisation, du positionnement épistémologique de nos travaux.
Nous ne gagnerons pas grand chose pour nos carrières, mais notre pensée n’en sera que plus forte.
Je suis heureux de voir qu’un tel espace est en train d’éclore.
Il nous appartient de le faire naître, de le faire grandir et de s’en servir comme arme de la pensée.

Pourquoi un blog Ethique et TAL ?

A la suite de l’atelier ETeRNAL de TALN 2015, il est apparu que la communauté du Traitement Automatique des Langues manquait d’espace pour communiquer au grand public sur la réalité des technologies que nous développons, et à leurs dangers éventuels.

Ce blog se veut une action concrète dans ce sens. Il est ouvert à tout chercheur ou industriel du TAL qui voudrait y contribuer. Pour ce faire, envoyez-nous un mail à ethique-et-tal chez schplaf point org.

Comité de rédaction :

  • Gilles Adda (LIMSI-CNRS / IMMI)
  • Maxime Amblard (LORIA / Université de Lorraine)
  • Jean-Yves Antoine (Université de Tours)
  • Karën Fort (STIH / Université Paris-Sorbonne)
  • Hugues de Mazancourt (Eptica)