Résultats de l’enquête Ethique et Traitement Automatique des Langues et de la Parole [1]

Nous présentons ici les résultats d’une enquête sur l’éthique dans le Traitement Automatique des Langues et de la Parole, menée auprès de chercheurs et d’industriels de ce domaine.

Pour des raisons de commodité de lecture, ce post présente les réponses aux questions fermées. Un prochain traitera des questions ouvertes et des commentaires.

Motivations

Le questionnaire a été réalisé très rapidement (pour pouvoir en disposer pendant  la conférence JEP-TALN 2015), suite à la très intéressante journée Ethique de la  CERNA (Commission de réflexion sur l’éthique de la recherche en sciences et technologies du numérique d’Allistene).

La question principale que nous nous posions était de savoir dans quelle mesure les chercheurs en TAL/P francophone se sentent responsables de l’utilisation faite de leurs recherches (moral buffer). D’autres questions sont apparues rapidement, notamment celle de savoir si les universités proposent des sensibilisations à l’éthique.
Enfin, d’autres nous sont venues en liaison avec des remarques entendues lors de séminaires ou de rencontres.
Le questionnaire a bien entendu été créé avec un biais en faveur d’une meilleure prise en compte des questions d’éthique dans nos pratiques de chercheurs, mais il n’a pas empêché les personnes étant en désaccord de s’exprimer, ce qu’elles ont fait, vous allez le voir, et nous les en remercions.

Participation

Suite à la publicité réalisée pendant JEP-TALN, sur la liste LN et par mails personnels, et malgré quelques problèmes de connexion, 102 personnes ont participé à l’enquête, entre le 23 juin et le 30  juillet 2015.
Lors des dernières conférences TALN, les organisateurs ont enregistré environ 200 inscrits (200 en 2013, 195 en 2014 et 180 en 2015), nous considérons donc cette enquête représentative de la communauté française du TAL/P  dans son ensemble.

Réponses et (début d’)analyse

Le questionnaire comprenait majoritairement des questions fermées, toutes facultatives. Chaque personne a laissé en moyenne moins de deux questions sans réponse. Les non-réponses et les réponses « ne sais pas » ont été traitées par LimeSurvey comme équivalentes.

Responsabilité des chercheurs

Question : « Vous considérez-vous responsable des utilisations faites des outils que vous développez ? »

Près de 75 % des chercheurs considèrent qu’ils sont responsables, individuellement ou collectivement, plus précisément :

  • 12,2 % ont répondu à la fois « Oui, c’est tout à fait mon rôle » et « C’est un rôle partagé par l’ensemble de l’équipe »
  • 33,3 % ont répondu « Oui, c’est tout à fait mon rôle
  • 26,7 % ont répondu « C’est un rôle partagé par l’ensemble de l’équipe »
  • 1,1 % ont répondu « C’est le rôle d’un des membres de l’équipe »

Role

Cependant, pour 26,7 % des personnes répondantes, l’utilisation faite des outils qu’elles développent n’est pas de la responsabilité des chercheurs. Ce chiffre confirme qu’il existe en TAL/P comme ailleurs, un moral buffer (tampon moral ?). Nous espérons que ce blog et les différentes actions de sensibilisation menées permettront de le faire diminuer, car si nous ne nous sentons pas responsables et que le grand public et les politiques ne comprennent pas vraiment les capacités réelles des outils que nous développons (voir plus loin), personne ne se sentira la légitimité d’agir en cas d’utilisation néfaste, contraire aux droits de l’homme par exemple.

Données personnelles

Questions : « Doit-il selon vous y avoir une exception recherche sur l’usage des données personnelles ? » et « Un statut particulier pour la recherche des données personnelles vous permettrait-il de lancer de nouveaux travaux ? »

Les données personnelles, au sens de la CNIL, sont toutes les données qui permettent d’identifier, directement ou indirectement, un individu. Cette définition couvre ainsi un large éventail de données : données d’identification, mais également informations déposées sur un réseau social, ou n’importe quel texte, dès lors que ce texte ou ces données permettent, par les indices qu’ils contiennent, ou par le croisement d’indices, de (ré)-identifier un individu.

A la question de la nécessité ou non d’un statut particulier de ces données pour la recherche :

  • 1,4 % ont répondu à la fois « non » et « les données utilisées pour une expérience doivent être mises à disposition des évaluateurs et/ou de l’ensemble de la communauté scientifique »
  • 4,2 % ont répondu « toutes les données doivent être disponibles pour la recherche »
  • 56,3 % ont répondu « oui, sous certaines conditions »
  • 14,1 % ont répondu « les données utilisées pour une expérience doivent être mises à disposition des évaluateurs et/ou de l’ensemble de la communauté scientifique »
  • 19,7 % ont répondu « Non »

Outre les considérations éthiques que ce point soulève, notons que le recueil et le traitement des données personnelles est soumis à des obligations fortes, dont le non-respect est passible d'emprisonnement ou de conséquences financières lourdes.

Commentaires des répondants

La question « Doit-il selon vous y avoir une exception recherche sur l’usage des données personnelles ? » donnait la possibilité d’insérer des commentaires, que nous reproduirons dans un post à venir.

Refus d’un projet pour raisons éthiques

Question : « Avez-vous déjà refusé ou limité un projet pour des raisons éthiques ? »

abandon_ANR5

Environ 40 % des répondants affirment avoir refusé ou limité un projet pour des raisons éthiques. Ce résultat, qui peut paraître surprenant — qui l’est pour nous — montre à quel point l’éthique est une problématique actuelle. Cette question aurait cependant mérité d’être affinée (quelles raisons ?).

Pérennisation des données

Question : « Dans vos projets intégrez-vous dès le départ la possibilité de pérenniser et redistribuer vos données ? »

Pereniser_données

Une large majorité affirme intégrer dès le début d’un projet la pérennisation et la redistribution des données. Cela semble un peu contradictoire avec le fait que le français reste encore une langue relativement peu dotée en données langagières (voir Joseph Mariani (LIMSI / CNRS) sur ce sujet, en vidéo), surtout librement disponibles. Cependant, le terme « données » est ambigu et aurait sans doute dû être précisé (« données langagières », par exemple).

Il est intéressant que près de 20 % des répondants avouent ne pas considérer cet aspect dès le début du projet : soit ils le prennent en compte plus tard, soit ils ne le prennent jamais en compte. C’est une question que nous devrons aborder ici.

Rémunération des producteurs de données

Question : « Dans les projets auxquels vous avez participé, savez-vous comment les producteurs de données ont été rémunérés ? »

Remuneration

Là encore, une majorité déclare savoir comment ont été rémunérés les producteurs de données. Reste à valoriser la documentation de cette information, via la Charte Ethique et Big Data, par exemple. Nous avons en effet montré que les articles de recherche concernant les ressources langagières les plus utilisées  ne donnent pas cette information.

Plus de 25 % des personnes interrogées (voire plus de 40 % si on y ajoute les non réponses) déclarent ne pas savoir comment les producteurs de données de leurs projets ont été rémunérés. C’est préoccupant, en particulier avec le développement des plate-formes de myriadisation du travail parcellisé à la Amazon Mechanical Turk, qui posent de nombreux problèmes éthiques.

Limites du TAL vues par les pouvoirs et le grand public(s)

Questions : « Pensez-vous que les pouvoirs publics sont conscients des limites des capacités des outils de TAL ? » et « Pensez-vous que le grand public est conscient des limites des capacités des outils de TAL ? ».

limites

Près de 9 % des répondants (8,8 %) pensent que les pouvoirs publics sont conscients des limites des capacités des outils de TAL, contre 5 % (4,9 %) concernant le grand public.

67,6 % pensent au contraire que les pouvoirs publics n’en sont pas conscients et 75,5 % que le grand public ne l’est pas non plus.

23,5 % et 19,6 % ne répondent pas (ce qui représente un nombre important de personnes), sans doute parce qu’il s’agit de donner ici une impression, non fondée sur des données concrètes. Ces questions mériteraient en effet une enquête sérieuse auprès des pouvoirs publics et du grand public.

Quoi qu’il en soit, ce blog se veut un début de réponse à cette préoccupation, même si rendre accessible à un public plus large la finesse de certaines questions de recherche représente un réel effort, voire du talent. Nous tenons au passage à rendre hommage à notre collègue Jean Véronis, décédé l’année dernière, qui avait su maintenir cet effort sur la durée, non sans talent : http://blog.veronis.fr/.

Formation à l’éthique

Question : « Existe-t-il une sensibilisation à l’éthique dans les formations dans lesquelles vous intervenez ? »

formation

Les réponses négatives sont à rapprocher d’autres réponses du questionnaire : s’il n’y a que peu de sensibilisation à l’éthique dans les formations, comment pourrait-on avoir des chercheurs, des citoyens ou des responsables politiques conscients des enjeux des limites des outils ?

Cependant, les presque 15 % de réponses positives montrent que de telles formations existent, qui pourraient être diffusées plus largement. Ce blog pourrait être le lieu pour les recenser (n’hésitez-pas à nous les signaler en commentaire), ainsi que leur contenu.

Éthique comme sujet dans l’appel général de TALN

Question : « Pensez-vous que l’éthique doit faire partie des sujets de l’appel général de la conférence TALN ? »

TALN

En d’autres termes, les trois quarts des personnes ayant émis un avis pensent qu’il faut inclure le thème dans les prochains appels de TALN. Cela tombe on ne peut mieux puisque l’AG finale de l’association savante du TAL, l’ATALA, a donné son accord pour cela.

Il faudrait bien entendu étendre cette décision à la conférence JEP (parole) et aux conférences internationales (LREC, ACL, COLING, INTERSPEECH, etc). Nous comptons pour cela sur (vous) nos collègues présents dans les différentes instances et associations et tenterons de sensibiliser à cette question autour de nous.

Participation à un groupe de travail éthique dans le TAL

Question : « Êtes-vous d’accord pour participer à un groupe de travail sur l’éthique dans le TAL ? »

TAL

26 personnes nous ont laissé leur adresse mail, dont 21 ne sont pas (encore ?) membre du comité de lecture de ce blog. C’est très encourageant ! Nous allons contacter ces personnes pour les faire travailler envisager des actions communes.

ANR

Question : « Avez-vous décrit dans l’annexe technique les dimensions éthiques des projets que vous avez soumis pour financement (ANR ou autre) ? »

ANR

Cette question donnait la possibilité de laisser un commentaire que l’on trouvera dans un post à venir.

Conclusions

La première conclusion de cette enquête est que le sujet de l’éthique est reconnu comme important par la communauté du TAL/P francophone, ce qui est pour nous une grande satisfaction.

Cela nous encourage à continuer et à proposer d’autres formes d’expression sur la sujet ainsi que d’élargir le questionnement à l’international. Nous comptons en effet réaliser une enquête similaire, en anglais, que nous proposerons à la communauté internationale du TAL/P. Nous y réfléchissons actuellement et sommes preneur/se de vos suggestions, donc n’hésitez-pas à en faire, en commentaire de ce post par exemple.

N’oubliez pas de nous signaler en commentaire les sensibilisations à l’éthique proposées dans des formations.

Karën Fort, Alain Couillault et Jean-Yves Antoine pour les graphiques.

Atelier « Fairness Accountability and Transparency in Machine Learning »

La Conférence internationale sur l’apprentissage automatique (International Conference on Machine Learning ou ICML) est la conférence de référence au niveau mondial sur l’apprentissage automatique, ces algorithmes  qui, à partir d’un ensemble de données, induisent automatiquement des modèles. Ces technologies sont par exemple utilisées en vision par ordinateur ou en reconnaissance de la parole.
Pendant la dernière conférence ICML qui s’est tenue récemment à Lille, un atelier intitulé « Fairness Accountability and Transparency in Machine Learning«  s’est tenu.
Il est intéressant de voir que ces questions font leur chemin aussi dans la communauté de l’apprentissage. Cependant, ne nous emballons pas, il y avait 30 personnes maximum pendant cet atelier alors qu’ICML a rassemblé plus de 1000 personnes.
Voici quelques exemples de communications (en ligne sur le site) :
-Nick Diakopoulo.s Algorithmic Accountability and Transparency in Journalism
-Sara Hajian. Discrimination- and Privacy-Aware Data Mining
-Salvatore Ruggieri.  Privacy Attacks and Anonymization Methods as Tools for Discrimination Discovery and Fairness
-Toshihiro Kamishima and Kazuto Fukuchi. Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, and Theoretical Aspects

Vous avez dit progrès ?

Par : Jean-Yves Antoine

Drawing of an old Raschel machine - Source: Josef Worm: Die Wirkerei und Strickerei. 2. Aufl. Leipzig, 1920

Il y a quelques semaines, le responsable de formation que je suis a été sollicité par un étudiant en Master Entrepreneuriat. En relation avec une entreprise dite innovante, il désirait que je diffuse auprès de mes étudiants un questionnaire sur leurs attentes en matière d’objets connectés. Vous savez, ces smartwatch qui vous permettent de suivre vos déplacements quotidiens, vos paramètres physiologiques et enregistrer sur le cloud ces informations pour votre confort. Ayant refusé poliment de donner suite à sa demande pour des raisons éthiques, un débat s’est amorcé sur la portée de ces dispositifs mobiles. Mon interlocuteur n’avait aucune notion d’éthique, qui semblait se rapprocher d’un jugement négatif sur les profits de sa future entreprise dans son esprit. Après quelques échanges la conclusion est tombée, cinglante : « oui je comprends vos réserves, mais je ne suis pas comme vous, je suis pour le progrès ».

Ah cher Progrès, que ne justifie-t-on en ton nom ! L’Etat, la société dans son ensemble, finance nos activités de recherche au motif que nous devons être moteurs d’innovation et de progrès techniques. Chercheurs en technologies langagières, nous travaillons ainsi sous une injonction permanente de contribuer au mouvement perpétuel du progrès. Nous nous en réclamons d’ailleurs le plus souvent. Mais nous interrogeons-nous sur ce qu’est le progrès ?

La question peut étonner tant progrès rime avec civilisation dans l’inconscient collectif. Pourtant, le concept de progrès n’est pas toujours allé de soi. Tout en développant un corpus scientifique conséquent, mais aussi une technologie trop ignorée, la Grèce antique n’associait pas une idée de progrès linéaire à sa recherche de connaissance : le monde grec apparaissait comme indépassable, simplement contraint par des limites religieuses qu’il convenait de ne pas enfreindre. Au Moyen-Age, Chine, Inde et Europe ont également développé un savoir technique de plus en plus poussé. En Europe, ces innovations étaient pourtant adoptées avec prudence, la société médiévale prenant le temps de jauger leur utilité globale. Refusant une notion de progrès utilitariste au profit du maintien d’un équilibre entre Terre et Ciel, la Chine laissa de son côté d’autres civilisations profiter de son inventivité technique. La Renaissance, pourtant avide de connaissance, ne changea rien à cette situation et un Louis XIV pouvait encore à l’aube du XVIII° siècle interdire tout simplement par décret la dissémination d’une nouvelle technologie menaçant l’équilibre du système corporatiste de l’Ancien Régime. Ainsi, en dépit d’un indéniable esprit d’innovation, ces siècles ne se vivaient pas comme participant à la grande marche d’une évolution humaine guidée par le progrès techniques.

A la suite de la révolution mécaniste amorcée par Descartes, ce n’est qu’avec les Lumières que le «Progrès » se construisit comme parfait symbole de l’action bénéfique humaine. Avec la révolution industrielle, il allait rapidement tenir lieu de gloire et phare de l’humanité. Presque deux siècles plus tard, le piédestal du progrès technique vacille quelque peu à l’aune du réchauffement climatique, mais cette construction intellectuelle reste solide. Notre jeune étudiant peut ainsi justifier sa démarche : le Progrès est le moteur perpétuel de l’évolution humaine, rien ne saurait le remettre en question.

Dans cette affaire, le progrès technique auquel nous participons comme chercheurs se pare de toutes les vertus : témoignage de l’esprit d’inventivité d’homo sapiens sapiens, il n’influe pas sur une civilisation humaine dont il n’est que le produit. On parle ainsi de neutralité de la technologie comme on parlerait de neutralité du net : lorsqu’une technologie pose souci, ce sont uniquement ses mésusages qui sont discutables.

Neutralité du progrès technique ? Voire… A l’heure où les émissions carbonées menacent la planète, j’aime à citer l’exemple du moteur à explosion, extrait du livre très éclairant de François Jarrige, Technocritiques (Jarrige, 2014). Devenu fiable au début du XX° siècle, le moteur à explosion permit l’apparition de véhicules individuels, mais aussi d’utilitaires robustes. Il est très éclairant d’observer comment cette innovation fut adoptée par les populations occidentales. L’adhésion pour le camion fut immédiate : d’une puissance de traction bien supérieure, il pouvait suppléer utilement au cheval dont la présence dans les villes posait par ailleurs des problèmes d’hygiène de plus en plus importants. A l’opposé, l’utilité de la voiture individuelle fut tout de suite questionnée. Face aux premiers accidents routiers, de multiples arrêtés ont été pris par des municipalités pour limiter la vitesse des automobiles, au grand dam de leurs promoteurs : le président de l’Automobile Club de France clame ainsi que « le progrès réclame des victimes » ! Les défenseurs de l’automobile caricaturent alors la position de leurs opposants en mettant en exergue une résistance passéiste au Progrès. Pourtant, ces critiques étaient justifiées dans la société de l’époque : la mobilité des populations était faible et assurée efficacement par le chemin de fer. La famille et les amis habitant dans un environnement proche, les congés payés n’existant pas encore, l’objet technique « automobile » n’était d’aucune utilité, à l’opposé de l’objet technique « camion », mu pourtant par le même dispositif thermique. De fait, l’automobile ne répondait qu’au désir d’autonomie individuelle de la société aisée des Années Folles, qui pesa de tout son poids pour une acclimatation sociale de cette nouvelle technologie. Ce ne sera qu’au tournant des années 1960 que la démocratisation de l’automobile sera acquise, avec les conséquences que l’on connait sur nos modes de vie quotidiens.

Voiturette Renault - domaine public

Ainsi, l’invention du moteur à explosion était une innovation technique qui avait une utilité tout de suite perçue par ses contemporains. Mais l’automobile individuelle par elle-même ne répondait pas aux besoins de la société de l’époque. Peut-on dès lors parler de progrès inéluctable à l’arrivée d’une Renault Type A en 1898 ? Je me permets d’en douter. On ne peut de même nier que les automobiles furent de tout temps utilisées pour ce à quoi elles sont été conçues (je ne parle pas ici des courses de Rallye-Cross avec 2CV démolies au milieu de champs boueux). La pollution automobile ne peut donc être considérée comme un mésusage du moteur à explosion. Non, simplement, la technologie automobile, comme toute technologie, n’est pas neutre. Et ses opposants s’interrogeaient simplement sur le sens du progrès, en se demandant quelles technologies étaient vraiment bénéfiques en termes de bien-être. Est-ce là une attitude passéiste que de prendre le temps d’une telle réflexion ? En tous cas, nous sommes loin ici de notre jeune étudiant obéissant à la loi supérieure du Progrès. Ce qui ne veut pas dire que nous le refusons…

Que peut enseigner ce retour historique sur nos activités de chercheurs en TALN ? Comme Louis Renault, nous sommes des créateurs de nouvelles technologies. Comme lui, nous participons à la marche d’un progrès technique qui est questionnable de par ses impacts. Les technologies numériques telles que le TALN revêtent une dimension virtuelle qui les rend plus propres, plus acceptables a priori aux yeux du public. Pourtant, leur impact n’en est pas moins réel. Il peut même être physique ! Pour le montrer, je vais prendre un exemple que j’aime beaucoup car il est inattendu mais parfaitement documenté. Il s’agit de l’utilisation des technologies vocales par les préparateurs de commande des grands centres logistiques tels que ceux d’Amazon. Afin de permettre un travail mains libres, les préparateurs de commande sont guidés dans leur mission grâce à un dialogue oral homme-machine : dès qu’un produit a été récupéré, le système de dialogue envoie immédiatement une commande vocale guidant le préparateur vers un nouveau produit commandé. Ce mode de gestion entraîne une densification du travail intéressante en termes de productivité. Il se trouve que l’Institut National de Recherche et Sécurité a monté que ce mode de gestion du travail par une technologie langagière peut entraîner une augmentation des lombalgies ou des troubles musculo-squelettiques de par la surcharge de travail qu’elle induit (INRS 2009). Voilà un bel exemple à mes yeux : l’utilisation d’une commande vocale à la place d’une bête fiche papier de mission est-elle vraiment un progrès portant la marque du génie humain ? Le choix d’une augmentation de la productivité au mépris de la santé de l’employé n’est-il pas plutôt un exemple de choix sociétal permis par le progrès technique ?

Cet exemple peut paraître isolé, caricatural du point de vue du TALN. Il n’en est rien. De nombreuses études en sociologie du travail ont montré que l’automatisation des tâches permises par les machines, puis les robots automates ont successivement profondément changé les conditions de travail tout d’abord des ouvriers et artisans, puis des professions intermédiaires (cols blancs). Les technologies numériques intelligentes, parmi lesquelles se trouvent le TALN, s’intéressent désormais à des activités complexes relevant de professions intellectuelles supérieures : les analystes financiers sont désormais remplacés par des algorithmes, de même que Google lance des «Google Award for Computational Journalism» où les technologies langagières vont suppléer au travail d’investigation du journalisme ? Au vu de ces exemples, l’impact de nos recherches ne peut être nié…

Dès lors quelle attitude pour le chercheur en traitement automatique des langues, mais aussi le citoyen intéressé par l’émergence des technologies langagières dans un contexte big data ? Doit-on refuser tout progrès technique ? Doit-on devenir schizophrène et créer de nouveaux systèmes tout en étant persuadés de leurs effets néfastes ? La question n’est jamais facile à trancher, mais avoir un regard lucide sur nos activités serait déjà utile : ne pas penser que le progrès technique est un Moloch aveugle auquel on doit se plier, se dire que chaque innovation est l’occasion d’un choix de société qui nous permet de réfléchir au sens de nos actions et aux priorités que l’on se donne dans nos modes de vie. Et lorsque des choix ont été faits, consciemment ou non, par la société, être toujours aux aguets sur leurs conséquences éventuellement néfastes.

Ma grand-mère pensait que les systèmes de dialogue homme-machine que je concevais allaient mettre des employés au chômage. Si elle savait qu’en plus, ces derniers iraient chercher leurs allocations avec une lombalgie…

Pour aller plus loin

INRS (2009) Fiche pratique de sécurité ED 135. Préparation de commande guidée par reconnaissance vocale.

JARRIGE F. (2014) Technocritiques : du refus des machines à la contestation des technosciences. La Découverte.

Avis du comité d’éthique du CNRS (COMETS) sur les sciences participatives

Jean-Gabriel Ganascia, membre du Comité d’éthique du CNRS (COMETS), nous a envoyé l’avis que vient d’émettre cette instance concernant les sciences participatives (ou citoyennes). Nous en reproduisons ici le résumé, l’avis complet étant disponible sur le site du COMETS.

Nous reviendrons sur cet avis un peu plus tard pour en fournir un éclairage, en attendant, voici de quoi alimenter la réflexion :

Résumé : Les relations de la science avec la société se sont profondément modifiées au cours de l’histoire. A partir des années 70, la notion de progrès est réinterrogée face aux nouveaux défis environnementaux et sanitaires. Ceci met aujourd’hui au premier plan les questions posées par les citoyens aux chercheurs et aux institutions de recherche, ainsi que le besoin des chercheurs de faire comprendre la nature et l’importance de leur démarche à l’ensemble de la société. Le COMETS affirme ici qu’il y a urgence à construire une relation de confiance entre les citoyens et les scientifiques. Deux voies sont abordées : celle des sciences participatives et celle d’un dialogue science-citoyens renouvelé.

La voie des sciences participatives, en grand développement aujourd’hui grâce à internet, associe les citoyens amateurs aux activités scientifiques pour la collecte des données et parfois la co-création ou l’interprétation des résultats. Il en résulte un apport mutuel considérable, d’une part pour l’enrichissement de la production des connaissances, d’autre part pour la formation des citoyens aux méthodes et à l’esprit scientifique. Cette voie encourage les vocations pour les sciences chez les jeunes. Le COMETS formule des recommandations portant sur l’encadrement des pratiques des réseaux amateurs, sur l’importance de la validation des résultats, sur le respect de l’anonymat lorsqu’il s’agit de données privées, enfin sur le statut et la reconnaissance dus aux contributeurs.

Dans un monde secoué de crises successives et traversé par des controverses sur des sujets sensibles, le COMETS est d’avis que les chercheurs et leurs institutions doivent être à l’écoute des questionnements du public sur l’impact de leurs choix. Tout en réaffirmant l’autonomie du champ scientifique, il estime nécessaire d’engager une réflexion sur les formes à donner au débat public autour des questions de recherche. Il souligne fortement l’importance de la diffusion de la culture scientifique et de sa promotion active à tous les niveaux de la société. Il recommande que les expertises exercées par les scientifiques sur des questions ayant un impact sociétal soient menées à l’abri des conflits d’intérêt, dans un cadre interdisciplinaire et si possible international. Il préconise que le CNRS soutienne l’implication d’équipes de recherche dans l’analyse des perceptions des sciences et encourage les initiatives abordant des thèmes sensibles. Il suggère enfin que le CNRS développe une expertise collective mobilisable pour répondre aux sollicitations des décideurs publics et des instances démocratiques.

Armons notre pensée

À l’heure où nous refermons la première édition de l’atelier ETeRNAL, je veux croire que cette idée, pourtant tout à fait ancienne, que ce que nous étudions et la manière dont nous l’étudions est le plus important.

Nous avons constaté que nous abordions naturellement la question de l’éthique par celle de l’anonymisation, trop souvent considérée comme réglée. Force est de constater que ce n’est pas le cas, et d’autant moins que nous conservons de grandes difficultés à définir le problème. Et il n’est qu’une porte ouverte sur un constat, celui que lorsque les données sont devenues un enjeu économique et politique, les outils transformant intelligemment ces données deviennent de facto des objets économiques et politiques. En cela, notre travail de chercheur, de penseur, se décale de nos habitudes et nous oblige. Il ne nous oblige certainement pas à courir après plus de réussite ou de succès, mais bien à reconsidérer l’importance de notre travail.

Le traitement automatique des langues est divers d’histoires très différentes. À la fois issu de la tradition de la linguistique, sciences fort ancienne, et de l’informatique, science tout à fait moderne.
D’aucuns font le constat de notre éloignement de nos objets de recherche. Est-ce que la langue, pour ce qu’elle dit de notre capacité cognitive, de notre évolution, de notre relation au monde peut seulement se traiter par le biais de modèles purement mathématiques ? Est-ce que nous pouvons nous faire croire raisonnablement que nos outils n’ont pas de finalité en dehors des desseins que nous leur prêtons ? Est-ce que comprendre et transformer les données linguistiques est tout à fait anodin ?
Probablement pas.

Il nous appartient, en tant qu’individu, mais également en tant que communauté scientifique de nous inscrire dans une histoire, au moins celle de la science. Ne tentons pas de nous cacher derrière l’argument de la jeunesse, et de ce qu’elle justifie insouciance. Nous ne sommes plus les contemporains de la naissance de l’informatique. Et aujourd’hui, plus qu’hier, notre travail est devenu économique et politique.

Il ne s’agit pas de reproduire au sein de la communauté les habitus de la société, mais d’être en mesure de parler librement, de penser librement nos objets et les conséquences même de notre pensée. Il ne s’agit certainement pas de revendiquer les uns contre les autres, ou de trouver là le vecteur d’une forme de militantisme. Il s’agit certainement là d’une opportunité de s’enthousiasmer.

Alors, oui, il nous faut un espace pour prendre la parole et porter aux débats, celui de la communauté que nous formons, et celui de la société entière, dans sa diversité, les questions qui nous traversent. Reprenons les exercices difficiles de la réflexion, de la vulgarisation, du positionnement épistémologique de nos travaux.
Nous ne gagnerons pas grand chose pour nos carrières, mais notre pensée n’en sera que plus forte.
Je suis heureux de voir qu’un tel espace est en train d’éclore.
Il nous appartient de le faire naître, de le faire grandir et de s’en servir comme arme de la pensée.

Pourquoi un blog Ethique et TAL ?

A la suite de l’atelier ETeRNAL de TALN 2015, il est apparu que la communauté du Traitement Automatique des Langues manquait d’espace pour communiquer au grand public sur la réalité des technologies que nous développons, et à leurs dangers éventuels.

Ce blog se veut une action concrète dans ce sens. Il est ouvert à tout chercheur ou industriel du TAL qui voudrait y contribuer. Pour ce faire, envoyez-nous un mail à ethique-et-tal chez schplaf point org.

Comité de rédaction :

  • Gilles Adda (LIMSI-CNRS / IMMI)
  • Maxime Amblard (LORIA / Université de Lorraine)
  • Jean-Yves Antoine (Université de Tours)
  • Karën Fort (STIH / Université Paris-Sorbonne)
  • Hugues de Mazancourt (Eptica)