Considérations éthiques à l’ère du journalisme robotisé

(Les textes que je publie dans cette revue de presse sont des références. Il ne faut pas les interpréter comme des opinions personnelles. Pierre Tourangeau)

Ce texte est une traduction par Jean-Hugues Roy, professeur de journalisme à l’UQAM, et une adaptation de l’article de Tom Kent, «An ethical checklist for robot journalism», également publié sur Medium. Tom Kent est responsable des normes éthiques à l’Associated Press.

Les entreprises de presse font de plus en plus d’expériences avec le journalisme robotisé. Il s’agit surtout de logiciels qui transforment des données brutes en articles. On en voit peu, voire pas du tout, dans la presse francophone européenne ou québécoise. Mais dans l’univers anglo-saxon, des robots sont utilisés depuis quelques années déjà.

Ce qu’ils produisent est assez prosaïque pour le moment: des résultats trimestriels d’entreprises cotées en bourse, par exemple, ou encore des compte-rendus de matches de ligues mineures. Un robot est utilisé par leLos Angeles Times pour mettre en ligne un court texte dès qu’il se produit, dans le sud de la Californie, un tremblement de terre dont la magnitude dépasse 3,0.

Par souci de transparence, il faut immédiatement préciser que l’auteur du texte d’origine, Tom Kent, travaille pour The Associated Press. L’agence de presse a co-fondé et utilise les services d’Automated Insights, une entreprise de rédaction automatisée de textes. AP a annoncé récemment qu’elle utiliserait le logiciel de cette entreprise pour générer des reportages sur les matches de baseball de la NCAA, la principale ligue universitaire aux États-Unis.

Ce que pondent ces robots n’est pas très raffiné encore. Mais avec les progrès de l’intelligence artificielle, on peut s’attendre à ce que les entreprises de presse utilisent bientôt de la rédaction automatisée pour traiter de sujets plus complexes. Et en français!

Surgiront alors des questions éthiques inédites. Tom Kent en anticipe dix:

  • Les données d’origine sont-elles fiables? La source des données est-elle un ministère ou une agence du gouvernement? Puise-t-on dans les document publics d’une entreprise cotée en bourse? Dans ces cas, les données sont probablement fiables (il demeure nécessaire, bien sûr, de vérifier si leur transmission se fait toujours correctement). Les sources, cependant, ne sont pas toujours crédibles. Les données sur le soccer amateur peuvent être fournies par des parents qui assistent aux parties de leurs enfants, par exemple. Pouvez-vous faire confiance en tout temps à ce type de collecte de données?
  • Avez-vous les droits sur les données? Vos fournisseurs de données ont-ils le droit de vous les faire parvenir? Avez-vous le droit de les traiter et de les publier? Si oui, vos droits s’étendent-ils sur l’ensemble des plateformes sur lesquelles vous diffusez? Et ces droits sont-ils éternels ou limités dans le temps?
  • Les récits automatisés sont-ils répétitifs? Des faits différents racontent une histoire différente. Le logiciel dont vous vous servez devrait être en mesure d’utiliser des approches différentes en fonction de ce que racontent les données.
  • Votre démarche est-elle transparente? Il va de soi que vous informerez vos lecteurs que ce qu’il lisent a été rédigé automatiquement par un logiciel. Mais vous pouvez faire davantage: fournir des hyperliens pour permettre au public d’identifier la source des données et de comprendre comment fonctionne votre robot.
  • Votre robot suit-il vos normes? Vos récits automatisés sont-ils rédigés en fonction des mêmes normes que ce qu’écrivent les journalistes en chair et en os? Si ce n’est pas le cas, cela pourrait donner l’impression à vos lecteurs que vous laissez le robot écrire n’importe comment (et, par extension, n’importe quoi).
  • Êtes-vous prêt à défendre ce qui est écrit par un logiciel? Si des lecteurs remettent en question les faits à la base d’un article automatisé, ou encore le choix des faits qui a été effectué par votre logiciel, pouvez-vous expliquer pourquoi (ou obtenir une explication rapidement de la part de vos fournisseurs de données ou du concepteur de votre robot)? Répondre: « C’est la faute de l’ordi » ne suffira pas. Serez-vous prêts à divulguer, par exemple, que dans vos comptes-rendus automatisés de soccer amateur, vous programmez votre logiciel pour qu’il mette l’emphase sur les bons coups afin d’encourager la pratique du sport chez les jeunes?
  • Qui surveille le robot? Des pépins avec les données de base, ou encore avec le logiciel de rédaction, peuvent engendrer des erreurs qui, à leur tour, peuvent se traduire par des centaines, voire des milliers d’articles erronés. Faites de nombreux tests avant de publier quoi que ce soit. Dans les premières phases de l’automatisation, assurez-vous qu’un véritable journaliste vérifie les textes du robot avant de les publier. Une fois la période de rodage terminée, les articles pourront être automatiquement mis en ligne avec, toutefois, des vérifications sporadiques par des rédacteurs humains.
  • Songez-vous à la production automatisée de contenu multimédia?Certains systèmes créent automatiquement des vidéos ou des galeries de photos pour accompagner des textes. Dans ces cas, avez-vous les droits sur le matériel vidéo et/ou photo que vous diffuserez? Comment vous assurerez-vous, avant leur mise en ligne, que les vidéos et/ou photos en question ne contreviennent pas à vos politiques éditoriales (matériel obscène, haineux, de mauvais goût, etc.)?
  • Votre logiciel résume-t-il correctement de longs textes? Faites des test exhaustifs, car il est possible que certains éléments importants d’un long texte échappent à votre logiciel lorsqu’il tentera de le résumer. Tom Kent rapporte que l’Associated Press a entré le texte de la Genèse, par exemple, dans un logiciel qui fait des sommaires automatisés. Dans ce que le logiciel a produit, il n’y avait aucune mention du jardin d’Éden!
  • Êtes-vous prêt pour la suite? Le journalisme automatisé n’en est qu’à ses premiers balbutiements. Il y a fort à parier qu’on s’en servira éventuellement pour couvrir des sujets controversés comme des campagnes électorales. Un politicien pourrait demander de savoir pourquoi il a été couvert de telle ou telle façon. Il pourrait demander (comme pourrait le faire toute personne ou groupe qui fait l’objet de vos reportages automatisés) de voir quels paramètres sont utilisés par votre robot en exigeant de consulter le code source. Essayez d’anticiper toutes les possibilités avant qu’elles ne surviennent.

En somme, si vous envisagez la rédaction automatisée, testez, testez et testez encore. Assurez-vous, également, que vos rédacteurs humains comprennent comment le logiciel fonctionne réellement. Enfin, n’oubliez jamais que bien des choses sont encore mieux faites par des êtres humains

Tom Kent a basé ce texte sur une présentation qu’il a faite au congrès 2014 du Global Editors Network.

Pour me joindre :

ombudsman@radio-canada.ca

Twitter : @ombudsmanrc