Ecriture automatisée : que peut y gagner la presse régionale française ?

Maëlle Fouquenet
12 min readSep 27, 2019

Il n’y a pas que Le Monde ou L’Express qui utilisent la génération automatique d’articles sur leur site internet. La PQR (presse quotidienne régionale) aussi le fait ! Le Télégramme, Ouest France, Sud Ouest, La Montagne, Nice Matin, Ebra… Tous ou presque ont essayé ou prépare des expérimentations dans le domaine. Souvent pas avec les mêmes moyens, mais avec des objectifs assez similaires, et un apprentissage important à chaque essai pour les rédactions en terme de processus et de méthodes.

Voici cinq bonnes raisons pour la PQR de se mettre à l’écriture automatisée de contenus, d’autres usages qui se profilent à court terme, et les conditions de réussite de ce type de projets.

1 - dégager du temps pour les journalistes
2 - une couverture exhaustive
3 - la création de nouvelles rubriques ou verticales
4 - une mise à jour plus régulière ou automatisée des informations
5 - une densité de contenus pour un meilleur référencement naturel

Précision tout d’abord, il est possible d’automatiser la génération de textes, incluant des images ou des liens, mais aussi de graphiques dynamiques. Il est aussi possible de générer automatiquement des vidéos.

L‘intérêt de l’automatisation de textes pour la PQR

1/ Supprimer les tâches répétitives, dégager du temps

La première raison invoquée à l’automatisation de productions de contenus, que ce soit en PQR ou en PQN, est de dégager du temps pour les journalistes. En évacuant les tâches répétitives et souvent inintéressantes de leur travail quotidien, les journalistes peuvent alors se recentrer sur des missions plus fondamentales comme l’enquête, l’analyse, le reportage sur le terrain. Des tâches qui apportent aussi plus de valeur à leur média, avec l’ojectif de transformer des lecteurs/internautes en abonnés.

Ex : les pointages du Vendée Globe

Le Télégramme a automatisé les pointages de course lors du Vendée Globe en 2016.

“Historiquement, les journalistes écrivaient six pointages par jour entre 6h et 23h pour donner la position de chaque participant avec les écarts entre les concurrents, cela en plus des reportages de la journée”, indique Vincent Lastennet, journaliste en charge de la data et de l’innovation pour le quotidien breton.

Pour prendre en charge ce travail de pointage, le développeur intégré à la rédaction a construit un robot récupérait les positions. Un texte (sur le principe du texte à trous) était ensuite automatiquement généré avec la dernière position des participants, les écarts, etc. Les différents scénarios avaient été pré-rédigés par un journaliste.

Au départ, les textes étaient vérifiés, relus et titrés. Puis “les journalistes ont vu que ça marchait et ils nous ont dit qu’on pouvait publier directement”. Le chapo (d’environ 400/500 signes) est alors actualisé automatiquement dans le CMS et publié sur le site du journal six fois par jour, et les pointages apparaissent dans le direct de la course.

Page dédiée aux pointages de la course Vendée Globe en 2016

2/ Une couverture plus exhaustive en quelques secondes

L’automatisation permet de couvrir un champ plus large, un territoire de manière plus exhaustive, et ce de manière très rapide. Les lecteurs constatent que des villages ne sont plus couverts, souvent par manque de correspondants. L’automatisation de certaines informations pourrait permettre de traiter à nouveau toutes les communes d’une zone de diffusion (notamment les “infos services”).

C’est une piste explorée par plusieurs titres régionaux français ainsi que par Syllabs, le principal prestataire dans la génération de textes pour les médias français. Selon Claude de Loupy, son pdg, il est possible d’automatiser un fil d’information locale sur une commune en intégrant par exemple son agenda événementiel, les fêtes, les horaires de cinéma, de la bibliothèque, les dates de rentrée scolaire, d’ouverture des inscriptions au centre de loisirs, la date butoir pour payer sa taxe d’habitation, celle du Beaujolais nouveau, les rencontres sportives à venir… On peut aussi choisir de créer un fil info thématique.

Ex : la météo pour toutes les communes

Avant l’automatisation de la météo, la rédaction de l’article web quotidien annonçant la météo départementale prenait 30 minutes à un journaliste de Nice Matin. Avec l’automatisation, un article distinct est généré pour chacune des 363 communes, quotidiennement et quelques secondes. Il contient la température et son évolution dans la journée, la vitesse du vent, ainsi qu’une prévision pour le lendemain.

“Il y a de nombreux villages où on n’a jamais de contenus car on n’a plus de correspondant. Résultat 80% du contenu concerne deux ou trois communes.”, explique Damien Allemand, responsable numérique du quotidien. L’automatisation de la météo permet de proposer tous les jours une information, même si elle est brève.

Page météo générée automatiquement pour la ville de Menton

3/ La création de nouvelles rubriques ou verticales

Autre utilisation possible de la génération automatisée d’articles : développer de nouvelles rubriques/verticales et attirer de nouveaux abonnés, et de nouveaux annonceurs.

Si on prend le foot à Lyon, on peut imaginer développer une verticale dédiée aux équipes féminines dans toutes les divisions pour viser l’exhaustivité et attirer les fans et d’éventuels annonceurs. Si les journalistes couvrent les équipes principales et locales, ils peuvent déléguer en revanche la rédaction des brèves d’annonce et de résultats des matchs des autres équipes et des divisions inférieures à un algorithme. Ce dernier produira aussi le tableau des scores et celui des classements de manière automatique (encore faut-il disposer des données). C’est là un contenu que le journal n’aurait pas produit sans automatisation par manque de temps et de moyen.

C’est la logique qu’a suivi le groupe suédois de presse régionale MittMedia en lançant deux verticales payantes (HockeyPuls et BandyPuls) largement alimentées par le système automatisé de United Robots (prestataire dans lequel le groupe média a investit).

En 2017, MittMedia a aussi lancé un flux d’articles automatisés sur l’immobilier local suite à une étude qui montrait un intérêt fort pour le sujet au niveau local de type (typiquement, “qui a acheté la maison du bout de la rue”). L’algorithme a produit 25 000 articles en un an (article qui comprend le nom des acheteurs, le prix de la transaction et sa localisation ainsi qu’une photo issue de Google Street View). Les abonnés peuvent également recevoir des notifications à chaque mise en vente de bien immobilier.

Cette rubrique a généré 700 abonnements. C’est un de leurs services les plus populaires et qui “convertit” le mieux les visiteurs gratuits en abonnés.

En 2018, ils ont automatisé les informations concernant les faillites des entreprises. En mars 2019, le groupe indiquait avoir gagné 1 000 abonnés en un an sur l’ensemble de ses 20 sites d’informations locales grâce à l’automatisation.

Autre exemple similaire dans la démarche : Östgöta Media, autre groupe de presse régional suédois, a créé en 2016 un pure player national dédié au football sous une nouvelle marque, avec l’objectif de couvrir toutes les divisions. Le site est alimenté en totalité par “l’algorithme sport” de United Robots. Selon Sören Karlsson (patron de United Robots), il a attiré une audience nouvelle, plus jeune. Ce qui a permis d’attirer également les annonceurs.

Le site Klackspork appartient à Östgöta Media, qui a créé ainsi une nouvelle marque média.

4/ Une couverture plus régulière et/ou mise à jour automatiquement

Le traitement de certains sujets peut également devenir plus régulier grâce à l’automatisation. Il devient possible de donner une information service (trafic routier ou météo par exemple) tous les jours pour toutes les communes, et même mises à jour automatiquement. Ce qui serait impensable si c’était fait “à la main” par un-e journaliste de la rédaction.

Ex : les prix du carburant en temps - presque - réel

Au début de la crise des Gilets Jaunes, Le Télégramme a créé des articles dynamiques (qui se mettent à jour automatiquement) sur le prix des carburants pour environ 700 communes. Un travail colossale et impossible à effectuer à la main car la mise à jour de textes s’effectue toutes les 30 minutes si une variation de prix est constatée par l’algorithme lorsqu’il vérifie les données sur le site source.

Capture d’écran du haut de la page générée pour la ville de Brest

Un texte d’environ 1000 signes accompagne chaque page de commune. Le robot utilise la base de données gouvernementale https://www.prix-carburants.gouv.fr et prend en compte les stations service dans un rayon de 10km. Il génère également un classement des stations les moins chères de la zone, le tableau exhaustif des stations ainsi qu’une carte.

On est là dans un réel service aux internautes puisque l’information qui leur est proposée est essentielle dans leur organisation quotidienne (les trajets domicile-travail s’effectuant majoritairement en voiture dans une grande partie du territoire). Elle répond à une actualité (les Gilets jaunes) qui repose sur une inquiétude économique. Le média propose alors une aide à la décision (où aller faire le plein le moins cher possible près de chez moi).

Vincent Lastennet souligne d’ailleurs un “bon retour, les journalistes voulaient que ça apparaissent bien sur leurs pages de locales et consultaient l’article pour écrire leur papier”. L’automatisation aide donc aussi les journalistes dans la recherche d’informations, leur permet d’y accéder plus rapidement.

Ex : les alertes lors de tremblements de terre

Dans le même esprit, Nice Matin travaille sur une automatisation d’articles à chaque tremblement de terre sur sa zone de couverture. Le projet n’est pas encore abouti mais s’inspire du Quake Bot du Los Angeles Times. Celui-ci génère un brouillon d’article à chaque tremblement de terre enregistré par le U.S. Geological Survey, dès que la secousse répond à certains critères (magnitude, localisation exacte…). Un-e journaliste de la rédaction décide ensuite si l’information est publiée ou non, et peut éventuellement l’enrichir.

5/ Une augmentation forte du volume d’articles publiés et du référencement

La création automatique de pages d’informations locales sans actualité particulière (regroupant des informations statistiques, fiscales, démographiques, liées à l’emploi…) pour chaque commune génère de fait une augmentation forte du volume de contenus publiés sur le site d’un média régional.

C’est la stratégie qu’avait adopté Le Monde en 2015 pour créer du volume et du référencement avant l’élection régionale. Le projet avait été présenté lors d’une réunion Hack/Hackers à Paris en janvier 2016. C’était pour le quotidien national une façon de “se positionner sur de l’hyper local” et “favoriser la longue traine”. Le Monde avait indiqué pour chaque page commune des informations sur la population, sur le logement, sur les revenus, sur le chômage, les comptes des collectivités, les élus, et les résultats électoraux depuis 2002.

Ces nouvelles pages ajoutées étant référencées par les moteurs de recherche, elles créent un historique sur des sujets (comme les impôts locaux ou le taux de chômage local), et sur des noms de communes. Element hautement stratégique et important pour capitaliser en vue de l’élection municipale de 2020.

Côté régie pub, un volume d’articles plus important signifie plus d’inventaires publicitaires à vendre.

Quelles autres applications possibles pour les algorithmes dans la PQR ?

L’épineux sujet des correspondants

Sujet important pour la PQR, la baisse du nombre de correspondants est une inquiétude forte. Moins de correspondants signifie moins de communes couvertes. Concrètement, les correspondants locaux fournissent entre 50 et 80% de la surface rédactionnelle des journaux de PQR et PHR. Mais ils sont de moins en moins nombreux. La tentation de trouver une solution technologique est forte. Plusieurs titres de PQR se penchent sur le sujet.

Lors du Festival de l’Info locale, qui s’est tenu à Nantes en juin 2019, le directeur de projets de Ouest-France, Michel Le Nouy, a ainsi évoqué l’hypothèse d’un formulaire à remplir par les correspondants. Ce qui aurait l’avantage de collecter des informations sous forme de données, tout en laissant la possibilité d’ajouter des commentaires. Pour un match de foot par exemple, le correspondant pourrait compléter en précisant l’état de la pelouse.

En revanche, difficile d’automatiser un compte rendu de conseil municipal ou une inauguration. “Il faut de la répétition pour que cela fonctionne”, insiste Claude de Loupy, de Syllabs. Sans répétition pour réutiliser des développements payants et parfois coûteux, pas d’intérêt économique tout simplement.

Les commentaires à chaud des coachs intégrés directement

Le prestataire suédois United Robots fournit un programme pour récolter les réactions d’après matchs des entraineurs. Le système génère un sms dont la réponse est ensuite intégrée dans le compte-rendu automatisé qui est lui-même publié sur le site.

Les alertes avec ou sans publication

Une application utile à mettre en place pour les lecteurs et les journalistes est la fonction d’alerte des algorithmes. Lors d’un événement particulier, l’algorithme envoie une brève hyper factuelle sur le site, et/ou sur les réseaux sociaux et en push mobile. L’alerte est également envoyée aux journalistes qui n’ont pas de temps à prendre pour rédiger la brève, info indispensable et urgente. Ils peuvent alors immédiatement chercher des témoignages, des informations plus précises, contextualiser l’événement pour produire un premier article assez dense.

L’alerte peut aussi seulement informer les journalistes qu’il se passe quelque chose de louche qui mérite leur attention. Par exemple, si on reprend les articles automatisés sur le prix de l’essence, l’algorithme pourrait être paramétré pour alerter les journalistes (via une notification par mail ou sms) si un écart inhabituel (à déterminer) se produit lors d’une variation de prix. Suite à cette alerte, les journalistes décident ou non de creuser.

Ce système est déjà en place dans certaines rédactions suédoises notamment (via United Robots). Syllabs travaille également sur ce sujet. L’alerte peut s’appliquer à tout ce qui s’automatise à partir d’une base de données.

L’expertise des journalistes et le travail d’équipe, conditions nécessaires pour que ça marche (mais pas que)

Si de nombreuses tâches semblent pouvoir s’automatiser dans la publication d’informations, les champs d’exploration restent vastes et très ouvertes, quelles autres idées vont émerger ?

Pour Laurence Dierickx, journaliste développeuse [qui a créé un robot pour récolter l’indice quotidien de la qualité de l’air à Bruxelles], aucun doute : “la base de l’automatisation, c’est l’expertise des journalistes sur un sujet”. En effet, les journalistes savent où aller chercher les infos (les données), ils savent les jauger.

Ce savoir se complète par celui des journalistes versés dans les données qui sont eux aussi en mesure d’évaluer leur qualité et pertinence éditoriale. Ils savent également juger de la structuration de la base de données, et de ce qu’il sera possible de faire avec ou pas.

Ce sont les journalistes ensuit qui sont à même d’expliquer les données, les analyser et contextualiser, le pourquoi, les conséquences de telle ou telle information. Mais attention, et c’est un enjeu de taille pour la PQR, sans données de qualité, point d’automatisation !

Enfin, il convient d’imaginer quel produit éditorial en tirer concrètement, qui sera utile aux lecteurs-internautes et qui les concerne directement, et comment. Là, l’aide d’un-e développeur-se en interne est précieuse. Et si on a de graphistes qui s’y connaissent en UX dans l’équipe, on peut réfléchir à un projet de manière plus globale.

Autre caractéristique importante pour développer des projets de contenus automatisés : la créativité éditoriale des journalistes qui ouvrent des pistes d’expérimentation. Comme pour les pointages de course au Télégramme, ou les informations liées aux tremblements de terre à Nice Matin, chaque média régional peut trouver des sujets automatisables et, idéalement, qui correspondent à l’intérêt de leur lectorat et leur ligne éditoriale.

Si on ajoute à cela le fait qu’on n’automatise que des tâches répétitives (pour des questions de coût et rentabilité économique), on est loin du fantasme voulant que tout soit automatisable. Guillaume Desombre, le patron de LabSense et concurrent de Syllabs, considère même que “90 à 95% du contenu d’un journal n’est pas automatisable”, en raison de la nature trop spécifique de l’information.

Un autre élément important pour que ces projets réussissent est l’investissement de la direction. Il est essentiel que la hiérarchie soit partie prenante et soutienne le projet sous peine de démobilisation sur le terrain.

Idéalement, il convient également d’associer les autres services du média, notamment le marketing, la diffusion, qui pourront réfléchir à la monétisation d’une nouvelle verticale par exemple (quels nouveaux annonceurs démarcher).

Les médias, dont la PQR, ont de bonnes raisons d’expérimenter, principalement pour être en mesure de tirer le meilleur parti de ses technologies dont les coût ont fortement diminué ces dernières années. Le but n’est pas juste d’aller plus vite, ou de faire plus, il est avant tout de conquérir de nouveaux internautes et abonnés en améliorant la qualité et la largeur de leur couverture éditoriale. Une démarche qui s’appuie sur l’expertise éditoriale de leurs équipes et une structure managériale qui permette ces expérimentations.

Celles-ci sont primordiales et ouvrent de nouvelles perspectives organisationnelles et de nouveaux métiers dans les rédactions. Elles posent également des questions sur le positionnement des médias dans le futur, notamment sur la transparence des algorithmes (et donc de ceux utilisés dans les rédactions) et sur l’utilisation intensive des données personnelles des internautes (qui permettent la personnalisation des home pages ou chemin de lecture par exemple dont les objectifs sont de générer des abonnements, mais aussi fidéliser les internautes une fois abonnés). Et ce n’est que le début des possibles, un des prochains enjeux pour les médias de presse écrite sera l’information vocale. Comme pour l’écriture, les usages évoluent et la technologie promet une révolution à venir.

--

--

Maëlle Fouquenet

Journaliste en formation/reconversion data analyst, ex responsable numérique @ESJPRO. Algo, transparence, audio, ❤#Berlin, #Nantes, #freediving et #lindyhop