I O P R E S S E

Le frigo est plein

Marie-Ève Thérenty : « Numapresse est un dialogue constant entre la machine et les humanistes »

image relative à Marie-Ève Thérenty : « Numapresse est un dialogue constant entre la machine et les humanistes »
© Marie-Eve Thérenty
📌 Marie-Ève Thérenty s’intéresse depuis toujours au rapport entre presse et littérature. Aujourd’hui, cette professeure des universités à Montpellier coordonne Numapresse. Le projet, estampillé Agence nationale de recherche, a pour ambition de relire et documenter l’histoire de la presse du XIXe siècle à nos jours grâce à des outils numériques tels que le machine learning et l’intelligence artificielle.

Numapresse est une histoire qui s’écrit depuis 2017 et fait suite à la création, en 2011, de la plateforme Média 19. Pouvez-vous nous présenter plus amplement le projet actuel ?

« Au bout de cinq ans, après avoir constitué un énorme réseau international de chercheurs sur la presse et comparé le développement des écritures de presse en Europe, aux USA, mais aussi la communication entre les grands systèmes [d’information], l’idée, avec Guillaume Pinson, était de passer à une autre étape.

C’est le temps où nous nous trouvons maintenant avec Numapresse, une histoire culturelle et littéraire de la presse, depuis le XIXe siècle jusqu’à aujourd’hui. Nous travaillons avec des littéraires, des historiens, mais aussi des spécialistes de l’information-communication et des Humanités numériques*. Au départ, nous étions une vingtaine de chercheurs mais le réseau s’est élargi.

Nous étudions beaucoup le XXe siècle, dont la première partie jusqu’à la Seconde Guerre mondiale a été un grand moment d’hybridation, notamment à travers les hebdomadaires, et dont la deuxième moitié est sans doute celle où l’on retrouve la plus grande persistance de rédaction par des écrivains. 
Actuellement, nous numérisons des corpus comme Paris Match, L’Express, France Observateur qui deviendra le Nouvel Obs. Nous avançons dans le temps.

Quels sont les autres volets d’étude du projet Numapresse ?

« Nous travaillons également sur les genres, notamment les rubriques sportives et cinématographiques, le grand reportage et les hebdomadaires d’information, sur l’identification de la profession journalistique, sur la circulation des modèles médiatiques internationaux et le journalisme web contemporain, [car] « aujourd’hui », ça veut aussi dire les nouveaux médias, le journalisme numérique, mais aussi les dynamiques de réauctorialisation [réappropriation du processus d’écriture, ndlr] des journalistes, dans un régime médiatique où tout est de plus en plus trouble.

Beaucoup croient que n’importe qui peut assumer la fonction journalistique et que, puisque nous sommes tous potentiellement publiants, nous sommes tous potentiellement journalistes. Il y a une très forte réaction de la profession, qui réinvestit l’écriture, la signature, pour résister au travail de desk, au journalisme de bâtonnage, de retweet, etc. »

Vous travaillez sur des corpus numérisés, mais l’usage du numérique se limite-t-il à cette dimension ?

« Avec Numapresse, notre première idée était de travailler sur le temps long et la deuxième, effectivement, de profiter des corpus de presse numérisés. Cela démocratise énormément la recherche. [Mais au-delà de cela], notre post-doc, Pierre-Carl Langlais, spécialiste des Humanités numériques, a mis en place beaucoup d’outils assez inédits.

La principale innovation est un outil qui permet de reconnaître automatiquement, à partir de l’ensemble du journal, l’appartenance d’un article à un genre. Nous avons étiqueté tout un corpus témoin pour entraîner la machine. Elle identifie les termes et tournures syntaxiques récurrents et est capable de nous dire que tel article est, par exemple, à 90 % du reportage et à 10 % de l’interview.

Cela nous permet de faire toute une série d’hypothèses intéressantes, par exemple sur la naissance de la critique cinématographique. Pendant longtemps, la machine a identifié ces articles avec un gros pourcentage de critique théâtrale, ce qui [témoigne] d’une matrice commune, avant que la critique cinématographique ne trouve son indépendance, sans doute en parlant un peu plus de technique. Cet outil nous donne ainsi la possibilité d’étudier de manière approfondie différents genres et rubriques que nous voyons naître dans le journal. Et l’extraction d’un corpus donné va également beaucoup plus vite.

Ensuite, Pierre-Carl Langlais a aussi mis en place un outil d’extraction automatique et massive de signatures. Cela permet de voir émerger un personnel différent, de revenir sur la question de la profession journalistique, de l’auctorialité, de la professionnalisation de certaines rubriques, comme le journalisme sportif, longtemps écrit par les sportifs eux-mêmes.

Nous utilisons également beaucoup un outil qui n’est pas inédit (développé par Ryan Cordell) et qui détecte la viralité, c’est-à-dire la reprise de textes entre différents journaux, différents pays. 
Cela sert, par exemple, à pister la circulation des nouvelles au XIXe et de montrer que nous ne sommes pas arrivés, aujourd’hui, à l’ère de la reprise de nouvelles, parfois fausses, de manière totalement abrupte. C’était là bien avant. [Idem] pour le journalisme copié-collé que l’on appelait le journalisme fait à la colle et au ciseaux et qui était même le mode principal d’information pour le fait divers au XIXe. 

Cela a abouti à un petit livre très grand public, Fake news et viralité avant internet, signé un peu facétieusement de Roy Pinker, qui était un journaliste inventé de la revue Détective dans les années 30, mais aussi un pseudonyme collectif. Le paradoxe est que c’est internet qui nous permet de montrer que la fake news et que la circulation abondante de nouvelles existaient avant internet. »

De quelle manière la démarche Numapresse s’inscrit-elle dans le champ des Humanités numériques ?

« Nous effectuons bien un travail en Humanités numériques : nous possédons une grande compétence d’informaticiens, de mise en place de scripts pour interroger la presse, Pierre-Carl Langlais est reconnu par les spécialistes du champ… Mais il y a un dialogue constant avec les spécialistes des Humanités : des historiens, des littéraires, etc. C’est essentiel dans notre travail. Je pense que nous sommes dans l’entre-deux, avec un lien [permanent] entre ce que la machine nous sort et les textes. 

L’autre point important, c’est que les Humanités numériques sont, pour nous, un outil. Ce qui nous intéresse c’est bien l’histoire de la presse. Notre projet reste régi par les Humanités. Nous ne sommes jamais, je crois, esclaves de l’outil numérique. Notre spécificité est d’arriver du champs littéraire et d’avoir envie que l’outil nous réponde. »

En plus d’être des outils, les technologies numériques sont-elles aussi des objets de recherche ?

« Avec le versant du projet sur le journalisme web, nous nous rendons compte qu’il y a une sorte de superposition entre l’outil – la manière dont on travaille –, et le support sur lequel on travaille.

Avec le journalisme web, il y aussi les outils d’écriture automatisée. Nous voyons bien comment des comptes-rendus sont rédigés par des bots, par exemple pour les comptes-rendus de matchs, ce qui suscite d’ailleurs chez les journalistes un certain effroi à pouvoir être remplacés par des robots, même dans une perspective de journalisme narratif. Nous réfléchissons à tout ça et d’un coup, le numérique se trouve complètement au centre du projet.

[Nous le constatons] aussi sur tous nos travaux antérieurs : il y a souvent une grande porosité entre la manière dont nous étudions des outils de production journalistique et la manière dont nous construisons nos propres outils d’exploration de la presse numérisée. En étudiant la manière dont les scripts écrivent automatiquement des corpus narratifs de presse, on arrive à [déceler] des patterns d’écriture journalistique que nous pouvons réemployer pour rechercher dans le passé et affiner notre identification des genres. »

Le numérique est aussi le creuset de nouvelles formes narratives. Les étudiez-vous ?

« Dans l’équipe, Adeline Wrona a mené toute une série d’observations dans les rédactions pour voir ce qui a changé avec le numérique, comme le bâtonnage et le fait d’avoir des journalistes dédiés [à cette pratique], ou encore les alertes, la manière dont elles arrivent sur nos portables, dont ces textes sont rédigés, formatés.

Elle essaye aussi de voir s’il y a des bulles de filtres ou si la même nouvelle nous atteint tous, et a entamé une série de travaux sur une sorte de formalisation du journalisme web, notamment les nouvelles formes courtes, comme les tweets, la présence des grandes rédactions sur Instagram, etc.

Moi, ce qui m’intéresse ce sont plutôt les formes réactives à ces formes brèves et stéréotypées. Cela passe notamment par le réinvestissement par les rédactions, anglo-saxonnes d’abord puis françaises, de longs formats d’été, par exemple, comme les grandes enquêtes de Florence Aubenas, ainsi que par les formes d’écriture, qui sont d’ailleurs parfois un réinvestissement de formes anciennes.

Donc Numapresse, c’est à la fois réfléchir à ces nouvelles formes standardisées, ce travail de desk, cette course à l’immédiateté et les réactions, avec une écriture plus narrative, sur une autre périodicité. »

Vous évoquez le mouvement de réappropriation, par les journalistes, d’une écriture plus littéraire et de la notion de signature. Rapprochez-vous cela de l’explosion actuelle de la parole des éditorialistes et de l’incursion du personal branding dans le monde des médias ?

« Les éditorialistes stars ont toujours existé, y compris au XIXe : ils avaient une forte autorité sur tout, on les interrogeait sur tout et ils ont pris, en fait, le relais des écrivains. Quelqu’un comme Jules Huret, fin XIXe, est vraiment un polygraphe, qui écrit sur tout, à la fois journaliste littéraire, politique, social… donc ça n’est pas totalement nouveau.

La simplification, avec des canaux de masse, souvent gratuits, pose aussi problème. La plupart de nos concitoyens pensent que l’information est gratuite. S’alimenter uniquement auprès des réseaux sociaux et [des chaînes d’info en continu], c’est oublier que l’information se paye et que si c’est gratuit, nous la payons autrement, que nous en devenons l'esclave. La jeune profession, qui doit inventer de nouvelles façons de s’en sortir économiquement, peut se sentir écraser par ces voix.

L’écrivain comme marque n’a rien de neuf non plus. Les journaux sont des marques, L’Express n’est pas Paris Match, et, bien sûr, les signatures en sont aussi. Le travail de Numapresse autour de la signature nous amène à réfléchir aussi à la signature comme marque. Quand un Mauriac signe dans L’Express, en 1954, son Bloc-note, cela valorise la marque L’Express et [celle-ci] valorise la marque Mauriac. »

Est-il du ressort de Numapresse d’analyser la « crise » actuelle de la presse ?

« Notre travail vise aussi, et c’est pour cela qu’on a des spécialistes d’information-communication, à poser un diagnostic sur le journalisme contemporain. J’insistais sur la réauctorialisation de certains journalistes qui publient de plus en plus de livres, on eu des blogs un temps, qui passe par l’émergence des mooks [contraction de magazine et de books, ndlr] ou de sites comme Les Jours. Tout cela va dans le sens d’une relittérarisation du journalisme et prend du sens dans un temps long car ce sont des phénomènes de retours, de réactions et de réaménagement par rapport à des situations qui ont évolué. Nous réagissons avec des recettes adaptées mais qui ont été inventées à d’autres époques. La fake news est également étudiée à l’aune du temps long.

Cela permet, je crois, de bien voir les spécificités de l’époque contemporaine : le passage par les réseaux sociaux, l’exploitation dans un registre politique d’une certaine horizontalité, les algorithmes qui nous placent dans des phénomènes de vase clos, ce qui fait que le fact checking ne fonctionne pas au delà de ces communautés…

Notre regard d’historien est utile pour relativiser la rupture, la crise. Une redistribution doit s’opérer. Tout comme l’essor de la presse a accompagné la première alphabétisation, je pense qu’il faudrait une deuxième alphabétisation, où nous sensibiliserions très jeunes les enfants, puis les collégiens et les lycéens, à tous ces phénomènes : comment reconnaître une fake news, quels sont les pulsions, les sentiments, les instincts qu’elle suscite en nous pour que l’on retweete. J’aimerais bien qu’à un moment, en cours de français ou d’éducation civique, nous apprenions aux jeunes générations qu’à partir du moment où nous sommes tous publiants, nous devons tous être éduqués et réfléchir à ce que nous publions. »


*Les Humanités numériques sont un champ transdisciplinaire appliquant les savoir-faire des technologies de l’information et de l’informatique au domaine des sciences humaines et sociales, autrement appelées Humanités.

Publications similaires

La titraille, tout un art

Le titre et la titraille d’un journal ne sont pas des éléments périphériques, petits satellites de l...

Élisabeth Chabuel : « La poésie est un moyen de dire ce que l’on ne peut pas vraiment dire »

📌 Élisabeth Chabuel est née à Die, dans la Drôme, et vit entre cette petite ville au pied du Ver...

Guillaume Pinson : « Au XIXe, on use de la fiction pour parler du monde et de l’actualité »

📌 PNA - publications non alignées
Guillaume Pinson est professeur à l’u...

Jean-Baptiste Diebold : « Il est crucial d’identifier sa base d’utilisateurs et d’être en affinité avec eux »

📌 PNA - publications non alignéesJean-Baptiste Diebold a été journaliste pendant quinze ans, don...

Entre radinerie et bavardage, écrire à l'économie

Ne pas « tirer à la ligne », éviter de « pisser de la copie », « écrire à l...