Menaces de procès, blocage des robots d’indexation : quels sont les enjeux du bras de fer entre les médias et Open AI ?
Le torchon brûle entre les médias et OpenAI à propos de son robot GPTBot, accusé de violer les droits d’auteur attachés aux contenus qu’il collecte sur le Web pour entraîner ses algorithmes et améliorer la pertinence des futurs modèles d’IA. Le très réputé quotidien The New York Times s’est empressé de bloquer l’accès au robot et a menacé OpenAI d’une action en justice.
« À défaut d’obtenir l’autorisation préalable des auteurs ou des ayants droit, OpenAI peut commettre un acte de contrefaçon à chaque fois que son robot indexe et traite du contenu protégé par le droit d’auteur (ou copyright), par exemple, des articles de presse, des images, des infographies, de la voix, de la vidéo », explique Constantin Pavleas, avocat spécialisé en droit du numérique.
Ni source ni provenance des articles
Courant août, le journal américain a interdit l’utilisation de son contenu pour le développement « de tout logiciel, notamment pour l’entraînement d’un système d’apprentissage automatique ou d’intelligence artificielle ». « Il entend ainsi protéger son contenu éditorial d’une exploitation par un tiers sans aucune contrepartie, contrairement à un moteur de recherche qui indexe le contenu et permet ainsi d’augmenter la visibilité et le trafic du site dont il provient », complète Me Pavleas. En effet, ChatGPT n’indique ni la source ni la provenance des articles. Le lecteur n’est donc pas incité à se rendre sur le site Web du journal. Ce qui, de fait, impacte son audience et les revenus publicitaires qui en découlent.
« L’accès libre ou payant ne résout pas le problème de la contrefaçon »
Dans sa notice d’information, OpenAI se veut rassurant, en précisant que rien n’empêche les sites de bloquer son robot GPTbot, lequel n’aspire pas les sources protégées par un accès payant. « On peut aisément lui répondre que l’accès libre ou payant ne résout pas le problème de la contrefaçon », assure Me Pavleas.
Reste que les articles ne bénéficient pas tous d’une protection par le droit d’auteur. « Les informations brutes de presse ne sont pas protégées, contrairement aux articles dont la rédaction traduit leur éditorialisation, à savoir le choix créatif, l’angle et la direction donnés à l’article, etc., qui les marquent de l’empreinte de la personnalité de l’auteur et rend ainsi l’article original », développe l’avocate Karine Riahi, associée cofondatrice de Spring Legal. Par ailleurs, « si ChatGPT reproduit tel quel des bouts d’articles, il y a contrefaçon. S’il ne fait que s’inspirer de ces contenus puisés sur Internet, la question se pose », doute Me Riahi.
Lourdes amendes
Si elle devait faire face à un procès en propriété intellectuelle, la pépite californienne s’exposerait à de lourdes amendes. « En droit américain, le montant maximal de dommages-intérêts légaux pour contrefaçon de droits d’auteur dépend de savoir si la contrefaçon est “innocente” ou “intentionnelle”, et du nombre d’œuvres contrefaites, précise Me Pavleas. L’auteur d’une contrefaçon “innocente”, qui suppose qu’il n’avait pas connaissance ou qu’il n’avait de raison de penser qu’il commettait un acte de contrefaçon, encourt entre 200 et 30 000 dollars par œuvre contrefaite. Si le contrefacteur a violé le droit d’auteur de manière volontaire, le tribunal peut tripler le montant des dommages-intérêts légaux dans une fourchette comprise entre 750 et 150 000 dollars par œuvre contrefaite. »
Des questions inédites sur la paternité des contenus produits par des IA génératives pourraient néanmoins s’inviter au procès : un article écrit à l’aide d’une IA peut-il être protégé par le droit d’auteur de la même façon que s’il n’était né que d’un cerveau humain ? Peut-on considérer qu’il porte l’empreinte de la personnalité du rédacteur ? Où placer le curseur de l’originalité d’une œuvre à l’ère de l’IA ? Open AI pourrait, par exemple, prétendre que les textes et vidéos réalisés avec l’aide de chatGPT sont libres de droits.
« Si j’étais l’avocat du New York Times, j’utiliserais le précédent judiciaire du selfie du singe, avance Me Julien Brunet, associé du Pôle Cinéma-Média-Digital chez Spring Legal. La question était de savoir si le selfie réalisé par un singe est protégé par le droit d’auteur, et qui est le titulaire de ce droit : le singe ou le photographe qui a réglé l’appareil photo. Les autorités ont répondu que seul un être humain peut être titulaire du droit d’auteur. En l’occurrence, l’originalité venait du fait que le photographe avait réglé l’appareil photo dont le singe s’était emparé pour se prendre en selfie. En l’état actuel du droit, l’humain est au centre du processus créatif. Une machine qui “semble” produire des contenus reste un outil, comme l’est la caméra de Spielberg. »
Violation de la réglementation sur les données personnelles
Le robot d’indexation d’OpenAI franchit une autre ligne jaune : il traite des données personnelles sans information préalable des personnes concernées, sans justifier d’un « intérêt légitime » à le faire. « Cette problématique a déjà été soulevée dès mars 2023 par l’autorité de contrôle italienne, la GPDP (Garante per la protezione dei dati personali). Celle-ci a pris une mesure radicale en suspendant pendant un mois l’utilisation de ChatGPT en Italie ! D’autres autorités lui ont emboîté le pas pour ouvrir des enquêtes (la Cnil en France, en Espagne…). Et l’EDPB (European Data Protection Board) a constitué un groupe de travail pour coordonner les enquêtes. À ce jour, les pratiques de GPTbot ne sont pas conformes au RGPD », rappelle Me Pavleas.
En août dernier, dix groupes de médias internationaux (dont l’AFP et l’Associated Press) ont appelé à encadrer l’usage de l’IA dans l’information. Mais, comment durcir les règles sans freiner l’innovation ? « Les obligations d’information et de transparence imposées aux éditeurs d’IA dans la dernière version du projet de règlement européen dédié à l’intelligence artificielle (AI Act) font déjà grincer des dents, souligne Me Pavleas. Beaucoup de start-up européennes y voient un frein à l’innovation, outre le fait qu’elle désavantagerait l’Europe dans sa concurrence avec les États-Unis et la Chine, des pays qui comptent bien maintenir leur hégémonie technologique. En l’état actuel, ce projet de texte impose aux éditeurs d’IA générative de rendre publique la liste des œuvres protégées par le droit d’auteur qui ont été utilisées pour la formation des algorithmes – mais il ne règle pas la question du non-respect des droits d’auteur. »
Juste rémunération
Pour l’heure, plusieurs médias, dont Radio France, le groupe TF1 (pour l’accès à ses sites TF1.fr et TF1info.fr) et le groupe Sipa (Ouest-France pour sa plateforme d’information locale Actu.fr) ont bloqué l’accès au robot GPTbot et réfléchissent à de possibles négociations avec Open AI, accusé de faire des profits sur la base de contenus pillés. « Les plateformes doivent sourcer les médias, sous peine d’absence de neutralité et de possible manipulation », a déclaré Bertrand Gié, directeur du pôle News du Figaro et président du Geste (Groupement des éditeurs de services en ligne).
Celui-ci appelle à « rémunérer justement les médias » au travers d’« accords de licence et de rémunération ». De tels accords sont d’autant plus attendus que les médias sont dans une position délicate, relève Me Pavleas : « Le RGPD leur impose de bloquer les robots qui aspirent et traitent des données personnelles, sauf s’ils ont passé un accord avec la société d’IA. »
L’agence de presse américaine The Associated Press a ouvert le bal en juillet dernier avec la conclusion d’un accord avec OpenAI, l’autorisant à utiliser ses archives depuis 1985 en échange d’un accès à sa technologie et à son expertise en matière d’IA. « On ne connaît pas les termes de cet accord, excepté une contribution quasiment symbolique de 5 millions de dollars à un organisme chargé de promouvoir l’utilisation d’outils IA par les petits médias. Il serait opportun pour la profession de saisir cette occasion pour se regrouper au niveau national, voire européen, à l’instar d’un organisme de gestion collective, et de négocier avec OpenAI et les autres éditeurs d’IA générative des licences uniformes pour toute la profession », conseille Me Pavleas. A bon entendeur…

