INTERVIEW. Des écrivains accusent le chatbot d’utiliser leurs œuvres sans leur consentement et sans compensation financière. L’avocat Jonathan Elkaim explique les enjeux de ces procès.
C’est le premier d’une probable longue série de procès en droit d’auteur visant ChatGPT. Fin juin, Mona Awad, qui a écrit notamment Bunny et 13 Ways of Looking at a Fat Girl, et Paul Tremblay, auteur de The Cabin at the End of the World, ont lancé une « plainte en recours collectif » auprès d’un tribunal fédéral de San Francisco. L’accusé : OpenAI, qui a conçu et développé ce nouvel agent conversationnel (dit chatbot)capable de répondre de manière argumentée à toutes sortes de questions en langage naturel.
Les deux écrivains accusent l’entreprise américaine d’avoir « alimenté et entraîné ChatGPT » avec leurs œuvres, protégées par le droit d’auteur, « sans consentement et sans compensation », et de « profiter injustement […] d’écrits et d’idées volés ». Les plaignants réclament des dommages et intérêts au nom de tous les auteurs basés aux États-Unis dont les œuvres auraient été utilisées pour entraîner ChatGPT.
Quelques jours plus tard, l’humoriste Sarah Silverman, autrice de l’autobiographie The Bedwetter, et les romanciers Christopher Golden et Richard Kadrey déposaient des plaintes contre OpenAI et Meta, leur reprochant d’avoir entraîné illégalement leurs modèles de langage GPT-3.5, GPT 4 et LLaMA.
Ces procès, qui s’inscrivent dans un contexte de controverses croissantes sur les dangers des IA génératives, sources potentielles d’erreurs, de discriminations, de désinformation et de violation de la vie privée, soulèvent des questions inédites : le droit d’auteur est-il opposable à ChatGPT ? La contrefaçon s’apprécie-t-elle différemment des deux côtés de l’Atlantique ? Comment, concrètement, faire valoir ses droits ? Éléments de réponses de Jonathan Elkaim, avocat associé du cabinet Hiro.
Le Point : Les écrivains Mona Awad et Paul Tremblay reprochent à OpenAI d’avoir illégalement « ingéré » et utilisé leurs romans pour entraîner ChatGPT, car il en a généré des « résumés très précis ». Qu’est-ce que cela vous inspire ?
Jonathan Elkaim : Cela me rappelle l’époque du téléchargement illégal d’œuvres protégées sur des plateformes de peer-to-peer (Napster, Emule…). Plusieurs auteurs et producteurs de phonogrammes et de vidéogrammes constataient avec effroi que les œuvres qu’ils avaient créées, ou qu’ils exploitaient, se trouvaient librement accessibles sans leur consentement express, sur un réseau dont ils ignoraient tout. La réponse juridique a été longue à mettre en œuvre, mais elle a permis l’avènement du principe de responsabilité de l’hébergeur et de l’éditeur, du principe de riposte graduée, du filtrage des sites contrefaisants par les fournisseurs d’accès, de l’identification des adresses IP…
À chaque grande évolution technologique, les droits de propriété intellectuelle ont été menacés et les juristes ont fait preuve d’innovation pour lutter efficacement pour leur protection et leur valorisation. L’avènement de l’intelligence artificielle ne fait pas exception à cette règle.
« Le contenu généré par une intelligence artificielle comportant une reproduction partielle ou intégrale de l’œuvre antérieure créée par un tiers, au mépris de ses droits de la propriété intellectuelle, suffit à constituer une contrefaçon. »
Selon Lilian Edwards, professeur de droit, d’innovation et de société à l’université de Newcastle, interrogé par The Guardian, l’issue de cette affaire « dépendra de savoir si l’utilisation des œuvres protégées par le droit d’auteur relève d’un usage loyal (“fair use”) ou d’une simple “copie non autorisée” ». Où place-t-on le curseur entre ces deux notions ?
Cette réflexion sera la pierre angulaire du jugement rendu dans cette affaire. Le fair use se définit comme un usage honnête ou loyal d’une œuvre protégée par le copyright et qui constitue une limite au monopole de l’auteur. Cette notion permet d’apprécier plus largement les exceptions au monopole du droit d’auteur qu’en droit français. À l’inverse, la notion de « copie non autorisée », mentionnée par le professeur Edwards, constitue ni plus ni moins un acte de contrefaçon. Là où le droit français tend vers une valorisation et une protection accrue des intérêts de l’auteur, le fair use vise à promouvoir une cohabitation entre les intérêts de l’auteur et la diffusion publique de son œuvre.
Notre code de la propriété intellectuelle limite strictement les exceptions au monopole de l’auteur sur son œuvre (L.122-5 du CPI), alors qu’en matière de copyright, les juges peuvent en créer de nouvelles par le biais de leur jurisprudence, permettant une plus grande liberté d’usage des œuvres protégées par des tiers. Dès lors, si les juges américains estimaient que l’assimilation de textes par BookCorpus (cette collection de livres numériques utilisés pour entraîner l’IA) ne relèvent pas du fair use, ils devraient alors considérer qu’il s’agit d’un acte de contrefaçon et, en conséquence, sanctionner Open AI sur ce fondement.
En fonction de quels critères vont-ils trancher ?
Concrètement, ils examineront si l’usage des œuvres concernées a été réalisé à des fins commerciales ou plutôt à des fins pédagogiques, et si ces œuvres ont été intégralement ou en grande partie reproduites. Ils analyseront aussi le caractère « significatif » de la partie de l’œuvre exploitée par BookCorpus et les conséquences de l’usage de l’œuvre sur sa valeur marchande. Pour écarter ou appliquer la notion de fair use en matière de copyright, l’un des principaux critères d’appréciation est l’impact de l’utilisation de l’œuvre protégée sur sa valeur économique, et donc par extension, sur les revenus de l’auteur. Si ces critères n’étaient pas réunis, le tribunal jugera que l’exploitation des ouvrages dans le cadre de l’apprentissage de l’IA constitue une violation du copyright et que Open AI met à la disposition des utilisateurs une copie non autorisée et donc une contrefaçon.
Qu’en serait-il si le litige était porté devant un tribunal français ? Faudrait-il aussi démontrer que l’exploitation des œuvres a entraîné une baisse de revenus pour les auteurs ?
Non, il n’est pas nécessaire de démontrer une baisse des revenus de l’auteur pour justifier l’existence d’une contrefaçon. L’article L.335-2 du Code de la propriété intellectuelle définit la le contenu généré par une intelligence artificielle comportant une reproduction partielle ou intégrale de l’œuvre antérieure créée par un tiers, au mépris de ses droits de la propriété intellectuelle, suffit à constituer une contrefaçon comme un délit, constitué par « toute édition d’écrits, de composition musicale, de dessin, de peinture ou de tout autre production, imprimée ou gravée en entier ou en partie, au mépris des lois et règlements relatifs à la propriété des auteurs ». À l’aune des textes bien connus des praticiens de la propriété intellectuelle, le contenu généré par une intelligence artificielle comportant une reproduction partielle ou intégrale de l’œuvre antérieure créée par un tiers, au mépris de ses droits de la propriété intellectuelle, suffit à constituer une contrefaçon.
La diminution des revenus sera en revanche un critère important pour apprécier le préjudice de contrefaçon de l’auteur dont l’œuvre aura été exploitée par une IA sans son autorisation. Le Code de la propriété intellectuelle permet de calculer le préjudice subi par l’auteur au regard de trois critères, dont l’un d’eux est justement le gain manqué par celui-ci (article L.331-1-3 du CPI).
Dans quels cas l’utilisation d’une œuvre par l’IA générative peut-elle constituer une contrefaçon en droit français ?
En droit français, et depuis le 24 novembre 2021, deux nouveaux articles ont été intégrés au Code de la propriété intellectuelle. L’un permet à un organisme ou à une institution de procéder à de la fouille de textes dans le cadre d’une recherche scientifique (L.122-5-II du CPI). En contrepartie de cet usage, une rémunération peut être accordée aux auteurs et peut même faire l’objet d’un accord collectif visant à les indemniser. L’autre, un peu plus compliqué à appréhender, autorise la reproduction des œuvres numériques dans le cadre d’une fouille de textes et, ce dans n’importe quel but (L.122-5-III du CPI). Curieusement, la loi ne mentionne pas dans ce cas la possibilité pour l’auteur de signer un accord avec les sociétés de gestion collective en vue de le rémunérer. Cela est peu compréhensible…
Dans cette hypothèse, l’auteur peut s’opposer à une telle exploitation par des moyens techniques de protection. Mais ce « tatouage numérique » (par exemple, le « watermaking », qui permet d’identifier l’acheteur d’une œuvre numérique) peut être contourné. En témoignent les nombreuses photos protégées qui se sont retrouvées sur des bases de données comme Laion. On peut néanmoins légitimement penser que si l’auteur n’a pas donné son accord sur l’exploitation de son œuvre dans le cadre de l’apprentissage de l’IA, la société qui exploiterait une IA générative la publiant malgré tout serait en situation de contrefaçon dès lors qu’elle outrepasserait son consentement.
Que prévoient sur ce point les conditions générales d’Open AI ?
Elles protègent la société contre toute action diligentée par des auteurs, en rappelant que le contenu de l’outil est avant tout réalisé par l’utilisateur de ses services (article 2, c, Terms of use). Elles précisent que l’utilisateur ne saurait « utiliser les services proposés d’une manière qui enfreint, détourne ou viole les droits de toute personne ». Ainsi, dans l’hypothèse où le contenu généré serait contraire à la loi et aux conditions générales d’utilisation de ChatGPT, l’utilisateur qui exploite les contenus en serait l’unique responsable.
OpenAI ne fait d’ailleurs pas mention de sa propre responsabilité et se contente d’évoquer les sanctions éventuelles qu’elle s’attachera à prononcer à l’encontre des utilisateurs responsables de contenus litigieux. Il en résulte que cette société, et plus généralement toutes celles qui exploitent des IA génératives, tenteront d’écarter leur responsabilité au profit de celle de l’utilisateur amené à générer un contenu contrefaisant sur la base d’une requête adressée à cette IA. Microsoft a fait de même avec les conditions d’utilisation de l’IA « Image creator ». Une nouvelle source de contentieux risque donc de naître dans les années à venir.
Les artistes qui ont assigné Leta et Open AI ont aussi agi sur le terrain de la concurrence déloyale. Cela vous semble-t-il judicieux ?
Bien sûr ! La reproduction d’une œuvre sans autorisation est également sanctionnée par le droit commun de la responsabilité civile (article 1240 du Code civil). De tels faits constitueraient manifestement des actes de parasitisme, dans la mesure où l’utilisateur d’une IA tendrait ainsi à bénéficier, au détriment de l’auteur d’une œuvre, des compétences, du travail et du savoir-faire déployé par ce dernier. La concurrence déloyale permettrait ainsi à l’auteur dont l’œuvre a été utilisée dans le processus de création du contenu généré par une IA de réagir au trouble commercial qu’il a subi.
« Désormais, l’intelligence artificielle, agissant sur commande de son utilisateur, pourra développer une œuvre si singulière à partir d’une œuvre préexistante que l’identification de cette dernière sera beaucoup plus difficile à démontrer. »
Concrètement, quels conseils prodiguez-vous aux auteurs pour se prémunir contre les risques d’appropriation et de détournement de leurs œuvres ?
En droit français, l’œuvre est protégée par le droit d’auteur au moment de sa création et « indépendamment de toute divulgation publique » (L.111-2 du CPI). Dès lors que celle-ci est originale, c’est-à-dire empreinte de la personnalité de son auteur, elle bénéficie d’une protection au moment de création. La principale difficulté réside dans la preuve d’une création à date certaine qui suppose de déposer son œuvre auprès d’un service dédié (Blockchain, société de droits d’auteur, etc.) afin de démontrer une antériorité opposable.
Une fois cet écueil évité, l’auteur doit se montrer vigilant dans l’exploitation des droits patrimoniaux qu’il va céder sur son œuvre en limitant par exemple les modes d’exploitation, la durée de cession ou de licence et réfléchir aussi à la mise en œuvre de mesures restrictives empêchant des téléchargements ou des diffusions sans son consentement. Un travail de surveillance pèse également sur l’auteur ou les sociétés représentant ses intérêts, afin d’agir promptement pour solliciter le retrait d’une œuvre contrefaisante.
En pratique, en cas de litige, les parties préfèrent signer des accords transactionnels plutôt que de subir les affres d’une procédure judiciaire parfois longue et coûteuse visant à mettre fin à l’exploitation d’œuvres non consenties. De tels accords exigent néanmoins la communication des preuves sur la titularité des droits, l’originalité de l’œuvre, ainsi que sur la matérialité de la contrefaçon. Le procès-verbal de constat d’huissier reste encore aujourd’hui l’élément le plus fiable.
D’après les informations du Washington Post, l’agence américaine Associated Press a conclu un accord avec OpenAI l’autorisant à utiliser ses contenus moyennant une redevance. Une solution équitable selon vous ?
Il faudrait en connaître les conditions mais il semble qu’un telle solution est naturellement profitable aux parties et semblent respectueuse des intérêts des auteurs. Un tel accord permet au moins aux auteurs d’obtenir une contrepartie à l’exploitation de leurs œuvres dans le cadre du machine learning, ce qui pemettra, à terme, d’éviter des contentieux. Cela permet également d’adresser un signal positif aux auteurs en leur démontrant que le développement d’une IA peut être réalisé dans le respect de leurs droits patrimoniaux.
Les IA génératives interrogent le concept de « création » ou d’œuvre « originale », dont le périmètre et les critères seront amenés à évoluer…
Il faut en effet rebattre les cartes de ce que nous connaissons : désormais, l’intelligence artificielle, agissant sur commande de son utilisateur, pourra développer une œuvre si singulière à partir d’une œuvre préexistante que l’identification de cette dernière sera beaucoup plus difficile à démontrer. La preuve de la reproduction ou l’imitation par l’intelligence artificielle d’une œuvre préexistante protégée devient alors très ardue, en ce que celle-ci se retrouve incorporée à un contenu nouveau, complexe et hétérogène.
Ainsi, les IA « nouvelles générations » permettent de reproduire, avec une exactitude parfois glaçante, les voix de chanteurs aujourd’hui décédés en duo avec des artistes contemporains sans qu’aucune autorisation des ayants droit n’ait été consentie. Face à ces œuvres composites, l’exercice d’une action par un auteur dont les droits auraient été violés semble particulièrement complexe. C’est la raison pour laquelle l’Union européenne et de manière générale les pouvoirs publics se sont très vite emparés de ce sujet qui, tout en révolutionnant la technologie, suscite de très nombreuses inquiétudes.
Quelle est l’approche de la réglementation européenne sur cette question ?
Rappelons tout d’abord qu’en France, les personnes physiques sont les seules titulaires de droits d’auteur sur leur création, même si elles utilisent une IA à cet effet. Cette position n’a pas changé depuis 1986 : ce qui distingue l’IA de l’auteur, c’est justement l’intervention humaine. Il faut ainsi comprendre que l’IA n’est ici qu’un outil aux services d’un commanditaire. Si un nouveau Mozart composait une symphonie grâce à une IA, sa qualité d’auteur ne saurait lui être déniée pour ce seul motif.
Le Parlement reconnaît toutefois que des œuvres peuvent être créées de manière autonome par une intelligence artificielle. Sa résolution adoptée le 20 octobre 2020, relative aux droits de propriété intellectuelle pour le développement des technologies liées à l’intelligence artificielle, souligne qu’il est « essentiel d’opérer une distinction entre les créations humaines assistées par l’IA et les créations autonomes de l’IA ». Mais, ajoute-t-elle, « lorsque l’IA est utilisée uniquement comme outil pour aider un auteur dans son processus de création, le cadre actuel sur le droit d’auteur reste applicable ».
Reste à savoir de quelle manière l’usage des outils fournis par l’IA sera appréhendé par les législateurs interne et européen à l’avenir. Les œuvres générées par ChatGPT seront-elles considérées comme des créations produites par l’IA de manière autonome ou des œuvres créées par des êtres humains avec la simple assistance d’une intelligence artificielle ? La question n’est pas encore tranchée, compte tenu de la vitesse avec laquelle l’IA assimile les différentes informations transmises. À terme, je pense que les créations réalisées par une IA pourraient bénéficier d’une protection sur le fondement du droit d’auteur dès lors qu’elles comportent l’empreinte créative de l’utilisateur.

