Intelligence artificielle générative et droit d’auteur : où en serons-nous ? Histoire prédictive du droit d’auteur appliqué à l’IA.

L’intelligence artificielle (« IA ») dite « générative » a fait son irruption sur la scène des technologies de l’information au cours de ces derniers mois. Des solutions simples, gratuites ou peu onéreuses, peuvent être utilisées par n’importe quelle personne disposant d’une connexion internet pour générer des textes, des images, des musiques, etc. qui sont le résultat du travail algorithmique et automatique du moteur d’IA utilisé, guidé par les instructions formulées en langage naturel (« prompts ») de l’utilisateur. Par itérations, les instructions peuvent se faire de plus en plus précises et aboutir, par exemple, à une image au plus proche de ce que l’utilisateur avait à l’esprit.

Textes, images mais aussi musique ou codes source de logiciels, l’IA se propose aujourd’hui de tout créer et les créations en question sont celles qui sont traditionnellement protégées par un droit de propriété incorporelle : le droit d’auteur.

S’ouvre donc un dialogue complexe entre les droits de ceux qui « promptent » (qui donnent leurs instructions à l’IA), de ceux qui conçoivent le moteur d’IA et de ceux dont les œuvres premières ont été automatiquement analysées par l’IA pour pouvoir nourrir son « intelligence » et alimenter les algorithmes lui permettant de générer, en retour, de nouvelles créations.

Le juriste spécialisé en droit du numérique et de la création est de nouveau interpellé par une nouvelle révolution technologique : qui possède quoi sur les créations générées par l’IA ?

1. L’IA ingurgite des œuvres

L’IA, tel un ogre, est un cerveau vide si elle n’ingurgite pas, en entrée du processus de génération, une quantité phénoménale d’œuvres préexistantes sous forme numérique, afin « d’entraîner » ses mystérieux algorithmes et en apprendre des choses qu’elle seule connaîtra et comprendra.

Cette ingurgitation boulimique heurte-t-elle le droit de tiers et particulièrement les droits d’auteur des créateurs des œuvres ainsi digérées à leur insu ?

1.1 Le droit qui ne change pas la réalité

La fonction première du droit d’auteur est de protéger l’auteur contre une exploitation de son œuvre « en tant que telle » : personne ne peut reproduire l’œuvre et commercialiser ces reproductions, personne ne peut diffuser l’œuvre par et sur n’importe quel réseau sans l’autorisation du titulaire des droits sur cette œuvre. C’est la base des droits patrimoniaux de l’auteur qui sont posés par l’article L122-1 du code de la propriété intellectuelle.

Mais dans la plupart des cas, et c’est là son utilité, il ne fait pas de doute que l’IA ne va pas rediffuser l’œuvre sous sa forme d’origine.

Le traitement algorithmique d’apprentissage produira-t-il une adaptation de l’œuvre « apprise » ? Nous ne le pensons pas car le résultat de l’apprentissage n’est pas une nouvelle œuvre dans laquelle on reconnaîtrait des traces de l’œuvre initiale mais des données mathématiques qui serviront plus tard à l’IA pour produire de nouvelles œuvres.

Il est plus que probable cependant que l’action d’apprentissage que réalise l’IA sur une œuvre va impliquer, au moins, une reproduction de celle-ci en entrée du processus, ce qui conduit à invoquer le droit de reproduction et donc à requérir l’accord préalable de l’auteur.

Pour autant, les plus anciens juristes du droit de l’internet se souviendront peut-être de la décision « Brel et Sardou »[1] qui fut la première décision d’une juridiction civile se prononçant sur l’atteinte au droit d’auteur que constituait la reproduction des paroles de chansons de Jacques Brel et Michel Sardou sur le site internet de leur école par deux étudiants. Nous étions en 1996. Le juge saisi avait fait une application rigoureusement exacte du code de la propriété intellectuelle en condamnant l’éditeur du site en question et en lui enjoignant le retrait des textes. Las. Le rouleau compresseur de l’internet est passé par là et le droit n’a pas changé la réalité.

Les œuvres de l’esprit, quelles qu’elles soient, sont aujourd’hui reproduites à l’infini sur internet sans autorisation des titulaires de droits et cela sans qu’ils puissent réellement infléchir cet état de fait.

C’est de ces milliards de contrefaçons que les IA génératives se nourrissent pour apprendre.

Seront-elles plus condamnables ou condamnées que les autres ? Ce n’est pas ce que l’histoire de l’internet nous enseigne. L’ingurgitation s’opérant de manière automatisée et occulte, quel auteur saura réellement que ses œuvres ont été apprises par l’IA ?

La première ingurgitation automatique et algorithmique d’œuvres fut celle de l’algorithme « PageRank » de Google. Parmi les premiers, les algorithmes de Google ont « scrawlé » automatiquement les contenus en ligne pour en générer des résultats mathématiques. Il s’agissait alors d’un classement de pages web. L’activité de calcul de Google permettant l’indexation n’a pas été considérée comme une contrefaçon des œuvres par le moteur de recherche. Elle nous semble, sur le plan factuel et sur le plan des concepts de droits d’auteur, très similaire au « scrawling » des moteurs d’IA à la recherche de données d’apprentissage.

Sur ce scrawling de Google, après avoir longuement analysé la situation et pesé chacun des arguments pour ou contre, dans son rapport de 2013 « Le référencement des œuvres sur Internet »[2], le Conseil Supérieur de la Propriété Littéraire et Artistique remarquait : « La définition très large du droit de reproduction, tant dans le code de la propriété intellectuelle français que dans la directive du 22 mai 2001 en son article 2 incite à considérer qu’en principe tout acte de reproduction d’une œuvre ou d’un objet protégé doit faire l’objet d’une autorisation préalable. Ainsi, théoriquement, et à moins de bénéficier d’une exception, le principe demeure celui d’application du monopole d’exploitation dès lors que les éléments repris s’apparentent à des objets protégés par le code de la propriété intellectuelle. Pour les actes qui nous occupent, la commission s’est essentiellement demandé s’ils étaient susceptibles de bénéficier d’une des exceptions prévues par la loi. » Inutile recherche dans les faits car, au final, il faut constater que l’intérêt d’avoir un point d’entrée unique à l’internet, capable de nous guider dans un contenu qui serait autrement largement inaccessible, supplanta l’interrogation de savoir si l’indexation pouvait bénéficier d’une exception au droit d’auteur.

De générale, la régulation est devenue sectorielle : ce référencement posait des problèmes économiques graves aux éditeurs de presse. Plutôt que d’appliquer un droit qui existait déjà, on préféra en créer un de toutes pièces : le droit voisin des éditeurs et agences de presse, afin d’obtenir un transfert économique de Google vers ces éditeurs (Cf. art. L218-1 et suivants du code de la propriété intellectuelle[3]).

D’une approche individuelle basée sur l’exercice d’un droit de propriété et sa capacité à le monnayer, on passe à une approche collective dans laquelle une perception par une société de gestion collective, sur Google, Facebook et autres, alimente une profession selon des règles de répartition à convenir (ce qui n’est jamais simple)

On connaissait déjà cela avec la rémunération pour copie privée, devenue une ressource économique pour les auteurs/compositeurs/artistes (alors qu’il n’y a plus, dans les faits, de copie privée…).

Donc, posons cette prédiction : les moteurs d’IA continueront d’ingurgiter des œuvres sans que le droit d’auteur – individuel – des créateurs des œuvres ingurgitées ne puisse s’y opposer. Dans quelque temps viendra la revendication – sectorielle – des photographes, des illustrateurs, des écrivains, des compositeurs, etc., pour qu’une perception sur les exploitants de ces moteurs d’IA générative soit instituée et vienne ainsi créer une source de revenus collectifs pour ces auteurs, à redistribuer par une société de gestion ad hoc.

1.2 La réalité qui change le droit

De l’épure du droit d’auteur, nous nous sommes éloignés avec internet.

Premier hold-up de l’histoire du réseau, ceux qui bénéficiaient de la réalisation de contrefaçons (les réseaux sociaux et sites de partage de contenus) ont aussi bénéficié des largesses d’une jurisprudence qui les a qualifiés d’hébergeurs et d’un législateur européen qui les qualifie maintenant de « plateformes ».

Les mêmes causes devraient produire les mêmes effets. Les IA mangeuses d’œuvres devraient échapper aux griefs de contrefaçon et trouver dans un droit accueillant la protection de leur boulimie.

L’ingurgitation d’œuvres par l’IA trouve déjà sa légitimation dans une exception dont seuls les plus rusés avaient vu l’opportunité.

Le législateur européen n’est pas avare pour saupoudrer les droits patrimoniaux des auteurs d’exceptions altruistes, telle celle prévue par l’article 4 de la directive (UE) 2019/790 du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique intitulée « Exception ou limitation pour la fouille de textes et de données »[4]. Cette exception au droit de reproduction de l’auteur, à l’objectif mystérieux quand elle fut adoptée en 2019, est ainsi formulée : « Les États membres prévoient une exception ou une limitation aux droits [de reproduction] pour les reproductions et les extractions d’œuvres et d’autres objets protégés accessibles de manière licite aux fins de la fouille de textes et de données ».

Cette exception est la sœur jumelle de l’exception prévue à l’article 3 de la même directive qui instaure ce droit à la « fouille » de données dans le seul but de la recherche scientifique. Sur 8 considérants, la directive nous explique l’importance de cette exception pour les organismes de recherche scientifique. Mais, au considérant 18, on apprend qu’une telle exception serait également nécessaire « Afin d’améliorer la sécurité juridique […] et d’encourager également l’innovation dans le secteur privé ».

Une intelligence, pas du tout artificielle mais prévoyante, avait donc réussi en 2019 à faire sanctuariser dans le droit d’auteur, l’exception qui permettrait en 2022 aux ChatGPT, Dall-e, Midjourney et consorts de révéler au public leurs incroyables capacités.

Dans sa proposition de directive de 2016, la Commission n’envisageait l’exception de fouille de données que dans un but de recherche scientifique. L’extension de l’exception aux activités privées a été introduite en 2017, par amendement, lors de la discussion du texte au Parlement européen. Il fallait donc protéger en 2019, contre les auteurs, une activité de « fouille » de données dont peu de monde comprenait l’existence et percevait le devenir. Véritable cheval de Troie législatif en faveur de l’IA générative, l’exception au droit de propriété qui était sensée être nécessaire à l’émergence de nouvelles connaissances ou de nouveaux services, sert en réalité à exploiter et concurrencer directement les contenus qui sont exploités au titre de l’exception. C’est faire du neuf avec du vieux, en fait…

L’exception connait une exception[5] : l’auteur peut s’opposer (opt-out) « de manière appropriée », notamment par des procédés lisibles par machine, à ce que ses œuvres soient « fouillées »

Maigre lot de consolation concédé aux titulaires de droit : comment, concrètement, exercer ce droit d’opposition pour qu’il puisse efficacement être opposé aux moteurs d’IA qui « scrawlent » le web ? Comment s’assurer que cette opposition est respectée ?

Tout ce qui s’absorbe sous forme numérique sera absorbé par l’IA et le droit s’y adaptera.

Dans un communiqué du 12 octobre 2023, la SACEM a fait savoir qu’elle exerçait, au nom de ses membres, ledit droit d’opposition. Peu d’autres sociétés de gestion collective l’ont suivie, certainement pour ne pas donner à penser qu’elles acquiesçaient à un système qui ne peut satisfaire les auteurs.

A moins que le futur règlement européen sur l’intelligence artificielle, en cours d’adoption, ne vienne accoucher d’une solution, comme souvent imprécise dans les textes européens des dernières années, qui tend à vouloir ménager des intérêts contradictoires.

Le 29 septembre 2023, 73 sociétés de gestion collective, associations, syndicats ont signé un communiqué appelant à l’adoption dans ce futur règlement d’un article 28b(4) ainsi rédigé : « Les fournisseurs de modèles de fondation utilisés dans des systèmes d’IA spécifiquement destinés à générer, avec différents niveaux d’autonomie, des contenus tels que des textes complexes, des images, des sons ou des vidéos (« IA générative ») et les fournisseurs qui spécialisent un modèle de fondation dans un système d’IA générative, doivent en outre […] sans préjudice de la législation de l’Union en matière de droit d’auteur, documenter et mettre à la disposition du public un résumé suffisamment détaillé de l’utilisation des données d’apprentissage protégées par la législation sur le droit d’auteur. »

2. L’IA régurgite des créations

2.1 Sont-elles protégées ?

Disons-le immédiatement, la réponse à cette question dépasse l’analyse proprement juridique et emporte une part de philosophie ou de politique, selon l’approche.

Ecartons immédiatement un sujet qui n’en est pas un : si l’IA génère une œuvre qui existe déjà ou qui s’en approche suffisamment, l’IA est utilisée pour produire une contrefaçon et celui qui l’exploitera en commettra le délit civil et pénal. Ainsi, si je demande à l’IA de générer une image de Schtroumpf, le petit personnage bleu créé sera une contrefaçon de l’œuvre de Peyo.

Mais pour les œuvres « nouvelles », la réponse semble être évidente : l’œuvre de l’esprit est le résultat de l’activité du cerveau humain (parfois secondé par ses doigts !) : l’auteur a pensé chaque mot de son roman, le compositeur chaque note de sa musique, le dessinateur a posé chaque trait de son dessin. L’IA générative se contrôle par des instructions (prompts) rédigées en langage naturel. Par affinement successif des demandes, celui qui « prompte » finit-il par produire un résultat créatif qui sera l’empreinte de sa personnalité ?

Ce n’est pas notre opinion : une œuvre est intrinsèquement unique et différente de toutes les autres produites par la créativité humaine, alors qu’une même succession de prompts produira un résultat identique. Et, si tel n’était pas le cas, cela ne serait que la conséquence de contingences algorithmiques étrangères à la personnalité du « prompteur ».

Cette formulation traditionnelle et incertaine qui veut qu’une œuvre, pour être protégée, doit être « originale », c’est-à-dire empreinte de la personnalité de son auteur, prend finalement tout son sens avec l’IA. Les œuvres naissent de l’imaginaire des êtres humains, imaginaire forgé par leur vie personnelle, leur culture, leur éducation, leurs capacités acquises ou innées. Sur les 8 milliards de cerveaux que porte la planète, aucun ne produira une œuvre identique à une autre[6]. L’IA, elle, ne fera que produire des résultats issus de la compilation statistique de toutes les œuvres déjà apprises. L’IA est ainsi intrinsèquement incapable de nouveauté. Elle ne produit que du passé recomposé.

Si l’auteur de ces lignes en juge par son expérience, le résultat produit par un service comme DALL-E reste encore largement aléatoire pour lui et l’IA n’écoute pas encore la voix de son maître. L’image qui s’affiche à l’écran en réponse aux prompts ne peut pas être considérée comme étant le fruit de l’effort créatif personnel du prompteur qui découvre, lui-même avec surprise, le résultat de ses prompts.

Alors, protection par le droit d’auteur sur une création générée par l’IA ? Non. Il ne faudrait pas, d’ailleurs, les appeler « œuvres » : ce sont des résultats mathématiques qui prennent pour les humains l’apparence d’œuvres ; résultats dans lesquels les prompts ne sont que des variables introduites par une action humaine qui n’en maîtrise et n’en anticipe pas les conséquences sur le résultat produit.

Qu’en est-il lorsque le résultat produit par une IA est intégré à une œuvre « réelle » ou retravaillé par la main de l’artiste, de l’auteur, du compositeur ? Est-ce qu’il y a une forme d’effet « contaminant » de l’utilisation de l’IA sur la création humaine ?

Il nous semblerait bien que oui. Et tout sera affaire de proportion. A un moment donné, la création sera trop artificielle pour être humaine et, à l’inverse, elle pourra être redevenue tellement humaine qu’on ne distinguera plus le contenu artificiel.

Il n’y a pas de décision de justice en France pour le moment sur ces questions. L’attention se porte sur les premières décisions américaines, même si tirer des conclusions du droit comparé en la matière nous semble toujours délicat.

L’office américain du copyright a ainsi refusé, dans une décision du 5 septembre 2023, d’enregistrer un dessin réalisé à l’aide de Midjourney puis « enrichi » ou « rehaussé » manuellement par l’artiste à l’aide de Photoshop. Le fait que l’artiste ait dû user de 624 prompts n’a pas convaincu l’office qui rappelle qu’une œuvre requiert d’être créée par un humain selon le Copyright Act et que l’intervention de l’IA dans la génération de l’œuvre doit être « mineure ».

Mais au-delà de cette conclusion juridique, la réalité peut aussi reprendre ses droits : comment savoir si un contenu (texte ou image par exemple) a été généré par une IA si une personne en revendique la paternité ? La course à la technologie est de nouveau ouverte pour créer des algorithmes qui détecteront les contenus créés par des algorithmes ou qui empêcheront, par des « watermarks », des contenus créés par des algorithmes d’être appropriés par des non-algorithmes (des humains)

2.2. A qui appartiennent-elles ?

Alors Res nullius que ces créations générées par l’IA ? Les résultats de l’IA générative, si on leur dénie la qualification d’œuvre, n’en existent pas moins. Sont-ils alors libres de droits, librement utilisables par qui veut ?

Ces résultats ont été produits par une technologie, plus spécifiquement un logiciel, qui est la propriété de l’entreprise l’ayant développé et mise sur le marché.

Le premier lien entre le créateur/prompteur du contenu et le contenu créé est d’abord un lien contractuel pour l’usage du service d’IA générative. En cette matière, à l’inverse de la loi sur la propriété intellectuelle (cf. article L111-1 du code de la propriété intellectuelle : « L’auteur d’une œuvre de l’esprit jouit sur cette œuvre, du seul fait de sa création, d’un droit de propriété incorporelle exclusif et opposable à tous. »), c’est le service d’IA générative qui fait sa loi, contractuelle.

Pour le moment, elle se veut libérale.

Ainsi, Dall-e/OpenAI prévoit dans ses conditions de service que : « Ownership of Content. As between you and OpenAI, and to the extent permitted by applicable law, you (a) retain your ownership rights in Input and (b) own the Output. We hereby assign to you all our right, title, and interest, if any, in and to Output. »[7].

De même, Midjourney concède : « You own all Assets You create with the Services to the fullest extent possible under applicable law. »[8] Cependant, cette intention libérale n’est pas totale. Ainsi, Midjourney prévoit qu’il existe des exceptions. Notamment pour les entreprises réalisant plus d’un million de dollars de revenus : « If you are a company or any employee of a company with more than $1,000,000 USD a year in revenue, you must be subscribed to a “Pro” or “Mega” plan to own Your Assets. »[9]

Ici les notions se troublent. On comprend que Midjourney souhaite commercialiser l’accès à son service à différents prix, en fonction de la taille de son cocontractant. Mais le lien fait avec la propriété du résultat montre que, en tout état de cause, il y a une possession originelle du service d’IA sur le résultat, lequel fait l’objet d’un transfert contractuel de possession – on n’ose pas écrire de propriété – à l’utilisateur du service. Utilisateur qui rétrocède d’ailleurs immédiatement à Midjourney une licence perpétuelle, mondiale, non exclusive, sous-licenciable sans frais, libre de redevances et irrévocable sur les contenus créés.

Chimère juridique que sont donc les créations produites par l’IA générative. Non couvertes par un droit d’auteur, mais issues d’une technologie propriétaire dont l’utilisation est permise contractuellement, seront-elles toujours aussi librement exploitables par l’utilisateur du service d’IA ?

Les géants de l’internet nous ont habitués à faire évoluer leurs conditions générales aussi souvent qu’il leur semble opportun de le faire.

[1] TGI Paris, réf., 14 août 1996

[2] Rapport établi par Mmes Valérie-Laure Benabou, Joëlle Farchy et Cécile Méadel, présidentes de la commission, paru le 8 juillet 2013.

[3] Article créé par la Loi n°2019-775 du 24 juillet 2019 tendant à créer un droit voisin au profit des agences de presse et des éditeurs de presse

[4] Transposée à l’article L122-5-3 du code de la propriété intellectuelle.

[5] Art. L122-5-3-III du code de la propriété intellectuelle

[6] Sauf « plagiat », comme on dit, imitation ou copie volontaires.

[7] Propriété du contenu. Entre vous et OpenAI, et dans la mesure permise par la loi applicable, vous (a) conservez vos droits de propriété sur l’entrée et (b) possédez le résultat. Nous vous cédons par la présente tous nos droits, titres et intérêts, le cas échéant, dans et sur le résultat.

[8] Vous possédez tous les actifs que vous créez avec les services, dans la mesure où la loi applicable le permet.

[9] Si vous êtes une entreprise ou un employé d’une entreprise dont le chiffre d’affaires annuel est supérieur à 1 000 000 USD, vous devez souscrire à un plan « Pro » ou « Mega » pour posséder vos actifs.