L’entraînement des IA génératives avec les œuvres de tiers : deux décisions récentes viennent préciser les contours du fair use en droit américain

04 Juil 2025 Porlon Avocats Propriété Intellectuelle

Deux décisions américaines récentes rendues en matière d’intelligence artificielle générative se sont confrontées de plein fouet à un principe bien connu du droit américain (le fair use).

Quid de la notion de fair use ?

La notion de fair use est une exception du droit américain du Copyright qui autorise, sous certaines conditions, l’utilisation d’œuvres protégées sans le consentement préalable de leurs titulaires. À l’image de l’article L. 122-5 du Code de la propriété intellectuelle qui autorise, en France, certaines utilisations d’une œuvre, sans l’accord préalable de l’auteur, parmi lesquelles le droit à la copie privée, à la courte citation, à la parodie ou encore à l’information, la notion de fair use repose sur l’appréciation de quatre facteurs, permettant d’évaluer si l’usage peut être considéré comme légitime[1].

Les conditions du fair use sont les suivantes :

1. La finalité et le caractère de l’utilisation,

2. La nature de l’œuvre protégée,

3. La quantité et l’importance de la partie utilisée de l’œuvre au regard de l’œuvre dans son ensemble,

4. Les conséquences de cet usage sur le marché potentiel ou sur la valeur de l’œuvre protégée.

Ces quatre critères sont traditionnellement appliqués de manière souple, dans le cadre d’un balancing test laissant ainsi une grande marge d’appréciation au juge. Ni cumulatives, ni exclusives, ces conditions forment une grille d’analyse destinée à guider l’évaluation au cas par cas. Il n’est alors pas nécessaire que l’ensemble des critères penche dans le même sens. Le juge recherche une tendance d’ensemble favorable ou non à la reconnaissance de l’exception. En pratique, tous ces critères ont une importance inégale : La jurisprudence américaine tend ainsi à accorder une place centrale au premier facteur, en particulier à la notion d’utilisation transformatrice, ainsi qu’au quatrième, relatif à l’effet de l’usage sur le marché de l’œuvre protégée[2].

Dès lors, il convient de s’interroger sur un point essentiel :

L’utilisation d’œuvres protégées par le droit d’auteur pour l’entraînement d’un modèle de langage relève-t-elle du fair use au sens du droit américain ?

Deux décisions récentes (Anthropic [3] et Meta [4]) apportent des éléments de réponse. Elles seront analysées afin de comprendre comment les juridictions américaines appliquent les critères du fair use à l’entraînement d’IA sur des œuvres protégées, et de déterminer quels enseignements peuvent en être tirés, tant pour les acteurs de l’IA que pour les auteurs.

A. Bartz v. Anthropic, District Court, San Francisco, 23 juin 2025

La société Anthropic, spécialisée dans le développement de technologies d’intelligence artificielle, notamment le modèle de langage Claude, a procédé à l'entraînement de son système à partir d’œuvres littéraires protégées, parmi lesquelles celles d’Andrea Bartz, Charles Graeber et Kirk Wallace Johnson. Le jugement laisse apparaître qu’aucun accord n’a été sollicité ni obtenu auprès des titulaires de droits et que certaines des œuvres auraient été extraites de sources illicites, autrement dit de copies piratées librement accessibles en ligne.

Face à cette exploitation non autorisée, les auteurs ont saisi la justice américaine, invoquant une atteinte à leurs droits d’auteur, et plus précisément une contrefaçon fondée sur la reproduction massive de leurs œuvres et sur leur stockage centralisé dans une base de données interne, désignée par Anthropic comme sa « central library ».

En réponse, la société défenderesse s’est appuyée sur l’exception de fair use, pour tenter de justifier la licéité de ses pratiques. Le juge William Alsup a alors entrepris une analyse détaillée des quatre facteurs précités.

S’agissant du premier facteur, relatif à la finalité et au caractère de l’utilisation, celui-ci a été jugé favorable à Anthropic. Le juge a reconnu le caractère « hautement transformatif » (« exceedingly transformative ») de l’usage, considérant que l’IA n’avait pas vocation à reproduire ni à concurrencer les œuvres originales, mais à contribuer au développement d’une technologie créative et novatrice. Le tribunal illustre cette analyse en comparant l’IA à un lecteur aspirant écrivain, qui s’inspire de ses lectures pour créer quelque chose de nouveau[5].

Le second facteur, portant sur la nature de l’œuvre utilisée, a été défavorable à Anthropic. La société elle-même a admis que les œuvres littéraires en cause présentaient un caractère expressif et créatif marqué, qualité qui avait motivé leur sélection.

Concernant le troisième facteur, relatif à la quantité et à l’importance de la partie utilisée, le tribunal s’est prononcé en faveur d’Anthropic. Il a considéré que la reproduction intégrale des œuvres était raisonnablement nécessaire pour atteindre l’objectif transformatif poursuivi.

Enfin, au titre du quatrième facteur, relatif à l’impact sur le marché, le juge a conclu que l’utilisation n’avait ni entraîné la création de copies identiques, ni généré de contenu concurrent nuisant à la valeur économique des œuvres originales.

En conclusion, le juge fédéral William Alsup considère que l’entraînement du modèle Claude d’Anthropic sur des œuvres protégées relève bien du fair use, car il s’agit d’un usage transformatif, comparable à celui d’un lecteur créant une œuvre nouvelle à partir de lectures passées.

Cette analyse demeure centrée sur l’usage même des œuvres, et non sur leur provenance. Ainsi, la conservation par Anthropic de plus de sept millions de copies non autorisées dans une bibliothèque numérique centralisée n’a pas, à ce stade, fait obstacle à l’exception de fair use.

Toutefois, l’utilisation d’œuvres issues de sources illicites peut fonder d’autres chefs de demande, notamment en contrefaçon. À cet égard, un autre procès est d’ores et déjà prévu pour décembre 2025 afin de statuer sur d’éventuels dommages et intérêts.

B. Kadrey et al. v. Meta Platforms Inc., U.S. District Court, N.D. California du 25 juin 2025

Dans cette affaire, la société Meta Platforms a, entre 2022 et le début de l’année 2024, téléchargé des milliers d’ouvrages protégés par le droit d’auteur, en provenance de bibliothèques en ligne illicites, telles que LibGen et Anna’s Archive. Ces livres ont ensuite été utilisés, sans licence ni autorisation préalable, pour entraîner les différentes versions (1, 2 et 3) de ses modèles de langage LLaMA. Parmi les œuvres concernées figuraient de nombreux livres d’auteurs (Sarah Silverman, Ta-Nehisi Coates ou encore Richard Kadrey). En juillet 2023, treize auteurs ont intenté une action collective en justice, invoquant plusieurs violations de leurs droits d’auteur, telles que la reproduction non autorisée, la création d’œuvres dérivées et l’exploitation commerciale illicite.

La Cour a examiné une nouvelle fois les quatre facteurs classiques permettant d’évaluer la légitimité de l’usage au regard de la doctrine du fair use puisque tel était l’un des moyens de défense de Meta.

S’agissant du premier facteur, la juridiction a considéré que l’usage réalisé par Meta présentait un caractère hautement transformatif. En effet, les œuvres n’étaient pas exploitées pour leur contenu littéraire ou narratif, mais pour permettre à un modèle d’intelligence artificielle d’apprendre la structure et les mécanismes du langage.

En revanche, le deuxième facteur, relatif à la nature des œuvres protégées, a penché en faveur des demandeurs. Le tribunal a souligné le caractère hautement expressif et créatif des romans concernés. Il a rejeté l’argument de Meta selon lequel les livres n’étaient exploités que pour leurs éléments dits « fonctionnels » (syntaxe, style, structures narratives), et non pour leur contenu créatif en tant que tel.

Concernant le troisième facteur, portant sur la quantité et la substantialité de la reproduction, bien que les œuvres aient été reproduites dans leur intégralité, le juge a estimé que cette reproduction était techniquement indispensable à la finalité poursuivie. Elle pouvait donc être considérée comme compatible avec le fair use.

Quant au quatrième facteur, relatif à l’impact sur le marché, les auteurs soutenaient que le modèle LLaMA serait susceptible de régurgiter certains passages de leurs œuvres et que l’usage incriminé nuisait à un marché hypothétique de licences pour l’entraînement de modèles d’IA. Le tribunal a toutefois rejeté ces arguments, faute d’éléments probants ou de démonstration concrète de l’existence d’un tel marché.

Cela étant dit, la Cour a reconnu que les modèles génératifs pourraient, à terme, produire des œuvres similaires en genre, ton ou thème, ce qui pourrait entraîner un phénomène de substitution indirecte. Cette dilution du marché constituerait alors une menace économique réelle. À ce titre, le juge a rappelé la position de la Cour suprême : « Market substitution is the only harm that matters under factor 4 [6]» Il a ajouté : « Using copyrighted books to train LLMs might harm the market for those works... by helping to enable the rapid generation of countless works that compete with the originals, even if those works aren’t themselves infringing.[7] »

Ainsi, bien que le tribunal ait finalement statué en faveur de Meta dans cette affaire, la décision constitue un avertissement pour les futurs demandeurs. En effet, une démonstration solide de la dilution du marché pourrait, à l’avenir, faire basculer ce quatrième facteur contre l’application du fair use. La portée de la décision ne doit donc pas être surestimée car elle ne constitue pas une validation générale de l’utilisation, par Meta, d’œuvres protégées à des fins d’entraînement de modèles d’IA («This ruling does not stand for the proposition that Meta’s use of copyrighted materials to train its language models is lawful. It stands only for the proposition that these plaintiffs made the wrong arguments and failed to develop a record in support of the right one »).[8] »).

Les demandeurs futurs contre une société exploitant une IA générative se devront d’être particulièrement vigilants sur ce point.

CONCLUSION :

Si, sur la question de l’utilisation d’œuvres protégées, le droit américain se caractérise par une appréciation souple et évolutive, fondée sur une analyse au cas par cas des circonstances propres à chaque affaire, ce n’est pas le cas du droit européen, et en particulier le droit français, qui repose sur un système d’exceptions limitativement énumérées à l’article L. 122-5 du Code de la propriété intellectuelle.

En effet, cet encadrement confère au juge un pouvoir d’interprétation réduit, au bénéfice d’une protection renforcée des titulaires de droits – à l’inverse du droit américain où le juge dispose d’une large marge d’appréciation, notamment à travers l’application du balancing test propre à la doctrine du fair use, lui permettant de s’adapter notamment aux évolutions technologiques.

En tout état de cause, le fair use, qui est une notion propre au droit américain et qui n’a pas d’équivalent en droit français, ne peut être invoqué devant les tribunaux français.

En ce sens, il n’est pas exclu, sous réserve des règles de compétence juridictionnelle, qu’un demandeur cherche à engager une action en Europe afin d’éviter l’application du fair use, dont la souplesse pourrait faire obstacle à la reconnaissance d’une atteinte à ses droits. À l’inverse, une entreprise recourant massivement à des œuvres protégées pour entraîner un modèle d’intelligence artificielle pourrait voir d’un bon œil le fait de devoir se défendre dans un contentieux engagé devant une juridiction américaine, où la doctrine du fair use constitue un fondement juridique plus favorable, notamment dans le cadre d’utilisations transformatrices à des fins non strictement commerciales

Cette divergence pourrait ouvrir la voie à un phénomène de forum shopping visant à chercher le tribunal territorialement compétent plus avantageux en matière de technologies IA.

Indépendamment de ces décisions de justice propres aux États-Unis, une réunion d’information parlementaire publiée en juin 2025 met en lumière l’inadéquation de la réglementation européenne actuelle (notamment la directive sur le droit d’auteur de 2019) face aux nouveaux enjeux posés par l’intelligence artificielle générative. Ce rapport préconise la création, au niveau européen, d’un organisme indépendant et neutre chargée de centraliser la liste des contenus utilisés par les fournisseurs d’IA et d’assurer une rémunération équitable en faveur des ayants droits.

De quoi rester vigilants sur ce sujet d’actualité qu’est l’IA tant sur le plan jurisprudentiel que législatif en Europe comme outre-Atlantique…

Sadry PORLON (Avocat Fondateur), Doréa BACHA (Avocate Collaboratrice) et Eloane MATHIASIN (Juriste Stagiaire)

[1] 17 U.S. Code § 107 – Limitations on exclusive rights: Fair use.

[2] « importance of the factors is not always the same. Your analysis should guide you to a conclusion » - Crews, K. D. (s.d.). Fair Use. Columbia University Libraries.

[3] Bartz et al. v. Anthropic PBC, No. C 24-05417 WHA (N.D. Cal. June 23, 2025).

[4] Kadrey et al. v. Meta Platforms, Inc., No. 23-cv-03417-VC (N.D. Cal. June 25, 2025).

[5] : « Like any reader aspiring to be a writer, Anthropic’s LLMs trained upon works not to race ahead and replicate or supplant them – but to turn a hard corner and create something different. »

[6] « La substitution sur le marché est le seul préjudice qui importe au regard de ce facteur. »

[7]  « Utiliser des livres protégés par le droit d’auteur pour entraîner des modèles de langage de grande taille (LLM) pourrait nuire au marché de ces œuvres… en facilitant la génération rapide d’innombrables œuvres qui entrent en concurrence avec les originales, même si ces nouvelles œuvres ne constituent pas elles-mêmes une contrefaçon. »

[8] “ Cette décision ne signifie pas que l’utilisation, par Meta, de contenus protégés par le droit d’auteur pour entraîner ses modèles de langage est licite. Elle signifie seulement que ces demandeurs ont avancé de mauvais arguments et n’ont pas su constituer un dossier étayant les bons”

L’entraînement des IA génératives avec les œuvres de tiers : deux décisions récentes viennent préciser les contours du fair use en droit américain

Sadry PORLON (Avocat Fondateur), Doréa BACHA (Avocate Collaboratrice) et Eloane MATHIASIN (Juriste Stagiaire)

Derniers articles

Loi Darcos : où en est la présomption d’utilisation d'œuvres par l’intelligence artificielle ?

Les contrats d’influence à la loupe

Les obligations légales pesant sur les influenceurs en matière publicitaire

Les droits voisins face au développement des outils IA

« Polémique » entre Canal et certains artistes : jusqu'où ne pas aller trop loin ?

Prospection commerciale : quelles règles selon la CNIL pour les pixels de suivi ?

Le droit d’accès du salarié à ses mails face à la notion d’abus de droit

Des conséquences juridiques du départ annoncé d’auteurs sous contrat avec les éditions Grasset

Les contrats SaaS sont-ils vraiment en danger à la suite de l’adoption du Data Act ?

Contenus générés par IA : vers une régulation au service des créateurs ?

L'« AI Act » : Un nouveau tournant juridique majeur pour la mise en conformité de votre entreprise

Compétences

Coordonnées

L’entraînement des IA génératives avec les œuvres de tiers : deux décisions récentes viennent préciser les contours du fair use en droit américain

Sadry PORLON (Avocat Fondateur), Doréa BACHA (Avocate Collaboratrice) et Eloane MATHIASIN (Juriste Stagiaire)

Articles similaires

Légendes urbaines autour de Studio Ghibli, d’Open IA et du droit d’auteur

IA générative : génératrice de complexité dans les procès en contrefaçon ?

L'« AI Act » : Un nouveau tournant juridique majeur pour la mise en conformité de votre entreprise

La « négative harmony » : prétexte à un tour d’horizon des poncifs en matière de droit d’auteur

Derniers articles

Compétences

Coordonnées