17 juin 2026.
1. Présentation générale
L’exception de fouille de textes et de données (Text and Data Mining, ou TDM) permet, sous certaines conditions, de réaliser des copies et extractions d’œuvres ou d’objets protégés afin d’en effectuer une analyse automatisée.
Elle est devenue centrale avec l’essor de l’IA générative : l’entraînement des grands modèles repose sur l’analyse massive de textes, images, musiques, vidéos, bases de données et autres contenus numériques.
Dans les articles répertoriés, cette exception est présentée comme l’un des principaux points de friction entre les fournisseurs d’IA, qui invoquent la nécessité d’accéder à de grands corpus, et les titulaires de droits, qui contestent l’utilisation non autorisée de leurs œuvres. La fiche Dabo Tibi Ius sur le droit d’auteur et les œuvres générées par IA identifie expressément le TDM comme un fondement juridique majeur invoqué pour l’entraînement des modèles génératifs. (dabotibius.ai)
2. Points essentiels à retenir
- Le TDM est une technique d’analyse automatisée de contenus numériques.
- La directive (UE) 2019/790 a créé deux exceptions : l’une pour la recherche scientifique, l’autre plus générale.
- L’exception générale peut être écartée par les titulaires de droits au moyen d’un opt-out.
- Le TDM ne donne pas un droit général d’utiliser librement toutes les œuvres protégées.
- L’AI Act ajoute des obligations de transparence et de respect du droit d’auteur pour les fournisseurs de modèles d’IA à usage général.
- Les débats récents portent sur l’entraînement des IA génératives, la preuve de l’utilisation des œuvres, la rémunération des auteurs et la portée de l’opt-out.
3. Cadre juridique
Directive DSM
La directive (UE) 2019/790 définit la fouille de textes et de données comme une technique d’analyse automatisée de textes et données numériques afin d’en dégager des informations, notamment des constantes, tendances ou corrélations. Ses articles 3 et 4 instaurent les deux régimes centraux du TDM. (Eur-Lex)
Article 3 : TDM à des fins de recherche scientifique
L’article 3 bénéficie aux organismes de recherche et aux institutions du patrimoine culturel. Il autorise certaines reproductions et extractions lorsque les bénéficiaires disposent d’un accès licite aux contenus.
Cette exception est protectrice pour la recherche : elle est obligatoire pour les États membres et ne peut pas être neutralisée par contrat.
Article 4 : exception générale de TDM
L’article 4 est plus large. Il peut bénéficier à d’autres acteurs, y compris économiques, mais seulement si les titulaires de droits n’ont pas expressément réservé l’usage de leurs œuvres.
C’est le mécanisme d’opt-out. En pratique, il peut être exprimé par des moyens contractuels, techniques ou lisibles par machine.
Droit français
La directive DSM a été transposée en droit français dans le Code de la propriété intellectuelle. Les exceptions de fouille de textes et de données s’articulent avec les droits exclusifs de reproduction, d’extraction de bases de données et les droits voisins.
4. Lien avec l’IA générative
La question centrale est de savoir si l’entraînement des modèles d’IA générative relève pleinement de l’exception TDM.
La fiche Dabo Tibi Ius sur le droit d’auteur et les œuvres générées par IA souligne que les grands modèles sont entraînés sur des corpus très vastes : livres, articles, images, musiques, vidéos et bases de données. Elle relève également que les ayants droit soutiennent que leurs œuvres ont été utilisées sans autorisation ni rémunération. (dabotibius.ai)
Deux lectures s’opposent :
Lecture favorable aux fournisseurs d’IA
L’entraînement serait une opération d’analyse automatisée comparable au TDM : le modèle extrait des régularités statistiques sans exploiter directement l’œuvre comme telle.
Lecture favorable aux titulaires de droits
L’entraînement impliquerait des reproductions massives et une exploitation économique autonome, qui ne devrait pas être couverte automatiquement par l’exception TDM, surtout lorsque l’opt-out n’a pas été respecté.
5. AI Act et droit d’auteur
L’AI Act ne crée pas une nouvelle exception au droit d’auteur. En revanche, il impose aux fournisseurs de modèles d’IA à usage général des obligations liées au respect du droit d’auteur et à la transparence des données d’entraînement. Le règlement prévoit notamment des obligations particulières pour les modèles d’IA à usage général. (Eur-Lex)
La fiche Dabo Tibi Ius sur le droit d’auteur et les œuvres générées par IA rappelle que l’AI Act impose notamment le respect du droit d’auteur européen et la publication d’un résumé suffisamment détaillé des contenus utilisés pour l’entraînement. (dabotibius.ai)
6. Jurisprudence et contentieux
La jurisprudence européenne n’a pas encore tranché de manière complète la portée du TDM appliqué à l’entraînement des modèles génératifs.
Les contentieux recensés dans la base concernent principalement :
- l’utilisation non autorisée d’œuvres protégées ;
- la preuve de l’entraînement sur des corpus protégés ;
- la responsabilité des fournisseurs d’IA ;
- la portée des exceptions existantes ;
- la rémunération des titulaires de droits.
La base Dabo Tibi Ius mentionne notamment les litiges impliquant OpenAI, Anthropic et Meta, ainsi que les revendications des industries culturelles contre l’utilisation massive de catalogues protégés pour entraîner des modèles. (dabotibius.ai)
7. Acteurs principaux
Les principaux acteurs sont :
- les auteurs, artistes, éditeurs, producteurs et sociétés de gestion collective ;
- les fournisseurs de modèles d’IA générative ;
- les organismes de recherche ;
- les institutions patrimoniales ;
- la Commission européenne et l’AI Office ;
- le CSPLA en France ;
- le Parlement français, notamment dans les débats sur la présomption d’utilisation des contenus culturels.
8. État actuel des débats
Le premier débat concerne la preuve : les titulaires de droits peinent souvent à démontrer que leurs œuvres ont été utilisées pour l’entraînement. C’est pourquoi plusieurs articles recensés évoquent les propositions françaises visant à instaurer une présomption d’utilisation des œuvres par les fournisseurs d’IA. (dabotibius.ai)
Le deuxième débat concerne l’opt-out : juridiquement prévu, il peut être difficile à exercer efficacement à l’échelle du web.
Le troisième débat porte sur la rémunération : faut-il maintenir une logique d’exception, créer des licences collectives, prévoir une compensation obligatoire ou renforcer les actions en contrefaçon ?
9. Actualité récente
Les articles Dabo Tibi Ius recensent une actualité dense en 2025-2026 : rapport Voss sur le droit d’auteur et l’IA générative, proposition de loi Darcos sur la présomption d’utilisation des contenus culturels, débats au Sénat, tensions avec les acteurs de l’IA et multiplication des actions contre les fournisseurs de modèles. (dabotibius.ai)
Ces développements montrent que l’exception TDM n’est plus seulement une règle technique du droit d’auteur : elle est devenue un enjeu de souveraineté culturelle, de compétitivité industrielle et de régulation de l’IA.
10. FAQ
Le TDM autorise-t-il librement l’entraînement des IA ?
Non. Il autorise certaines reproductions et extractions sous conditions. L’accès doit être licite et, pour l’article 4, l’usage ne doit pas avoir été réservé par le titulaire des droits.
Quelle est la différence entre les articles 3 et 4 ?
L’article 3 concerne la recherche scientifique. L’article 4 est plus général, mais il est soumis à l’opt-out.
Un auteur peut-il s’opposer au TDM ?
Oui, dans le cadre de l’article 4, par une réserve appropriée.
L’AI Act modifie-t-il le droit d’auteur ?
Non, mais il renforce la transparence et la conformité des fournisseurs de modèles d’IA à usage général.
Le sujet est-il juridiquement stabilisé ?
Non. La portée exacte de l’exception TDM appliquée à l’IA générative reste discutée et fait l’objet de contentieux et de propositions de réforme.
11. Sources Dabo Tibi Ius mobilisées
- Fiche – Droit d’auteur et œuvres générées par l’intelligence artificielle, 11 juin 2026, Dabo Tibi Ius, URL : https://dabotibius.ai/fiche-droit-dauteur-et-oeuvres-generees-par-lintelligence-artificielle/
- L’exception de TDM au droit d’auteur : un levier stratégique pour l’intelligence artificielle en Europe, Journal du Net, 13 octobre 2025, recensé dans la fiche précitée.
- Proposition de loi Darcos sur l’utilisation des contenus culturels par les IA : le vote au Sénat du chaînon manquant, Village de la Justice, 13 avril 2026, recensé dans la catégorie Propriété intellectuelle.
- IA et droit d’auteur : le Sénat instaure une présomption d’utilisation des œuvres, Le Club des Juristes, 10 avril 2026, recensé dans la catégorie Propriété intellectuelle.
- Rapport Voss : le Parlement européen prend position sur le droit d’auteur et l’IA générative, Deloitte, 7 avril 2026, recensé dans la catégorie Propriété intellectuelle.
Méthodologie : Cette fiche a été générée avec l’assistance de l’intelligence artificielle à partir de la base documentaire Dabo Tibi Ius et de sources complémentaires sélectionnées. Elle a vocation à fournir une synthèse informative et ne constitue pas un avis juridique.

