Le 11 février 2025, Thomson Reuters a remporté un procès contre Ross Intelligence pour avoir utilisé illégalement le contenu de sa base de données juridique Westlaw, pour entraîner ses modèles d’IA. Dans un contexte constant de développement en matière d’IA, Ross Intelligence est un concurrent direct de Reuters qui a créé une plateforme de recherche juridique alimentée par l’intelligence artificielle pour le droit américain.
Pour entraîner son outil de recherche, Ross avait demandé une licence d’exploitation du contenu de Westlaw que Reteurs avait refusée du fait de leur concurrence directe.
Par la suite, un accord a été conclu avec LegalEase pour l’exploitation de données d’entraînement sous « Bulk Memos ». Ces données représentent 25000 compilations de questions juridiques posées par des avocats avec des bonnes et mauvaises réponses. En clair, ces Bulk Memos, sont des gros volumes de données [1]
La problématique repose sur le fait que ces mémos ont eux-mêmes été construits sur les données de Westlaw (résumés juridiques issus des décisions judiciaires, etc.). En pratique, cette pratique s’assimile à de la contrefaçon du droit d’auteur de la base de données Westlaw.
La question de l'utilisation des données d'entraînement pour l'IA fait également écho aux exigences de l'IA Act de 2024 [2], réglementation européenne visant à encadrer l'utilisation de l'intelligence artificielle, en particulier dans les domaines sensibles comme le droit d’auteur. Ce règlement vise une approche par les risques pour la santé, la sécurité ou les droits fondamentaux, notamment à travers la sécurité des produits et la surveillance du marché en ce qui concerne les systèmes et modèles d’IA [3]. Le point central du règlement pour être en conformité, désigne une obligation de transparence selon le niveau de risque de l’IA qui est notamment reparti en quatre niveaux :
Initialement, le Fair Use est issu de la législation et de la jurisprudence américaine et s’applique dans les pays de Common Law (États-Unis, Canada, Royaume-Uni, Australie et Nouvelle-Zélande). Par traduction, on peut le caractériser « d’usage loyal » qui désigne un ensemble de limitations et d’exception aux utilisations protégées par le Copyright (droit d’auteur). Cet ensemble pose généralement des critères sur lesquels les juges s’appuient pour retenir cet usage loyal, par exemple aux États-Unis les juges retiennent en principe quatre critères :
Dans ce contexte, le fait de créer de nouvelles œuvres qui donnent un nouveau sens à l’œuvre originale peut être considéré comme une utilisation loyale et donc autorisée par la loi. C’est en ce sens que la Cour a rejeté le « Fair Use » en constatant que l’utilisation faite par Ross n’est pas transformatrice et l’objectif poursuivi n’est pas distinct de celui de Reuters, soit de fournir un outil juridique performant. Donc la cour retient une intention délibérée de concurrencer Westlaw et reconnaît un marché spécifique des données d’entraînement pour l’IA méritant protection.
Cette décision s’inscrit dans le même sillage qu’une affaire précédente où huit journaux américains ont poursuivi Open IA et Microsoft pour violation du droit d’auteur du fait d’entraîner leurs outils sans autorisation avec des millions d’articles de presse protégés[4]. C’est en reconnaissant un marché spécifique aux données d’entraînement, que la cour pose un cadre de plus en plus dessiné sur la frontière entre le droit d’auteur et l’IA.
La mission du CSPLA de décembre 2024[5] a justement porté sur la mise en conformité du droit français avec l’IA Act, en identifiant les meilleures pratiques pour assurer une protection efficace des contenus protégés tout en permettant l'innovation technologique. Les conclusions du CSPLA réaffirment la nécessité de cadres contractuels et l’obligation de transparence pour l’utilisation des bases de données à des fins d’entraînement IA, ce qui renforce la démarche européenne visant à éviter les abus en la matière. Cette mission propose alors aux fournisseurs et développeurs des IA un type « de résumé suffisamment détaillé » des bases de données d’entraînements à fournir, pour justement permettre de voir si parmi ces données, il y a des œuvres protégées par le droit d’auteur qui nécessiteraient une autorisation pour leur exploitation.
Chez Altij Avocats, nous comprenons les défis juridiques liés à l'utilisation des données pour l'entraînement des modèlesd'intelligence artificielle. Notre équipe d'experts vous accompagne pour garantir la conformité avec les lois sur le droit d’auteur, comme illustré par le récent cas ThomsonReutersvsRossIntelligence.
Cas Pratique : Thomson Reuters vs Ross Intelligence
En février 2025, ThomsonReutersa remporté un procès contre RossIntelligencepour utilisation illégale de la base dedonnées Westlaw.
Ce cas met en lumière l'importance de la protection des données d'entraînement IA et l es limites du FairUse dans un contexte commercial.
Le Fair Use est une exception au droit d'auteur qui permet certaines utilisations sans au torisation. Cependant, comme lemontre le cas Reuters vs Ross, cette exception ne s'a pplique pas lorsque l'utilisation n'est pas transformatrice et vise àconcurrencer directe ment l'œuvre originale.
Pour en savoir plus sur nos services et comment nous pouvons vous aider à protéger vo s innovations en IA, contactez-nous dès aujourd'hui.
[1] https://www.linguee.fr/anglais-francais/traduction/bulk+memory.html
[2] https://eur-lex.europa.eu/legal-content/FR/TXT/?uri=CELEX:32024R1689
[3] https://www.cnil.fr/fr/entree-en-vigueur-du-reglement-europeen-sur-lia-les-premieres-questions-reponses-de-la-cnil
[4] https://www.usine-digitale.fr/article/droit-d-auteur-huit-journaux-americains-portent-plainte-contre-openai-et-microsoft.N2212597
[5] https://www.culture.gouv.fr/nous-connaitre/organisation-du-ministere/Conseil-superieur-de-la-propriete-litteraire-et-artistique-CSPLA/Travaux-et-publications-du-CSPLA/Missions-du-CSPLA/ia-et-transparence-des-donnees-d-entrainement-publication-du-rapport-d-alexandra-bensamoun-sur-la-mise-en-aeuvre-du-reglement-europeen-etablissant