Histoire du droit et de la loi, des pros à votre service.
Droit d’auteur et IA générative : que pouvons-nous apprendre des conditions générales du modèle ?
Bien que les grands modèles d’IA à usage général (GPAI) ou « de base » et leurs produits génératifs existent depuis plusieurs annéesc’était le lancement de ChatGPT en novembre 2022, qui a captivé l’imagination du public et des médias ainsi que d’importantes sommes de capital-risque. Depuis, les grands modèles générant non seulement du texte et des images, mais aussi de la vidéo, des jeux, de la musique et du code, sont devenus une obsession mondiale, vantés comme devant révolutionner l’innovation et démocratiser la créativité, sur fond de frénésie médiatique.Méta et maintenant même Apple ont intégré la technologie du modèle de fondation dans leurs produits phares, non sans controverse.
La relation entre le droit d’auteur et l’IA générative (genAI) s’est avérée être l’une des questions les plus controversées que le droit doit résoudre dans ce domaine. Deux questions clés ont suscité de nombreuses discussions, portant respectivement sur les entrées et les sorties des grands modèles. Sur la première, un litige substantiel Des débats ont déjà été lancés sur la question de savoir si les données utilisées pour former ces modèles nécessitent un paiement ou une participation des créatifs dont le travail a été ingéré, souvent sans leur consentement. Alors que les industries créatives affirment que leur travail a été non seulement volé mais spécifiquement utilisé pour les remplacer, les fournisseurs d’IA continuent, de manière remarquable, d’insister sur le fait que les millions d’images « alimentées » à l’IA peuvent être utilisées sans autorisation dans le cadre du « contrat social » d’InternetIl faudra probablement des années pour que ces litiges soient résolus et ils peuvent avoir des conséquences très différentes selon les juridictions, compte tenu de la portée très large de l’usage équitable aux États-Unis par rapport (entre autres) à l’UE. En ce qui concerne les résultats, les tribunaux et les régulateurs on nous a déjà demandé à plusieurs reprises (et nous avons généralement répondu non) si les modèles genAI, en particulier les modèles Text-To-Image (T2I), peuvent être reconnus comme les créateurs d’œuvres littéraires ou artistiques dignes d’une certaine forme de protection par le droit d’auteur.
Ces deux points ont suscité un débat politique et universitaire important. Mais moins d’attention a été accordée à la manière dont les fournisseurs d’IA réglementent eux-mêmes selon leurs conditions générales – ce que l’on appelle dans le contexte contractuel une commande privéeLes grands fournisseurs de modèles d’IA régulent leurs utilisateurs via une variété d’instruments qui vont des conditions générales (CGV ou conditions de service, ou CGU) juridiquement plus contraignantes, des politiques de confidentialité ou des avis et licences de droits d’auteur, jusqu’aux politiques d’« utilisation acceptable » plus floues et plus favorables aux relations publiques mais moins applicables, les « principes » des parties prenantes et les codes de conduite. Si l’étude des commandes privées sur les réseaux sociaux et les plateformes en ligne est un moyen très bien établi de découvrir comment les fournisseurs traitent le droit d’auteur, la protection des données et la protection des consommateurs, les études sur les CGU de l’IA générative ont été plus lentes à démarrer. L’étude des CGU est cruciale car dans la plupart des cas, en attendant la résolution d’un litige ou une nouvelle législation, elles régiront effectivement les droits des utilisateurs et des créateurs. Pourtant, en particulier dans le contexte du commerce interentreprises (B2C), ces CGU ont souvent été décriées comme étant largement non lues, non comprises et créant une relation abusive de déséquilibre de pouvoir sur des marchés monopolistiques ou oligopolistiques. En effet, Palka a qualifié les conditions générales des plateformes en ligne de « conditions d’injustice » et nous avons fait valoir qu’elles ne devraient plus être tolérées. Dans ce contexte, nous avons choisi de lancer un petit projet pilote dès que possible pour voir quelles conditions étaient imposées par les fournisseurs d’IA générative et si les résultats étaient effectivement préjudiciables pour les utilisateurs et les créateurs.
Notre travail empirique pilote de janvier à mars 2023 a cartographié les ToS sur un échantillon représentatif de 13 fournisseurs d’IA générative, issus du monde entier et comprenant des petits fournisseurs ainsi que de grandes entreprises mondialement connues telles que Google et OpenAI. Nous avons examiné les modèles de texte à texte (T2T – par exemple ChatGPT)); Modèles texte-image (T2I – par exemple diffusion stable et MidJourney); et modèles texte-audio ou vidéo (T2AV par exemple Synthesia et Colossyan). Nous avons analysé les clauses affectant les intérêts des utilisateurs en matière de confidentialité ou de protection des données, de contenu illégal et préjudiciable, de résolution des litiges, de juridiction et d’application, et de droit d’auteur, ce dernier ayant peut-être fourni nos résultats les plus intéressants et qui est l’objet de cet article de blog.
S’appuyant sur les controverses et les poursuites judiciaires émergentes, Nous avons divisé notre analyse des clauses de droit d’auteur selon les questions suivantes :
Qui détient les droits d’auteur sur les sorties et (si une indication est trouvée) sur les entrées du modèle ? S’agit-il d’un droit d’auteur propre ou d’une licence cédée ?
Si les œuvres produites enfreignent le droit d’auteur, qui en est responsable (par exemple, l’utilisateur, le service) ?
Les fournisseurs de modèles ont-ils entrepris une modération du contenu (par exemple un filtrage des invites) pour tenter de réduire le risque de violation du droit d’auteur dans les résultats ?
Question 1 a donné des résultats sans conséquence concernant entrées. Il n’y avait pratiquement aucune référence à la propriété des données de formation provenant de parties autres que les partenaires contractuels.par exemple, les entrées définies de manière restrictive pour signifier du matériel rapide et la propriété de l’utilisateur a été reconnue. Nous avions espéré peut-être naïvement une indication des droits des créateurs par rapport aux œuvres protégées par le droit d’auteur utilisées pour entraîner les modèles ex ante mais bien sûr, comme ces données se situaient en dehors de la relation modèle-utilisateur, nous n’avons presque rien trouvé. Il est intéressant de noter qu’au moment de notre étude, la question de savoir si les utilisateurs d’un service principal pouvaient par défaut être obligés de fournir leurs données pour aider à former et à recycler les grands modèles développés par le fournisseur de services n’était pas devenue aussi aiguë qu’elle l’a été plus récemment, par exemple en ce qui concerne AdobeMéta et SlackNous espérons revenir sur ce sujet dans de futurs travaux.
Concernant sorties Cependant, les résultats étaient plus intéressants. Dans presque tous les modèles étudiés, la propriété des résultats était attribuée à l’utilisateur, mais dans de nombreux cas, une licence étendue était également accordée au fournisseur du modèle pour l’utilisation coexistante des résultats. La terminologie était souvent très similaire à celle des conditions d’utilisation des plateformes de contenu généré par les utilisateurs (UGC) en ligne comme Google et Meta. Modèle T2I LensaPar exemple, a accordé à l’utilisateur « une licence perpétuelle, révocable, non exclusive, libre de redevances, mondiale, entièrement payée, transférable et sous-licenciable pour utiliser, reproduire, modifier, adapter, traduire et créer des œuvres dérivées ». En revanche, T2I Nightcafe Il est simplement stipulé qu’une fois le contenu créé et livré à l’utilisateur, ce dernier détient tous les droits de propriété intellectuelle. Diffusion stable adopté une licence open source bien connue, la licence CreativeML Open RAIL-Mqui permet à ses utilisateurs non seulement d’avoir des droits sur leurs œuvres de sortie générées, mais également de fournir et de travailler avec le modèle de diffusion stable lui-même.
Dans les services T2T, ChatGPT d’OpenAI attribué à l’utilisateur tous les « droits, titres et intérêts dans et sur la production ». BardSimplifié et CLOVA Studio également attribué la propriété aux utilisateurs. En revanche, la société Baidu – propriétaire d’Ernie Bot – s’est identifié comme le propriétaire de tous les droits de propriété intellectuelle de la plateforme de services API et de ses éléments connexes, tels que « le contenu, les données, la technologie, les logiciels, le code, l’interface utilisateur ». Fait inhabituel, DeepLun service de traduction IA, n’a « assumé aucun droit d’auteur sur les traductions effectuées par le Client à l’aide des Produits ».
Pourquoi les fournisseurs étaient-ils si disposés à céder des droits sur les précieux résultats de leurs services, en particulier lorsque pour les consommateurs à ce stade de développement de l’IA générale, les services étaient en grande partie gratuits ?
Question 2 nous a donné quelques indices. Étudié dans presque tous les modèles ou services risque La responsabilité de la violation du droit d’auteur dans le travail produit a été laissée, dans une certaine mesure, à l’utilisateur. Par exemple, les conditions générales de Midjourney utilisé un langage coloré et divertissant :
‘[i]« Si vous violez sciemment la propriété intellectuelle de quelqu’un d’autre et que cela nous coûte de l’argent, nous viendrons vous chercher et récupérer cet argent auprès de vous ».
Nous avons donc découvert un pacte faustien dans lequel les utilisateurs se voyaient accorder la propriété des résultats de leurs invites, à condition qu’ils assument également tous les risques de poursuites pour violation de droits d’auteur de la part des créateurs en amont dont le travail avait été absorbé dans les ensembles de formation. Pourtant, les risques de violation proviendront exclusivement du contenu des ensembles de données de formation, souvent collectés sans préavis ni autorisation des fournisseurs de contenu créatif, et dont le contenu est souvent un secret de propriété dont les utilisateurs n’ont aucune idée des modalités de consentement ou de rémunération. Cela semble être l’essence même d’une clause abusive.
Dans notre rapport complet, nous affirmons que les fournisseurs d’IA se positionnent ainsi, via leurs conditions d’utilisation et à leur seul avantage, comme des « intermédiaires neutres », à l’instar des plateformes de recherche et de médias sociaux. Ils échangent la propriété des résultats contre l’attribution des risques aux utilisateurs, réalisant leurs bénéfices non pas à partir des résultats mais à partir des frais d’abonnement et d’API, et très probablement à l’avenir, tout comme les plateformes en ligne, de la publicité. Pourtant, les fournisseurs d’IA de génération ne sont pas des plateformes ; ils n’hébergent pas de contenu généré par les utilisateurs, mais fournissent simplement un service Généré par l’IA contenuNous appelons cela un « paradigme de plateformisation », une pratique trompeuse par laquelle les fournisseurs d’IA revendiquent les avantages du statut d’hôte neutre mais sans la gouvernance de plus en plus imposée à ces acteurs (par exemple en Europe par le biais de la directive sur le droit d’auteur dans le marché unique numérique). et la loi sur les services numériques). À compter de février 2024, les plateformes en ligne de l’UE (et pas seulement les très grandes ou « VLOP » !) doivent rendre publiques leurs CGU et leurs actions de modération de contenu et également prendre en compte les droits et les intérêts des utilisateurs lors de l’interprétation et de l’application de leurs CGU. Aucune de ces nouvelles règles améliorant les « conditions d’injustice » auxquelles Palka fait référence ne s’applique aux fournisseurs de genAI (du moins à moins que les services ne soient intégrés à des services soumis au DSA tels que GPT intégré à Bing de Microsoft, un très grand moteur de recherche en ligne (VLOSE)).
Le paradigme de la plateforme est renforcé dans l’optique par la manière dont presque tous les fournisseurs de modèles, à l’exception du plus petit, ont entrepris une modération du contenu, avec des dispositions de notification et de retrait comme norme (Question 3 ci-dessus). Encore une fois, bien que les utilisateurs assument le risque de responsabilité associé aux résultats, les fournisseurs de modèles ont invariablement exercé leur propre pouvoir discrétionnaire pour évaluer quel résultat ou comportement viole les conditions d’utilisation, et quelle pourrait être la sanction (interdiction du site, par exemple) (voir par exemple, Nightcafe).
En conclusion, alors que les universitaires, les législateurs et les juges cherchent sans doute à équilibrer les intérêts des créateurs dont le travail est utilisé pour construire des modèles d’IA générative, les fournisseurs qui les construisent et les droits des utilisateurs de ces services, l’analyse des conditions d’utilisation offre un aperçu familier de contrats d’adhésion unilatéraux, rédigés en langage juridique pour minimiser les risques et maximiser le contrôle des fournisseurs de services se faisant passer pour des plateformes afin d’éviter la réglementation. Nous pensons que cette situation doit être abordée, au moins par une analyse du droit de la protection des consommateurs, mais très probablement par une réflexion sur la manière dont le DSA peut être étendu pour régir l’IA générative et les modèles de fondation. Une autre solution pourrait être de reprendre ces points dans le code de conduite des fournisseurs d’IA générative que la Commission a maintenant neuf mois pour rédiger – mais puisque ce processus semble déjà avoir été coopté par les entreprises d’IA elles-mêmesnous n’avons pas beaucoup d’espoir dans cette direction.
Cet article de blog est basé sur les résultats d’un travail empirique pilote mené entre janvier et mars 2023 et financé par l’EPSRC Trusted Autonomous Systems Hub. Vous pouvez trouver le rapport complet ici.
We use cookies to personalise content and ads, to provide social media features and to analyse our traffic. We also share information about your use of our site with our social media, advertising and analytics partners. View more
Cookies settings
Accept
Privacy & Cookie policy
Privacy & Cookies policy
Cookies list
Cookie name
Active
Politique de confidentialité:
Exploitation et transmission de vos données privées:
Au cas où vous sollicitez une désactivation de votre password, votre identifiant IP sera enfermée dans l’e-mail de désactivation.
Divulgation de vos datas individuelles:
Tous commentaires des utilisateurs pourront être étudiés au moyen d'un service industrialisé de découverte des textes outrageants.
A propos des cookies:
Au cas où vous envoyez un message sur notre site, vous serez amenés à enregistrer votre nom, e-mail et site dans des cookies. Cela a pour but uniquement dans le but de votre surf convivial pour ne pas être conduit à redonner ces informations au cas où vous déposez un nouveau commentaire plus tard. Ces cookies expirent au bout d’un an.Dans les cas où vous vous rendez sur la partie de l'enregistrement, un cookie transitoire va se généré afin de constater si votre browser autorise les cookies. Cela ne concentre pas de datas personnelles et sera supprimé inéluctablement à la fermeture votre browser.Au cas où vous vous connectez, nous activons un certain nombre de cookies dans le but d'enregistrer vos informations de login et vos options d’écran. L'espérance d'existence d’un cookie de login est de quelques jours, celle d’un cookie de navigation est de l'ordre de l'année. Lorsque vous mentionnez « Se souvenir de moi », votre cookie de login sera perpétué pour une durée de moins d'un mois. Dans les cas où vous clôturez votre compte, le cookie de connexion sera radié.En modifiant ou si vous publiez une publication, un cookie supplémentaire sera établi dans votre terminal. Ce cookie ne comprend aucune information privée. Il expose simplement l’ID du post que vous avez décidé de corriger. Il périt au bout de 24 heures.
Données placées à partir d’autres sites:
Les posts de ce site peuvent introduire des informations constituées (par exemple des vidéos, fichiers, papiers…). Le contenu embarqué depuis d’autres sites se compose de manière identique que si l'utilisateur visitait ce site tiers.Ces sites internet ont la possibilité de charger des datas sur vous, appliquer des cookies, télécharger des logiciels de suivis tiers, conserver vos informations avec ces datas saisies si vous détenez un compte connecté sur leur site internet.
Les droits que vous avez sur vos informations:
Lorsque vous détenez un espace personnel ou si vous avez enregistré des commentaires sur le site, vous avez le droit de demander à recevoir un fichier introduisant en globalité les informations individuelles que nous contrôlons à propos de vous, enfermant celles que vous nous avez consenties. Vous avez le droit aussi de solliciter l'effacement des datas personnelles vous concernant. Cette procédure ne concerne pas les informations accumulées à des fins de statistiques, dans le respect du droit ou pour sécurité.
Cela est en conformité à la RGPD.
Données de contenu:
Au cas où vous envoyez des médias sur le site, nous vous suggérons de vous abstenir de le faire des icônes contenant des identifiants EXIF de positionnement GPS. Les gens visitant le site savent prélever des données de détection à partir de ces photographies.
Ecrire des textes sur le site:
Quand vous écrivez un texte sur notre site, les infos insérées dans le formulaire de texte, mais aussi l'identification IP et l’agent utilisateur de votre logiciel de navigation sont collectés pour nous donner la possibilité de déceler des commentaires non autorisés.
Durées de mémorisation de vos datas:
Lorsque vous enregistrez un commentaire, le texte et ses métadonnées sont entreposés pour toujours. Ce processus implique de diagnostiquer et acquiescer mécaniquement les textes consécutifs au lieu de les transmettre dans la file du modérateur.Si les espaces personnels qui s’insèrent sur le site (au cas où), nous accumulons également les informations personnelles communiquées dans leur profil. Tous les comptes ont la possibilité intervenir sur leurs informations privées n'importe quand. Les modérateurs du site savent aussi intervenir sur ces données.