Achikochi

IA et copyright, enfin une clarification légale

2023-06-07 | Lecture : 5 min

Dur en 2023 de passer à côté des IA génératives. De Dall-e en 2021 aux dernières itérations de ChatGPT, la machine marketing s’est mise en route et promet que l’IA va tout révolutionner dans nos vies. Ou tout détruire. En tout cas, en creux, les sujets de travail à la tâche pour étiqueter les bases de données et modérer les résultats et les questions de copyright des œuvres et contenus aspirés reviennent régulièrement.

Pour le Japon, dont les productions culturelles sont au cœur du Soft Power, l’IA peut être une opportunité mais très certainement une menace. Et dans ce cadre, le gouvernement vient enfin de se positionner.

Le 30 mai, le Ministère de l’Éducation, de la Culture, des Sports, des Sciences et de la Technologie et le cabinet du premier ministre ont publié un document précisant les règles en matière d’entraînement des IA génératives vis-à- vis du respect du copyright.

Capture d'écran du document d'orientation
Capture d'écran du document d'orientation

Si le gouvernement japonais avait publié des 2019 sa stratégie vis-à- vis de l’intelligence artificielle, le sujet de l’utilisation des productions culturelles (tant mangas, animés, illustrations que textes ou voix) n’était pas à l’ordre du jour à l’époque mais l’explosion des DALL-E, MidJourney ou ChatGPT a jeté un énorme caillou dans la marre.

Dans le détail, le document prévoit deux niveaux qui correspondent globalement aux étapes de développement:

En phase de conception et d’entrainement de l’IA, l’usage de contenus sous copyright est globalement tolérée “dans la limite du raisonnable” ou si cela met en péril les intérêts du créateur. Sur ce deuxième point, la vente d’une base de données contenant ou listant des œuvres sous copyright a des fins d’entrainement d’IA serait exclue de cette dérogation.

En phase de production / génération / usage, on tombe alors sous le coup de la loi sur les copyrights classiques. L’upload ou la mise en vente de contenus basés sur des contenus copyrightés est illégale, sauf si accord des ayant-droits. S’il s’avère que l’image générée, etc. présente une similitude (que l’expression créative est identique ou similaire) ou une dépendance (qu’elle a été créée sur la base d’une œuvre existante) avec une image existante protégée par le droit d’auteur, c’est une atteinte au droit d’auteur. En plus de pouvoir réclamer des dommages-intérêts et des mesures injonctives en tant que dommages, il est également passible de sanctions pénales.

Un jeu de pouvoir et des zones d’ombres

Typiquement, la base de données LAION, qui sert de base d’entraînement a DALL-E, MidJourney et Stable Diffusion serait exclue de la dérogation prévue par le gouvernement japonais. Mise a disposition au travers d’une entreprise à but non lucratif, la base de données est connue pour contenir des contenus copyrightés, pornographiques, violents, soumis au secret médical, etc mais aussi pour être extrêmement réticente a retirer les contenus problématiques, ce qui ne présage rien de bon pour les créateurs japonais (et les autres).

Coté pro-IA (par exemple ici ou la), notamment dans les cercles anglophones, suite a des traductions partielles, la nouvelle a été accueillie comme signifiant que le Japon considère que le copyright ne s’applique pas au training dans son ensemble et que donc les modèles qui en sont issus n’auront pas de souci. Ce qui ne va sans doute pas aider les créateurs japonais à faire valoir leurs droits.

Les sites portfolio comme pixiv ou Artstation ont aussi été submergés d’images générées par IA, noyant les autres créateurs sous le nombre. Ce qui a incité ceux-ci à lancer une campagne coordonnée d’upload d’images s’opposant aux IA, monopolisant la page d’accueil du site et envoyant un message clair aux gestionnaires de ces sites. Qui ont donc décidé de masquer ces images plutot que de réguler l’upload d’images générées par IA sur leur site.

Frontpage d'ArtStation couverte de post anti-IA

On peut aussi se poser la question de ce que signifie obtenir l’accord des ayants droits. DeviantArt, par exemple, lors l’annonce du lancement de sa propre IA (DreamUp), avait inclus de base tous les contenus qui avaient été uploadés sur sa plateforme, mettant ses utilisateurs devant le fait accompli et leur demandant de faire la démarche (pénible) de s’exclure (dans les options et en ajoutant des tags à chaque image), a posteriori donc. Et meme la marche arrière faite par la plateforme devant le backlash ne convainc pas les utilisateurs qui craignent de voir les gestionnaires revenir sur cette décision mais aussi que leurs œuvres aient déjà été incluses dans des modèles et ne peuvent donc plus être retirées.

En comparaison, Pixiv a mis a jour fin mai ses conditions d’utilisation pour considérer comme infraction le scraping et l’utilisation des images disponibles sur le site pour l’entraînement des modèles.

Une clarification très attendue

Si une part des créateurs japonais a rapidement pris en main les IA génératives, dans l’ensemble, c’est l’appréhension qui domine.

Début mai, l’association professionnelle Arts Workers Japan, qui rassemble des créateurs dans beaucoup de domaines, demandait au gouvernement de statuer sur le sujet et d’assurer la protection des créateurs et de leurs droits.

Dans le cadre d’un sondage concernant les IA génératives aupres de ses membres début mai, le syndicat a recueilli plus de 25000 réponses, un volume inattendu par les organisateurs. Parmi ces réponses, environ 94% étaient inquiets des conséquences négatives sur leur métier.

Le mot de la fin

Si, à mon sens, le document clarifie beaucoup de choses, il est loin de tout résoudre. Pour les personnes intéressées, le Monbugakusho organise une présentation sur le sujet le 19 juin 2023.