Données protégées par des droits d’auteur : un défi ‘impossible’ à éviter pour l’entraînement de l’IA

L’utilisation de données soumises au droit d’auteur par OpenAI a suscité une polémique cette semaine lors d’une audience parlementaire britannique. La société a défendu son utilisation de grandes quantités de données protégées par le droit d’auteur comme étant indispensable au développement de ses systèmes d’intelligence artificielle (IA).

Selon OpenAI, des outils d’IA avancés tels que ChatGPT nécessitent une formation si vaste qu’il serait totalement impossible de respecter la loi sur le droit d’auteur. La société a fait valoir que presque toutes les formes d’expression humaine, y compris le journalisme, la littérature, les images en ligne, seraient interdites aux données de formation en raison des lois étendues sur le droit d’auteur.

L’entreprise a également souligné que limiter les données de formation aux livres et dessins du domaine public ne permettrait pas de développer des systèmes d’IA répondant aux besoins des citoyens d’aujourd’hui.

Malgré les critiques et les poursuites pour violation du droit d’auteur, OpenAI ne semble pas disposé à modifier ses pratiques de collecte de données et de formation. La société cherche plutôt à exploiter légalement de vastes pans de données protégées par le droit d’auteur en s’appuyant sur des interprétations larges des autorisations d’utilisation équitable.

Cette position a ouvert OpenAI à de multiples poursuites, notamment de la part de médias alléguant des violations du droit d’auteur.

Alors que les avancées de l’IA continuent de démontrer d’étranges capacités à imiter l’expression humaine, les experts juridiques s’attendent à de vigoureuses batailles judiciaires autour de la violation par des systèmes intrinsèquement conçus pour absorber d’énormes volumes de textes, médias et autres productions créatives protégées.

Pour l’instant, OpenAI parie contre les maximalistes du droit d’auteur en faveur d’une copie quasi illimitée pour stimuler le développement continu de l’IA.

Il reste à voir comment les autorités et les tribunaux répondront à ces défis éthiques et juridiques posés par l’utilisation de données protégées par le droit d’auteur pour l’entraînement des systèmes d’IA.

Laisser un commentaire