Industrie Musicale

IA contre l'industrie musicale : L'avènement du clonage vocal par l'IA

Martina
12 octobre 2023, jeudi

Partager cet article sur

La technologie de clonage vocal par l'IA s'est développée au cours des deux derniers mois, s'avérant puissante dans différents secteurs, dont l'industrie musicale. Bien que nous ayons abordé le sujet dans notre précédent article sur l'IA et la musique, nous pensons que cela mérite un article à part entière, qui explore plus en profondeur ses effets et les inquiétudes que cela suscite chez les artistes indépendant·e·s. Entrons dans le vif du sujet.

La technologie du clonage vocal par l'IA

Indépendamment de la controverse qui entoure le clonage de la voix, cette technologie représente une avancée remarquable dans le domaine de l'intelligence artificielle. Sans entrer dans les détails, nous avons décidé de présenter les grandes lignes du fonctionnement de cette technologie. Essentiellement, le clonage vocal s'appuie sur des algorithmes d'apprentissage sophistiqués pour reproduire des voix humaines spécifiques.

Ce qui est au cœur de ce processus innovant, c'est l'entraînement des réseaux neuronaux qui s'appuie sur de vastes volumes de données vocales enregistrées. Les modèles d'IA sont entraînés à maîtriser d'innombrables nuances vocales, intonations, hauteurs, accents ou débits afin d'adopter un discours de synthèse qui imitera le plus fidèlement la voix originale.

Un rôle essentiel est également joué par les architectures d'apprentissage profond appelées « réseaux adversaires génératifs » (GAN), qui assurent la médiation entre les réseaux dits « générateurs » et « discriminants ». Comme leur nom l'indique, les « générateurs » visent à produire des voix synthétiques, tandis que les « discriminants » évaluent leur authenticité par rapport à la parole humaine réelle. L'interaction entre les deux réseaux crée un cycle répété de création, d'évaluation et d'amélioration, grâce auquel la technologie de clonage vocal par IA évolue constamment.

DALL E 2023 10 12 15 15 05 a robot who imitates someone elses voice

Le clonage de la voix par l'IA dans le domaine de la musique

Au tout début de cet article, nous avons mentionné que les services de clonage vocal sont utilisés dans divers domaines et industries. Il s'agit, par exemple, de développer des assistants virtuels personnalisés qui ressemblent davantage à des humain·e·s, de créer des messages viraux sur les réseaux sociaux ou de permettre à ceux·celles qui ont perdu leur capacité à parler d’avoir accès à une communication de haute qualité.

Ce qui différencie l'utilisation du clonage vocal dans l'industrie musicale de son utilisation dans d'autres domaines, c'est que la voix est l’un des ingrédients sacrés de l’art et de la profession des musicien·ne·s. En réalité, on peut dire que la voix d'un chanteur ou d’une chanteuse est à la fois un outil de communication, un instrument de musique et un outil de monétisation.

Le clonage vocal a fait l'objet de vifs débats suite à certaines situations marquantes. En 2021, Capitol Record a suscité l'attention en engageant FN Meka, un rappeur à la voix purement synthétique. Rapidement, il est apparu que cette voix était celle d'un acteur humain non mentionné ni récompensé pour son expertise. Cette révélation a provoqué une polémique, amplifiée par les comportements de l'artiste virtuel, perçus comme renforçant des préjugés raciaux et une exploitation inappropriée de la culture noire. Face à cela, le label a résilié son contrat avec l'artiste à peine dix jours après l’avoir signé.

Please accept marketing cookies to view this content.

Vous vous souvenez sans doute de la chanson « Heart on my sleeve » qui est devenue virale en début d'année parce qu'elle contenait des voix de Drake et de The Weeknd générées par l'intelligence artificielle, avec un rendu réaliste. La chanson a été écrite et produite par un utilisateur de TikTok, ghostwriter977, qui l'a publiée lui-même sur des plateformes de streaming telles que Spotify, Apple Music ou YouTube.

Résultat : le titre a généré des millions de vues sur TikTok et des milliers de streams sur les différentes plateformes. Bien qu'Universal Music Group ait fini par le retirer, il est devenu un cas central dans les discussions actuelles sur la légalité de la musique générée par l'IA sur les plateformes de streaming et sur l'adoption de lois relatives au droit d'auteur.

Récemment, une chanson fictive attribuée à Taylor Swift, où sa voix serait simulée par une IA, a émergé en ligne. Cette chanson, prétendant dépeindre un futur post-rupture hypothétique pour la chanteuse, aurait été rédigée par un utilisateur de TikTok, Will King. Cependant, sa version finale a été réalisée par un autre individu grâce à des outils d'édition audio, exploitant le potentiel de l'IA pour créer la voix de Taylor. Après une mise en ligne sur YouTube, elle a rapidement atteint près de 60 000 vues et a été accueillie positivement, incitant des suggestions pour sa diffusion sur d'autres plateformes. Ce phénomène met en lumière l'impact croissant du clonage vocal par IA sur la carrière et la vie des artistes.

Le rôle du clonage de la voix par l'IA sur la vie des musicien·ne·s

1. Dévalorisation du travail humain

Même avec son immense talent, Taylor Swift aurait probablement eu besoin d’un certain temps pour composer et finaliser une chanson sur sa vie, sans aide extérieure. Sans oublier les coûts associés à l'enregistrement et à la production. Cette réalité s'étend à tou·te·s les artistes, qui ont besoin de temps, de ressources financières et des équipements adéquats pour peaufiner leur musique avant distribution. À l'inverse, un logiciel d'IA efficace peut créer, composer et moduler une chanson en quelques minutes après un simple clic. Bien qu'il puisse actuellement falloir combiner plusieurs outils IA pour créer une chanson complète, cette approche reste économique, rapide et plus accessible que les méthodes traditionnelles.

L'intention n'est pas de critiquer systématiquement le travail humain au profit de l'IA, mais il est crucial de reconnaître la possibilité que certaines entités de l'industrie musicale pourraient éventuellement privilégier la pensée automatisée. Sans réglementations et restrictions appropriées, la production et la consommation de musique pourraient être largement dominées par des compositions générées par l'IA, reléguant ainsi la musique créée par des artistes au second plan.

De plus, avec les avancées constantes dans le domaine du clonage vocal par IA, et sa capacité croissante à simuler parfaitement une voix, il est possible que les fans commencent à montrer moins de réticence à acheter des morceaux générés par l'IA plutôt que les créations authentiques des artistes. Les situations mentionnées précédemment illustrent cette tendance.

Les morceaux de Drake, The Weeknd et Taylor Swift ont gagné un vaste public, incitant les fans à réclamer leur diffusion sur les principales plateformes de streaming. Cette évolution pourrait se traduire par une diminution des ventes, une baisse des écoutes de streaming, et, par conséquent, une chute significative des revenus pour les artistes concerné·e·s. Alors que certain·e·s estiment que cela pourrait aussi affecter les concerts en direct, d'autres soutiennent que l'IA ne saurait jamais reproduire la connexion émotionnelle unique propre à chaque performance live. La série de concerts virtuels ABBA Voyage à Londres, prévue jusqu'à la fin 2024, alimente ces débats. Toutefois, actuellement, ces discussions demeurent spéculatives, car ce format virtuel est la conséquence du choix du groupe original de ne pas entreprendre une tournée traditionnelle.

2. Usurpation d'identité

Le clonage vocal représente une menace potentielle, non seulement en permettant à des tiers de commercialiser de la musique contenant des voix clonées (exploitant ainsi le talent et les qualités d'interprètes), mais également en facilitant le vol d'identité et l'utilisation de voix dans des situations indésirables, dépassant le cadre de la création musicale et pouvant englober diverses activités frauduleuses. Cette technologie peut être utilisée pour usurper une identité, même si la personne concernée n'a aucun désir d'implication, élargissant ainsi les risques au-delà du domaine musical.

Certain.e.s pourraient avancer que cela ne concerne que les artistes jouissant d'une renommée mondiale et d'un succès commercial. Cependant, la facilité d'accès à cette technologie signifie que toute personne possédant une voix peut être affectée. Les répercussions peuvent être graves, surtout à une époque où les médias sociaux, les avancées technologiques notables (comme le deepfake) et le partage excessif d'informations compliquent la détection de l'authenticité et de la vérité. Dans cet environnement, tout acte répréhensible, qu'il soit réel ou non, est sévèrement sanctionné.

À long terme, cela pourrait entraîner des dommages physiques et psychologiques pour les musicien·ne·s, les fans et, dans le cas d'activités frauduleuses et criminelles, également pour le grand public. Les individu·e·s peuvent être facilement manipulé·e·s, soumis·e·s à des critiques injustes et être sujet·te·s à des mesures « d'annulation » pour des actions qu'ielles n'ont peut-être même pas commises.

3. Nouvelles possibilités de création et d'innovation

Il convient de souligner que le clonage vocal et d'autres avancées technologiques en intelligence artificielle ne sont pas forcément préjudiciables. D'un côté, elles offrent de nouvelles possibilités aux artistes et des voies pour enrichir leur expression artistique. Grâce à ces outils d'IA, les musicien·ne·s peuvent explorer des sonorités, des instruments et des collaborations novatrices.

Lors de représentations musicales et d'autres événements artistiques, ces technologies peuvent constituer des atouts divertissants, contribuant à créer des moments mémorables sans pour autant supplanter l'artiste principal·e. Une telle performance a de fortes chances de captiver le public, potentiellement augmenter l'affluence et favoriser la vente de billets.

De plus, la technologie d'intelligence artificielle offre à un plus grand nombre de personnes la possibilité de créer et diffuser leur musique de façon autonome. Cela réduit la dépendance financière à l'égard des maisons de disques et transforme progressivement les dynamiques de l'industrie musicale, influençant la manière dont les passionné·e·s de musique concrétisent leur amour pour la musique en une trajectoire professionnelle.

Il est primordial de comprendre que le but principal des avancées technologiques est généralement d'élargir et d'enrichir les compétences et l'ingéniosité humaine, plutôt que de les remplacer. Cependant, cette synergie n'est réalisable qu'avec la mise en place de cadres législatifs adaptés aux droits d'auteur. Quelle est la situation actuelle concernant les droits d'auteur face à l'usage de l'IA ? Examinons cela ensemble.

DALL E 2023 10 12 15 15 29 a robot who sings

Le clonage par l'IA et la protection des droits d'auteur pour le travail humain

Commençons par souligner que bien que la technologie de l'IA ait connu un développement sur plusieurs années, son intégration s'est faite de manière quasi instantanée, transformant des outils et des plateformes individuels en une part essentielle de notre quotidien. Du jour au lendemain, le ChatGPT est passé de l'inconnu à un outil actif dans nos environnements professionnels, scolaires et personnels. Il n'est donc pas surprenant que, du point de vue législatif, nous ayons du mal à suivre cette évolution rapide.

Actuellement, la législation sur le droit d'auteur se concentre principalement sur la protection des créations « fixes » et tangibles, telles que les mélodies, les paroles, les enregistrements de chansons et les œuvres d'art. Les éléments immatériels, incluant la voix d'une personne, ne bénéficient pas de cette protection. Aux États-Unis en particulier, la propriété de la voix n'a pas été intégrée dans la loi fédérale sur le droit d'auteur, car les sons de la voix ne sont pas considérés comme « fixes », selon les exigences de la loi.

Par ailleurs, si les lois visant à protéger la vie privée, à prévenir la fraude et à réglementer le consentement peuvent, en théorie, s'appliquer au clonage vocal, il n'existe à ce jour aucune législation ou réglementation de ce type conçue spécifiquement pour relever les défis de cette technologie. De plus, aux États-Unis, les « politiques équitables » autorisent une utilisation limitée du matériel protégé par des droits d'auteur sans nécessiter l'obtention d'une autorisation des détenteurs de droits. Toutefois, la notion « d'utilisation équitable limitée », notamment dans le contexte de la technologie de l'IA, demeure floue. En revanche, l'UE a manifesté une volonté de réformer les lois sur le droit d'auteur pour aborder les enjeux du monde virtuel. En 2021, la Commission européenne a proposé une loi sur l'IA visant à encadrer à la fois l'utilisation et le développement de l'IA en émettant des directives à l'attention des développeur·euse·s et des utilisateur·rice·s. Cependant, bien que le projet de loi actuel sur l'IA prône la transparence et la gouvernance des données, il a été critiqué pour son insuffisance à prendre en compte les applications génératives de l'IA développées dans les domaines du contenu vidéo et audio.

Cette plainte a été déposée par l'UVA, une coalition mondiale regroupant 35 associations, syndicats et fédérations européennes d'acteur·rice·s vocaux. Elle s'est associée à des organisations suisses, américaines et asiatiques afin de garantir que l'utilisation de l'IA dans l'industrie du doublage et du voice-over ne compromette ni l'héritage artistique ni la créativité humaine.

Cette décision a été prise suite à des signalements indiquant que plusieurs mods de Skyrim (un jeu vidéo) utilisaient l'IA pour créer du contenu pornographique avec les voix des personnages, sans le consentement des acteur·rice·s. Comme il a été démontré par la suite, cette pratique ne serait pas interdite par les lois sur le droit d'auteur.

Des lois sur la ressemblance pourraient-elles être la solution ?

Si la protection se concentre principalement sur les lois sur les droits d'auteur, de nombreu·x·ses professionnel·le·s de l'industrie musicale mettent en avant l'importance des lois sur la ressemblance. À leurs yeux, la ressemblance d'un·e artiste se fonde sur sa voix, et ces lois servent donc à protéger les musicien·ne·s contre une utilisation non autorisée de leur voix.

Ces expert·e·s ont mis en lumière la complexité du contenu cloné ou ressemblant à la production d'un·e artiste spécifique, car il ne s'agit pas d'une simple copie de l'œuvre originale. On pourrait avancer que l'utilisation de chansons clonées (ou de chansons avec des voix générées par l'IA) constitue une forme dérivée de l'original, ce qui représente un argument délicat à défendre pour les titulaires de droits d'auteur. En définitive, de nombreux·ses artistes ont déjà puisé dans les idées d'autrui lors de la composition ou de l'écriture de chansons.

Cependant, comme c'est souvent le cas dans les procès relatifs aux droits d'auteur que nous avons observés dans l'industrie musicale, les plaintes pour infraction se concentrent principalement sur la mélodie des chansons, et non sur l'imitation de la voix ou du style global d'une personnalité. L'idée fondamentale derrière les lois sur la ressemblance est que la personne propriétaire de la création, que ce soit une chanson, une vidéo ou un film, ne possède pas seulement les droits respectifs sur son œuvre, mais a également le droit de contrôler sa réputation et de monnayer son identité.

Par le passé, les affaires les plus médiatisées concernant la ressemblance et le droit à l'image portaient sur l'utilisation non autorisée d'images individuelles et d'autres contenus dans des jeux vidéo. On peut citer l'exemple du groupe américain No Doubt qui a engagé des poursuites contre l'éditeur de jeux vidéo Activision, arguant que leur image avait été exploitée pour interpréter des chansons dans le jeu Band Hero sans leur consentement.

La question de savoir si les lois sur la ressemblance sont essentielles à la protection juridique des musicien·ne·s contre les contenus générés par l'IA sans autorisation reste ouverte et doit faire l'objet d'un débat plus approfondi. Ce qui est déjà clair, cependant, c'est qu'une approche juridique modernisée, conçue pour faire face à l'évolution constante du paysage de l'IA dans la musique, est une nécessité absolue pour protéger les œuvres, les talents et les identités des artistes.