IA vs. Indústria da Música: O Surgimento da Clonagem de Voz por IA
- Martina
- 12 outubro 2023, quinta-feira
A tecnologia de clonagem de voz por inteligência Artificial tem crescido nos últimos meses, mostrando sua eficácia em diversos setores, incluindo a indústria da música. Embora tenhamos abordado o tema em um artigo anterior sobre IA e música, acreditamos que ele mereça seu próprio artigo, aprofundando-se em suas implicações e preocupações relacionadas para artistas independentes. Vamos direto ao assunto.
A tecnologia de clonagem de voz por IA
Independentemente da controvérsia em torno da clonagem de voz, a tecnologia representa uma conquista notável no avanço da inteligência artificial. Embora não abordemos detalhes, decidimos esboçar o básico de como a tecnologia funciona. Em essência, a clonagem de voz utiliza algoritmos de aprendizado sofisticados para replicar vozes humanas específicas.
O cerne desse processo inovador é o treinamento de redes neurais impulsionado por vastos volumes de dados de voz gravados. Modelos de IA são treinados para dominar inúmeras nuances vocais, entonações, tons, sotaques ou velocidades para adotar um discurso sintetizado que imite o mais fielmente possível a voz do locutor de origem.
Um papel essencial também é desempenhado por arquiteturas de aprendizado profundo chamadas redes generativas adversárias (GANs), que mediam a interação entre redes geradoras e discriminadoras. Como o nome sugere, geradores buscam criar vozes sintéticas, enquanto discriminadores avaliam sua autenticidade em relação à fala humana real. A interação entre as duas redes cria um ciclo repetido de criação, avaliação e aprimoramento, por meio do qual a tecnologia de clonagem de voz por IA está em constante evolução.
Clonagem de voz por IA na música
No início deste artigo, mencionamos que serviços de clonagem de voz estão sendo utilizados em diversas áreas e setores. Isso inclui o desenvolvimento de assistentes virtuais personalizados e mais humanizados, a criação de postagens virais em redes sociais ou a facilitação da comunicação de alta qualidade para aqueles que perderam a capacidade de falar.
O que torna o uso da clonagem de voz na indústria da música diferente de seu uso em outras áreas é que, para os músicos, suas vozes são um ingrediente sagrado de sua arte e profissão. De fato, podemos argumentar que a voz de um cantor é uma ferramenta de comunicação, um instrumento musical e uma ferramenta de monetização, tudo em um.
Alguns exemplos específicos colocaram a clonagem de voz na vanguarda. Em 2021, a Capitol Record fez notícia ao anunciar sua decisão de assinar um rapper totalmente gerado por IA, FN Meka. Pouco depois, os fãs descobriram que a voz de FN Meka pertencia a um ator de voz humano que não foi creditado nem compensado por seu trabalho e talento.
Isso desencadeou uma controvérsia que foi ainda mais alimentada pela persona pública e maneirismos do artista virtual, que foram vistos como apoio a estereótipos raciais e apropriação cultural da cultura negra. Não surpreendentemente, o artista foi dispensado da gravadora apenas 10 dias após ser contratado.
Você provavelmente também se lembra da música "heart on my sleeve" que se tornou viral este ano por apresentar vocais "realisticamente sonoros" de Drake e The Weeknd gerados por IA. A música foi escrita e produzida por um usuário do TikTok, ghostwriter977, que a lançou independentemente em plataformas de streaming como Spotify, Apple Music ou YouTube.
O resultado? A faixa gerou milhões de visualizações no TikTok e milhares de streams em diversas plataformas. E embora a Universal Music Group eventualmente a tenha retirado, tornou-se um caso crucial nas discussões atuais sobre a legalidade de músicas geradas por IA em plataformas de streaming e a adoção de leis de direitos autorais relevantes.
Mais recentemente, uma nova música com tema de término de relacionamento apresentando vocais de Taylor Swift gerados por IA surgiu na internet, imitando como sua música 'será' após o suposto fim de seu novo relacionamento no futuro. A letra foi supostamente escrita por um usuário humano do TikTok, Will King, mas foi posteriormente produzida por outro usuário usando software e ferramentas de edição de áudio para criar a versão final gerada por IA da música.
Após apenas um dia no YouTube, a música alcançou quase 60.000 visualizações e recebeu principalmente críticas favoráveis, com espectadores sugerindo que a música fosse lançada em outras plataformas de streaming também.
Influência da clonagem de voz por IA na vida dos músicos
1. Diminuição do valor do trabalho gerado por humanos
Independentemente de quão talentosa, habilidosa e experiente ela seja, Swift provavelmente precisaria de um certo tempo para terminar a música (ou escrever uma música sobre sua própria vida sem a contribuição de ninguém). Vamos também não esquecer o investimento financeiro necessário para gravar e produzir a música. Em última análise, isso se aplicaria a todos os músicos, que precisariam de tempo substancial, dinheiro e ferramentas apropriadas para terem sua música pronta para lançamento.
Uma ferramenta de IA ideal precisaria apenas de uma solicitação, um clique e, no máximo, alguns minutos para terminar de escrever a música, produzi-la e gerar vocais para ela. Atualmente, realisticamente, você precisaria de mais de uma ferramenta de IA para criar a música do zero, mas mesmo assim, o processo criativo seria mais barato, menos demorado e mais acessível do que o adotado pelos humanos.
Isso não é para condenar o trabalho gerado por humanos e defender a IA a todo custo, mas, em última análise, é isso que o processo de pensamento pode se tornar para certas pessoas na indústria da música se não houver regulamentações e restrições em vigor. Como resultado, tanto a produção quanto o consumo de música podem ser dominados por faixas geradas por IA, empurrando a música feita por humanos para segundo plano.
Além disso, com a tecnologia de clonagem de voz por IA continuamente melhorando e lentamente dominando a arte da imitação, os fãs também podem ser menos contra a compra de música gerada por IA em vez do trabalho original do artista. Podemos ver isso acontecendo com os casos que mencionamos anteriormente.
As músicas de Drake e The Weeknd, assim como as de Taylor Swift, conquistaram enorme popularidade, com os fãs pedindo que as músicas fossem completadas e lançadas em plataformas de streaming. Isso tudo pode eventualmente levar a uma diminuição nas vendas de música, perda de streams e, portanto, uma redução substancial na receita para os artistas.
Alguns afirmam que tais mudanças teriam um impacto também nas apresentações ao vivo, enquanto outros, pelo contrário, enfatizam que a IA nunca pode substituir ou mesmo imitar uma conexão humana que é uma parte essencial de cada concerto.
A residência virtual contínua do ABBA Voyage em Londres, que se espera que dure pelo menos até o final de 2024, pode sugerir que é correto se preocupar. Por enquanto, no entanto, isso só pode ser uma especulação, já que a residência virtual está acontecendo apenas porque os membros originais da banda decidiram não fazer turnês novamente.
2. Roubo de identidade
A clonagem de voz pode não ser usada apenas por outros para vender e ganhar dinheiro com músicas que têm suas vocais clonadas (e que mostram seu talento e qualidades de performance também). Também pode ser usada por outros para roubar sua identidade e usar sua voz em situações em que você preferiria não estar envolvido, e isso pode se estender além da área de criação musical (incluindo várias atividades fraudulentas).
Alguém pode argumentar que isso poderia acontecer apenas com artistas que desfrutam de fama mundial e sucesso comercial. No entanto, com a tecnologia sendo tão facilmente acessível, qualquer pessoa com uma voz pode ser afetada. As consequências podem ser brutais, especialmente na era atual de mídias sociais, grande avanço tecnológico (incluindo deepfake) e compartilhamento excessivo de informações, onde a autenticidade e a verdade são mais difíceis de detectar e onde qualquer pequena transgressão (verdadeira ou não) é severamente punida.
Eventualmente, isso poderia resultar em danos físicos e psicológicos para os músicos, os fãs e, em casos fraudulentos e criminosos, também para o público. As pessoas podem ser facilmente manipuladas, lançando sombras e 'cancelando' outros por coisas que podem nem mesmo ter cometido.
3. Novas oportunidades criativas e inovadoras
É importante observar que a clonagem de voz, assim como outras tecnologias de IA, não são necessariamente tão ruins. Para alguns, podem ser vistas como fontes de novas oportunidades para artistas e meios de aprimorar sua arte. Ao usar ferramentas de IA, os músicos podem encontrar novas maneiras e formas de se expressar, optando por sons, instrumentos e sinergias antes não descobertos.
Em shows e outras performances ao vivo, as ferramentas de IA podem servir como uma ferramenta de entretenimento poderosa, ajudando a criar experiências únicas sem necessariamente substituir o artista principal. Realizar um show assim é provável que atraia grande atenção, o que pode levar a um maior crescimento de público e um aumento nas vendas de ingressos.
Além disso, a tecnologia de IA pode abrir a porta para que mais pessoas produzam e lancem sua música de forma independente, reduzindo a dependência financeira de gravadoras e gradualmente desmantelando e remodelando como a indústria da música opera (e a maneira como as pessoas transformam sua paixão por música em uma carreira profissional).
A verdade final sobre os desenvolvimentos tecnológicos é que eles são (quase sempre) inicialmente destinados a aprimorar e complementar as capacidades e a criatividade humanas existentes, e não a substituí-las. No entanto, isso só é possível com a adoção de leis de direitos autorais e regulamentações relevantes. E qual é a situação atual das leis de direitos autorais e uso de IA, você pode perguntar? Vamos dar uma olhada.
Clonagem de IA e proteção de direitos autorais do trabalho humano
Começaremos dizendo que, embora a tecnologia de IA esteja em desenvolvimento há anos, parece que, da noite para o dia, ferramentas e plataformas individuais se tornaram parte integrante de nossas vidas cotidianas. Um dia, não tínhamos ideia do que era o ChatGPT, e no dia seguinte, estávamos usando ativamente no trabalho, nas escolas e em nossas vidas particulares também. Não é de surpreender que, do ponto de vista legislativo, ainda tenhamos que acompanhar essas mudanças rápidas.
As leis de direitos autorais atuais são quase exclusivamente dedicadas à proteção de expressões criativas 'fixas' e tangíveis, como melodias, letras, gravações de músicas e obras de arte. Elementos intangíveis, incluindo a voz, são deixados relativamente desprotegidos. Especialmente nos EUA, a propriedade exclusiva da voz de alguém não foi incluída na lei federal de direitos autorais, uma vez que os sons da voz não são considerados 'fixos'.
Além disso, enquanto as leis destinadas a proteger a privacidade, prevenir fraudes e regular o consentimento teoricamente podem se aplicar à clonagem de voz, atualmente não existem leis ou regulamentações projetadas exclusivamente para abordar os desafios únicos da tecnologia.
Além disso, nos EUA, as 'políticas justas' permitem o uso limitado de material protegido por direitos autorais sem a necessidade de permissão dos detentores dos direitos autorais. No entanto, o que constitui um 'uso justo limitado', especialmente no contexto da tecnologia de IA, não foi definido.
A União Europeia, por outro lado, tem mostrado incentivos para reformar as leis de direitos autorais a fim de lidar com as respectivas questões no mundo virtual. Em 2021, a Comissão Europeia apresentou o AI Act, que visa retificar e regular tanto o uso quanto o desenvolvimento de IA emitindo diretrizes para desenvolvedores e usuários. No entanto, embora o projeto atual do AI Act exija transparência e governança de dados, ele tem sido criticado por não abordar adequadamente as aplicações de IA generativa desenvolvidas nos campos de conteúdo de vídeo e áudio.
Essa reclamação foi levantada pela UVA, uma coalizão global de 35 sindicatos, associações e uniões europeias de dublagem, que se uniu a organizações da Suíça, EUA ou Ásia para garantir que nenhum dano seja causado ao patrimônio artístico e à criatividade humana pelo uso de IA na indústria de dublagem e voice-over.
Isso ocorreu após relatos de que vários mods de Skyrim (um jogo de vídeo) usaram IA para criar conteúdo pornográfico com vozes de personagens sem o consentimento dos atores. Como foi posteriormente mostrado, tal prática alegadamente não é proibida nas respectivas leis de direitos autorais.
As leis de semelhança são a solução?
Enquanto o foco principal na proteção está direcionado para as leis de direitos autorais, muitos insiders da indústria musical têm enfatizado a importância das chamadas leis de semelhança. Segundo eles, a semelhança de um artista é baseada em sua voz, e tais leis protegerão os músicos contra o uso não autorizado de suas vozes.
Insiders revelaram que conteúdo clonado ou conteúdo que se assemelha à saída de um artista específico é complicado, pois tal trabalho não consiste em uma cópia direta da criação real do artista.
Pode-se argumentar que uma música clonada (ou uma música com vozes geradas por IA) é apenas derivada da original, o que é um argumento muito difícil para os detentores de direitos autorais. No final, houve vários casos de artistas usando ideias de outras pessoas ao compor músicas e escrever canções.
No entanto, como tem sido o caso de processos por violação de direitos autorais que vivenciamos na indústria da música, as alegações de infração estavam fundamentalmente direcionadas para a melodia das músicas - não para alguém imitar a voz de outra pessoa ou estilo geral.
A ideia final das leis de semelhança é que o proprietário da criação, seja uma música, um vídeo ou um filme, não apenas detém os respectivos direitos sobre seu trabalho, mas também tem o direito de controlar sua reputação e monetizar sua identidade.
No passado, os casos de processos judiciais mais renomados relacionados à semelhança e ao direito de publicidade giravam em torno do uso não autorizado de imagens individuais e outros conteúdos em videogames. Esse foi também o caso da banda americana No Doubt, que moveu um processo contra a editora de videogames Activision, alegando que sua semelhança foi usada para tocar música no jogo chamado Band Hero sem o consentimento deles.
Se as leis de semelhança são a chave na proteção legal de músicos contra conteúdo gerado por IA não autorizado, permanece uma questão, pois discussões adicionais sobre o tópico precisam acontecer. O que já está claro, no entanto, é que uma abordagem legal modernizada projetada para lidar com o cenário de IA em constante evolução na música é absolutamente necessária para cuidar das obras, talentos e identidades dos artistas.
OFERTAS DE BLACK FRIDAY
Economize 30% em TODOS os nossos planos de assinatura! Por tempo limitado!