IA vs. industria musical: El auge del clonado de voz mediante IA
- Martina
- 12 octubre 2023, jueves
La tecnología de clonación de voz mediante IA ha ido en aumento en los últimos meses y ha demostrado ser poderosa en diversos sectores, incluida la industria de la música. Si bien hemos tocado el tema en nuestro artículo anterior sobre IA y música, creemos que merece su propio artículo, profundizando en sus implicaciones y preocupaciones relacionadas para los artistas independientes. Entremos directamente al grano.
La tecnología de clonación de voz mediante IA
Independientemente de la controversia que rodea a la clonación de voz, la tecnología presenta un logro notable en el avance de la inteligencia artificial. Si bien no cubriremos los detalles, hemos decidido describir los conceptos básicos de cómo funciona la tecnología. En esencia, la clonación de voces aprovecha sofisticados algoritmos de aprendizaje para replicar voces humanas específicas.
El núcleo de este proceso innovador es el entrenamiento de redes neuronales, impulsado por grandes volúmenes de datos de voz grabados. Los modelos de IA están entrenados para dominar innumerables matices vocales, entonaciones, tonos, acentos o velocidades para adoptar un habla sintetizada que imitará lo más fielmente posible la voz del hablante fuente.
También desempeñan un papel esencial las arquitecturas de aprendizaje profundo llamadas redes generativas adversarias (GAN) que median en la interacción entre las redes generadoras y discriminadoras. Como sugiere el nombre, los generadores tienen como objetivo generar voces sintéticas, mientras que los discriminadores evalúan su autenticidad frente al habla humana real. La interacción entre las dos redes crea un ciclo repetido de creación, evaluación y refinamiento, a través del cual la tecnología de clonación de voz de IA evoluciona constantemente.
Clonación de voz con IA en la música
Al principio de este artículo, mencionamos que los servicios de clonación de voz se están utilizando en una variedad de áreas e industrias. Esto es, por ejemplo, para desarrollar asistentes virtuales personalizados y más humanos, crear publicaciones virales en las redes sociales o permitir una comunicación de alta calidad con quienes han perdido la capacidad de hablar.
Lo que diferencia el uso de la clonación de voces en la industria musical de su uso en otras áreas es que para los músicos, su voz también es un ingrediente sagrado de su arte y profesión. De hecho, podemos argumentar que la voz de un cantante es una herramienta de comunicación, un instrumento musical y una herramienta de monetización, todo al mismo tiempo.
Algunos ejemplos particulares sacaron a la luz la clonación de voces artísticas. En 2021, Capitol Record fue noticia cuando anunciaron su decisión de contratar a un rapero con voz entera de IA. FN Meka. Fue poco después de esto cuando los fans descubrieron que la voz de FN Meka pertenecía a un actor de doblaje humano que no fue acreditado ni compensado por su trabajo y talento.
Esto desató una controversia que se vio alimentada aún más por la personalidad pública del artista virtual y sus gestos que se consideraban que apoyaban los estereotipos raciales y la apropiación cultural de la cultura negra. No es de extrañar, por tanto, que el artista fuera retirado del sello sólo 10 días después de haber firmado.
Probablemente también recuerdes la canción "Heart on My Sleeve" que se volvió viral a principios de este año por presentar voces "realistas" de Pato y The Weekend generado por IA. La canción fue escrita y producida por un usuario de TikTok, ghostwriter977, quien la autoeditó en plataformas de streaming, como Spotify, Apple Music o YouTube.
¿El resultado? La pista generó millones de visitas en TikTok y miles de transmisiones en todas las plataformas. Y aunque Universal Music Group finalmente lo retiró, se convirtió en un caso fundamental en las discusiones actuales sobre la legalidad de la música generada por IA en las plataformas de streaming y la adopción de leyes de derechos de autor pertinentes.
Más recientemente, una nueva canción de ruptura con Taylor Swift la voz generada por IA apareció en Internet imitando cómo sonaría su canción después de que su nueva supuesta relación se acabe en el futuro. Según se informa, la letra fue escrita por un usuario humano de TikTok, Will King, pero fue producida por otro usuario utilizando software y herramientas de edición de audio para crear la versión final de la canción generada por IA.
Después de solo un día en YouTube, la canción obtuvo casi 60.000 visitas y recibió críticas en su mayoría favorables y los espectadores sugirieron que la canción también se lanzara en otras plataformas de transmisión.
Influencia de la clonación de voces mediante IA en la vida de los músicos
1. Disminución del valor del trabajo generado por humanos
Independientemente de lo extremadamente talentosa, hábil y experimentada que sea, lo más probable es que Swift necesite una cierta cantidad de tiempo para terminar la canción (o para escribir su canción sobre su propia vida sin la participación de nadie más). Tampoco nos olvidemos de la inversión financiera necesaria para grabar y producir la canción. En última instancia, esto se aplicaría a todos los músicos, que necesitarían mucho tiempo, dinero y herramientas adecuadas para tener su música lista para su lanzamiento.
Una herramienta de IA ideal sólo necesitará una solicitud, un clic y como máximo unos minutos para terminar de escribir la canción, producirla y generar las voces para ella. Hoy en día, de manera realista, se necesitaría más de una herramienta de inteligencia artificial para crear la canción desde cero, pero incluso entonces, el proceso creativo resultaría más barato, consumiría menos tiempo y sería más accesible que el adoptado por los humanos.
No se trata de condenar el trabajo generado por humanos y defender la IA a toda costa, pero, en última instancia, esto es en lo que podría convertirse el proceso de pensamiento para ciertos individuos en la industria de la música si no se establecen regulaciones ni restricciones. Como resultado, tanto la producción como el consumo de música pueden quedar dominados por pistas generadas por IA, dejando de lado la música creada por humanos.
Además, con la tecnología de clonación de voz de IA mejorando continuamente y dominando lentamente el arte de la suplantación, los fanáticos también pueden oponerse menos a comprar música generada por IA en lugar del trabajo original del artista. Podemos ver que eso sucede con los casos que mencionamos anteriormente.
Tanto las canciones de Drake & The Weeknd como las de Taylor Swift han obtenido una inmensa popularidad y los fanáticos piden que las canciones se completen y se publiquen en plataformas de transmisión. Todo esto podría eventualmente conducir a una disminución en las ventas de música, pérdida de reproducciones y, por lo tanto, una reducción sustancial de los ingresos de los artistas.
Algunos afirman que tales cambios también tendrían un impacto en las actuaciones en vivo, mientras que otros, por el contrario, enfatizan que la IA nunca podrá reemplazar o incluso imitar una conexión humana que es una parte esencial de cada concierto.
La actual residencia de conciertos virtuales de ABBA Voyage en Londres, que se espera que dure al menos hasta finales de 2024, puede sugerir que es correcto estar preocupado. Por ahora, sin embargo, esto sólo puede ser una especulación, ya que la residencia virtual se llevará a cabo sólo porque los miembros originales de la banda han decidido no volver a hacer giras.
2. Robo de identidad
Es posible que otros no solo utilicen la clonación de voces para vender y ganar dinero con música que contenga tus voces clonadas (y que también muestre tu talento y cualidades interpretativas). También pueden usarlo otros para robar tu identidad y usar tu voz en situaciones en las que no le gustaría estar involucrado y que pueden extenderse más allá del área de la creación musical (incluidas diversas actividades fraudulentas).
Se podría argumentar que esto podría suceder sólo a los artistas que disfrutan de fama mundial y éxito comercial. Sin embargo, dado que la tecnología es tan fácilmente accesible, cualquier persona con voz puede verse afectada. Las consecuencias pueden ser brutales, especialmente en la era actual de las redes sociales, los grandes avances tecnológicos (incluidos los deepfake) y el intercambio excesivo de información, donde la autenticidad y la verdad son más difíciles de detectar y donde cualquier pequeña infracción (sea cierta o no) es severamente castigada.
En última instancia, esto podría provocar daños tanto físicos como psicológicos a los músicos, a los fans y, en caso de casos fraudulentos y criminales, también al público. Las personas pueden ser fácilmente manipuladas, arrojando sombra y “cancelando” a otros por cosas que tal vez ni siquiera hayan cometido.
3. Nuevas oportunidades creativas e innovadoras
Es importante señalar que la clonación de voz y otras tecnologías de inteligencia artificial no son necesariamente tan malas. Por un lado, pueden percibirse como fuentes de nuevas oportunidades para los artistas y medios para mejorar su arte. Al utilizar herramientas de inteligencia artificial, los músicos pueden encontrar nuevas formas de expresarse, optando por sonidos, instrumentos y sinergias nunca antes descubiertos.
En conciertos y otras presentaciones en vivo, las herramientas de inteligencia artificial pueden servir como una poderosa herramienta de entretenimiento, ayudando a crear experiencias únicas sin necesariamente reemplazar al artista principal. Es probable que montar un espectáculo como ese atraiga una gran atención, lo que puede conducir a un mayor crecimiento de la audiencia y un aumento en la venta de entradas.
Además de eso, la tecnología de inteligencia artificial puede abrir la puerta para que más personas produzcan y publiquen su música de forma independiente, reduciendo la dependencia financiera de los sellos discográficos y desmantelando y remodelando gradualmente la forma en que opera el negocio de la música (y la forma en que los individuos convierten su pasión por la música en una carrera profesional).
La verdad fundamental sobre los avances tecnológicos es que (casi siempre) inicialmente tienen como objetivo mejorar y complementar las capacidades y la creatividad humanas existentes, no reemplazarlas. Sin embargo, esto sólo es posible con la adopción de las leyes y regulaciones de derechos de autor pertinentes. ¿Y cuál es la situación actual con las leyes de derechos de autor y el uso de la IA? Echemos un vistazo.
Clonación de IA y protección de derechos de autor del trabajo humano
Comenzaremos diciendo que, si bien la tecnología de inteligencia artificial ha estado en desarrollo durante años, parece como si hubiera sucedido de la noche a la mañana que las herramientas y plataformas individuales se hayan convertido en una parte integral de nuestra vida cotidiana. Un día no teníamos ni idea de qué era ChatGPT y al día siguiente lo usábamos activamente en el trabajo, las escuelas y también en nuestra vida privada. Por lo tanto, no es de extrañar que, desde un punto de vista legislativo, todavía tengamos que mantenernos al día con estos rápidos cambios.
Las leyes de derechos de autor actuales se dedican casi exclusivamente a proteger expresiones creativas “fijas” y tangibles, como melodías, letras, grabaciones de canciones y obras de arte. Los elementos intangibles, incluida la propia voz, quedan bastante desprotegidos. Especialmente en los EE.UU., la propiedad de la propia voz no está incluida en la ley federal de derechos de autor, ya que los sonidos de la voz no se consideran "fijos", como exige la ley.
Además, si bien las leyes diseñadas para proteger la privacidad, prevenir el fraude y regular el consentimiento pueden en teoría aplicarse a la clonación de voz, actualmente no existen leyes o regulaciones diseñadas únicamente para abordar los desafíos exclusivos de esta tecnología.
Además de eso, en EE.UU., 'políticas justas' permitir el uso limitado de material protegido por derechos de autor sin necesidad de permiso de los titulares de los derechos de autor. Sin embargo, no se ha definido qué constituye un “uso legítimo limitado”, particularmente en el contexto de la tecnología de inteligencia artificial.
La UE, por el contrario, ha mostrado incentivos para reformar las leyes de derechos de autor para abordar las cuestiones respectivas en el mundo virtual. En 2021, la Comisión Europea presentó la Ley de IA que tiene como objetivo rectificar y regular tanto el uso como el desarrollo de la IA mediante la emisión de directrices para desarrolladores y usuarios. Sin embargo, aunque el borrador actual de la Ley de IA exige transparencia y gobernanza de datos, ha sido criticado por no abordar suficientemente las aplicaciones generativas de IA desarrolladas en los campos de contenido de video y audio.
Esta queja fue presentada por la UVA, una coalición global de 35 gremios, asociaciones y sindicatos de locutores europeos, que además se ha unido con organizaciones de Suiza, EE. UU. o Asia para garantizar que no se cause daño al patrimonio artístico ni a la creatividad humana. por el uso de la IA en la industria del doblaje y locución.
Esto finalmente ocurrió después de que se informó que varias modificaciones de Skyrim (un videojuego) usaban IA para crear contenido pornográfico con las voces de los personajes sin el consentimiento de los actores. Como se demostró más tarde, esta práctica supuestamente no está prohibida en las respectivas leyes de derechos de autor.
¿Son las leyes de semejanza la solución?
Si bien el foco principal de la protección se dirige a las leyes de derechos de autor, muchos expertos de la industria musical han enfatizado la importancia de las llamadas leyes de semejanza. Como afirman, la imagen de un artista se basa en su voz y, por lo tanto, dichas leyes protegerán a los músicos contra el uso no autorizado de su voz.
Estos expertos han revelado que el contenido clonado o el contenido que suena como la producción de un artista en particular es complicado en el sentido de que dicho trabajo no consiste en una copia directa de la creación real del artista.
Se puede afirmar que una canción clonada (o una canción con voces generadas por IA) es sólo un derivado de la original, lo cual es un argumento muy difícil para los propietarios de derechos de autor. Al final, ha habido múltiples casos de artistas que tomaron prestadas las ideas de otra persona al componer música y escribir canciones.
Sin embargo, como ha sido el caso de las demandas por derechos de autor que hemos experimentado en la industria de la música, las demandas por infracción se dirigieron fundamentalmente a la melodía de las canciones, no a que alguien imitara la voz o el estilo general de otro individuo.
La idea fundamental de las leyes de semejanza es que el propietario de la creación, ya sea una canción, un vídeo o una película, no sólo posee los derechos respectivos sobre su trabajo, sino que también tiene derecho a controlar su reputación y monetizar su identidad.
En el pasado, los litigios más famosos relacionados con la imagen y el derecho de publicidad giraban en torno al uso no autorizado de imágenes individuales y otros contenidos en videojuegos. Este fue también el caso de la banda estadounidense No Doubt que presentó una demanda contra el editor de videojuegos Activision, alegando que su imagen se utilizó para reproducir música en el juego llamado Band Hero sin su consentimiento.
Si las leyes de semejanza son clave en la protección legal de los músicos contra el contenido no autorizado generado por IA sigue siendo una cuestión, ya que es necesario seguir debatiendo el tema. Sin embargo, lo que ya está claro es que un enfoque legal modernizado diseñado para abordar el panorama en constante evolución de la IA en la música es una necesidad absoluta para cuidar las obras, los talentos y las identidades de los artistas.