El desarrollador Charlie Holtz, mostró en X con herramientas de IA, una versión no autorizada de la voz de David Attenborough.
El miércoles pasado, el desarrollador de Replicate, Charlie Holtz, mostró a través de X una combinación de GPT-4 Vision (GPT-4V) con la clonación de voz de ElevenLabs.
El resultado fue una versión no autorizada de la icónica voz de David Attenborough, divulgador científico británico y uno de los más conocidos en la historia de la televisión, narrando cada movimiento de Holtz frente a la cámara, convirtiéndose rápidamente en un fenómeno viral.
El experimento y la reacción
La publicación que detalla este experimento inusual obtuvo más de 21,000 me gusta en menos de 24 horas.
En el video, el falso Attenborough describe a Holtz como un “notable espécimen de Homo sapiens”, observando sus gestos y vestimenta de manera humorística.
A pesar de algunas críticas éticas, la mayoría de la audiencia pareció disfrutar de la creatividad detrás de esta hazaña técnica.
La tecnología en acción
Charlie Holtz logró este experimento utilizando un script de Python llamado “narrador”. Cada cinco segundos, este script captura una imagen de la cámara web de Holtz y la envía a GPT-4V a través de una API.
El modelo de lenguaje procesa la entrada de imágenes y genera un texto al estilo de las narraciones de Attenborough.
El texto luego se integra en un perfil de voz de IA de ElevenLabs entrenado con grabaciones de audio del discurso del presentador.
Repercusiones éticas y legales
Aunque la combinación de capacidades de GPT-4V y la clonación de voz no es nueva, su aplicación conjunta ha llevado a demostraciones impactantes, como la voz clonada de Steve Jobs criticando diseños en una aplicación de diseño.
Pese a ello, estas prácticas no están exentas de preocupaciones éticas y legales.
La tecnología de clonación de voz plantea problemas sobre derechos de propiedad intelectual, publicidad y derechos de autor, cuestiones que las empresas como ElevenLabs intentan abordar en sus términos de servicio.
Reacciones del público:
Pese a las preocupaciones éticas, muchos expresaron su deleite por la demostración.
En una respuesta, un usuario bromeó sobre hacer que Attenborough narre videos de su bebé.
Las reacciones divididas destacan la dualidad de emociones generadas por esta tecnología innovadora.
El clon no autorizado de la voz de David Attenborough creado el desarrollador de Replicate, abre un debate sobre los límites éticos y legales de la tecnología de clonación de voz.
Aunque algunos pueden encontrar cómico estas demostraciones, es crucial abordar las preocupaciones relacionadas con los derechos de propiedad intelectual y la posibilidad de un mal uso de esta tecnología en el futuro.
La convergencia de GPT-4V y la clonación de voz presenta un escenario fascinante pero desafiante para la ética tecnológica.
Con información de Ars Technica.
More Stories
CEO de Automattic paga a empleados en desacuerdo
Android 15 se lanza para AOSP
Granite Rapids: Intel vuelve a competir con AMD