Nvidia presentó Fugatto, una herramienta de inteligencia artificial diseñada para transformar la creación y edición de audio.
Según la empresa, este generador puede producir sonidos que nunca antes han sido escuchados, como una trompeta que maúlla.
La tecnología detrás de Fugatto le permite generar música, voz o efectos de sonido basados únicamente en descripciones de texto, abriendo nuevas fronteras en la creatividad sonora.
Sonidos únicos y edición avanzada
Fugatto no se limita a lo convencional. Puede crear canciones basadas en indicaciones tan imaginativas como: “Un saxofón que aúlla, seguido de música electrónica con perros ladrando”.
También es capaz de producir efectos de sonido inusuales, como “pulsos graves retumbantes con chirridos digitales, evocando una enorme máquina sensible despertándose”.
También, puede alterar voces, modificando acentos o tonos emocionales, como un discurso tranquilo convertido en uno enojado.
En la edición musical, Fugatto sobresale por su capacidad para aislar voces, agregar instrumentos o cambiar completamente la composición, como sustituir un piano por un cantante de ópera.
Las funcionalidades posicionan a la herramienta de IA como una aplicación versátil tanto para músicos como para diseñadores de sonido.
Entrenamiento y retos del modelo de Fugatto
El desarrollo de Fugatto implicó entrenar al modelo con millones de muestras de audio, incluyendo la biblioteca de efectos de sonido de la BBC.
Nvidia explica que sus investigadores ampliaron las tareas que la herramienta podía realizar sin añadir más datos, lo que genera resultados más precisos y versátiles.
Si bien otras empresas como OpenAI, Adobe y Google han desarrollado herramientas de audio generativo, ninguna ha afirmado crear sonidos completamente nuevos como lo hace Fugatto.
Si bien, el sector enfrenta retos legales, ya que algunas compañías han sido acusadas de usar material protegido por derechos de autor para entrenar sus modelos.
Un futuro incierto pero prometedor
A pesar de su potencial, Nvidia no ha confirmado si Fugatto estará disponible para el público.
Esta investigación tecnológico promete revolucionar la industria del audio, pero también plantea preguntas éticas sobre el uso de datos y la propiedad intelectual.
Mientras tanto, Fugatto se coloca como una herramienta funcional que redefine los límites de la creatividad sonora.
Con información de The Verge.
More Stories
NVIDIA y AWS: Innovación en IA, robótica y computación cuántica
Herramientas responsables de IA generativa de Google
Amazon desafía a Nvidia con sus propios chips de IA